автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Многокомпонентные модели и алгоритмы анализа аномальных геофизических сигналов
Автореферат диссертации по теме "Многокомпонентные модели и алгоритмы анализа аномальных геофизических сигналов"
я?
На правах рукописи
Мандрикова Оксана Викторовна
МНОГОКОМПОНЕНТНЫЕ МОДЕЛИ И АЛГОРИТМЫ АНАЛИЗА
АНОМАЛЬНЫХ ГЕОФИЗИЧЕСКИХ СИГНАЛОВ Специальность: 05.13.18 - математическое моделирование, численные
методы и комплексы программ
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук
Санкт-Петербург - 2009
003463290
Работа выполнена в Институте космофизических исследований и распространения
радиоволн
Дальневосточное отделение Российской Академии наук (ИКИР ДВО РАН)
Официальные оппоненты:
доктор технических наук, профессор Куприянов М.С. доктор технических наук, профессор Нечаев Ю. И. доктор технических наук, профессор Емельянов Г.М.
Ведущая организация - ОАО Концерн "Океанприбор", г. Санкт-Петербург, Чкаловский проспект, д.46.
Защита диссертации состоится 2009 г, в часов на заседании совета по
защите докторских и кандидатских диссертаций Д 212.238.01 Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" имени В.И. Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.
С диссертацией можно ознакомиться в библиотеке университета.
Автореферат разослан Р2— 2009 г.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы. Настоящая работа посвящена разработке математических моделей для аналитического описания природных сигналов со сложной структурой и построению автоматизированных систем моделирования и прогноза на их основе. Наличие модели природного сигнала, несущего информацию об исследуемом процессе либо явлении природы, значительно расширяет возможности их изучения, и позволяет решать задачу предсказания их поведения во времени. Наряду с другими методами исследований, анализ временных рядов систем геофизического мониторинга, регистрирующих вариации геофизических полей, имеет крайне важное значение для решения целого ряда фундаментальных научных задач физики атмосферы, ионосферы, распространения радиоволн и практических задач обеспечения, в конечном счете, безопасной жизнедеятельности на Земле. На основе прямых экспериментальных данных и соответствующих модельных построений этот подход позволяет получить количественную оценку процессам, которые формируются в той или иной геосфере. Эта тема лежит в общем русле работ фундаментальных научных исследований в области мониторинга, прогнозирования состояния атмосферы, гидросферы и литосферы и технологии снижения риска и уменьшения последствий природных и техногенных катастроф.
Состояние среды является суперпозицией очень большого количества взаимодействий между азличными процессами, и перед исследователем стоит задача найти способ уменьшить размерность системы и выявить структурные компоненты, наиболее полно описывающие исследуемый процесс. В настоящее время наблюдается рост сети станций регистрации геофизических сигналов и вследствие чего возникновение больших массивов статистических данных, развиваются методы их анализа. Это позволяет на принципиально новом уровне решить данную проблему.
В диссертации в первую очередь рассматривается класс задач, связанных с обнаружением и ассификацией аномальных эффектов в природных сигналах. . Аномальное поведение егистрируемых сигналов может содержать резкие всплески, сопровождаться серией пиков, иметь тупенеобразный вид. Относительная величина и временная протяженность таких аномалий зависит т многих факторов. Эти аномальные особенности содержат полезную информацию об исследуемом . оцессе и должны быть отображены в модели. Сложная структура возникновения аномалии, а также аличие мешающих факторов различной природы делают невозможным непосредственное вменение к ним существующих регрессионных и других статистических моделей временных ядов. Естественным и наиболее эффективным способом представления таких сигналов является .остроение нелинейных адаптивных аппроксимирующих схем на основе экстраполирующих ильтров. Инструментом, позволяющим реализовать такую процедуру для сигналов с подобными собенностями, является вейвлет-преобразование. В настоящее время ведутся интенсивные сследования по применению этого метода в различных прикладных задачах, связанных с анализом ложных сигналов, возникающих в физике, медицине, финансовом анализе и др. областях. Несмотря 1а то, что данный метод в последнее время имеет распространение при обработке сигналов в еофизике, общей теории по применению этого аппарата в анализе регистрируемых природных игналов нет. Данная диссертация восполняет ряд пробелов в этой области. Вейвлет-преобразование работе является инструментом, лежащим в основе построения моделей сигналов со сложной ■труктурой. В диссертационной работе введены математические конструкции, расширяющие область адиционных методов моделирования и позволяющие построить адаптивную многокомпонентную одель сигнала с учетом внутренней структурой исходных данных и выполнить отображение как арактерных, так и изолированных особенностей его структуры. Это играет важную роль в задачах нализа сложных природных сигналов. Способы идентификации предложенных моделей основаны а совместном применении моделей авторегрессии-проинтегрированного скользящего среднего и етодов нейронных сетей с вейвлет-преобразованием.
Цель работы заключается в разработке математических моделей для аналитического описания риродных сигналов со сложной структурой, включающей локальные особенности различной формы временной протяженности и построению систем анализа и прогноза. Сигналы с такими собенностями имеют место в физике, геофизике, геоэкологии и др. областях.
Проведенные в работе исследования привели к созданию класса моделей, в основе которых ■ежит математическая конструкция, названная многокомпонентной моделью временного ряда, редставляющая исходный временной ряд в виде разномасштабных компонент с различной формой и ременной протяженностью. На основе данной конструкции построена общая теория построения юдели временного ряда со сложной структурой. Разработаны методы идентификации и оценки оделей, описаны их свойства. Также разработан комплекс методов и алгоритмов анализа данных,,,'- у
и' '
основанный на предложенных моделях к служащий теоретической базой для построен! автоматизированных систем анализа статистических данных и выполнения прогноза.
При этом решены следующие задачи:
1. Разработана новая математическая конструкция - многокомпонентная моде, временного ряда (ММВР), позволяющая идентифицировать локальные особенности различи формы и временной протяженности в структуре сложного сигнала.
2. Разработаны способы идентификации ММВР для сигналов со сложной струюуро обеспечивающие' выделение существенных компонентов структуры сигнала и эффективнс вейвлетное подавление шума.
3. Разработаны методы оценки параметров ММВР, основанные на совмещении метод авторегрессии-проинтегрированного скользящего среднего (АРПСС) и методов нейронных сет с вейвлет-преобразованием.
4. Разработаны численные методы и алгоритмы идентификации устойчивь характеристик временного ряда и изолированных особенностей его структуры.
5. Построенный аппарат применен к исследованию геофизических сигналов с широки спектром флуктуаций различных масштабов.
6. Предложено использование построенного аппарата для оценки плотное распределения случайной величины.
7. Разработано программное обеспечение для автоматического обнаружения классификации локальных аномальных особенностей в геофизических сигналах на базе ПЭВМ.
Методы исследований. В развитых автором подходах использовались классические работы теории вейвлетов, опубликованные на рубеже 90х S. Mallat, L.K. Meyer, D.J. Lemarie, I. Daubechie R.R. Chui и др., работы отечественных авторов, работы Donoho D. по минимаксным оценкам сигна. в смеси с шумом. В диссертационной работе также использовался аппарат теории случайнь процессов, теории цифровой обработки сигналов, теории распознавания образов, теории построен математических моделей, методы вычислительной математики, основы функционального анализа, целью проверки эффективности новых результатов и синтезируемых на их основе алгоритм обработки данных, в среде МАТЛАБ выполнялись расчеты, и проводилось математическ моделирование с использованием реальных и модельных сигналов.
Научная новизна состоит в создании и исследовании класса моделей природных сигналов сложной структурой, в основе которого лежит многокомпонентная модель временного ряд представляющая исходный сигнал в виде разномасштабных компонент с различной формой временной протяженностью, в частности;
1. На основе нелинейных аппроксимирующих схем разработаны методы идентификац структурных компонентов природного сигнала, содержащего изолированные особенное различной формы и временной протяженности. В качестве пространства-образа сигн определено пространство вейвлет-коэффициентов, обеспечивающее отображен разномасштабных структурных компонентов сигнала в элементы модели. В качестве базов конструкций, используемых для построения отображения, определены кратномасштабнь анализ и вейвлет-пакеты.
2. Разработаны методы выделения устойчивых характеристик структуры сигнала изолированных особенностей.
3. Разработаны численные методы и алгоритмы построения наилучшей аппроксимирующ схемы сложного природного сигнала, обеспечивающие выделение существенн компонентов структуры сигнала и эффективное вейвлетное подавление шума.
4. Предложен способ оценки многокомпонентной модели временного ряда на осно минимаксного подхода, разработаны способы диагностики и оптимизации модели.
5. Разработаны два способа оценки параметров модели сигнала: первый основан на совмещен методов АРПСС и вейвлет-преобразования - позволяет выполнить оценку параметров моде в случае, когда компоненты сигнала имеют линейную структуру; второй базируется совмещении методов нейронных сетей и вейвлет-преобразования - позволяет построй аппроксимирующую функцию частного вида на дискретном множестве значений в случ когда структура компонент сигнала существенно нелинейная.
А также:
1. На основе построенной аппроксимирующей схемы сигнам разработана техни
идентификации характерных элементов структуры сигнала и выделен
редковстречающихся особенностей.
2. Разработаны способы классификации выделенных локальных особенностей в структуре сигнала.
3. Впервые предложен метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.
Научная и практическая ценность работы заключается в том, что:
1. созданы теоретические основы построения моделей сложных природных сигналов, содержащих локальные особенности различной формы и временной протяженности;
2. разработаны конкретные модели природных сигналов;
3. предложенный автором метод выделения изолированных особенностей в структуре сигнала стал заметным вкладом в компьютерные методы анализа сложных геофизических сигналов, применяемые в различных лабораториях;
4. разработанные автором способы классификации локальных особенностей в структуре сигнала используются в программном обеспечении по обработке данных регистрации подпочвенного радона и сигнала критической частоты ^Рг;
5. на основе предложенных автором алгоритмов автоматического обнаружения изменения параметров модели построены системы по обработке ионосферных данных;
6. разработанный автором метод оценки плотности распределения случайной величины на основе вейвлет-преобразования нашел применение в обработке данных регистрации сейсмического каталога и позволил выявить аномальные изменения в распределении сейсмических событий по глубине накануне сильных землетрясений на Камчатке;
7. проведены экспериментальные исследования разработанных методов и алгоритмов на реальных и модельных сигналах, подтвердившие их эффективность при обработке сигналов со сложной структурой;
8. разработанные методы значительно расширяют область применения традиционных методов анализа сложных сигналов, они позволяют идентифицировать те особенности структуры сигнала, которые не попадают в область этих методов, и могут быть использованы для широкого круга задач, в которых необходим анализ сигналов со сложной структурой.
Результаты научных исследований, выполненные автором и представленные в пунктах 1-5, в еречне «Научная и практическая ценность работы», включены в важные научные достижения ДВО АН в период 2005 - 2007 гг.
Научные положения, выносимые на защиту:
1. Теоретические и методические основы построения многокомпонентной модели сложного
природного сигнала, содержащего изолированные особенности различной формы и временной протяженности.
2. Численный метод построения наилучшей аппроксимирующей схемы сложного сигнала, лежащий в основе построения многокомпонентной модели.
3. Способ оценки параметров многокомпонентной модели сигнала на основе совмещения конструкции вейвлет-преобразования и регрессионных методов.
4. Способ оценки параметров многокомпонентной модели на основе совмещения конструкции вейвлет-преобразования и методов нейронных сетей.
5. Численные методы и алгоритмы классификации выделенных изолированных особенностей в структуре сложного сигнала.
6. Методики идентификации моделей природных сигналов применительно к задаче выделения и классификации аномальных особенностей в их структуре.
7. Метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.
недрение результатов работы, абота выполнялась в рамках: - -
Договора о научно-техническом сотрудничестве между Институтом вулканической геологии и геохимии ДВО РАН с одной стороны, Камчатским государственным техническим университетом, с другой стороны, и Санкт-Петербургским государственным электротехническим университетом, с третьей стороны по теме "Разработка алгоритмов и методов выделения средне и краткосрочных предвестников сильных землетрясений Петропавловск-Камчатского геодинамического полигона по данным геохимического мониторинга". Тематика работы связана с программой ГНТП №16 «Безопасность населения и народно-хозяйственных объектов с учетом риска возникновения природных и техногенных
катастроф», программа Президиума РАН «Изменение окружающей среды и климат; природные катастрофы»;
2. Договора о научно-техническом сотрудничестве между Институтом космофизическл исследований и распространения радиоволн ДВО РАН с одной стороны и Саше Петербургским государственным электротехническим; университетом, с другой сторож. Тематика работы связана с программами фундаментальных .исследований Президиума РА1 научная программа № 18 «Теплофизика и механика интенсивных энергетических воздействий в части «Солнечный ветер: генерация и взаимодействие.с Землей и другими планетами) научная программа № 13 «Изменение окружающей среды и климата: природные катастрофы» ; программа №30 «Солнечная активность и физические процессы- в системе Солнце-Земля». Работа была поддержана грантом РФФИ №02-05-64467 «Выявление среднесрочных краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки М>6 в вариациях динамики подпочвенного радона, водорода и пространственно - временны характеристик сейсмичности», грантом РФФИ для студентов, аспирантов и молодых-ученых №03-0 06453а, грантом ДВО РАН №05-3-В-02-76 «Исследование механизмов ионосферного и литосферног взаимодействия», грантом ДВО РАН №06-3-В-02-059 «Исследование механизмов формировали вероятностной структуры распределения сейсмических событий на основе статистической модел сейсмического режима Камчатского региона».
Научные результаты и разработанное программное обеспечение внедрены в лаборатори ИКИР ДВО РАН, г. П.-Камчатский, а также используются в учебном процессе при проведени лабораторных и курсовых работ по курсу «Системы цифровой ' обработки' сигналов) «Моделирование систем» для студентов специальностей «Управление и: информатика в технически системах» и «Программное обеспечение вычислительной техники й автоматизированных систем» КамчатГТУ. '""
Апробация полученных результатов. Основные положения и результаты работ; докладывались и обсуждались на научно-технических конференциях КамчатГТУ в 2000-2008 гг.; н Всероссийской научной конференции "Проектирование научных и инженерных приложений в сре Matlab".- Москва: ИПУ РАН 2002г; на Международной научно-практической конференци "Рыбохозяйственное образование Камчатки в XXI веке". - Петропавловск-Камчатский, 15-16 октябр 2002 г.; на Международной конференции по мягким вычислениям и измерениям, - С.-Петербур 2003, 2005-2008 г.г.; на III международной конференции «Солнечно-земные связи электромагнитные предвестники землетрясений», -П.-Камчатский, 2004г.; на IV. международно совещании «Солнечно-земные связи и предвестники землетрясений», с.Паратунка, Камчатский р-о 2007г.; на 8ой международной конференции «Pattern recognition and image analysis: new informatio technologies», Йошкар-Ола, 2007г.; на 10ой международной научной конференции «Проблем эволюции открытых систем», Казахстан, Алматы, 2008г.; на 5°" научной конференции «Управление информационные технологии», (УИТ-2008), Санкт-Петербург, 2008г.
Материалы диссертации докладывались на семинарах в институте вулканической геологии геохимии ДВО РАН (П.-Камчатский); институте космофизических исследований и распространени радиоволн ДВО РАН (П.-Камчатский). ■ " - . . ; ! : ■
Публикации. По теме диссертации опубликовано 37 печатных работ, из. .них - 17 стате (9-статей, рекомендованных ВАК -Минобрнауки России), 18 докладов на международных всероссийских научно-технических конференциях и 2 монографии. 2 статьи, определенные ВА находятся в печати. .
Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключен и списка литературы, включающего 137 наименований, 2 приложения. Основная часть работ изложена на 260 страницах машинописного текста и содержит 91 рисунок и 18 таблиц.
СОДЕРЖАНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ ,
Во введении показана и обоснована актуальность работы, сформулированы основные цели задачи, научная новйзна и практическая ценность диссертационной работы.
Первая глава посвящена анализу основных подходов к построению модели временного ря и постановке задачи.'-Приведены традиционные стохастические методы, с указанием имеющих недостатков и рассмотрен способ построения модели временного ряда с использованием нейронны сетей. Выполнен анализ современных методов аппроксимации сигналов, основанных на разложени функции по базису. Приводятся аргументы в пользу того, что нелинейные аппроксимирующие схем в базисе вейвлетов является наиболее эффективным методом, позволяющим решить поставленну задачу. Введена новая математическая конструкция - многокомпонентная модель временного ряд
позволяющая выявить и исследовать те особенности структуры данных, которые не попадают в область традиционных методов.
Предметом исследований являются природные сигналы, которые содержат изолированные аномальные особенности различной формы и временной протяженности, возникающие в случайные моменты времени. Примером являются сигналы регистрации геофизических параметров, которые включают в себя различного характера аномальные эффекты, возникающие накануне сейсмических явлений, связанные с активностью Солнца и другими процессами различной природы. Время появления и интенсивность этих аномалий является полезной для исследователей информацией. Выделение аномалий в вариациях геопараметров является сложной задачей и сталкивается с серьезными трудностями. Это связано с большим разнообразием и достаточно сложной формой аномалий и с отсутствием адекватных математических моделей. Анализ основных подходов к построению модели геофизических данных показывает, что традиционно для решения данной задачи применяют процедуру сглаживания, которая позволяет отфильтровать шум и выделить регулярную составляющую. Причем регулярная составляющая рассматривается двух видов: либо тренд, либо сезонная составляющая. В случае отсутствия теоретических обоснований предположения о том, что поведение данных описывается некоторым полиномом, модель тренда теряет смысл. В области экстраполяции доверительные границы для построения оценки быстро расходятся и довольно сильно отклоняются от найденного полинома. Популярным методом анализа временных рядов также является метод авторегрессии-проинтегрированного скользящего среднего. Практика подтвердила его мощность и гибкость при решении многих прикладных задач. Но он тоже имеет ограничения как на возможность его использования для отдельных временных рядов, так и на выявляемые при этом закономерности. Допущение, что временной ряд может быть описан линейным стохастическим дифференциальным уравнением, не позволяет учитывать некоторые характеристики структуры данных, и влечет потерю и искажение важной информации. Недостатком перечисленных методов, по отношению к решаемой задаче, также является предположение, что сигналы подчиняются нормальному распределению, которое не всегда оправдано. Методы оценки параметров модели, а также ее диагностика и оптимизация полностью базируются на этом предположении, что автоматически исключает возможность отображения в модели изолированных локальных особенностей и делает непосредственное применение перечисленных методов неэффективным для решения поставленной задачи. Получающие развитие в настоящее время современные методы обработки сигналов, такие как вейвлет-преобразование и методы нейронных сетей, хотя и позволяют частично справиться с данной проблемой, но отсутствие общей теории их применения для природных сигналов с подобными особенностями не дает возможность в полной мере использовать их аппарат.
Предложено представление сигнала / в виде разномасштабных компонент /у с различной структурой:
/(') = *,/¡(')+*2/2(>)+- + *,/,(')• (1) Если коэффициенты х1,х2,...х! коррелируют между собой, вывод о том, какие аппроксимирующие функции использовать, сделать достаточно трудно. Естественным путем решения является представление сигнала в виде ортонормированных компонент:
/
Поскольку функции ^ в (1) имеют разную структуру, подверженную изменению в случайные
моменты времени, наиболее эффективным способом их идентификации является применение методов аппроксимации, основанных на разложении функции по базису:
/,(0 = 1сЛ(<), (3)
п
где /] б 1} (Я), (Р]П - базисные функции пространства 1? (Я).
С целью возможности построения моделей, адаптирующихся к структуре сигнала, автором предложено использовать здесь нелинейные аппроксимирующие схемы. В этом случае приближение / выполняется М векторами, зависящими от структуры сигнала:
где 1и - множество индексов, определяемое свойствами функции /.
Конструкция (1) с учетом свойств (2) - (4) названа многокомпонентной моделью временное ряда.
" Учитывая локальный характер анализируемых особенностей, их разномасштабность I разнообразие по форме, наиболее подходящим пространством для их представления являете пространство, натянутое на базис смещенных функций или вейвлет-базис. Вейвлет-коэффициенты с1.» = (/>;,„}> К>)(;,п)б2г "«^нормированныйвейвлет-базис,
рассматриваются как результат отображения / в пространство с разрешением }.
Предложенный подход к построению модели временного ряда со сложной структурой I использование вейвлёт-преобразования в качестве метода идентификации его структурны компонентов предоставляет широкие возможности в задачах анализа природных сигналор Некоторые общие вопросы и методы построения моделей'природных сигналов на основе нелинейны аппроксимирующих схем в вейвлет-базисе подробно рассмотрены в монографиях [20,31 ]. 'Задача исследования состоит в разработке
1. теоретических и методических основ построения многокомпонентной модели сложног природного сигнала;
2. численных методов и алгоритмов построения аппроксимирующей функции для сигнала описанной структурой на основе нелинейной аппроксимирующей схемы в базисе вейвлетов;
3. методов оценки модели;
4. алгоритмов автоматического обнаружения изменения параметров модели применительно задаче обнаружения аномального поведения геофизических компонентов;
5. методов, и алгоритмов классификации выделенных аномальных особенностей;
6. методик построения модели природного сигнала на основе разработанного аппарата:
Во второй главе, основываясь на понятиях вейвлет-преобразования, автор определяет качестве базовых конструкций, используемых для построения многокомпонентной модели сигнала кратномасштабный анализ (КМА) и вейвлет-пакеты (ВП). Предложены критерии выбора базис обеспечивающие построение наилучшей аппроксимирующей схемы (НАС) сигнала, лежащей в основ построения многокомпонентной модели и обеспечивающей выделение существенных компоненто структуры сигнала. Разработаны способы идентификации устойчивых характеристик структур сигнала и изолированных особенностей. Разработаны численные методы и алгоритмы построени НАС сигнала. Предложены методы диагностики и оптимизации полученной аппроксимирующе схемы сигнала.
В утверждении 1 диссертационной работы доказано, что конструкция дискретного вейвле преобразования СЦВП), осуществляет разложение функции / е 1}(К) на ортогональнь компоненты /(0-'... + + х2/2(1) + ... + хк/к{() +... и обеспечивает выполнение условия (
И/2
ММВР, при условии, что х] ■
, где с] „ - коэффициенты вейвлет-разложения.
Случайный сигнал у представляет зависимость
>-(/) = ДО+ е(/),
где / - истинное значение измеряемой величины, е - ошибки измерений. Вейвлет-коэффициенты функции у определяются как
^О'Ь/^+ч,'
где/,
Показано, что компоненты модели (1) з пространстве вейвлет-образов имеют вид
Используя утверждение 1, доказано, что структурные компоненты сигнала с шумо принадлежащего пространству с разрешением у = 0
Л>(0 = /о(0 + е„(0.
отображаются в компоненты ММВР вида
I I
Показано, на основе процедуры КМА, что случайный сигнал у0 в пространстве вейвлет-образов может быть представлен в виде:
'))+/-. (5)
де е}, gJ е^, V?, =Ыо811-п)), е, -белыйшум, f_m еУт, Ут = ...+»'__,
Каждая компонента (5) единственным образом определяется последовательностями коэффициентов и = и
Этот способ идентификации компонентов модели (1) назван в работе конструкцией 1-го типа. Конструкция 1-го типа построена на предположении, что полезная информация о сигнале аходится в низкочастотной его составляющей. В случае необходимости идентификации различных пов частотно-временных структур более эффективным методом является конструкция вейвлет-акетов (ВП).
В работе показано, аналогично конструкции 1-го типа, процедура разложения сигнала по базисам П позволяет идентифицировать компоненты ММВР. На основе конструкции ВП случайный сигнал уй имеет представление:
Уо(')= (О+«А(0)+/-*('). (6)
де е^, gJ.( И^д - пространства вейвлет-пакета.
Каждая компонента (6) единственным образом определяется последовательностями коэффициентов Ъ>< е" и ^ =(/,%.,„), е* и
7 =</.^>.
Эта процедура идентификации компонентов ММВР названа в работе конструкцией 2-го типа. Методы выделения изолированных особенностей в структуре сигнала построены на основе еоремы Жаффара. Используя эту теорему, в работе доказано утверждение 2:
Для случайной функции у, имеющей вид (б), на малых масштабных уровнях абсолютные значения коэффициентов ('О | = »}|" определяющих компоненту % являются мачыми за
исключением окрестностей, содержащих изолированные особенности структуры сигнала.
Постепенное уменьшение масштабного параметра позволяет фокусироваться на локальных труктурах сложного сигнала и исследовать его структуру. Для каждого _/, компонента дает юкалнзованную частотно-временную информацию об / в ]1 -й октаве (частотном диапазоне).
Метод выделения устойчивых характеристик в структуре случайного сигнала базируется на нализе компоненты f_m. Скалярные произведения функции / с функциями эквивалентны ыполнению операции свертки с фильтром высоких частот. Когда функция ф имеет Ь нулевых оментов и / е С1, то для / вблизи 2™ п
С = (/,£„„) = 2-""'2/(г ")•
Получаем, что в компоненте сигнала /_„ е У_т мы имеем приближение аппроксимируемой ункции / с разрешением 2™. Изолированные особенности структуры случайного сигнала у
отображаются в пространства WJt и Wj nV_„ ={о}. Автокорреляционная функция от / е/2(Л) определяется как
р(о=+от=н *
й II= Zf-»(I+0LJ0 = Pu,
t n I
где pf - автокорреляционная функция компоненты /_„.
—m г
Следовательно, коэффициенты с , соответствующие компоненте J_m, содержат
устойчивые характеристики структуры сигнала.
Вейвлет-преобразование предоставляет широкий спектр базисных функций, но качество обработки, определяется их свойствами. Решение проблемы выбора базисной функции является нелегким. В зависимости от задачи возможны различные способы формирования критериев.
С целью обеспечения численно устойчивых разложений сигнала, в диссертации, в качестве первого критерия, определено условие: у/ является R -функцией.
Решая задачу аппроксимации сигнала в базисе ортогональных функций в качестве следующих критериев логично определить:
1. минимизацию числа аппроксимирующих слагаемых;
2. минимизацию погрешности аппроксимации.
Минимизация числа аппроксимирующих слагаемых и минимизация погрешности аппроксимации достигается на основе выбора вейвлет-базиса, обеспечивающего как можно большее
число вейвлет-коэффициентов dJn - (/,4^,,), которые являются пренебрежимо малыми.
Нелинейная аппроксимирующая схема, удовлетворяющая этим требованиям, определена в работе как наилучшая аппроксимирующая схема (НАС).
Показано, что в этом случае определяющими при выборе семейства базисов будут характеристиками: гладкость, размер носителя, число нулевых моментов.
Предложена методика построения НАС сигнала, включающая операции:
1. удаление шума;
2. выбор базиса;
3. идентификация структурных компонентов сигнала.
В основе данной методики лежит следующий численный алгоритм:
1. построение полного дерева разложения: W°: W¡ =@'ы¡WJ¡', (ч*?1 (2Лt-«)}nsZесть
базис пространства ;
2. определение ветвей дерева, соответствующих структурным компонентам случайного сигнала, путем выбора «наилучшего» базиса: «наилучший» базис О' пространства есть базис
Of =
neli "'>» M/i"
^ I/ 42*
где множества индексов 1'м,1 = Р, 2Р, 2Р +1 определяются следующим образом: индекс п е /¿.ёс/ш^у.Чу^Ц^Г, порог Т = МесА^у^'^ /т1„ - наименьший масштаб.
Доказано, что выделенные на основе этих операций детализирующие вейвлет-коэффициенть соответствуют изолированным особенностям структуры сигнала и определяют компоненты ММВР, а вейвлет-коэффициенты аппроксимирующей компоненты сигнала соответствую устойчивым характеристикам его структуры и определяют компоненту /_я ММВР.
Оценка модели в диссертационной работе выполняется на основе минимаксного подхода. Сигнал оценивается преобразованием зашумленных данных у с помощью оператора решения И. езультирующая оценка есть
7 = Ду.
Погрешность оценки / составляет
Кд/М||/-д>]|2}.
Минимаксный риск - это нижняя граница, вычисленная по всем линейным и нелинейным ераторам О:
Оптимизация оценки / выполняется в работе путем улучшения порога Т на основе .горитма НОРШ-порога.
Также в работе предложен метод оптимизации модели путем определения наилучшего базиса. пределение наилучшего базиса основывается на результатах работы Б. Ма11а1. Оценка /
лучается пороговой обработкой разложения сигнала у длины N в базисе , р1 = {ч^ }0акЛ.:
те Рт - пороговая функция.
Идеальный базис ув" - это такой, который минимизирует погрешность оценки
ЕI
17 11 1 ЛеЛ
Тогда, оценив погрешность | в каждом базисе /Зг, логично определить в качестве
илучшего базиса тот, который ее минимизирует.
В основе метода диагностики модели лежит естественное предположение, что полезные ставляющие сигнала более скоррелированы, чем случайные возмущения. Когда N возрастает, есть роятность, стремящаяся к 1, что
Корреляция сигнала у с базисом ¡3 определяется как
»>11 '
Тогда диагностика модели может быть построена на проверке условия:
\у»\
е 1е - множество векторов из р, для которых не выполнено условие С (у) = уу > Ск, к-их личество.
В третьей главе описаны методы оценки параметров ММВР на основе совместного применения йвлет-преобразования и модели АРПСС. Расширяя область традиционных методов анализа еменных рядов, автором предложена новая математическая модель, представляющая собой инейную комбинацию составляющих двух видов: детализирующую и аппроксимирующую. етализирующая составляющая модели аппроксимирует изолированные особенности в структуре гнале. Методы оценки параметров данной составляющей основаны на вейвлет-теории.
Аппроксимирующая составляющая содержит устойчивые характеристики структуры сигнала, оцеп которых основана на методах АРПСС. Разработаны численные методы и алгоритмы идентификат новой модели, описаны ее свойства. Предложены методы автоматического обнаружения классификации аномальных особенностей в структуре сложного сигнала, основанные на введение математической конструкции.
Модель (6) может быть представлена в виде линейной комбинации составляющих двух видов:
Д0 = /,(')+/2(0,
где т=2>,м = ¿Х^Ю. т=5>тт"""(<). ¿1={/л,„),с={/>0<7«
множество индексов, определяемое свойствами функции /.
Компоненты соответствующие составляющей /, модели, являются детализирующими
включают в себя приращения порядка 2"1'. Данная составляющая нацелена на выделен1 изолированных особенностей в структуре сигнала. Методы выделения и классификации эт! особенностей основаны-в работе на анализе наибольших абсолютных значений коэффициент ^1 = {^я1/ «€/„ • которые определены в качестве параметров составляющей /, модели.
Для оценки параметром сглаженной компоненты /2(/) модели в работе предложены мето АРПСС.
Общий вид модели сигнала, получаемый на основе совместного применения конструкц вейвлет-преобразования и методов АРПСС, имеет вид:
где = (/'^л»)' ^м ~ множество индексов, определяемое свойствами функции /; У\.....УР
коэффициенты авторегрессии, со, , с~т = (/,#-„,„)
Эта модель названа в работе вейвлет-преобразование авторегрессия (ВПАР). Показано, что модель ВПАР обладает следующими важными свойствами:
• позволяет выделить изолированные особенности в структуре сигнала и идентифщирова их на основе вейвлет-преобразования;
• позволяет выделить стационарные характеристики временного ряда и идентифицирова их на основе модели АРПСС;
• обеспечивает понижение порядка модели АРПСС.
Таким образом, предложенная конструкция - ВПАР не только расширяет область использован класса моделей АРПСС, но и улучшает свойства результирующей АР-модели. Этапы идентификац модели ВПАР могут быть представлены в виде схемы, показанной на рис. 1.
Рис. 1. Этапы идентификации модели вейвлет-преобразование авторегрессия.
Формальная постановка задачи обнаружения и классификации аномальных особенностей в гнале следующая:
Пусть дана случайная последовательность значений функции , обладающая набором ойств. Предположим, что в момент времени (0 последовательность меняет одно (или несколько) из оих свойств. Наблюдая {дг( , необходимо:
• обнаруживать момент изменения свойств /0;
• классифицировать вид особенности и ее временную протяженность;
• формулировать заключение о поведении объекта исследования.
Методы обнаружения и классификации высокочастотных аномальных особенностей в сигнале строены на обработке детализирующей составляющей /, (?) модели:
1. Обнаружение аномалии'.
1.1. на каждом уровне детализации у сохранение коэффициентов абсолютные
значения которых превышают пороговое значение ГО): <¡1 = 0, если < Г(у);
1.2. в случае выполнения условия:
] п=1
где Р - порог, определяющий наличие аномалии в сигнале, ¡,к - пределы временного
окна,
в момент времени / =; имеем аномалию;
2. Классификация особенности:
2.1. по виду: на каждом уровне детальности _/' для аномальной точки п = г определяется
гладкость Липшица по максимальному наклону как функции 1о§2 } ;
2.2. по энергии: на каждом уровне детальности _/' производится расчет энергии в пределах скользящего временного окна:
X АХ1Л = </„'/(шах |<*„'|),
л»/
где г, к - пределы временного окна;
2.3. по масштабу: для всех уровней детальности _/ производится расчет общей энергии в пределах скользящего временного окна:
22К-1'
где ¡,к - пределы временного окна; Методы обнаружения и классификации аномальных особенностей в сигнале, соответствующих ительным периодам времени, построены на обработке сглаженной составляющей /2(/) модели: Пусть дана последовательность значений функции }. Рассмотрим следующие гипотезы:
• Г, : 3 / е \{х,} порождаются М^'^х,} - образуют конечное число изолированных точек наблюдаемой последовательности;
• Г2: Э г е ТУ]: порождаются Мв), {х, ( порождаются моделью Мвл;
• Г3:Э .....1к е ^Лф порождаются моделью Мв), порождаются
моделью порождаются моделью М^, где Мв/ - семейство моделей,
параметризованных вектором в1 ■
В случае выполнения гипотезы Г, появляется дополнительная задача определения моментов емени )'. В случае выполнения гипотезы Г2 помимо оценки времени изменения возникает задача
определения вх. Поскольку обработка данных предполагается по мере их поступления, мы можс ограничиться рассмотрением гипотез Г, ,Г2.
Для получения оценки времени изменения в случае обработки блоков данных разумнее все! применять метод максимального правдоподобия. В соответствии с идеей Е.С. Пейджа проверяют N+ \ гипотезы Я,,Я2,...,Яд,+1, состоящие в том, что = 1,2,...,ЛГ + 1,где /0- момент изменен! свойств процесса. Вероятность ошибочной классификации будет минимальной, если гипотеза / принимается при выполнении условия
т-1 . . N . .
где 1т(х) = ^!пт\х1 )+ !вг) - функция правдоподобия, соответствующая гипоте-
№
Нт, й)(х] /в) - плотность распределения наблюдений хг Все значения = 1,Л' предполагают
равновероятными. Оценка /0мп получается заменой неизвестной величины в1 оценк максимального правдоподобия. Применительно к модели АРПСС имеем: /0мп =агБ тах^пй^х,'0-'/0,)+ 1п®(х;*/02)}=
= агё тах 1па{хрх1в]+ £ 1па{х,!х\-\,в,)+ 1п«(х,';^"1 /й2)+ ^\п(о{х,1 х',:\,вЖ
° [ 1-Р+1 '-'о *Р )
В случае гауссовской модели, следуя Боксу и Дженкинсу, имеем:
1пй)(х,"/в)= -£1п2ж7* +—1п ёе1 —1—ХТрМ^Х р, 2 2 2<7с
2 £ 1-Р*'\ №
где — |х|.....х^М^ =Г;'а1,Гр - ковариационная матрица (р х р) последовательно
авторегрессии, М^ - матрица (р х р) квадратичной формы нормального закона.
Общая схема решения задачи обнаружения и классификации аномальных особенностей в сигн на основе модели вейвлет-преобразование авторегрессия представлена на рис.2.
Идентификация модели вейвлет-преобразование авторегрессия
Обработка составляющей /,(/) модели
Выявление и классификация краткосрочных аномалий
Обработка составляющей /2 (?) модели
Г, :3 /е(1.АГ]:
порождаются ; {х,} -
множество изолированных точек наблюдаемой последовательности
Выявление кратко и среднесрочных аномалий
Г2:Э /6(1,А']:{ху};',
порождаются Мв>, {х^ порождаются моделью М0
1
Выявление средне и долгосрочных аномалий
Рис. 2. Схема решения задачи обнаружения и классификации аномальных эффектов в сигнале на
основе конструкции ВПАР.
Четвертая глава посвящена описанию методов оценки параметров ММВР на основе совместного применения вейвлет-преобразования и методов нейронных сетей (НС). Предложена новая математическая модель - вейвлет-преобразование нейронная сеть (ВПНС), позволяющая идентифицировать многокомпонентную модель сигнала, в случае, когда компоненты вейвлет-преобразования имеют нелинейную структуру. Синтезируются методы и алгоритмы формирования обучающего и тестового множеств для обучения НС, обеспечивающие адекватность модели для сигналов со сложной структурой.
В случае, когда для временного ряда сложной структуры идентифицировать модель общего вида не представляется возможным, возникает задача аппроксимации частного вида функций, принимающих дискретное множество значений. Существенная особенность НС состоит в том, что вид аналитической зависимости между переменными определяется в процессе обучения сети. Показатели качества отображения во многом определяются характеристиками обучающего множества. В работах большинства авторов основное внимание уделено выбору архитектуры и способу обучения сети, а этап предобработки рассматривается, к сожалению, только в контексте решаемой задачи. Авторы этих работ не учитывают, что задача предобработки данных определяет не только конечный результат, но и влияет на все остальные этапы разработки НС. Удаляются избыточные и шумовые данные, понижается размерность пространства признаков, следовательно, сокращается размерность обучающего множества, упрощается архитектура сети и сокращается время ее обучения.
В диссертационной работе предложены следующие методы формирования обучающего и контрольного множеств:
1. понижение размерности пространства признаков на основе удаления шумовой
компоненты',
2. выделение характерных особенностей структуры сигнала;
3. устранение несущественных и редковстречающихся признаков.
Первая процедура базируется на построении НАС сигнала и применении операции вейвлет-фильтрации. Для реализации второй процедуры общий массив данных делится на Ь
блоков длины Т:
.. . М'Х -Их.иж^о:,.*)-
Далее выполняется отображение каждого блока данных в пространство вейвлет-образов: _ /'=/,'+/,'+...+/;. где / - номер блока, I = \,Ь.
Каждая выделенная компонента сигнала /, определяет подпространство V, пространства V
к к
признаков сигнала: = У. Компоненты, из которых далее будет сформирована
(»1 м
обучающая выборка, определяются следующим образом: сравниваются структуры //, соответствующие различным блокам данных I: компонента является характерной для сигнала, если она выделена в каждом блоке I, т.е. V/ /! Ф {о}. Последовательный анализ узлов дерева вейвлет-пакета снизу вверх на основе этой методики позволяет определить характерные для аппроксимируемого сигнала компоненты.
Устранение несущественных и редковстречающихся признаков выполняется на основе анализа выделенных компонент сигнала : для каждой компоненты /( выполняется анализ гистограмм вейвлет-коэффициентов, построенных по данным всех блоков. Признак считается редковстречающимся и несущественным, если плотность вероятности в соответствующей точке пространства меньше, чем некоторое наперед заданное число Я. Для устранения такого признака вейвлет-коэффициенты, которые попадают в окрестность этих точек, заменяются нулями.
Предложенные методы выделяют информативные составляющие сложной функции с учетом ее внутренней структуры и не нарушает вероятностную структуру исходных данных.
Полученные на основе описанных процедур реконструированные сигналы у :
где {яг,л} е 1}, Iмножество индексов, определяемое свойствами функции /,
аппроксимируются нейронной сетью. Изолированные особенности сигнала отображаются п детализирующую компоненту модели. Модель временного ряда, получаемая на основе совместного применения конструкции вейвлет-преобразования и методов НС, имеет вид:
^ I т4 / ],к
где^- функция активации НС, й>, - весовые коэффициенты НС, с* - коэффициенты вейвлет-преобразования, - вейвлет-базис, (те,.у)е /у, Iмножество существенных признаков, с![ -детализирующие коэффициенты вейвлет-преобразования, (/,Л)б /г, 1Г- множество изолированных особенностей сигнала, превышающих пороговое значение Т, Ч/У * - вейвлет-базис.
Полученная модель названа в работе моделью вейвлет-преобразование нейронная сеть (ВПНС). Этапы ее идентификации представлены на рис. 3.
Рис. 3. Этапы идентификации модели сигнала на основе совместного применения конструкции вейвлет-преобразования и методов НС. В качестве приложения вейвлетов к обработке экспериментальных данных в пятой главе рассматривается метод оценки плотности распределения случайной величины на основе вейвлет преобразования.
Оцениваемая функция /(х) представлена в виде:
/"(*) =/О)+
где IV(х) - шум, /'(х) - гистограмма, построенная на основе выборки.
Функция /(х) оценивается преобразованием / с помощью оператора решения О Результирующая оценка есть
/ = £>/'.
Наша цель - это минимизация погрешности оценки. Оптимизация оператора И зависит о априорной информации, имеющейся в нашем распоряжении. Освободившись от предположения нормальности, можно использовать минимаксную процедуру.
В работе, в качестве аппроксимирующей функции, рассматривается нелинейн аппроксимирующая схема. В этом случае, используя метод вейвлет-преобразования, на основ
обширного словаря ортонормированных вейвлет-базисов мы имеем возможность подобрать функции, обеспечивающие наилучшую оценку функции /.
Процедура выделения структурных составляющих функции / выполняется на основе пороговой функции.
Оценка погрешности г(/,/) вычисляется по зашумленным данным /' и оптимизируется
минимизацией г (/",/). Если
|/;(*)|<г.
гДе /у ={/'.ч1')> ^ -вейвлет-базис,
то пороговая обработка делает этот коэффициент равным нулю, что приводит к погрешности, равной |/„(х)|2. Так как
е\Гг{х) |2|=|/Д*)|2+а2,
то можно оценить (д:)| с помощью (;с)|2 - с2.
Если (х)| £ Т, то погрешность равна энергии шума. Она оценивается величиной аг. Результирующая оценка г(/,/) есть
и-<т2,если и<Т2
а1,если и>Т2
Предложенный подход является весьма полезным в случае наличия малого числа наблюдений. Получение оценок в среднем на основе вейвлет-аппроксимации дает здесь более ценную информацию о законе распределения случайной величины, чем конкретные значения частот имеющейся выборки.
В случае наличия нескольких выборок, в работе предложены методы улучшения полученной оценки путем выделения характерных для функции / признаков.
В качестве одного из примеров использования предложенного подхода в работе рассмотрена задача обработки данных сейсмического каталога п-ова Камчатка.
Рассматривая сейсмические события слабого энергетического класса в локальной области региона, произошедшие в пределах некоторого интервала времени и предполагая, что условия возникновения землетрясений не изменяются за анализируемый период, мы можем определить статистическое распределение этих событий по глубине. Можно сделать предположение, что пространственные характеристики землетрясений за анализируемый период отражают в среднем его сейсмический режим. Определив статистическое распределение событий по глубине для различных сейсмически активных областей, мы получаем возможность сравнить сейсмические режимы отдельных участков за различные периоды времени, и проанализировать реальные изменения в этих режимах, проявившиеся в локальной области за некоторый период времени.
На основе данной методики обработаны данные сейсмического каталога Камчатского региона за период 1990-1997гг. Обработке были подвержены 12 сейсмически активных восточных областей полуострова. Было выбрано временное окно - 1 год, и с шагом, равным одному году, осуществлялось скольжение по каталогу событий.
Используя предложенный метод оценки плотности распределения случайной величины, для каждого района определены аппроксимирующие функции за весь анализируемый период и в пределах временных окон:
Л и 7«.
где к - номер района, I - номер временного окна.
Результаты расчетов, произведенные для различных районов полуострова, показали наличие существенных вариаций функций в определенные периоды времени. На основе сравнения сейсмических режимов отдельных участков региона за различные периоды времени выделены
признаки возрастания сейсмической активности в различных районах полуострова, которч проявлялись в виде значительного увеличения значений функции Д, на определенных глубинах п
сравнению со значениями функции /к.
Выделенные таким способом аномальные периоды предшествовали двум периодам резког возрастания сейсмической активности на Камчатке. В период с 1992 по 1993 гг. в разных района полуострова произошло 12 землетрясений энергетического класса ¿>13. Наиболее сильные событш произошли на глубине 40км, два события с ¿=14,6 и одно с Л: =14,9. Второй, наиболее сильны поток землетрясений наблюдался на Камчатке в период с 1996 по 1997 гг. В этот период п. полуострове произошло 26 землетрясений энергетического класса £>13, самым сильным из которы было Кроноцкое землетрясение (5 декабря 1997г, к =14,9). В 1990г., накануне первого поток-землетрясений, в шести районах полуострова, в окрестности глубин от 20-ти до 40 км, произошл превышение значений функции /к более чем в 2 раза. В 1996г. в восьми районах полуострова,
окрестности глубин от 5 до 10 км, также произошло превышение значений функции /4 более чем 1,5 раза.
На рис. 4, в качестве примера, показаны результаты расчета значений функций /к и дл
одного из анализируемых районов. Из графика значений функции /к (рис.4 (а)) видно, что в средне большинство событий в этом районе происходит на малых глубинах. В период 1991-1992 гг, можн отметить значительное увеличение значений функций /к4 в окрестности глубины 40 км. В перио
1996-1997 гг. в данном районе также наблюдается значительное увеличение значений функций /к, но в окрестности глубин от 5 до 10 км.
,_,_____,_ мае--1-■-------г----- -
1991г, значительное увеличение значений функции в окрестности бины 40км
.ДО во во 100
17
Рис.4. Значения функций (а) и рассчитанные за период 1990-1997гг. для района с
координатами 51-52 град.с.ш., 158,5-160 град.в.д. Значения коэффициентов вейвлет-преобразования
арактеризуют распределение энергии процесса по масштабам ) , С целью анализа распределения нергии функции / по глубине, для каждого района был выполнен расчет суммы абсолютных начений вейвлет-коэффициентов по всем масштабным уровням:
V
На основе этой методики была проанализирована область Кроноцкого землетрясения параллелепипед с основанием 100x100 км и высотой #=100 км, центр основания имел координаты 54,2 - 162,2 град]). На рис.5 представлены результаты непрерывного вейвлет-преобразования функций
| Ш) и л»,
где й - глубина, к - номер района, 1 ■ номер временного окна, I, соответствующие им, значения функций^ и Ек1.
Результат обработки статистических данных показал, что наибольшая плотность распределения ейсмических событий в данном районе наблюдается на глубинах 20 - 40 км. Непосредственно перед Сроноцким землетрясением отмечено ярко выраженное резкое увеличение энергии сигнала на лубине 5 км, что указывает на область будущего события.
1977-1997
Рис.5. Вейвлет-преобразования значений /к (вверху, слева) и /к, (внизу слева). Соответствующие им значения функций Ек и Ец показаны на рисунке справа.
Шестая глава полностью посвящена исследованию эффективности предложенных моделей алгоритмов на примерах обработки реальных и модельных сигналов.
В диссертационной работе выполнена обработка геофизических сигналов с широки спектром флуктуаций различных масштабов. Рассмотрена эффективность предложенных методов алгоритмов в сравнении с некоторыми другими известными подходами. Сущность обработ сигналов сводилась к задаче обнаружения и классификации аномальных особенностей в I структуре.
В процессе экспериментов синтезировались модельные сигналы, характеристики которь максимально приближены к характеристикам изучаемых процессов.
Структурная схема формирования модельного сигнала показана на рис.б. Она состоит из следующих элементов:
» 7.'к - локальные особенности масштаба }, имеющие вид:1)прямоугольный импуль высоты ;2) синусоида с амплитудой , модулированная функцией Гаусса;3)треугольное колебание с уровнем ;
• Рр, 1 - линейный процесс;
• ф(^а>!а1)- генерация данных со сложной нелинейной структурой;
I
»IV- операция восстановления сложного многомасштабного сигнала г,.
Временная протяженность локальных особенностей к является случайной величино имеющей равномерное распределение на интервале [^.¡у-и]- Высота аномалии £",^,/ = 1,3 та: является случайной величиной, имеющей равномерное распределение на интервале ].
гги
¡У*.2
и
т
-ч +
г-2.
Ч+>
2-\
-4 +
Модель данных
С?
г1,
ж
тт~
г-.
.............►
Идентификация модели
Обнаружение аномалий
Результат обработки
Рис.б. Структурная схема модели проведения экспериментов.
В процессе формирования модельных сигналов временной интервал Дг =
омалию, принимает значения от 2 до 120, а высота аномалий = принимает значения,
чиная с уровня фоновых вариаций и заканчивая значением, превышающим в два раза фоновый овень.
В работе доказано, что аномалия с амплитудой, превышающей фоновый уровень в 1,3 раза, зволяет себя обнаруживать с вероятностью 0,99. На рис.7 показан график зависимости вероятности наружения аномалии от ее относительной величины. График подтверждает достаточно устойчивый
Я,
рактер вероятности обнаружения аномалии при
>1,3. В таблице 1, в качестве примера,
иведены результаты экспериментов по обнаружению и классификации аномалий, ответствующих масштабному уровню 7 = 1. В ходе экспериментов рассматривались аномалии, зволяющие себя обнаруживать с вероятностью 0,99 и более. Коэффициент отношения среднего аксимального значения вейвлет-коэффициентов аномальной окрестности к фону рассчитывался по ормуле:
К _ Утах
У/™* 2Д
е у^ - выборочное среднее максимального значения вейвлет-коэффициентов аномальной рестности; у/яп -выборочное среднее вейвлет-коэффициентов окрестности, не содержащей омальных эффектов; Д-длина доверительного интервала значения у{опс коэффициентом доверия 99.
Рис.7. График зависимости вероятности обнаружения аномалии от ее относительной величины. Таблица 1. Результаты экспериментов по обнаружению и классификации аномалий (масштабный
Временная Временная Коэф-ент отношения Коэф-ент отношения
протяженность протяженность высоты аномалии к среднего
аномалии выявленной фону максимального
аномальной значения вейв-коэф.
окрестности в сигнале аномальной
окрестности к фону к
4 4 1,3 1,7879
8 8 1,3 1,9864
16 16 1,3 2,0350
32 32 1,2 2,:2576
Данные таблицы 1 подтверждают эффективность предложенных методов и алгоритмов по ыявлению аномалий, и показывают хорошую детектирующую способность используемых базисных ункций: при коэффициенте отношения высоты аномалии к фону равному 1 или 1,3 (в зависимости т длины аномалии) коэффициент отношения максимального значения вейвлет-коэффициентов номальной окрестности к фону колеблется в районе значения 2.
На основе предложенной в работе методики построения наилучшей аппроксимирующе! схемы (НАС) сигнала, выполнена идентификация структурных компонентов сигнала магнитног поля Земли, что позволило решить задачу автоматического определения индекса геомагнитно активности К (К-индекса). К-индекс является одной из характеристик магнитного поля Земли. Охарактеризует меру интенсивности геомагнитных возмущений в месте регистрации и используете при решении широкого ряда научных и прикладных задач. К-индекс введен Дж. Бартельсом в 1938 и представляет собой значения от 0 до 9 для каждого трехчасового интервала мирового времени. О вычисляется из магнитограмм по специальной методике, которая предполагает высокий уровен профессиональной подготовки персонала магнитной обсерватории. Основные требования данно методики предъявляются к выделению не возмущенной вариации геомагнитного поля, котор называется Эя-кривой. На основе разницы между наибольшим и наименьшим отклонениями течение трехчасового интервала реальной магнитограммы от значения вя-кривой определяю амплитуду возмущения в нТл. Далее эта амплитуда переводится по квазилогарифмической шкале К-индекс. Шкала для каждой обсерватории определяется в соответствии с геомагнитной широто индивидуально.
Создание автоматических методов определения К-индекса является серьезной проблеме" трудности решения которой связаны с выполнением процедуры определения Sq-кpивov максимально приближенной к ручному способу ее выделения. Существующие метод автоматизации данной процедуры не удовлетворяют основному требованию, поскольку не включаю в себя средства адаптации, тем самым не учитывают возможность изменчивости Sq-кpивoй течением времени.
На основе построения НАС сигнала выделены регулярные составляющие процесса компоненты, содержащие в себе информацию о величине отклонений от среднего уровня локальные моменты времени. В качестве регулярных составляющих процесса определены ветк дерева ВП, показанные на рис.8. На основе анализа и обработки этих компонент разработан методика идентификации спокойного дня, определяющего Бц-кривую. Процедура идентификаци спокойного дня заключается в выполнении следующих операций: определяется суммарное значени вейвлет-коэффициентов выделенных веток для текущего дна, и производится его сравнение соответствующим значением спокойного дня, не превышение которого служит характеристикой тог что текущий день является спокойным. Данная методика позволила получить алгорит адаптирующийся к сигналу по мере его изменения. Преимуществом этого способа адаптации служи тот факт, что при этом не требуется процедуры обучения и знания статистических свойств сигнала.
На основе этой методики обработаны магнитные данные, полученные на обсерватори «Паратунка» (с. Паратунка, Камчатская область). Сравнение полученных результатов определения индекса с ручным методом показывает, что отличия составляют 18 процентов и в своем большинств не превышают 1 балла. Данный результат позволяет считать предлагаемую методик удовлетворительной по точности и допустимой для проведения автоматических расчетов п определению индекса геомагнитной активности К.
Db3 AAAD decomposition signal (1440 counts) mi' \P M1 (720 counts) Db3 AADD decomposition signal (1440 counts) ^ м 1 (720 courts) Db3 AAADD decomposition signal (1440 counts) ^ \P M 1 (720 counts)
M 2 (360 counts) -/(^ N M 2 (3(30 counts) VO M 2 (360 counts)
VA N M 3(180 counts) M 3 (180 counts} VA 4 Jvl 3j[180 coun(B) л/h 4
^/A ^ M 4 (90 counts) VA 4 IvU (90 counts) VA N M 4 (90 counts)
4 ivt 5 (45 counts)
Рис. 8. Ветки вейвлет-пакета, отобранные для идентификации спокойного дня по данным
магнитного поля Земли.
Оценка модели ВПАР производилась на основе обработки модельных и природных сигналов. В ачестве природных сигналов использовались данные подпочвенного радона АОИп и критической стоты £,Р'2.
Для исследования свойств модели ВПАР генерировались процессы авторегрессии порядка р, = 4,5, и производилась их обработка на основе модели ВПАР. Результаты сравнения арактеристик исходного авторегрессионного процесса и полученной, после его обработки, модели ПАР показали:
• на основе применения конструкции вейвлет-преобразования шумовые составляющие авторегрессионного процесса отображаются в пространства деталей W|;
• структура исходного сигнала . упрощается, вследствие чего понижается порядок авторегрессионной модели;
• наблюдается значительное уменьшение остаточных ошибок авторегрессионной модели.
На рис.9 показаны графики остаточных ошибок моделей авторегрессии до обработки (рис.9.а) и осле обработки (рис.9.в), и спектральные характеристики этих процессов (рис.9.6 и рис.9.г). До бработки вейвлетами модель авторегрессии имела 5-ый порядок, после обработки вейвлетами дентифицирована модель порядка 4.
а б
Спектральные характеристики процессов до обработки (б) и после обработки (г).
В процессе обработки данных подпочвенного радона АСЖл идентифицирована модель ВПАР ида:
>1 4-1 /=1
де коэффициенты с// являются детализирующими коэффициентами всйвлет-разложения, Ч1' -
азисный вейвлет, ф{.....ф$ - коэффициенты авторегрессии, со, = Ус,4, коэффициенты с* являются
проксимирующими коэффициентами 4-го масштабного уровня вейвлет-разложения, N - длина игнала.
Анализ модели позволил выявить разномасштабные аномальные особенности в структуре сигнала СЖп, предшествующие сильным сейсмическим событиям на Камчатке. На основе составляющей
4
одели /](') = ХХ^'^7* выявлены короткопериодные аномальные особенности,
м ш
аблюдающиеся непосредственно перед землетрясениями, что имеет важное значение для перативного прогноза. С целью выявления возможных среднесрочных аномальных особенностей,
произведен анализ составляющей модели /2(0 = Анализ остаточных ошибок этой
(-1
компоненты позволил обнаружить краткосрочные аномальные особенности перед сильными землетрясениями. Выявленные аномальные области показаны на рис.10, 11 пунктирными линиями, стрелками показаны моменты возникновения сильных сейсмических событий.
1 ,1
1997г. 1998г.
1999т/. \
2000г
20 СЭСЭ
1 ООО
^ооо
еооо
гооо
1 1 1 1 1
1 — » — 1 » 1 1 1 1
! 'Ч ' 1 — ' \ ' » <| 1 1.' . 1 \ \ 1 1 1 1/
1 ' ■ ■
т 1 * - ' М 1 М 1 1 1 ■¡г----------1"..........
1, 1
Рис. 10. Данные регистрации подпочвенного'радона ОАЯп (а); детали 1-4-го уровней вейвлет-разложення (б, в, г, д); суммарные значения вейвлет-коэффициентов в скользящем временной окне
(е). Стрелками отмечены моменты возникновения сейсмических событий, пунктирной линией показаны аномальные области.
1997г. 1998г. 1999г. 2000г. 2001г.
б
2002г.
2003г.
Рис.11. Модель сглаженной составляющей сигнала АОЯп (а) и ошибки модели (б). Стрелками показаны моменты возникновения землетрясений, пунктирной линией выделены аномальные
области, а
Рис. 12. Сигнал подпочвенного радона ОАНп (а); сглаженная компонента сигнала ОАНп (6); остаточные ошибки модели АРПСС сглаженной компоненты сигнала ОАЯп (в).
Выполнено сравнение эффективности предложенного метода с традиционными подходами. С этой целью была произведена процедура сглаживания сигнала подпочвенного радона ОАЯп на основе метода скользящего среднего с последующей попыткой идентификации модели АРПСС. Процесс идентификации модели АРПСС оказался безуспешным: наблюдалась существенная автокорреляция остатков, свидетельствующая о неадекватности полученной модели. На рис.12 показан исходный сигнал подпочвенного радона ОАЯп и результаты его обработки: (а) сигнал подпочвенного радона ОАЯп; (б) сглаженная компонента сигнала ОАКп; (в) остаточные ошибки модели АРПСС сглаженной компоненты сигнала ОАЯп.
Анализ сигнала критической частоты ^2 показал, что он имеет сложную структуру, существенное влияние на данные регистрации оказывают внешние факторы. Для сейсмически спокойных лет идентифицированы модели ВПАР. Параметры моделей оказались достаточно близки между собой. В результатах моделирования проявил себя солнечный двенадцатилетний цикл. Модели этих лет имеют наибольшее сходство друг с другом: константы, характеризующие средний уровень процесса, и параметры моделей.
Общий вид модели сигнала критической частоты ^2 в сейсмически спокойные периоды времени имеет вид:
>1 *=1 м
где (}[ являются детализирующими коэффициентами вейвлет-разложения, - базисный вейвлет, ф ,...,ф5 - коэффициенты авторегрессии, со, = Ус'к, ск являются аппроксимирующими коэффициентами 4-го масштабного уровня вейвлет-разложения, N - длина сигнала.
Анализ модели показал, что в большинстве случаев накануне сейсмических событий наблюдается резкое увеличение амплитуды колебаний (область увеличения амплитуды колебаний показана на рис.13 пунктирной линией), в отдельных случаях наблюдается незначительное увеличение остаточной ошибки модели (момент увеличения остаточной ошибки модели показан на рис.14 стрелкой).
5^2 за 1985 г.
Оценка модели ВПНС выполнена в работе на основе обработки модельных и природных гналов. В качестве природных сигналов использовались сигналы критической частоты №2. В процессе обработки сигнала показано, предложенные в работе методы формирования чающего множества для нейронной сети позволяют:
1. сократить время обучения сети в 5 раз;
2. уменьшить ошибку сети в 40раз;
3. увеличить шаг упреждения в 3 раза.
На рис.15, 16 показаны результаты работы нейронной сети при подаче на ее вход сигнала Г0Р2 1977г.: (рис.15.а) вектор ошибки сети до обработки вейвлетами; (рис.15.б) вектор ошибки сети еле обработки вейвлетами; (рисЛб.а) дисперсия ошибки сети в скользящем временном окне до аботки вейвлетами; (рис. 16.6) дисперсия ошибки сети в скользящем временном окне после аботки вейвлетами.
400 Ш 800 1000 Ш Ш
Рис. 15. Сравнение двух методов обработки: метод НС и метод ВПНС: вектор ошибки сети до обработки вейвлетами (а); вектор ошибки сети после обработки вейвлетами (б).
1400
0.01 0.005
V 200 400 600 800 1000 1200 1400
Рис. 16 Сравнение двух методов обработки: метод НС и метод ВПНС: дисперсия ошибки сети в скользящем временном окне до обработки вейвлетами (а); дисперсия ошибки сети в скользящем
временном окне после обработки вейвлетами (б). На основе модели ВПНС разработана система прогнозирования данных критической частоты 2, полученных автомагической ионосферной станцией, расположенной в п.Паратунка
(ф = 52.97°с.ш., А. = 158.25° в.д. п-ов Камчатка). Для экспериментов были взяты результат измерений за период с 1971 по 2006 гг.
Формальная модель сигнала критической частоты имеет вид:
т-
<Рг\ 2>л
^ < я
40
//у
+ >
где ^(г) = -
1
(г) = к * г + Ъ ,й)1 - весовые коэффициенты первого слоя нейронн
1 + ехр(-г))
сети, со, - весовые коэффициенты второго слоя нейронной сети,
базисный вейвлет, сп
вейвлет-коэффициенты реконструированных сигналов, с1 - детализирующие вейвле коэффициенты.
Анализ работы системы, построенный на основе сопоставления выявляемых аномальнь особенностей сигнала с данными каталога сейсмический явлений показал: накануне сильнь сейсмических событий на Камчатке в большом числе случаев наблюдается значительное увеличен ошибки сети. На рис.17, в качестве примера, показан результат работы сети, в качестве тестов выборки использовались данные критической частоты ^2 зимнего периода 1973г. Моме! произошедшего землетрясения отмечен на рисунке стрелками.
Сигнал за 1973год
29.01 06.02
Ошибка за 197Эгод
лу^Г^ "ЧугчМ^ Д)
29.01 05.02
Дисперан ошибки за 1973год
>3.01 15.01 22.01 29.01 05.02 12.02 19.02 23.02 2
Рис.17 Результат работы нейронной сети: компонента сигнала критической частоты за 1973г. (а); ошибка сети (б); дисперсия ошибки сети, рассчитанная в скользящем временном окне, равном одни.
суткам (с).
Основные теоретические и прикладные результаты работы:
1. Предложена и исследована новая математическая конструкция - многокомпонентн модель временного ряда (ММВР), лежащая в основе построения модели сложного природно сигнала и позволяющая,
• выполнить оценку модели в случае, когда данные имеют сложное априор неизвестное распределение;
• дает возможность адаптивного определения аппроксимирующих функций зависимости от структуры исходных данных;
• позволяет отобразить в модели изолированные особенности структуры
моделируемых данных, что важно при решении задач выявления и классификации аномалий.
2. На основе конструкции кратномасштабного анализа и вейвлет-пакетов построено ображение компонентов сложного сигнала в пространство веквлет-образов и доказано, что
олученные компоненты являются компонентами ММВР.
3. Предложены критерии выбора базисной функции, обеспечивающие построение наилучшей проксимирующей схемы (НАС) сигнала. Разработаны численные методы идентификации мпонентов ММВР, в основе которых лежит НАС сигнала, обеспечивающая минимизацию числа шроксимирующих слагаемых и минимизацию погрешности аппроксимации для сложных сигналов.
4. На основе минимаксного подхода разработаны способы оценки и оптимизации одели. Оптимизация модели выполняется путем выбора наилучшего порога, адаптируемого к нным, и путем выбора наилучшей базисной функции.
5. Разработаны методы идентификации изолированных особенностей и устойчивых рактеристик структуры сложного сигнала.
6. Предложены' и исследованы два способа оценки параметров ММВР: первый, -нованный на совмещении методов АРПСС и вейвлет-преобразования, позволяет выполнить оценку араметров модели в случае, когда компоненты имеют линейную структуру; второй, базирующийся а совместном использовании методов нейронных сетей и вейвлет-преобразования, позволяет встроить аппроксимирующую функцию в случае, когда структура компонент существенно елинейная. Разработаны методы и алгоритмы идентификации новых моделей, описаны их свойства, оказано, что совместное применение конструкции вейвлет-преобразования и модели АРПСС озволяет понизить порядок авторегрессионной модели и улучшить ее характеристики. Данный факт одтвержден результатами экспериментов. На основе экспериментов с природным сигналом оказано, что совместное применение конструкции вейвлет-преобразования и нейронных сетей озволяет оптимизировать процедуру обучения сети и улучшить качество ее работы.
7.' Предложены и реализованы численные алгоритмы автоматического обнаружения зменений параметров многокомпонентной модели применительно к задаче обнаружения
омальных эффектов в структуре сложного сигнала. Эффективность предложенных алгоритмов одтверждена теоретически и результатами экспериментов.
8. На основе построенной , НАС сигнала разработана техника выделения едковстречающихся особенностей и характерных элементов его структуры. На примере обработки риродных сигналов показано, что применение данной техники позволяет улучшить качество бучающей выборки для Нейронной сети, и обеспечивает уменьшение ошибки сети.
9. Разработаны и исследованы способы и алгоритмы классификации изолированных собенкостей в структуре сигнала. На основе обработки модельных сигналов показано, что, .ногомасштабная изолированная особенность с амплитудой, превышающей фоновый уровень в 1,3 аза, позволяет себя обнаруживать с вероятностью 0,99.
10. На основе разработанного аппарата предложен метод автоматического определения ндекса геомагнитной активности К, построены модели сигналов подпочвенного радона ОЛРл и ритической частоты ^2. Анализ модели сигнала подпочвенного радона ОАКп показал, что перед ильными землетрясениями в сигнале наблюдаются короткопериодные аномальные особенности, оторые выявлены на основе детализирующей составляющей модели. Анализ сглаженной омпоненты модели позволил обнаружить краткосрочные аномалии продолжительностью от ескольких дней до полутора месяцев, предшествующие сильным сейсмическим явлениям. Анализ труктуры сигнала критической частоты Г0Р2 показал, что в периоды повышения сейсмической ктивности на Камчатке он имеет сложную структуру, поэтому идентификация модели базировалась а совместном использовании вейвлет-преобразования и нейронных сетей. На основе полученной одели разработана система прогнозирования. Анализ работы системы показал, что накануне ильных сейсмических событий на Камчатке наблюдается значительное увеличение ошибки сети.
11: Предложен метод оценки плотности распределения случайной величины на основе ейвлет-преобразования, позволяющий адаптивно подобрать аппроксимирующую функцию и ыполнить оценку в случае, когда распределение оцениваемой функции имеет сложную форму, нализ результатов обработки данных сейсмического каталога п-ова Камчатка подтвердил ффективность предложенного метода и позволил выделить периоды сильного повышения ейСмической активности на Камчатке, которые предшествовали сильным землетрясениям.
ОПУБЛИКОВАННЫЕ РАБОТЫ ПО ТЕМЕ ДИССЕРТАЦИИ
книги:
1. Богданов В.В., Геппенер В.В., Мандрикова О.В. Моделирование нестационарн временных рядов геофизических параметров со сложной структурой. - С.-Петербург: ЛЭТИ.2006 108с.
2. Мандрикова О.В. Моделирование геохимических сигналов на основе вейвл преобразования. - Владивосток: Дальнаука.2007. - 123с.
статьи из изданий, рекомендованных ВАК:
3. Мандрикова О.В. Непараметрическое моделирование сейсмических данных использованием сплайн-вейвлетов //Известия СПбГЭТУ "ЛЭТИ" (Известия Государствен!) электротехнического университета), Серия "Информатика, управление и компьютерные технологи
— С.-Петербург. 2002 г. №4. С.77-81.
4. Фирстов П.П., Филиппов Ю.А., Мандрикова О.В. Предвестниковые аномалии сильн землетрясений в динамике подпочвенного радона на Петропавловск-Камчатском геодинамическ полигоне в 1997-2001ГГ//Доклады РАН. 2003.Т.389.№6. С.810-813.
5. Геппенер В.В., Мандрикова О.В. Совмещение параметрического и непараметрическ подходов к построению моделей нестационарных временных рядов, имеющих сложную структуру целью повышения качества их обработки //Известия СПбГЭТУ "ЛЭТИ", (Известия Государствен!! электротехнического университета), Серия "Информатика, управление и компьютерные технологи
— С.-Петербург. 2003 г. №2. С.14-17.
6. Мандрикова О.В. Многоструктурная модель геофизического сигнала. //Известия вуз Северо-Кавказский регион, — Ростов-на-Дону, Серия естественные науки.-2007 г.-№6,- С.47-50.
7. Мандрикова О.В., Богданов В.В. Исследование сигнала критической частоты на осн конструкции вейвлет - разложения. //Известия вузов, Северо-Кавказский регион, Серия естествен науки. Науки о Земле. — Ростов-на-Дону, Спецвыпуск. 2007 г. С.90-93.
8. Мандрикова О.В., Богданов В.В. Полозов Ю.А. Моделирование сигналов со сложной структурой на основе конструкции вейвлет-преобразования. // Информационные технологии. — Москва. 2008 г. №4. С.12-19.
9. Мандрикова О.В., Богданов В.В. Аппроксимация статистического распределе случайной величины на основе конструкции вейвлет-преобразования. //Известия вузов, Севе Кавказский регион, Серия технические науки. — Новочеркасск, №3. 2008 С.53-57.
10. Мандрикова О.В., Портнягин H.H., Полозов Ю.А. Способ построения модели времени ряда на основе совместного применения методов нейронных сетей и конструкции вейв преобразования.// Иззестия вузов, Северо-Кавказский регион, Серия технические науки. Новочеркасск, №4.2008 г. С.5-8.
И. Богданов В.В., Мандрикова О.В. Анализ распределений вероятностей пот сейсмических событий перед сильными землетрясениями на основе метода вейвлет-разложения Автоматизация и современные технологии. —Москва. 2008 г. №6. С.14-17. из других изданий:
12. Мандрикова О.В. Тристанов А.Б. Исследование локальных особенностей временного р с использованием пакета Wavelet Toolbox. // труды Всероссийск. научн. конф. "Проектирова научных и инженерных приложений в среде Matlab". — Москва: ИПУ РАН, 28-29 мая 2002г., С.2 261
13. Мандрикова О.В., Тристанов А.Б., Фирстов П.П. Представления о вейвлет-анализ возможность его использования для рядов мониторинга подпочвенного радона на Петропавло Камчатском геодинамическом полигоне //сбор. ст. «Проблемы современной науки» Тр. КамчатГТУ. Вып. 16 — Петропавловск-Камчатский: Издательство КамчатГТУ, 2002г., С.139-153.
14. Мандрикова О. В., Фирстов П. П. Сплайн-вейвлеты как инструмент обработки и анал краткосрочных вариаций геохимических компонентов. // Матер. Междунар. научн.-практич. ко "Рыбохозяйственное образование Камчатки в XXI веке". — Петропавловск-Камчатский, 15 октября 2002 г.: Издательство КамчатГТУ, С.261-270.
15. Геппенер В.В., Мандрикова О.В., Фирстов П.П. Прогнозирование сейсмичес активности с использованием многоструктурной модели геохимических данных // Междунар. ко по мягким вычислениям и измерениям (SCM'2003): [сб. докл.]. — Санкт-Петербург, 23-24 и 2003г.:Издательство СПбГЭТУ "ЛЭТИ", СПб, Т.2., С. 194-197.
16. Богданов В.В., Мандрикова О.В. Вариации в распределении вероятностей пот сейсмических событий по глубине и времени перед сильными землетрясениями (на прим
оноцкого землетрясения) // Солнечно-земные связи и предвестники землетрясений: III ждународное совещание 16-21 августа 2004г. с. Паратунка: [сб. докл.]. - П.-Камчатский, 2004. 31-35
17. Богданов В.В., Мандрикова О.В. Непарамстрическое моделирование ионосферных данных азисе вейвлетов на примере критической частоты f0F2 // Солнечно-земные связи и предвестники летрясений: III международное совещание 16-21 августа 2004г. с. Парагунка: [сб. докл.]. - П,-мчатский. 2004. С.35-42. .
18. Богданов В.В., Мандрикова О.В. Исследование временных рядов распределений оятностей сейсмических событий методом вейвлет-разложения (Кроноцкое землетрясение, .12.97, Камчатка) // Междунар. конф. по мягким вычислениям и измерениям (SCM'2005): [сб. кл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2005. Т.2 С.162-164.
19. Богданов В.В., Мандрикова О.В., Корнев Е.В., Шумилова А.Л., Конюхов A.B. Об омалиях в ионосферных процессах Камчатского региона накануне сейсмических событий // стник КамчатГТУ., Выпуск 4. — П.-Камчатский, 2005. С.52-56.
20. Богданов В.В., Мандрикова О.В. Вейвлет-анализ распределений вероятностей "омических событий Камчатского региона накануне Кроноцкого землетрясения // Вестник мчатГТУ. Выпуск 4. — П.-Камчатский, 2005. С.56-59.
21. Мандрикова О.В., Богданов В.В., Конюхов A.B. Оптимизация обучения нейронной сети на нове вейвлет-преобразования на примере модельного представления ионосферного сигнала // еждунар. конф. по мягким вычислениям и измерениям (SCM'2006): [сб. докл.]. — Санкт-тербурп Издательство СПбГЭТУ "ЛЭТИ", СПб, 2006. T.l. С.223-226.
22. Мандрикова О.В., Богданов В.В., Павлов A.B. Изменения в распределении вероятностей зникновеция землетрясений по глубине накануне Кроноцкого землетрясения. (05.12.97 г.) // ждунар. конф. по . мягким, вычислениям и измерениям. (SCM'2006): [сб. докл.]. — Санкт-тербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2006. Т. 2. С.153-157.
23. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Моделирование сигнала критической стоты на основе нейронных сетей с целью поиска аномального поведения // Междунар. конф. по гким вычислениям и измерениям (SCM'2006): [сб. докл.]. — Санкт- Петербург: Издательство 6ГЭТУ "ЛЭТИ", СПб, 2006. Т.2. С.158-160.
24. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Анализ изменений, происходящих в носферных параметрах накануне сильных землетрясений на Камчатке, на основе вейвлет-еобразования сигналов критической частоты. // Междунар. конф. по мягким вычислениям и мерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 07, С. 213-216.
25. Богданов В.В., Мандрикова О.В., Павлов A.B., Шумилова А.Л. Вероятностная терпретация закона Гутгенберга-Рихтера и оценха времени повторений сильных Камчатских млетрясений с магнитудой 9 и 9,5 баллов. // Междунар. конф. по мягким вычислениям и мерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 07, С.177-181.
26. Мандрикова О.В., Богданов В.В. Исследование вариаций распределения сейсмических бытий по глубине на основе применения конструкции вейвлет-преобразования // Междунар. конф.
мягким вычислениям и измерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство 6ГЭТУ "ЛЭТИ", СПб, 2007, С. 209-212.
27. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Выявление аномальных изменений в носферных параметрах на основе модельного представления сигналов критической частоты foF2 // лнечно-земные связи и предвестники землетрясений: IV международное совещание 16-21 августа 07г. с. Паратунка: [сб. докл.]. - П.-Камчатский. 2007. С. 213-216.
28. Богданов В.В., Мандрикова О.В. Анализ изменений в распределении вероятностей йсмических событий по глубине на основе вейвлет-разложений. // Солнечно-земные связи и едвестники землетрясений: IV международное совещание 16-21 августа 2007г. с. Паратунка: [сб. кл.]. - П.-Камчатский. 2007. С. 260-263.
29. Богданов В.В., Родткин М.В., Мейстер К.В., Силина A.C., Липеровская Е.В., Мандрикова .В. Статистический анализ возмущений критической частоты foF2 ионосферы за несколько суток до после землетрясения по материалам станции «Петропавловск-Камчатский» и «Токио» Солнечно-мные связи и предвестники землетрясений: IV международное совещание 16-21 августа 2007г. с. аратунка - П.-Камчатский. 2007. С.378-384.
30. Мандрикова О.В., Богданов B.B. Multistructural models of geophysical signals. 8 International Conference on PATTERN RECOGNITION and IMAGE ANALYSIS: NEW INFORMATIO TECNOLOGIES, October 8-12, 2007, (PRIA-8-2007): Conference Proceedings. Vol. 3. - Yoshkar-Ol 2007. C.81-84.
31. Мандрикова O.B., Богданов B.B., Полозов Ю.А. Автоматизированный метод выделени аномальных изменений в ионосферных параметрах накануне сильных землетрясений на Камчатке Междунар. конф. по мягким вычислениям и измерениям (SCM'2008): [сб. докл.]. — Санк Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2008. С.122-125.
32. Мандрикова О.В. Многокомпонентная модель временного ряда. // Междунар. конф. п мягким вычислениям и измерениям (SCM'2008): [сб. докл.]. — Санкт- Петербург: Издательств СПбГЭТУ "ЛЭТИ", СПб, 2008. С.152-155.
33. Мандрикова О.В., Горева Т.С. Построение модели сигнала критической частоты на осно вейвлет-пакетов // Вестник КамчатГТУ. Выпуск 7 — П.Камчатский. 2008. С.53-59.
34. Мандрикова О.В. Многокомпонентная модель временного ряда. // Вестник КамчатГП Выпуск 7 — П.Камчатский, 2008. С.41-46.
35. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Автоматический алгоритм выделени аномальных изменений в ионосферных параметрах на основе обработки сигналов критическо частоты f0F2 и индексов геомагнитной активности К // Вестник КамчатГТУ. Выпуск 7. П.Камчатский, 2008. С. 47-52.
36. Мандрикова О.В., Смирнов С.Э. Автоматический метод определения K-индекса п магнитным данным на основе вейвлетов. // Вестник КамчатГТУ. Выпуск 7. — П.Камчатский, 2008. 60-63.
37. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Метод обработки сигналов со сложно структурой на основе совмещения конструкции вейвлет-преобразования и нейронных сетей // 5 научная конференция «Управление и информационные технологии» (УИТ-2008) [сб. докл.]. — Санк Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2008. С.207-209.
Подписано в печать 17.02.2009. Формат 60x84/16 Отпечатано с готового оригинал-макета в типографии ЗАО «КопиСервис». Печать ризографическая. Заказ № 1/0217. П. л. 2.0. Уч.-изд. л. 2.0. Тираж 100 экз.
ЗАО «КопиСервис» Адрес: 197376, Санкт-Петербург, ул. Проф. Попова, д. 3. тел.: (812) 327 5098
Оглавление автор диссертации — доктора технических наук Мандрикова, Оксана Викторовна
ВВЕДЕНИЕ.
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ. ОСНОВНЫЕ ПОДХОДЫ К ПОСТРОЕНИЮ МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ
1.1. Постановка задачи.
1.1.1. Структура природного сигнала.
1.1.2. Влияние внешних факторов на данные регистрации.
1.2. Обзор традиционных методов анализа данных, представленных в виде временных рядов.
1.3. Способ построения модели временного ряда с использованием нейронных сетей.
1.3.1. Известные архитектуры сетей.
1.3.2. Решение задач построения прогноза на основе нейронных сетей.
1.3.3. Особенности решения задач на основе нейронных сетей.
1.4. Современные методы аппроксимации сигналов, основанные на разложении сигнала по базису.
1.5. Прикладные задачи, рассмотренные в диссертационной работе.-.
1.5.1. Задачи анализа геофизических сигналов.
1.5.2. Обзор существующих методов геофизических исследований.
1.6. Новый подход к проблеме построения моделей временных рядов со сложной структурой.
Выводы.
ГЛАВА 2. ИДЕНТИФИКАЦИЯ КОМПОНЕНТ ММВР.
2.1. Вейвлет-образ случайной функции у.
2.2. Конструкции, используемые для идентификации компонент
2.3. Методы выделения и классификации изолированных особенностей в структуре случайного сигнала.
2.4. Методы выделения устойчивых характеристик в структуре сигнала.
2.5. Метод построения наилучшей аппроксимирующей схемы случайного сигнала.
2.5.1. Критерии выбора базисных функций.
2.5.2. Семейства ортогональных и полуортогональных вейвлетов с наименьшим носителем.
2.5.2.1. Ортогональные вейвлеты Добеши с компактным носителем.
2.5.2.2. Койфлеты.
2.5.2.3. Сплайн-вейвлеты.
2.5.3 Удаление шума на основе аппроксимирующих вейвлет-схем.
2.5.4. Уточнение аппроксимирующей схемы сигнала на основе выбора «наилучшего» базиса.
2.5.5. Метод идентификации структурных компонентов сложного сигнала.
2.6. Методика идентификации компонентов модели.
2.7. Оценка адекватности модели.
2.7.1. Минимаксный подход как способ оценки модели сложного сигнала.
2.7.2. Метод оптимизации модели путем улучшения порога.
2.7.3. Метод оптимизации модели путем определения наилучшего базиса.
2.7.4. Диагностика модели.
Выводы.Ю
ГЛАВА 3. ОЦЕНКА ПАРАМЕТРОВ МНОГОКОМПОНЕНТНОЙ
-МОДЕЛИ-НА-ОСНОВЕСОВМЕЩЕНИЯВЕЙВЛЕТ—
ПРЕОБРАЗОВАНИЯ И МОДЕЛИ АРПСС.
-43.1. Способ оценки параметров многокомпонентной модели.
3.2. Процессы APIICC
3.3. Решение задами прогнозирования знамении временного ряда на основе модели APIICC.
3.4. Идентификация модели APIICC.
3.5. Многокомпонентная модель временного ряда, получаемая на основе совмещения конструкции вейвлет-преобразоваиия и методов АРПСС.
3.5.1. Общий вид модели.
3.5.2. Этапы идентификации модели.
3.5.3. Свойства модели.
3.6. Методы и алгоритмы обнаружения и классификации аномалий в сигнале на основе модели ВПАР.
Выводы
ГЛАВА 4. ОЦЕНКА ПАРАМЕТРОВ МНОГОКОМПОНЕНТНОЙ МОДЕЛИ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ.
4.1. Постановка задами экстраполяции функции на основе нейронных сетей.
4.2. Методы формирования обучающего и контрольного множеств для нейронной сети.
4.2.1. Понижение размерности пространства признаков на основе удаления шумовой компоненты.
4.2.2. Выделение характерных признаков, устранение несущественных и редковстречающихся признаков.
4.3. Общий вид модели временного ряда. Оценка модели.
4.4. Прогнозирование значений временного ряда на основе нейронной сети. Выделение аномалий.
Выводы
ГЛАВА 5. ОЦЕНКА ПЛОТНРХТИРАСПРЕДЕЛЕНИЯ-СЛУЯАЙНОЙ
ВЕЛИЧИНЫ НА ОСНОВЕ ВЕЙВЛЕТтПРЕОБРАЗОВАНИЯ.
5.1. Способ оценки плотности распределения случайной величины на основе вейвлет-преобразования.
5.2. Оценка плотности распределения сейсмических событий
Камчатского региона по глубине.
Выводы.
ГЛАВА 6. ПОСТРОЕНИЕ МОДЕЛЕЙ ПРИРОДНЫХ СИГНАЛОВ СО СЛОЖНОЙ СТРУКТУРОЙ.
6.1. Описание программного обеспечения.
6.2. Реализация метода статистического моделирования.
6.2.1. Статистическая модель системы.
6.2.2. Формирование входных модельных сигналов.
6.2.3. Методика идентификации изолированных особенностей в сигнале.
6.2.4. Оценка характеристик.
6.2.5. Проведение экспериментов с модельными сигналами на основе модели ВПАР.
6.3. Автоматизация вычисления K-индекса на основе вейвлет-пакетов.
6.3.1. Постановка задачи.
6.3.2. Описание методики.
6.3.3. Автоматический алгоритм определения K-индекса.
6.3.4. Результаты экспериментов.
6.4. Построение многокомпонентной модели подпочвенного радона OARn.
6.4.1. Описание статистических данных.
6.4.2. Значение геохимических методов для краткосрочного прогноза землетрясений.
6.4.3. Влияние внешних факторов на данные регистрации OARn.202 6.4.4.Методикадошраенжялуюдед^^
-66.4.5. Методика обнаружения и классификации аномалий в данных
ОАЫп.
6.4.6. Результаты обработки данных радона.
6.4.6.1 Выделение и анализ детализирующих компонент модели.
6.4.6.2. Процесс идентификации АР-модели для сглаженной компоненты сигнала.
6.4.6.3. Эксперименты по обнаружению среднесрочных аномалий в сглаженной компоненте модели.
6.4.6.4. Применение к данным подпочвенного радона традиционных методов.
6.5. Построение многокомпонентной модели сигнала критической частоты
6.5.1. Описание статистических данных.
6.5.2. Значение геофизических методов для решения задачи прогноза землетрясений.
6.5.3. Влияние внешних факторов на данные регистрации ^2.
6.5.4. Этапы построения модели сигнала критической частоты ^2.
6.5.5. Результаты обработки данных радона.
6.5.5.1. Идентификация структурных компонент сигнала ^2. Выделение детализирующих составляющих модели.
6.5.5.2. Анализ сигналов ^2 и данных К-индекса на основе непрерывного вейвлет-преобразования.
6.5.5.3. Оценка параметров сглаженной компоненты модели сигнала критической частоты на основе конструкции ВПАР.
6.5.5.4. Анализ сглаженной компоненты модели ВПАР.
6.5.5.5. Аппроксимация сигнала критической частоты на основенейрш1цойсети. .-.-.-^.245
-76.5.5.6. Построение модели сигнала критической частоты на основе конструкции ВПНС.
6.5.5.6.1. Оптимизация процедуры обучения сети на основе подавления шумовой компоненты.
6.5.5.6.2. Оптимизация модели ВПНС на основе выделения несущественных и редко встречающихся признаков.
Выводы.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Мандрикова, Оксана Викторовна
Настоящая работа посвящена разработке математических моделей для аналитического, описания природных сигналов со сложной структурой. Наличие модели природного сигнала, несущего информацию об исследуемом процессе либо явления природы, значительно расширяет возможности их изучения, и позволяет решать задачу предсказания их поведения во времени. Наряду с другими методами исследований анализ статистических данных имеет очень важное значение в физике, геофизике, медицине, финансовом анализе и др. областях знаний. Первая задача, которая стрит перед исследователем, найти способ уменьшить размерность системы и выявить структурные компоненты, наиболее полно описывающие исследуемый природный процесс. Не случайно на протяжении последних 20-30 лет в центре внимания ученых, связанных с обработкой статистических данных, находится проблема выделения полезных сигналов на фоне помех. В настоящее время наблюдается рост сети станций регистрации сигналов и вследствие чего возникновение больших массивов статистических данных, развиваются методы их обработки. Это позволяет решить данную задачу на принципиально новом уровне. В диссертационной работе рассматривается класс задач, связанных с обнаружением и классификацией аномальных эффектов в природных сигналах. Аномальное поведение регистрируемых геопараметров может содержать резкие всплески, сопровождаться серией пиков, иметь ступенеобразный вид. Относительная величина и временная протяженность таких аномалий зависит от многих факторов. Эти аномальные особенности содержат полезную информацию об изучаемом процессе и не могут быть отфильтрованы как шум. Сложная структура возникновения аномалии, а также наличие мешающих факторов различной природы делают невозможным непосредственное применение к ним существующих регрессионных и других статистических моделей временных рядов. Е.схес1венныминаиболееэффекхивнымспособом—представления—таких-сигналов является построение нелинейных адаптивных аппроксимирующих схем на основе экстраполирующих фильтров. Инструментом, позволяющим реализовать такую процедуру для сигналов с подобными особенностями, является вейвлет-преобразование. В настоящее время ведутся интенсивные исследования по применению этого метода в различных прикладных задачах, связанных с анализом статистических данных. Несмотря на то, что данный метод в последнее время получает широкое распространение при обработке природных сигналов в геофизике, общей теории по применению этого аппарата в анализе регистрируемых геопараметров нет. В диссертационной работе вейвлет-преобразование является инструментом аналитического исследования, лежащего в основе построения моделей временных рядов со сложной структурой. Проведенные в работе исследования привели к созданию класса моделей, в основе которых лежит математическая конструкция, названная многокомпонентной моделью временного ряда (ММВР), представляющая исходный временной ряд в виде некоррелированных разномасштабных компонент с различной формой и временной протяженностью. На основе данной конструкции построена общая теория построения модели временного ряда, разработаны методы идентификации и оценки моделей, описаны их свойства. Разработан комплекс методов и алгоритмов обработки данных, основанных на предложенных моделях и служащих теоретической базой для построения автоматизированных систем анализа статистических данных и выполнения прогноза.
Расширяя область традиционных методов моделирования временных рядов, введенные математические конструкции позволяют построить адаптивную многокомпонентную модель с учетом внутренней структуры исходных данных и отобразить как характерные, так и изолированные особенности его структуры. Это играет важную роль в задачах анализа природных сигналов в геофизике, физике, геоэкологии, геологии, где состояние среды является суперпозицией большого количества нелинейных взаимодействий между различными процессами [6, 8, 12, 43]. Природные сигналы могут включать в себя нерегулярные, иерархические структуры. Способы идентификации моделей таких сигналов основаны в работе на совместном применении моделей авторегрессии-проинтегрированного скользящего среднего (АРПСС) и методов нейронных сетей с вейвлет-преобразованием.
При этом решены следующие задачи:
1. Разработана новая математическая конструкция — многокомпонентная модель временного ряда, позволяющая идентифицировать локальные особенности различной формы и временной протяженности в структуре сложного сигнала.
2. Разработаны способы идентификации ММВР для сложных сигналов, обеспечивающие выделение существенных компонентов структуры сигнала и эффективное вейвлетное подавление шума.
3. Разработаны методы оценки параметров ММВР, основанные на совмещении методов АРПСС и методов нейронных сетей с вейвлет-преобразованием.
4. Разработаны методы и алгоритмы выявления и классификации изолированных особенностей в структуре сигнала и идентификации устойчивых характеристик временного ряда.
5. Построенный аппарат применен к исследованию геофизических сигналов с широким спектром флуктуаций различных масштабов.
6. Предложено использование построенного аппарата для оценки плотности распределения случайной величины.
7. Разработано программное обеспечение системы для автоматического обнаружения и классификации локальных аномальных особенностей в геохимических и геофизических сигналах на базе ПЭВМ.
Заключение диссертация на тему "Многокомпонентные модели и алгоритмы анализа аномальных геофизических сигналов"
ВЫВОДЫ
1. На основе экспериментов с модельными сигналами показано:
1.1 предложенные в работе методы и алгоритмы по выявлению краткосрочных аномальных эффектов позволяют обнаруживать изолированные особенности в сигнале, по амплитуде превышающие фоновый уровень в 1.3 раза и более, с вероятностью 0,99;
1.2 применение конструкции ВПАР обеспечивает понижение порядка АР-модели и улучшает ее характеристики;
1.3 предложенные в работе методы и алгоритмы по выявлению среднесрочных аномалий позволяют обнаруживать момент разладки в системе, когда протяженность аномалии по времени составляет 10 отсчетов и более.
2. Предложенный в работе метод выделения структурных компонентов сложного сигнала на основе построения НАС нашёл свое применение в решении задачи автоматизации определения индекса геомагнитной активности К. На основе обработки магнитных данных п-ова Камчатка подтверждена эффективность метода.
3. На основе экспериментов с сигналами подпочвенного радона ОАКп показано, что конструкция ВПАР открывает широкие возможности в обработке сложных сигналов, в частности:
3.1 кратномасштабное представление сигнала и конструкция вейвлет-пакетов, лежащие в основе методов оценки компонент ММВР, позволяют выявить составляющие сложного процесса и идентифицировать разномасштабные аномальные эффекты, возникающие накануне сильных сейсмических явлений;
3.2 полученная в процессе обработки вейвлетами сглаженная компонента сигнала аппроксимируется АР-моделыо, что позволяет выявить среднесрочные и долгосрочные аномальные эффекты в данных ОА11п;
-2574. На основе экспериментов с сигналами критической частоты получены следующие важные научные и практические результаты:
4.1. Подтверждена эффективность метода аппроксимации сложного природного сигнала на основе НАС: выявлены скрытые закономерности в структуре сигнала ^2; обнаружена взаимосвязь между процессами, протекающими в ионосфере и сильными сейсмическими явлениями, показан характер взаимосвязи.
4.2. На основе совместной обработки сигналов критической частоты и данных индекса геомагнитной активности К Камчатки и Магадана и их сопоставления с данными сейсмического каталога выявлены разномасштабные аномальные эффекты в ионосферном процессе, которые предшествуют наиболее сильным сейсмическим событиям на Камчатке.
4.3. Подтверждена эффективность конструкции ВПНС: время обучения нейронной сети сокращено в 5 раз; ошибка сети снижена в 40 раз; шаг упреждения увеличен в 3 раза.
4.4. На основе анализа работы системы выявлены локальные аномальные эффекты в его структуре, в большинстве случаев возникающие накануне сильных сейсмических событий п-ова Камчатка.
Основные научные и практические результаты главы описаны в работах [12, 17, 18, 20, 26, 27, 43-47, 49-53, 55, 56, 58-66].
-258
ЗАКЛЮЧЕНИЕ
Проведенные в работе исследования привели к созданию класса моделей сигналов со сложной структурой, в основе которых лежит математическая конструкция, названная многокомпонентной моделью временного ряда, представляющая исходный случайный сигнал / в виде некоррелированных разномасштабных компонент ft с различной формой и временной протяженностью:
0 = х,/1(0 + х2/2(0 + . + хп/п(0(х1,х2,.,хп - параметры модели).
Введенная математическая конструкция расширяет область использования традиционных методов анализа временных рядов и позволяет выявить и классифицировать локальные особенности в сложном сигнале, тем самым получить информацию о структуре сигнала. Это играет важную роль в задачах анализа природных сигналов со сложной структурой. Составляющие процесса, компоненты f^ (7), имеют более простую структуру, чем исходный сигнал /, что облегчает процедуру оценки параметров модели. В работе разработаны способы оценки параметров модели на основе совмещения класса моделей авторегрессии-проинтегрированного скользящего среднего и методов нейронных сетей с вейвлет-преобразованием.
Основные научные и практические результаты работы можно сформулировать следующим образом:
1. Предложена и исследована новая математическая конструкция -многокомпонентная модель временного ряда (ММВР), лежащая в основе построения модели сложного природного сигнала и позволяющая,
• выполнить оценку модели в случае, когда данные имеют сложное априори неизвестное распределение процесса;
• дает возможность адаптивного определения аппроксимирующих функций в зависимости от структуры исходных данных;
• позволяет отобразить в модели изолированные особенности структуры моделируемых данных, что важно при решении задач выявления и классификации аномалий.
2. На основе конструкции кратномасштабного анализа и вейвлет-пакетов построено отображение компонентов сложного сигнала в пространство вейвлет-образов и доказано, что полученные компоненты являются компонентами ММВР.
3. Предложены критерии выбора базисной функции, обеспечивающие построение наилучшей аппроксимирующей схемы (НАС) сигнала. Разработаны численные методы идентификации компонентов ММВР, в основе которых лежит НАС сигнала, обеспечивающая минимизацию числа аппроксимирующих слагаемых и минимизацию погрешности аппроксимации для сложных сигналов.
4. На основе минимаксного подхода разработаны способы оценки и оптимизации модели. Оптимизация модели выполняется путем выбора наилучшего порога, адаптируемого к данным, и путем выбора наилучшей базисной функции.
5. Разработаны методы идентификации изолированных особенностей и устойчивых характеристик структуры сложного сигнала.
6. Предложены и исследованы два способа оценки параметров ММВР: первый, основанный на совмещении методов АРПСС и вейвлет-преобразования, позволяет выполнить оценку параметров модели в случае, когда компоненты имеют линейную структуру; второй, базирующийся на совместном использовании методов нейронных сетей и вейвлет-преобразования, позволяет построить аппроксимирующую функцию в случае, когда структура компонент существенно нелинейная. Разработаны методы и алгоритмы идентификации новых моделей, описаны их свойства. Показано, совместное применение конструкции вейвлет-преобразования и модели АРПСС позволяет понизить порядок авторегрессионной модели и улучшить ее характеристики. Данный факт подтвержден результатами экспериментов. На основе экспериментов с природным сигналом показано, совместное применение конструкции вейвлет-преобразования и нейронных сетей позволяет оптимизировать процедуру обучения сети и улучшить качество ее работы.
7. Предложены и реализованы численные алгоритмы автоматического обнаружения изменений параметров многокомпонентной модели применительно к задаче обнаружения аномальных эффектов в структуре сложного сигнала. Эффективность предложенных алгоритмов подтверждена теоретически и результатами экспериментов.
8. На основе построенной НАС сигнала разработана техника выделения редковстречающихся особенностей и характерных элементов его структуры. На примере обработки природных сигналов показано, что применение данной техники позволяет улучшить качества обучающей выборки для нейронной сети, и обеспечивает уменьшение ошибки сети.
9. Разработаны и исследованы способы и алгоритмы классификации изолированных особенностей в структуре сигнала. На основе обработки модельных сигналов показано, что, многомасштабная изолированная особенность с амплитудой, превышающей фоновый уровень в 1,3 раза, позволяет себя обнаруживать с вероятностью 0,99.
10. На основе разработанного аппарата предложен метод автоматического определения индекса геомагнитной активности К, построены модели сигналов подпочвенного радона ОАЯп и критической частоты ^2. Анализ модели сигнала подпочвенного радона ОАЯп показал, что перед сильными землетрясениями в сигнале наблюдаются короткопериодные аномальные особенности, которые выявлены на основе детализирующей составляющей модели. Анализ сглаженной компоненты модели позволил обнаружить краткосрочные аномалии продолжительностью от нескольких дней до полутора месяцев, предшествующие сильным сейсмическим явлениям. Анализ структуры сигнала критической частоты ^2 показал, что в периоды повышения сейсмической активности на
Камчатке он имеет сложную структуру, поэтому идентификация модели базировалась на совместном использовании вейвлет-преобразования и нейронных сетей. На основе полученной модели разработана система прогнозирования. Анализ работы системы показал, что накануне сильных сейсмических событий на Камчатке наблюдается значительное увеличение ошибки сети.
11. Предложен метод оценки плотности распределения случайной величины на основе вейвлет-преобразования, позволяющий адаптивно подобрать аппроксимирующую функцию и выполнить оценку в случае, когда распределение оцениваемой функции имеет сложную форму. Анализ результатов обработки данных сейсмического каталога п-ова Камчатка подтвердил эффективность предложенного метода и позволил выделить периоды сильного повышения сейсмической активности на Камчатке, которые предшествовали сильным землетрясениям.
-262
Библиография Мандрикова, Оксана Викторовна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Агамирзоев Р. А., Золотовицкая Т. А., Исмаил-Заде Т. А. и др. Поиски предвестников землетрясений в Азербайджане.- В кн.: Поиски предвестников землетрясений. Ташкент: Фан, 1976, с. 213-216.
2. Айвазян С.А., Мхитарян B.C., Прикладная статистика в задачах и упражнениях: Учебник для вузов. М.:ЮНИТИ-ДАНА, 2001
3. Алексеев Ф. А., Войтов Т. Н. и др. О радиохимических, изотопных и геохимических эффектах в сейсмоактивных областях.- В кн.: Ядерная геология. М.ЮНТИ ВНИИЯГ, 1974, с.91-105.
4. Афифи А., Эйзен С. Статистический анализ. М.: "Мир". 1982.
5. Ахундова С. Б., Мамед-Заде Р. Н. Проблема прогноза землетрясений в научной литературе.- Изв. АН СССР. Физика Земли, 1980, №6, с.61-64.
6. Гидрогеохимические предвестники землетрясений. Под ред. Г. М. Варшала. М.: Наука, 1985.
7. Будько Н., Зайцев А., Карпачев А., Козлов А., Филиппов Б. Космическая среда вокруг нас. Троицк: ТРОВАНТ, 2006. 232 с.
8. Беляев А. А. Особенности радоновых прогнозных признаков землетрясений.- Геохимия, 2001, №12, с. 1355-1360.
9. Берколайко М. 3., Новиков И. Я. О бесконечно гладких почти-всплесках с компактным носителем. Доклады РАН. 1992.-326, № 6, с. 935938.
10. Бернштейн С.Н. Теория вероятностей М.: Физматгиз,1974.
11. Богданов В.В. Вероятностная интерпретация закона повторяемости землетрясений на примере Камчатского региона. Докл. АН Т. 408.2006. №3
12. Богданов В.В., Мандрикова О.В. Вейвлет-анализ распределений вероятностей сейсмических событий Камчатского региона накануне Кроноцкого землетрясения // Вестник КамчатГТУ. Выпуск 4. — П.-Камчатский, 2005. С.56-59.
13. Богданов В.В., Мандрикова О.В., Корнев Е.В., Шумилова А.Л., Конюхов A.B. Об аномалиях в ионосферных процессах Камчатского региона накануне сейсмических событий // Вестник КамчатГТУ. Выпуск 4. — П.-Камчатский, 2005. С.52-56.
14. Бокс Дж., Дженкинс Г. Анализ временных рядов прогноз и управление: Пер. с англ. М.: Мир, 1974.
15. Вальд А. Последовательный анализ. М.: Физматгиз, 1960.
16. Вентцель Е. С., Овчаров Л.А., Теория вероятностей и ее инженерные приложения. Учеб. Пособие для вузов. 2-е изд., стер. - М.: Высш. шк, 2000
17. Волков И. К., Зуев С. М., Цветкова Г. М. Случайные процессы: Учеб. Для вузов / Под ред. B.C. Зарубина, А.П. Крищенко- М.: Изд-во МГТУ им. Н.Э. Баумана, 2000.
18. Гайский В.Н. Статистические исследования сейсмического режима. М.: Наука. 1970.
19. Герцик В.М. Математические основы теории прогноза вероятностей сильных землетрясений // Физика Земли, 2006, №6, с.21-31.
20. Гидрогеохимические предвестники землетрясений. Под ред. Г. М. Варшала. В кн.: Желанкина Т. С., Кушнир А. Ф., Писаренко В. Ф. и др. Комплексный статистический анализ геохимических предвестников землетрясений. М.: Наука, 1985.С. 135-148.
21. Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука. Сибирская издательская фирма РАН, 1996.
22. Головков В.П., Папиташвили В.О., Папиташвили Н.Е. Автоматизированное вычисление К-индексов с использованием метода естественных ортогональных составляющих. // Геомагнетизм и аэрономия. 1989. Т. 29, №4. С. 667-670.
23. Демидович Б.П., И.А. Марон, Э.З. Шувалова. Численные методы анализа. М., Государственное издательство физико-математической литературы, 1963.
24. И. Добеши. Десять лекций по вейвлетах, Пер. с английского, -Ижевск: НИЦ «Регулярная и хаотическая динамика».- 2001.
25. Закс Л. Статистическое оценивание. М.: Статистика, 1976.
26. Иванов С.Н. Зоны пластичных и хрупких деформаций в вертикальном разрезе литосферы // Геотектоника. 1990, № 2. С. 3-13.-26636. Колмогоров А.Н. Основные понятия теории вероятностей. М.: Наука, 1974.
27. Корнеев В.В., Гареев А.Ф., Васютин C.B., Райх В.В. Базы данных. Интеллектуальная обработка информации: М.: Издатель Молгачева C.B., Издательство Нолидж, 2001.
28. Кроноцкое землетрясение на Камчатке 5 декабря 1997 года, предвестники, особенности, последствия П-К.:изд. КГ АРФ, 1998.
29. Лебедев А.Н., Куприянов М.С., Недосекин Д.Д., Чернявский Е.А. Вероятностные методы в инженерных задачах: Справочник. СПб.: Энергоатомиздат. Санкт-Петербургское отделение, 2000.
30. Любушин (мл.) A.A. Вейвлет-агрегированный сигнал и синхронные всплески в задачах геофизического мониторинга и прогноза землетрясений // Физика Земли, 2000, №3, с.20-30.
31. Мавашев Б. 3., Мавлянов Г. А. и др. Аномалии радиоактивности Ташкентской минеральной воды в 1965 г.- Строительство и архитектура Узбекистана, 1966, №8, с. 9.
32. Мавлянов Г. А., Султанходжаев А. Н. и др. Явление изменения химического состава подземных вод при землетрясении.- Диплом № 129 по заявке № 01-7928 от 14 апреля 1971 г. Бюл. № 42, 1973.
33. Мандрикова О.В. Моделирование геохимических сигналов на основе вейвлет-преобразования. -Владивосток: Дальнаука.2007. 123с.
34. Мандрикова О.В., Богданов В.В. Полозов Ю.А. Моделирование сигналов со сложной структурой на основе конструкции вейвлет-преобразования. // Информационные технологии. — Москва. 2008 г. №4. С.12-19.
35. Мандрикова О.В., Богданов В.В. Аппроксимация статистического распределения случайной величины на основе конструкции вейвлет-преобразования. //Известия вузов, Северо-Кавказский регион, — Новочеркасск, Серия технические науки. №3. 2008 С.53-57.
36. Мандрикова О.В. Многокомпонентная модель временного ряда. // Междунар. конф. по мягким вычислениям и измерениям (SCM'2008): сб. докл.. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2008. С.152-155.
37. Мандрикова О.В., Горева Т.С. Построение модели сигнала критической частоты на основе вейвлет-пакетов // Вестник КамчатГТУ. Выпуск 7 — П.Камчатский. 2008. С.53-59.
38. Мандрикова О.В. Многокомпонентная модель временного ряда. // Вестник КамчатГТУ. Выпуск 7 — П.Камчатский, 2008. С.41-46.
39. Марпл.-мл. С.Л. Цифровой спектральный анализ и его приложения: Пер. с англ. -М.: Мир, 1990.
40. Математическая статистика: Учеб. Для вузов / В.Б. Горяинов, И.В. Павлов, Г.М. Цветкова и др.; Под ред. B.C. Зарубина, А.П. Крищенко.-М.: Изд-во МГТУ им. Н.Э. Баумана, 2001.
41. Мирзоев К. М., Маламуд А. С. и др. Поиск пространственно-временных закономерностей изменения параметров, предваряющих сильное землетрясение. В кн.: Поиски предвестников землетрясений. Ташкент: Фан, 1976, с. 241-251.
42. Митра С.К. Верхняя атмосфера. М: Изд. Иностранной литературы. 1955.
43. Моги К. Предсказание землетрясений. М: Мир. 1982. с. 264.
44. Монтвилас А. Обработка результатов наблюдений при определении изменения свойств случайных сигналов.- В кн.: Труды семинара «Статистические проблемы управления». Вильнюс: Ин-т математики и кибернетики АН ЛитССР, 1973, вып. 7, с.41-53.
45. Новиков JI.B. Адаптивный вейвлет-анализ сигналов// Научное приборостроение. 1999.Т.9, №2.
46. Обнаружение изменения свойств сигналов и динамических систем, (под ред. М. Бассвиль) М. : МИР , 1989.
47. Осика Д. Т. Опыт разработки и перспективы практического использования геохимических и гидрологических методов прогноза места, силы и времени мелкофокусных землетрясений.-Геохимия, 1979, № 3, с. 354364.
48. Поиски предвестников землетрясений Под ред. Е. В. Саваренского. Ташкент: Фан, 1974. 264с.
49. Поплавский A.A. О распределении очагов дальневосточных землетрясений по глубине.// Проблемы сейсмичности Дальнего Востока. III научная конференция. Хабаровск, 22-25 мая 2001 г. С. 106-107.
50. Привальский В.Е., В.А. Панченко, E.IO. Асарина. Модели временных рядов: СПб.: Гидрометеоиздат, 1992.
51. Пытьев Ю.А. Возможность. Элементы теории и применение. М.: Эдиториал УРСС, 2000. 192 с.
52. Райе Дж. Механика очага землетрясений. М.: Мир. 1982. с. 217.-27285. Ризниченко Ю.В. Проблемы сейсмологии. Избранные труды. М.: Наука. 1985. 410 с.
53. Смирнов В.Б. Опыт оценки представительности данных каталогов землетрясений // Вулканология и сейсмология. 1997. .№ 4. С. 8996.
54. Соболев Г.А. Стадии подготовки сильных камчатских землетрясений//Вулканология и сейсмология. 1999. № 4-5. С. 63-72.
55. Советов Б.Я., Яковлев С.А., Моделирование систем: Учеб. Для вузов 3-е изд., перераб. и доп. - М.: Высш. шк., 2001
56. Спичак В.В., Попова И.В. Методология нейросетевой инверсии геофизических данных // Физика Земли, 2005, №3, с.71-85.
57. Стаховский И.Р. Вейвлетный анализ временных сейсмических рядов // ДАН. 1996.Т.350.№3. С.393-396.
58. Султанходжаев А. Н., Зиган Ф. Г. Методические рекомендации к гидросейсмологическим исследованиям. Ташкент: Фан, 1980. 52с.
59. Уидроу Б., С. Стирнз. Адаптивная обработка сигналов. М. "Радио и связь" 1989.
60. Федотов С.А., Чернышев С.Д. и др. Прогноз Кроноцкого землетрясения 5 декабря 1997 г. //Вулканология и сейсмология. 1998, № 6. С. 3-16.
61. Филиппов Ю.А. Фирстов П.П. Применение нейронной сети для анализа динамики объемной активности подпочвенного радона за 1998-2002 гг. на Паратунской геотермальной системе (Камчатка) // Нейроинформатика и ее приложения. Красноярск. 2002. С.33-37.
62. Фирстов П.П., Рудаков В.П. Результаты регистрации подпочвенного радона в 1997-2000 гг. на Петропавловск-Камчатском геодинамическом полигоне // Вулканология и сейсмология. 2003. №1. С.26-41.
63. Фирстов П.П., Филиппов Ю.А., Мандрикова О.В. Предвестниковые аномалии сильных землетрясений в динамике подпочвенного радона на Петропавловск-Камчатском геодинамическом полигоне в 1997-2001гг // Доклады РАН. 2003.Т.389.№6. С.810-813.
64. Хитаров Н. И., Войтов Г. И., Лебедев В. С. О геохимических предвестниках землетрясений.- В кн.: Поиски предвестников землетрясений на прогностических полигонах. М.:Наука, 1974, с. 165-170.
65. Худсон Д. Статистика для физиков. М.: Мир. 1970. 296с.
66. Чижевский А.Л. Земное эхо солнечных бурь. М.: Мысль, 1973.
67. Чуй К. Введение в вейвлеты. Пер. с английского, М.: Мир —2001.
68. Ширяев А. Н. Задача скорейшего обнаружения нарушения стационарного режима. // Докл. АН СССР, 1961, 138, № 5, с.1039-1042.
69. Ширяев А. Н. Статистический последовательный анализ. М.: Наука, Хазен Э. М. Методы оптимальных статистических решений и задачи оптимального управления. М.: Сов. Радио, 1968.
70. Эйби Дж.А. Землетрясения. М.: Недра. 1982. с. 264.-274107. Berryman J. G. Choice of Operator Length for Maximum Entropy Spectral Analysis. Geophysics, vol. 43, pp. 1384-1391,1978
71. Box G. E. P., Pierce D. A., Distribution of residual autocorrelation in autoregressive-integrated moving average time series models, J. Amer. Stat. Ass., 64, 1970
72. Chui C.K. and Wang J.Z. A general framework of compactly supported splines and wavelets, CAT Report #219, Texas A&M University, 1990
73. Cohen A., Ondelettes. Analyses multiresolutions et traitement numerique du signal, Doctoral Thesis, Univ. Paris-Dauphine, 1990
74. Chui C. K. Multivariate Splines, CBMS-NSF Series in Applied Mach. #54, SIAMPubl., Philadelphia, 1988
75. A. Croisier, D. Esteban, C. Galand. Perfect channel splitting by use of interpolation/ decimation/ tree decomposition techniques. In Int. Conf. on Info. Sciences and Systems, pages 443-446, Patras, Greece, August 1976.
76. I. Daubechies and J. Lagarias. Two-scale difference equations: II. Local regularity, infinite products of matrices and fractals. SIAM J. of Math. Anal., 24, 1992.
77. Donoho D., Johnstone I. Minimax estimation via wavelet shrinkage. Annals of Statistics, 1998.
78. Donoho D. L. Nonlinear solution of linear inverse problems by Wavelet -Vagulet Decomposition// App. Comp. Harmonic Anal. 1995. V2. P. 101126.
79. Duncan A. J. Quality control and industrial statistics.-Homewood (111.): Irvin, 1965.
80. Girshich M. A., Rubin H. A. Bayes approach to a quality control model.-Ann. Math. Statist., 1952, 23, N 1, p. 114-125-275118. Ghave P. M., Torgersen P. E. The malticharacteristic control charts.- J. Industr. Eng., 1968, 19, N 6, p. 269-272.
81. Hatuda Z. Radon Content and change in Soil air near Ground Surface.- In:Memoire of the College of Science, University of Kyoto, ser. B. XX, Art. 6,1953, p.38
82. Hinkley D. V. Inference in two-phase regression.- J. Amer. Statist. Assoc., 1971, 66, N 336, p. 736-743.
83. Hinkley D. V. Time-ordered classification.- Biometrika, 1972, 52, N 2, p.509-523.
84. Jones R. H. Autoregression Order Selection. Geophysics, vol. 41, pp. 771-773, 1976
85. Kashyap R. L. Inconsistency of the AIC Rule for Estimation the Order of Autoregressive Models. IEEE Trans. Autom. Control, vol. AC-25, pp.996-998, 1980
86. Landers T. E., Lacoss R. T. Some Geophysical Application of Autoregressive Spectral Estimates. IEEE Trans. Geosci. Electron., vol. Ge-15, pp. 26-32, 1977.
87. Lorden G. Procedures for reacting to a change in distribution.- Ann. Math. Statist., 1971, 42, N 6, p. 1897-1908.
88. Mc Gilchrist C. A., Woodyer K. D. Note on a distribution.- Ann. Mach. Statist.,1971, 42, N 6, p. 1897-1908.
89. Nuttall A. H. Spectral Analysis of a Univariate Process with Bad Data Points, via Maximum Entropy and Linear Predictive Techniques. Naval Underwater Systems Centre Technical Report TR-5303, New London, Conn., 1976
90. Page E. S. Control charts for the mean of a normal population.- J. Roy. Statist. Soc. B, 1954, 16, N 1, p. 131-135.
91. Page E. S. Estimating the point of change in a continuous process.-Biometrika, 1957,44, N 2, p. 248-252.
92. Rissanen J. A. Universal Prior for the Integers and Estimation by Minimum Description Length. Ann. Stat., vol. 11, pp. 417-431, 1983
93. Roberts S. W. A comparison of some control chart procedures.-Technometrics, 1966, 8, N 3, p. 411-430.
94. Siegmund Brandt. Data Analysis. Statistical and Computational Methods for Scientists and Engineers. Пер. с англ. M.: Мир, ООО «Издательство ACT», 2003.
95. Stephane Mallat, A Wavelet tour of signal processing. Пер. с английского, M.: Мир, 2005.
96. P.P. Vaidyanathan. Quadrature mirror filter banks, M-band extensions and perfect reconstruction techniques. IEEE ASSP Mag., 4(3):4-20, July 1987.
97. M. Vetterli. Filter banks allowing perfect reconstruction. Signal Proc., 10(3):219-244, April 1986.
-
Похожие работы
- Методы выявления аномальных событий в многокомпонентных измерительных сигналах на основе мультимасштабных и спектральных методов высокого разрешения
- Структурные модели и алгоритмы обнаружения аномалий в ионосферных сигналах
- Методы и модели интеллектуального анализа сигналов геофизических полей
- Методы устранения аномально больших погрешностей пеленгования сканирующего источника радиоизлучения сантиметрового диапазона на наземных трассах
- Алгоритмы и комплекс программ оценивания параметров многокомпонентного вибрационного сигнала
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность