автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Исследование и разработка математических моделей и численных алгоритмов для решения задач обнаружения аномалий при обработке геохимических данных
Автореферат диссертации по теме "Исследование и разработка математических моделей и численных алгоритмов для решения задач обнаружения аномалий при обработке геохимических данных"
На правах рукописи
Мандрикова Оксана Викторовна
ИССЛЕДОВАНИЕ И РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ И ЧИСЛЕННЫХ АЛГОРИТМОВ В ЗАДАЧАХ ОБНАРУЖЕНИЯ АНОМАЛИЙ ПРИ ОБРАБОТКЕ ГЕОХИМИЧЕСКИХ ДАННЫХ
I
Специальность: 05.13.18.- Математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
!
Санкт-Петербург - 2003
Работа выполнена в Камчатском государственном техническом университете ("КамчатГТУ").
Научный руководитель -
доктор технических наук, профессор Геппенер В.В.
Научный консультант -
Кандидат технических наук, доцент Портнягин H.H. Официальные оппоненты:
доктор технических наук, профессор Куприянов М.С. кандидат технических наук, с.н.с. Егоров В.В.
Ведущая организация — Институт Вулканической Геологии и Геохимии
ДВО РАН, г. Петропавловск-Камчатский
Защита состоится "/У." £ 2003 г. в часов на заседании диссертационного совета Д 212.238.01 Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" имени В.И. Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.
С диссертацией можно ознакомиться в библиотеке университета. Автореферат разослан " ^ " ^_2003 г.
Пантелеев М.Г.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Настоящая работа посвящена моделированию процессов обработки геохимических данных с целью обнаружения аномальных эффектов геохимических сигналов и выделения периодов высокой сейсмичности.
Основой возникновения геохимической аномалии является изменение концентрации отдельных компонентов подземных вод и подпочвенных газов или их химических показателей на фоне средних значений. Несмотря на то, что проблема поиска предвестников и прогноза землетрясений исследуется достаточно давно, вариабельность геохимических полей во времени в настоящее время недостаточно изучена и особенно их
диффереяцнрованность в различных сейсмоактивных областях. В настоящее время интерес к исследованию и разработке методов обработки геохимических данных сильно возрос. Это также связано с появлением новых научных знаний и методов обработки временных рядов и со значительным ростом производительности вычислительных средств.
Вариации геохимических компонентов имеют достаточно сложную структуру. Аномальное поведение компоненты может содержать резкие одиночные всплески концентраций, сопровождаться серией пиков, иметь ступенчатый вид. Относительная величина и временная протяженность таких аномалий зависит от многих факторов. Построение математических моделей процессов в этом случае весьма затруднительно. Результаты исследований в своем большинстве относятся к низкочастотным составляющим колебаний концентрации геохимических компонентов и свидетельствуют о возможности предсказания периодов высокой сейсмичности длительностью в 3-5 месяцев. Для анализа устойчивых изменений производят процедуру сглаживания и это, несомненно, влечет потерю информации. Однако, зачастую, наряду с выявленными аномальными изменениями отдельных параметров отмечаются короткопериодные скоротечные вариации, что весьма важно для краткосрочного и оперативного прогноза землетрясений, и используемые методы в этом случае нельзя считать достаточно эффективными. В настоящее время существует сравнительно новая математическая конструкция, названная вейвлет-анализом, которая является одним из наиболее эффективных методов детального изучения закономерностей нестационарных временных рядов. Компактность носителя и схожесть по форме используемых в этой конструкции базисных функций с аномальными эффектами геохимических процессов позволяет исследовать сигнал с достаточной степенью локализации и выявить характер подобной особенности в сигнале.
В связи со сказанным актуальным является разработка новых методов обнаружения и классификаций аномальных эффектов геохимических данных.
В диссертационной работе автором с целью повышения качества
обработки геохимических данных разработан но вм но ватроеяжю
I БИБЛИОТЕКА I С.Петербургг-Ул ) 1 03 300? а*?м/ I
алгоритмов обработки геохимических данных, который базируется на совмещений модели авторегрессии - проинтегрированного скользящего среднего (АРПСС) и быстрого вейвлет-преобразования. Данная задача становится реализуемой благодаря возможности вейвлет-разложения произвольного сигнала на составляющие, так называемого кратномасштабного анализа (КМА). Эта конструкция позволяет работать с дискретными данными, дает информацию о структуре сигнала, позволяет отделить высокочастотные локальные нестационарности и провести дополнительный анализ компонент ряда, получить информацию о масштабах процесса. Это играет важную роль в задачах обработки сигналов с такой сложной структурой, как вариации концентраций геохимических компонентов. Образующаяся при этом сглаженная составляющая ряда имеет более простую структуру и может быть аппроксимирована моделью АРПСС с целью выявления среднесрочных и долгосрочных аномальных эффектов. Формальная модель сигнала в данном случае имеет вид:
оператор, 4^(0 = 2]ПЧ'(21(-- базисный вейвлет, соответствующий ему двойственный, коэффициенты авторегрессии,
е(0~ ошибка.
Тематика работы связана с программой ГНТП №16 «Безопасность населения и народно-хозяйственных объектов с учетом риска возникновения природных и техногенных катастроф», программа Президиума РАН «Изменение окружающей среды и климата: природные катастрофы».
Цель и задачи работы. Целью работы является разработка моделей автоматической обработки геохимических данных для обнаружения и классификации аномального поведения компонентов и выявления периодов высокой сейсмичности.
Для достижения этих целей в диссертации решались следующие задачи:
1. Разработка и исследование алгоритмов автоматического обнаружения изменения параметров модели сигнала применительно к задаче обработки и обнаружения аномального поведения геохимических данных.
2. Разработка способов классификации выделенных аномалий с целью выявления периодов высокой сейсмичности.
3. Разработка программного обеспечения системы для автоматического обнаружения и классификации выделенных аномалий на базе ПЭВМ.
4. Моделирование разработанных алгоритмов в задачах обработки и обнаружения аномального поведения геохимических данных.
Методы исследования. В диссертационной работе использовался аппарат теории случайных процессов, теории цифровой обработки сигналов,
т, = У'г,— разностный
Теории распознавания образов, теории построения математических моделей, методы вычислительной математики, основы функционального анализа.
Научную новизну работы составляет:
• Способ решения задачи обработки и обнаружения аномального поведения геохимических данных на основе совмещения модели авторегрессии - проинтегрированного скользящего среднего и быстрого вейнлет-преобразоВания.
• Алгоритм классификации выявленной аномалии, основанный на использовании вейвлет - преобразования сигнала.
• Способ использования вейвлетов, построенных на основе сплайнов, обеспечивающий повышение эффективности и качества обработки данных.
• Конструкция вейвлет-пакетов, улучшающая частотную локализацию при проведении детального анализа выявленной аномалии в динамике геохимического компонента.
Практическая ценность работы заключается в следующем:
1. Разработаны конкретные модели и алгоритмы выделения и классификации аномалии в динамике геохимического компонента.
2. Разработан программный комплекс на ПЭВМ, обеспечивающий решение задач выделения и классификации аномалий геохимических процессов.
3. Проведены исследования предложенных моделей и алгоритмов на реальных и модельных сигналах, получены положительные результаты.
4. Разработанные методы можно применять для более широкого круга задач, в которых необходим анализ нестационарных сигналов со сложной структурой.
Внедрение результатов работы:
Работа выполнялась в рамках НИР «Выявление среднесрочных и краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки с М>6 в вариациях динамики подпочвенного радона, водорода и пространственно - временных характеристик сейсмичности», поддержаной грантом РФФИ №02-05-64467, а также грантом РФФИ для студентов, аспирантов и молодых ученых №03-05-06453а за 2003 г.
Разработанные программные средства и методические материалы использовались в учебном процессе при проведении лабораторных и курсовых работ по курсу «Системы цифровой обработки сигналов», для студентов специальности 210100 в КамчатГТУ.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на научно-технических конференциях КамчатГТУ в 2000-2003 гг.; на Всероссийской научной конференции "Проектирование научных и инженерных приложений в среде МайаЬ", Москва: ИПУ РАН 2002г; на Международной научно-практической конференции "Рыбохозяйственное образование Камчатки в XXI веке",
Петропавловск-Камчатский, 15-16 октября 2002 г.; на Международной конференции по мягким вычислениям и измерениям (8СМ'2003), - С.Петербург, 25-27 июня 2003 г.
Публикации. По теме диссертации опубликовано 8 печатных работ, из них 4 статьи, 4 доклада на международных и всероссийских научно-технических конференциях.
Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения, списка литературы, включающего 78 наименований и приложения. Основная часть работы изложена на 132 страницах машинописного текста и содержит 39 рисунков и 12 таблиц.
ОСНОВНОЕ СОД ЕРЖАНИЕ РАБОТЫ
Во введении показана и обоснована актуальность работы, сформулированы основные цели и задачи, научная новизна и практическая ценность диссертационной работы.
В первой главе, имеющей обзорный характер, описана структура сигнала геохимической компоненты, методы регистрации данных. Кратко рассмотрен механизм аномалий подпочвенного радона, являющегося одним из наиболее важных объектов исследований в задачах прогноза землетрясений геохимическими методами. Более подробные справочные сведения вынесены в Приложение. Сделан обзор существующих методов обработки данных с указанием имеющихся недостатков, поставлена задача их обработки. Приведены основные подходы к решению задачи.
Определяя пути решения задачи необходимо учесть, что один из способов изучения различных процессов и явлений природы состоит в построении и исследовании их математических моделей. Наличие модели исследуемой системы значительно расширяет возможности ее изучения. В данном случае достаточно сложная структура возникновения предвестника, а так же наличие мешающих факторов различной природы ставят под сомнение возможность использования существующих базовых моделей временных рядов. Задача обнаружения аномального поведения компоненты в этом случае может быть сведена к задаче обнаружения изменения стохастических свойств сигнала. Такая задача по постановке близка к задаче обнаружения разладки в динамических системах.
Сложность построения модели обработки заключается в наличии аномальных эффектов различного характера. Поэтому в процессе построения модели мы можем:
• удалить все уже обнаруженные аномальные явления из анализируемого массива, что значительно облегчит процедуру идентификации модели; обнаружение разладки в системе в этом случае будет говорить о наличии очередного аномального эффекта (стратегия 1);
• идентифицировать модель для каждой отдельной аномалии (стратегия 2).
Так как аномальные эффекты весьма разнообразны и построение формальных моделей оказывается затруднительным, то стратегия 1
обнаружения разладки выглядит более привлекательной. С другой стороны, наличие среднесрочных и долгосрочных периодов высокой сейсмичности делает невозможным удаление всех аномальных явлений из анализируемого временного ряда. Разработанный автором метод построения модели обработки, предполагает некоторый компромисс между указанными стратегиями:
• совмещение параметрического и непараметрического подходов к построению модели;
• частичное удаление аномальных эффектов из анализируемой последовательности данных.
Предложенная методика стала возможной благодаря возникшей сравнительно недавно математической конструкции, названной кратномасштабным разложением, порождаемым некоторым вейвлетом. Данная конструкция раскладывает произвольный сигнал на компоненты, образующаяся при этом сглаженная составляющая сигнала содержит наиболее устойчивые характеристики временного ряда и может быть описана одним из известных классов моделей временных рядов. Для большинства практических задач целесообразно конкретизировать модели рядов наблюдений в виде последовательностей авторегрессии-проинтегрированного скользящего среднего (АРПСС). Модели данного класса получили наиболее широкое распространение во всех областях науки и техники и, в частности, в геологии и геофизике. Получаемые с их помощью оценки статистических характеристик ряда, как правило, обладают большей надежностью, чем традиционные непараметрические оценки, а сама модель процесса достаточно легко интерпретируется физически.
Рис.1 Блок-схема исследования геохимических процессов.
В итоге решение задачи состоит из следующих этапов: ' 1. Выделение из сигнала высокочастотных локальных участков нестацйонарн'ости с помощью быстрого вейвлет-преобразования. Анализ выделенных компонентов ряда.
2. Идентификация модели АРПСС для сглаженной составляющей сигнала. Анализ моментов отклонения значений ряда от прошоза.
Общая схема решения задачи представлена на рис.1.
Во второй главе рассмотрены основные подходы к решению задачи обнаружения изменений свойств сигналов и динамических систем. Сформулирована формальная постановка задачи. Описана классификация последовательных и апостериорных алгоритмов обнаружения разладки в динамических системах. Рассмотрены и проанализированы основные схемы обнаружения разладки. Приведены критерии оптимизации алгоритмов. Сформулирована модель разладки геохимического сигнала.
Формальная постановка данной задачи выглядит следующим образом.
Пусть дана случайная последовательность {*/}«• Свойства последовательности {*,}", образуют некоторое множество £2, элементы которого определяются конкретным приложением. Предположим, что в момент времени г0 последовательность меняет одно (или несколько) из своих свойств. Наблюдая {*, , необходимо:
• обнаруживать момент изменения свойств ряда /0;
• классифицировать аномальный участок ряда;
• формулировать заключение о поведении объекта исследования.
В зависимости от типа рассматриваемой модели существуют разные методы решения поставленной задачи. Как было указано выше, задача обнаружения изменения свойств ряда может быть сведена к задаче обнаружения разладки в динамических системах. Вне зависимости от того, применяется ли параметрический подход или непараметрический, методы обнаружения разладки можно разделить на последовательные и апостериорные. Как известно, последовательный алгоритм позволяет дать сигнал о разладке и сделать первичную оценку момента разладки. Апостериорный алгоритм, в свою очередь, делает наиболее точную оценку момента разладки. Применительно к задаче обнаружения и классификации аномальных эффектов геохимических сигналов, наиболее эффективными и удобными являются алгоритмы, предназначенные для обработки целых блоков накопленных отсчетов данных некоторого фиксированного объема. Среднесрочные и долгосрочные аномалии, рассмотренные в 1-ой главе, несомненно, могут привести к изменению не только параметров модели, но и к изменению самой модели. В этом случае, как известно, наиболее эффективными являются алгоритмы блочной обработки данных, которые рассмотрены в 4-ой главе работы. Модель разладки сглаженной компоненты геохимического сигнала в этом случае может выглядеть следующим образом.
Пусть дана последовательность {г*}. Рассмотрим гипотезы:
• Г, :3 ¿е(1,л']:^}^1\{дг,} порождаются моделью Мво;{х,} - образуют
конечное число изолированных точек наблюдаемой последовательности, Мв) — семействб моделей, параметризованных вектором в,;
• Г2 •=Пе(1,Л']:{*Д:_11 порождаются моделью М%, \х]порождаются моделью Мв>;
• г3:э /,,.....е^лф^)*"' порождаются моделью М^,
порождаются моделью М^.....порождаются моделью Мв).
В случае выполнения гипотезы Г, дополнительной задачей становится задача определения моментов времени /.
В случае выполнения гипотезы Г2 помимо оценки времени изменения возникает задача определения в1.
Поскольку задача прогноза предполагает обработку данных по мере их поступления, мы можем ограничиться рассмотрением гипотез Г,,Г2.
Общая схема модели разладки геохимического сигнала показана на рис.2._
Анализ компонент сигнала
Выявление краткосрочных аномалий
Г,:3 кгМЬ^Ч*,}
порождаются -
образуют конечное число изолированных точек наблюдаемой последовательности
Г2:В ¿€(1,ЛГ]:У;'
порождаются Мва, {xJ ] порождаются моделью
Выявление кратко и среднесрочных аномалий
Выявление средне и долгосрочных аномалий
Рис.2 Блок-схема модели обнаружения аномалий геохимического сигнала.
Для получения оценки времени изменения разумнее всего применять метод максимального правдоподобия, поскольку, в данном случае, как показано Е.С. Пейджем, он значительно эффективнее метода кумулятивных
сумм. В соответствии с его идеей проверяются N+1 гипотезы #,,#2.....ЯЛЧ1,
состоящие в том, что /0 =1,2.....N+1, где /0- момент разладки. Вероятность
ошибочной классификации будет минимальной, если гипотеза Нк принимается при выполнении условия
= шах
VJ:j^k,тдe 1т(х)=^Ыт{х1/в1)+^Ы0>{^/в2) (2.1)
» у-*
- функция правдоподобия соответствующая гипотезе Нт, а(х]1в) -плотность распределения наблюдений х,. Все значения предполагаются равновероятными. Применительно к модели АРСС получаем следующее: /0мп тах^й<и(х;'"'I в)+\хм>{х^/02)}=
'-'а+Р )
Если 0, и (или) в2 неизвестны, то в (2.2) используются оценки 0, и 02. Оценка 0, рассчитывается по первым х,'""1 значениям выборки, а 02 по остальным х?а, в то время как ¡0 пробегает значение от р+3 до Ы-р-1. Если снять предположение о независимости ^} от {к,'""1), третий и четвертый
члены в (2.2) необходимо заменить на условное правдоподобие /в2,х{''1), где р точек {г'»^] будет играть роль начальных условий.
В случае гауссовской модели (2.2), следуя работе Бокса и Дженкинса, запишем для модели авторегрессии.
2 2 2&1
г*
где Хтр = \хх,...,хр\,М{р] = Т~р1о1,Тр- ковариационная матрица (рхр) последовательности авторегрессии, М^ матрица (рхр) квадратичной формы нормального закона.
Проанализируем получения /0ип с вычислительной точки зрения. В случае модели «чистой» авторегрессии на каждом шаге при отыскании максимума в соотношении (2.2) необходимо получение оценок двух векторов 0, и 02, а затем вычисление оценок двух функций правдоподобия. Хорошо известно, что применение смешанных моделей дает возможность экономно моделировать временные ряды, но оценка коэффициентов моделей АРСС с вычислительной точки зрения существенно сложнее, чем оценка коэффициентов модели авторегрессии (АР). Объем вычислений при оценке 10 методом максимального правдоподобия быстро растет с увеличением длины выборки, особенно для моделей АРСС. Поэтому для апостериорного ряда целесообразно использовать модели «чистой» авторегрессии.
В третьей главе рассматриваются основные положения теории вейвлет-преобразовавия, особое внимание уделяется частотно-временной обработке дискретных данных.
В практических приложениях часто приходится иметь дело с дискретными наборами чисел, поэтому возникает проблема устойчивости
вейвлет-преобразования и соответствующих численных алгоритмов. Строго говоря, для дискретных сигналов не существует базисных функций, масштабированные и смещенные версии которых дают базис пространства сигнала. Тем не менее, если пространство 1}(Я) представляет пространство всех аналоговых сигналов с конечной энергией и образует КМА в 12(Л), то выборка аналогового сигнала осуществляется в виде аппроксимации из некоторого пространства выборки К„. Положения теории вейвлет-преобразования, которые необходимы для реализации конструкции КМА, в работе рассматриваются достаточно детально. Для обработки нестационарных временных рядов полезными являются вейвлеты, имеющие компактные носители. В диссертационной работе описывается алгоритм построения масштабирующих функций с компактными носителями, исследуются функции с наименьшим носителем. Так же рассматриваются вопросы о гладкости масштабирующих функций и соответствующих им вейвлетов, поскольку это имеет важное значение в задачах, связанных с выявлением локальных особенностей сигнала.
Рассматривая задачу обнаружения и классификации различных аномальных эффектов, содержащихся в геохимических данных, можно определить следующие критерии выбора базисной функции:
1. минимизация величины носителя;
2. минимизация размеров частотно-временного окна;
3. гладкость;
4. вычислительная сложность и эффективность;
5. минимизация погрешности разложения;
6. область применения конструкции вейвлет-пакетов, которые необходимы для получения лучшего разрешения по частоте.
Чуй было показано, что В-сплайн т-ого порядка является единственной функцией с наименьшим носителем, которая порождает КМА ))7*'} (п.1). А вейвлеты, построенные на основе сплайнов (сплайн-
вейвлеты), имеют наилучшие размеры частотно-временного окна (п.2), где понятие наилучшие понимается в соответствии с рассмотренным в этой же работе принципом неопределенности. В этой же работе показано, что масштабирующая сплайн-функция порядка т и построенный на основе нее вейвлет имеет производную порядка т-2 (п.З). Кроме этого сплайн-вейвлеты имеют простую структуру и образуют целый класс базисных функций различной формы (п.4). А поскольку аномальные эффекты геохимических данных весьма разнообразны, для их выявления необходим определенный набор базисных функций.
В связи со сказанным для решения задачи обработки и анализа геохимических данных автором использовались в расчетах сплайн-вейвлеты.
В диссертационной работе проанализированы базисные свойства сплаййоВ, показан процесс порождения пространств {к" }, где т -порядок В-сплайна. Для реализации процедуры разложения, мы имеем возможность использовать вейвлет-фильтры, имеющие конечную импульсную
характеристику, что способствует уменьшению погрешности сплайн-вейалет-разложенйя (п.5). Соответствующие операторы приведены в работе. Также в работе произведен расчет коэффициентов низкочастотной и высокочастотной составляющих вейвлет-фильтров, соответствующих В-сплайнам 2-го, 3-го и 4-го порядков, которые используются в разложении.
Для использования быстрого алгоритма разложения сплайн - методы позволяют построить операторы, проектирующие сигналы на некоторое пространство выборки У„. В работе в связи с этим были рассмотрены соответствующие сплайн-аппроксимационные формулы, определяющие квази-интерполяционный оператор, отбражающий С = С(Д)на пространство сплайнов К™. Данный оператор является ограниченным, линейным и имеет локальную структуру. Так же в работе был рассмотрен интерполяционный графически-изобразительный алгоритм, позволяющий, используя только формулу скользящего среднего, получить изображение любой сплайн-функции на любом желаемом уровне разрешения. В итоге получаются простые и вычислительно эффективные схемы построения базисных сплайн-приближений с наивысшим порядком аппроксимации (п.4,5).
На основе сплайн-интерполяционных формул автором произведена оценка погрешности разложения для В-сплайнов 2, 3 и 4-го порядков. Для уменьшения погрешности разложения можно воспользоваться графически-изобразительным алгоритмом. В диссертационной работе при обработке результатов в качестве базисных пространств были рассмотрены пространства = 0,1,2 с последовательностью узлов Т12.
Последним критерием выбора базисной функции была определена область применения конструкции вейвлет-пакетов, улучшающая разрешение по частоте при проведении детального анализа аномальной окрестности в сигнале (п.6). Автором в диссертационной работе на основе доказанной теоремы была определена следующая структура разложения в вейвлет-пакеты на основе сплайн-вейвлетов.
Теорема: Пусть (р(х)у—соответственно масштабирующая функция и соответствующий ей сплайн-вейвлет. Пусть также
соответствующие им двухмаспггабные соотношения. Относительно масштабирующей функции //„ = Ыт определим сплайн-вейвлет-пакеты /л„,п = 21 или 21+1,1 = 0,1..., следующими формулами:
= х-И)'
л
/*о(х) Ф(х)>(х) з= У(х)
(3.3)
1(х) = £?„/<,(2х-л)
Л
(3.4)
Я
Тогда для семейства подпространств
(3.5)
и
справедливо равенство: £/"+] = и]" + и™, и г 1. Причем семейство '
:) = ...,-1,0,п - 2,3,..,к е 2} является базисом Рисса пространства
Доказательство теоремы приводится в работе.
В четвертой главе рассматривается класс моделей АРПСС. Дается описание основных свойств моделей. Рассматриваются три формы представления модели, которые необходимы для лучшего понимания природы прогнозов. Приведены формулы для построения прогноза с минимальной среднеквадратичной ошибкой.
Известно, что применение смешанных моделей дает возможность экономно моделировать временные ряды. Но оценка коэффициентов моделей АРСС с вычислительной точки зрения существенно сложнее. Кроме того, во второй главе данной работы было показано, что объем вычислений для оценки момента (или моментов) разладки в системе методом максимального правдоподобия быстро растет с увеличением выборки для смешанных моделей. Поэтому для апостериорного ряда целесообразно использовать модели «чистой» авторегрессии.
Методы оценки параметров АР-модели можно разбить на две категории: алгоритмы для обработки блоков данных и алгоритмы для обработки последовательных данных. Ввиду описанных выше причин (см. гл. 2), нас интересуют алгоритмы для обработки блоков данных. Одну из важных категорий методов оценивания АР-параметров на основе блоков данных составляют методы, основанные на линейном предсказании по критерию наименьших квадратов. К этой категории относится модифицированный ковариационный метод. Данный метод обеспечивает наилучшие результаты при наличии в данных синусоидальных компонент. Поскольку геохимические данные содержат сезонную компоненту и, учитывая наличие коротких записей данных, представляется целесообразным, для оценки АР-параметром выбрать именно этот метод.
После идентификации модели и получения оценок ее параметров, модель подвергается диагностической проверке. А поскольку никакой диагностический метод проверки не может быть всеобъемлющим, желательно исследовать модель различными методами. В работе рассмотрены два известных метода диагностики модели: совокупный критерий согласия и проверка при помощи кумулятивной периодограммы. Методы проверки модели также могут быть использованы для обнаружения моментов изменения либо порядка модели, либо ее параметров. Что имеет важное значение в задачах обнаружения среднесрочных и (или) долгосрочных аномалий временных рядов.
В пятой главе описывается предлагаемый автором работы новый подход к построению модели обработки геохимического сигнала. Рассматривается процесс построения модели, описаны основные свойства новой модели и ее преимущества перед существующими моделями.
Наиболее эффективными методами описания временных рядов являются параметрические методы. Они позволяют получить более точные оценки статистических характеристик процесса, а получаемая при этом модель поддается физической интерпретации, что играет важную роль в задачах анализа экспериментально полученных данных. Но, как известно, модели данного класса имеют ряд ограничений, и это сужает область их применения (предположение о линейности и стационарности описываемого процесса).
В том случае, когда известна физическая модель процесса, модификация параметрической модели, как правило, не является сложной задачей и может быть решена с применением широкого класса известных нелинейных моделей. Но в нашем случае зависимость между различными переменными неизвестна.
Что касается учета нестационарности ряда, то имеющиеся модификации данного класса моделей (на основе стационарных) позволяют описывать нестационарности лишь определенного вида. Либо рассматривают глобально нестационарный процесс, который полагается локально стационарным, либо используют понятие однородной нестационарности, позволяющее обобщить модели авторегрессии (модели АРПСС). В случае сигнала геохимической компоненты, содержащей различного рода шумовые компоненты и разномасштабные аномальные эффекты оба пути являются неэффективными.
Разработанный автором работы новый подход к построению модели, который совмещает параметрический и непараметрический подходы к построению моделей, позволяет не только разрешить описанные выше проблемы, но и улучшить качество обработки подобных сигналов. Для непараметрического моделирования геохимических сигналов автор использует кратномаспггабное (КМ) представление сигнала (3-я глава работы). Компактность носителя и схожесть по форме используемых в этой конструкции базисных функций с аномальными эффектами описываемых процессов, а также возможность разнесения в пространстве разномасштабных аномалий, позволяет достаточно эффективно реализовать как процедуру их обнаружения, так и классификации. Получаемая при этом модель содержит многоуровневую структуру, объединяющую кратномаспггабное представление компонент временного ряда и модель АРПСС. Образующаяся после разложения сглаженная составляющая ряда имеет более упрощенную структуру, и это облегчает построение модели. В итоге мы получаем нелинейную модель, не выдвигая при этом каких-либо предположений по поводу вида ее нелинейности и учитывая нестационарности лишь определенного типа. В этом заключается основное преимущество данного метода.
Процесс построения модели заключается в следующем.
1.Непараметрическое моделирование на основе конструкции КМ разложения
Пусть / е 1}{К), /ц - некоторая проекция / на подпространство Ум =с1о5^(я)(ф(2" х-к), где{ к,Ы }ег, N фиксировано, ф - масштабирующая функция, порождающая кратномасштабный анализ. Уы в этом случае является пространством выборки и /ы - данные регистрации / в У„. Тогда пространство У„ может быть разложено в прямую сумму подпространств, т.е.
Ун = + Ун_, = .... = + .... + IV„_м + У„_и \/М, причем используемы базисные функции линейно не зависимые. Получаем, что /„ имеет единственное разложение: /н(х) = (х)+(х)+...+ё„_м (х)+(х), где /„_и(х)еУК_м,
\fjix) = ^с1ф(2'х-к) е У1 \gjix) = ^'к¥{2'х-к) 6 У?!
< * 1 * т Ф ~ масштабирующая
функция, а у— соответствующий ей вейвлет. Тогда /К{х) единственным образом определяется последовательностями с7 и I1. Если I/ -ортогональный вейвлет, то прямая сумма становится ортогональной и разложение /К(х) не только единственно, но и компоненты разложения взаимно ортогональны. 2.Использование модели авторегрессии
Для сглаженной компоненты сигнала, полученной после применения конструкции кратномасштабного разложения и представленной в виде коэффициентов с1, идентифицируется параметрическая модель из класса моделей АРПСС. В результате получаем модель:
ф^'сь1 =е{в)а1,№^-№-~~-ФРвр, ад>=1 В"с{ = с1„
В шестой главе приводится описание экспериментов по обнаружению и классификации аномальных эффектов геохимических сигналов на примере обработки данных регистрации объемной активности подпочвенного радона (ОАдп). Рассматриваются используемые статистические данные. Приводится описание программного обеспечения, которое демонстрирует разработанные методы. Для отладки алгоритма обработки данных была разработана статистическая модель, моделирующая исследуемый временной ряд.
При проведении экспериментов использовались данные регистрации О Айв Камчатского геодинамического полигона, полученные в ходе плановой работы по выявлению среднесрочных и краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки с Магнитудой (М) больше 6-ти в вариациях динамики подпочвенного радона в лаборатории Института космофизических исследований и распространения радиоволн ДВО РАН. Всего для экспериментов было взято 9 файлов, содержащих результаты измерений разноглубинных точек за период с декабря 1997 г. по март 2003 г. В 7 файлах интервал данных равен 0,5 суток, а в 2-х файлах интервал данных равен 3 часам. Для обработки использовались 10 фрагментов регистрации ОА^ (преобразованных в отдельные файлы),
содержащих различные разномасштабные аномальные эффекты в периоды высокой сейсмичности. Результаты обработки сопоставлялись с данными оперативного каталога землетрясений Камчатской опытно-методической сейсмологической партии ГС РАН.
Для проведения процедуры КМА в качестве базисного пространства рассматриваются пространства = 0,1,2 с последовательностью узлов
х = Для обнаружения и классификации аномальных эффектов
использовался следующий алгоритм:
1. на каждом уровне детализации в = 1,4 сохраняются коэффициенты, абсолютные значения которых превышают пороговое значение
определяется ее временная протяженность 1 = (]-1)-2' и энергия аномального сигнала, рассчитанная в скользящем временном окне:
3. производится расчет общей энергии сигнала по всем уровням детализации в пределах скользящего временного окна, длиной 2м*1:
4. для получения лучшей частотной локализации для высоких значений частоты используется конструкция вейвлет-пакетов.
В процессе экспериментов были получены следующие результаты: на различных временных масштабах наблюдался рост вейвлет-коэффициентов накануне всех анализируемых в работе сейсмических событий, что соответствовало превышению фонового значения в 2-6 раз. При этом временная протяженность аномальной окрестности изменялась в пределах от 1,5 недель до 3 месяцев. Накануне анализируемых событий на отдельных временных масштабах также наблюдалось увеличение энергии сигнала, рассчитанное в скользящем временном окне, при этом превышение фонового значения составляло 1,5-6 раз (рис. 3). Временная протяженность этих областей соответствовала временной протяженности выявленных аномальных окрестностей. Таким образом, результаты преобразования свидетельствовали о наличии аномалии, захватывающей несколько масштабных уровней накануне всех отмеченных событий.
Сглаженная компонента сигнала аппроксимировалась АР-моделью. Для этого оценка параметров АР-модели проводилась на основе модифицированного ковариационного метода, затем выполнялась последовательная диагностика модели в скользящем временном окне на основе анализа автокорреляционной функции остаточных ошибок. В случае
й"
п Ж+У".'-! , _
I ВЦ т-^-Г-*
получения неудовлетворительных результатов, которые свидетельствуют о возможном наличии аномального эффекта, на основе метода максимального правдоподобия производилась оценка момента (или моментов) изменения в системе. Для выявления краткосрочных аномальных эффектов проводился анализ значений автокорреляционной функции остаточных ошибок. Значения а,:, абсолютные величины которых превышают пороговое значение
< а1
А , остаются, остальные заменяются нулями: {а, =0, —
<М = 1 ,ЛГ },
г,-величина размаха выборки, протяженностью е, не содержащая
аномальных эффектов. В случае обнаружения аномалии: I — 12: А, к = /,
г,
определялась ее временная протяженность 1 = 0'- г) • 2'.
1
г х ' 1 1
Рис. 3 Данные регистрации ОА^ (а); общая энергия сигнала в скользящем временной окне (Ь); стрелками показаны моменты землетрясений с М>6.
В процессе экспериментов на основе АР-модели были получены следующие результаты. Для сигналов, зарегистрированных в разных точках измерения, порядки моделей были различными, но в каждом случае была получена хорошая модель: диагностические проверки на основе совокупного критерия согласия и нормированной кумулятивной периодограммы давали хорошие результаты. При этом в процессе анализа остаточных ошибок были выявлены краткосрочные временные аномальные эффекты (от 1,5 недель до 2,5 месяцев).
Таким образом, в процессе обработки реальных сигналов получены следующие результаты:
• в выявленные аномальные окрестности попали области повышенной сейсмичности: кратномаспггабное представление сигнала и конструкция вейвлет-пакетов позволили выявить и классифицировать (по энергии и длительности) короткопериодные аномальные эффекты;
• идентификация модели АР для сглаженной составляющей процесса позволила выделить серию краткосрочных аномальных эффектов, в совокупности определяющих среднесрочные
временные периоды высокой сейсмичности. Что подтверждает работоспособность предложенного алгоритма. Статистическая модель проведения экспериментов на модельных сигналах показана на рис. 4._
Ъ
% Модель данных
£
2Г\
* Л «г
у г
"Ж........ & 1 < 1 г
1 .л (Г
к
т
5
1
Модель обнаружения аномалий сигнала
Результат обработки
Рис. 4 Блок-схема статистической модели проведения экспериментов.
Модель состоит из следующих элементов:!)''' = У52;_„5у = ,
амплитуда входного сигнала; у/(В) = ф~1(В)- стационарный оператор авторегрессии; вейвлет-восстановление г, по коэффициентам
разложения; 2\ - локальные нестационарности масштаба /, имеющие вид: прямоугольный импульс высоты синусоида с амплитудой
модулированная функцией Гаусса; треугольное колебание с уровнем Временная протяженность перечисленных локальных особенностей является случайной величиной, имеющей равномерное распределение на интервале ['/»';+!]• = также является случайной величиной, имеющей равномерное распределение на интервале [а,6], где значения а,Ъ различные для каждого масштабного уровня /.
Модель данных составлена в полном соответствии со структурой исследуемых сигналов, причем локальные нестационарности, добавленные в сигнал, по форме идентичны выявляемым аномальным эффектам.
Методика проведения экспериментов заключалась в следующем: для каждого типа локальной особенности в ходе экспериментов определялось наименьшее значение ее относительной величины, позволяющее обнаруживать ее с вероятностью 0,99. Для доказательства достоверности
полученного результата использовался критерий согласия хг • Выявление аномалии и ее классификация на основе конструкции КМА проводилась в соответствии с алгоритмом, рассмотренным выше. Кроме того, производилась свертка каждого уровня детальности с аномалией того вида, который в нем содержится, затем полученные коэффициенты аномальной окрестности сравнивались с аномальным вектором. На рис. 5 показан график зависимости значений вероятности обнаружения аномалии от ее относительной величины. График подтверждает достаточно устойчивый
характер вероятности обнаружения аномалии при
>1,3.
Рис. 5 График зависимости вероятности обнаружения аномалии от ее относительной величины
На основе КМА были получены следующие результаты экспериментов:
• любая из рассмотренных видов локальных особенностей, высота которой превышает фоновый уровень в 1.3 раза и более, позволяет себя обнаруживать и правильно классифицировать (по энергии сигнала и по временной протяженности) с вероятностью 0,99;
• разработанные методы и алгоритмы позволяют также обнаруживать и классифицировать аномалии, высота которых равна уровню шума в сигнале, но временная протяженность таких аномалий должна быть более 20 отсчетов.
Для решения задачи обнаружения и классификации аномальных эффектов геохимических данных рассмотренные требования являются достаточными, что доказывает работоспособность предложенных в работе методов и алгоритмов выделения и классификации разномасштабных аномальных составляющих геохимических сигналов.
Методика проведения экспериментов на основе АР-модели заключалась в следующем: в процессе экспериментов в модель авторегрессии добавлялся аномальный эффект, временная протяженность которого постепенно увеличивалась до момента возникновения разладки в системе. Так же использовались сигналы, включающие в себя несколько различных АР-процессов.
В процессе экспериментов были получены следующие результаты:
• в момент разладки происходило резкое увеличение остаточной ошибки, что свидетельствовало о наличии краткосрочной аномалии;
• с последующим увеличением длины аномальной окрестности происходит обнаружение среднесрочной аномалии, выделяемое невыполнением совокупного критерия согласия;
• на основе метода максимального правдоподобия были получены точные оценки моментов изменения в системе.
Кроме этого для оценки алгоритма обнаружения среднесрочных и долгосрочных аномальных эффектов проводилась обработка
я
сгенерированных сглаженных компонент и и полученные результаты сравнивались с характеристиками, полученными в процессе обработки этих же компонент, но уже для восстановленных сигналов. На основе сравнения характеристик этих процессов был получен следующий результат: в процессе кратномасштабного разложения часть шумовых высокочастотных компонент перешло в детализирующие составляющие сигнала, в результате структура сигнала упростилась, что повлекло понижение порядка модели и уменьшение остаточных ошибок. Эти факты также подтверждались оценками спектральных характеристик процессов. Данный результат говорит о хорошей совместимости КМА и модели АРПСС, и тем самым дает хорошую оценку предлагаемого метода обработки.
Таким образом, проведенное в диссертационной работе экспериментальное исследование показало, что предложенные методы и алгоритмы позволяют эффективно производить обнаружение аномальных эффектов в геохимических сигналах и решать задачу их классификации.
ЗАКЛЮЧЕНИЕ
Основные научные и практические результаты работы можно сформулировать следующим образом:
1. Разработана модель геохимических сигналов и способ решения задачи обработки и обнаружения аномального поведения геохимических данных на основе совмещения модели авторегрессии-проинтегрированного скользящего среднего и быстрого вейвлет- преобразования.
2. Разработан способ классификации выявленных аномалий, основанный на использовании быстрого вейвлет-разложения сигнала.
3. Разработаны численные методы и способ использования вейвлетов, построенных на основе сплайнов, обеспечивающие повышение качества обработки данных.
4. На основе доказанной теоремы разработана конструкция вейвлет-пакетов, улучшающая частотную локализацию при проведении детального анализа выявленной аномалии в вариациях концентраций геохимических компонентов.
5. Реализован программный комплекс на ПЭВМ, выполнены экспериментальные исследования предложенных моделей, численных методов и алгоритмов на модельных и реальных сигналах и получены положительные результаты.
6. При ретроспективном анализе на основе разработанной модели геохимических сигналов на Камчатском сейсмическом полигоне на примере радона были выявлены аномалии в его поведении, которые могут быть отождествлены с предвестниками периодов повышенной сейсмической активности.
Дальнейшая работа может быть направлена на расширение количества видов аномальных эффектов, содержащихся в геохимических сигналах, с использованием широкого объема экспериментальных данных для различных условий регистрации, а также на другие виды наблюдений, которые имеют дело с временными рядами.
По теме диссертации опубликованы следующие работы:
1. Мандрикова О.В., Филиппов Ю.А., Фирстов П.П. Выявление среднесрочных предвестников сильных землетрясений с М>6,5 Авачинского залива (Камчатка) в динамике подпочвенного радона // Ежегодная научная сессия, посвященная дню Вулканолога. Тезисы докладов. — Петропавловск-Камчатский: Издательство КГПУ (РАН, Дальневосточное отделение), 3-4 апреля 2002г. — с.31-35.
2. Мандрикова О.В. Тристанов А.Б. Исследование локальных особенностей временного ряда с использованием пакета Wavelet Toolbox. // труды Всероссийск. научн. конф. "Проектирование научных и инженерных приложений в среде Matlab"— Москва: ИПУ РАН, 28-29 мая 2002г, с.242-261
3. Мандрикова О.В., Тристанов А.Б., Фирстов П.П. Представления о вейвлет-анализе и возможность его использования для рядов мониторинга подпочвенного радона на Петропавловск-Камчатском геодинамическом полигоне //сбор. ст. «Проблемы современной науки» Труды КамчатГТУ. Вып. 16 - Петропавловск-Камчатский: Издательство КГТУ, 2002г.-с.139-153
4. Мандрикова О.В., Филиппов Ю.А., Фирстов П.П. Предвестниковые аномалии сильных землетрясений в динамике подпочвенного радона на Петропавловск-Камчатском геодинамическом полигоне в 1997-2001гг // ДАН. 2003.Т.З 89.№6.с. 810-813.
5. Мандрикова О. В., Фирстов П. П. Сплайн-вейвлеты как инструмент обработки и анализа краткосрочных вариаций геохимических компонентов. // Матер. Междунар. научн.-практич. конф. "Рыбохозяйственное образование Камчатки в XXI веке". — Петропавловск-Камчатский, 15-16 октября 2002 г. — с.261-270.
6. Мандрикова О.В. Непараметрическое моделирование сейсмических данных с использованием сплайн-вейвлетов. — СПб, 2002. (Известия ГЭТУ)- с.77-81.
7. Геппенер В.В., Мандрикова О.В. Совмещение параметрического и непараметрического подходов к построению моделей нестационарных временных рядов, имеющих сложную структуру, с целью повышения качества их обработки. — СПб, 2003. (Известия ГЭТУ)- с. 14-17.
8. Геппенер В.В., Мандрикова О.В., Фирстов П.П. Прогнозирование сейсмической активности с использованием многоструктурной модели
геохимических данных // Междунар. конф. по мягким вычислениям и измерениям (БСМ'2003), - Сборник докл. С.-Петербург, 23-24 июня 2003 г./Изд-во СПбГЭТУ "ЛЭТИ", СПб, в 2-х т., Т.2., стр. 194-197.
Подписано в печать 10.09.2003. Формат 60x84/16. Отпечатано с готового оригинал-макета в типографии ЗАО «КопиСервис». Печать ризографическая. Заказ № 1/1009. П. л. 1.25. Уч.-изд. 1.2. Тираж 100 экз.
ЗАО «КопиСервис», 194017, Санкт-Петербург, Скобелсвский пр., д. 16
тел.: (812) 234 4333
РЧ296
Оглавление автор диссертации — кандидата технических наук Мандрикова, Оксана Викторовна
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР МЕТОДОВ ГЕОХИМИЧЕСКИХ ИССЛЕДОВАНИЙ И СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ. ЗНАЧЕНИЕ ГЕОХИМИЧЕСКИХ МЕТОДОВ ДЛЯ КРАТКОСРОЧНОГО И ОПЕРАТИВНОГО ПРОГНОЗА ЗЕМЛЕТРЯСЕНИЙ.
1.1. Значение геохимических методов для краткосрочного прогноза землетрясений.
1.2. Радон как главный объект исследования в задачах прогноза землетрясений геохимическими методами. О механизме аномалий радона в период подготовки землетрясений.
1.3. Методы регистрации.
1.4. Влияние внешних факторов на регистрацию.
1.5. Обзор существующих методов геохимических исследований и статистической обработки данных.
1.6. Анализ основных подходов к решению задачи.
1.7. Выводы.
ГЛАВА 2. КЛАССИФИКАЦИЯ АЛГОРИТМОВ ОБНАРУЖЕНИЯ ИЗМЕНЕНИЯ СВОЙСТВ ВРЕМЕННЫХ РЯДОВ.
2.1. Формальная постановка задачи.
2.2. Последовательные методы обнаружения разладки (независимые случайные последовательности).
2.2.1. Методы, использующие априорное распределение момента t0.
2.2.2. Методы, не использующие апостериорное распределение момента /0( скалярный параметр в ).
2.2.3. Методы, не использующие апостериорное распределение момента /0 (векторный параметр в).
2.2.4. Критерии оптимизации последовательных алгоритмов.
2.2.5. Настройка и сравнение алгоритмов.
2.3. Апостериорные методы обнаружения разладки.
2.3.1. Параметрические методы, независимые последовательност.
2.3.2. Параметрические методы, зависимые последовательности.
2.3.3. Критерии оптимизации апостериорных алгоритмов.
2.4. Модель разладки сглаженной компоненты геохимического сигнала.
2.5. Выводы.
ГЛАВА 3. НЕПАРАМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ НА ОСНОВЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ.
3.1. Основные определения.
3.1.1. Непрерывное вейвлет-преобразование.
3.1.2. Дискретное вейвлет - преобразование.
3.1.3. Частотно — временной анализ.
3.2. Быстрое вейвлет-преобразование.
3.2.1. Масштабирующие функции с конечными двухмасштабными соотношениями.
3.2.2. Разложение L2 (R) в прямую сумму.
3.2.3. Определение двойственного вейвлета.
3.3. Вейвлеты с компактным носителем.
-43.4. Сплайны.
3.4.1. Базисные свойства сплайнов.
3.4.2. Двухмасштабное соотношение В-сплайнов.
3.4.3. Алгоритм изображения графиков любой сплайн-функции на любом желаемом уровне разрешения./
3.4.4. Сплайн-аппроксимационные формулы.
3.4.5. Сплайн-интерполяционные формулы.
3.5. Сплайны как инструмент построения вейвлетов с наименьшим * носителем.
3.6. Сплайн-вейвлет-пакеты.
3.7. Выводы.
ГЛАВА 4. ОПИСАНИЕ ВРЕМЕННЫХ РЯДОВ С ПОМОЩЬЮ МОДЕЛЕЙ АРПСС.
4.1. Основные определения.
4.1.1. Процессы АР, ПСС и смешанные процессы. Условия стационарности и обратимости.
4.1.2. Автокорреляционная функция и дисперсия процессов авторегрессии.
4.1.3. Автокорреляционная функция и дисперсия процессов скользящего среднего.
4.1.4. Смешанные процессы.
4.2. Процессы АРПСС.
4.2.1. Три формы представления модели АРПСС.
4.3. Прогноз будущих значений временного ряда.
4.3.1. Прогноз с минимальной среднеквадратичной ошибкой
Ч 4.3.2. Подправление прогнозов.
4.3.3. Вероятностные пределы прогнозов.
4.3.4. Эвентуальная прогнозирующая функция, определенная оператором авторегрессии.
4.3.5. Роль оператора СС в определении начальных величин.
4.3.6. Веса прогноза для упреждения 1.
4.4. Возвратное представление модели АРСС.
4.5. Идентификация модели.
4.5.1. Выбор порядка АР - модели.
4.5.2. Оценка параметров АР - модели.
4.5.2.1 Модифицированный ковариационный метод.
4.5.3. Диагностическая проверка модели.
4.5.3.1 Проверка при помощи автокорреляционной функции остаточных ошибок.
4.5.3.2 Проверка при помощи кумулятивной периодограммы
4.6. Выводы.
ГЛАВА 5. СОВМЕЩЕНИЕ АР-МОДЕЛИ И БЫСТРОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОБНАРУЖЕНИЯ И КЛАССИФИКАЦИИ АНОМАЛЬНОГО ПОВЕДЕНИЯ ГЕОХИМИЧЕСКИХ КОМПОНЕНТОВ.
5.1. Структура сигнала геохимической компоненты.
5.2. Совмещение АР-модели и быстрого вейвлет преобразования с целью повышения качества обработки геохимических данных.
5.2.1. Разделение сигнала на составляющие в пространстве L2(R).
5.2.2. Идентификация модели АР для сглаженной компоненты сигнала.
5.2.3. Многоуровневая модель процесса.
5.3. Выводы.
ГЛАВА 6. ЭКСПЕРИМЕНТЫ ПО ОБНАРУЖЕНИЮ И КЛАССИФИКАЦИИ АНОМАЛЬНЫХ ЭФФЕКТОВ ГЕОХИМИЧЕСКИХ СИГНАЛОВ. РЕАЛИЗАЦИЯ МЕТОДА СТАТИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ОЦЕНКИ МНОГОСТРУКТУРНОЙ МОДЕЛИ
6.1. Описание программного обеспечения.
6.2. Описание статистических данных.
6.3. Эксперименты по обнаружению и классификации краткосрочных и среднесрочных аномалий на основе КМА и конструкции вейвлет-пакетов.
6.3.1. Методика проведения экспериментов.
6.3.2. Результаты экспериментов.
6.4. Эксперименты по обнаружению и классификации среднесрочных и долгосрочных аномалий на основе АР-модели
6.4.1. Методика проведения экспериментов.
6.4.2. Результаты экспериментов.
6.5. Реализация метода статистического моделирования для оценки многоструктурной модели.
6.5.1. Статистическая модель системы.
6.5.2. Формирование входных модельных сигналов.
6.5.3. Обработка и анализ результатов статистического моделирования.
6.5.3.1 Методика проведения экспериментов на основе кратномаспггабного разложения сигнала.
6.5.3.2 Оценка характеристик.
6.5.3.3 Методика проведения экспериментов на основе модели авторегрессии.
6.5.3.4 Результаты экспериментов.
6.6. Выводы.
Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Мандрикова, Оксана Викторовна
Актуальность
Настоящая работа посвящена моделированию процессов обработки геохимических данных с целью обнаружения аномальных эффектов геохимических сигналов и выделения периодов высокой сейсмичности.
В качестве поисковых критериев возникновения геохимических аномалий рассматриваются изменения химических показателей или концентрации отдельных компонентов подземных вод и подпочвенных газов. Возможность использования отдельных геохимических параметров в качестве поисковых критериев предсказания землетрясений неоднократно подтверждалась исследованиями в различных сейсмоактивных районах страны. В широком комплексе методов, используемых для прогноза землетрясений (сейсмологические, гидрогеодинамические и др. методы), роль геохимических методов представляется наиболее эффективной на стадии краткосрочного прогноза. Для каждой конкретной зоны выявление комплекса присущих ей предвестников землетрясений и изучения характера их проявления происходит на базе многолетних наблюдений. И, несмотря на то, что проблема поиска и прогноза землетрясений исследуется достаточно давно, вариабельность геохимических полей во времени в настоящее время недостаточно изучена и особенно их дифференцированности в различных сейсмоактивных областях. В настоящее время интерес к исследованию и разработке методов обработки геохимических данных сильно возрос. Это также связано со значительным ростом производительности вычислительных средств и появлению новых научных знаний и методов обработки временных рядов.
Поскольку вариации компонентов имеют достаточно сложную структуру, а также в связи с практическим отсутствием представительной статистической выборки, задача обнаружения и классификации аномалии является весьма сложной. Аномальное поведение компоненты может содержать резкие всплески концентраций, сопровождаться серией пиков. Относительная величина и временная протяженность таких аномалий зависит от интенсивности и длительности процесса трещинообразования, температуры и др. факторов. Построение формальных моделей в этом случае весьма затруднительно. Результаты исследований в своем большинстве относятся к низкочастотным составляющим колебаний концентрации геохимических компонентов и свидетельствуют о возможности предсказания длительных периодов (5-3 мес.) высокой сейсмичности. Для анализа устойчивых изменений производят процедуру сглаживания и это, несомненно, влечет потерю информации. Однако, зачастую, наряду с положительными аномальными изменениями отдельных параметров отмечаются короткопериодные скоротечные вариации, что весьма важно для оперативного прогноза землетрясений и используемые методы в этом случае нельзя считать достаточно эффективными. Для оценки периодических изменений компонент временного ряда широко применяются ряды Фурье, но в данном случае наличие в сигналах резких пикообразных вариаций компонентов и ступенеобразных особенностей, ставят под сомнение эффективность методов спектрального анализа. В тоже время существует сравнительно новая математическая конструкция, названная вейвлет-анализ, которая позволяет исследовать сигнал с достаточной степенью локализации и выявить характер подобной особенности в сигнале. Вейвлет-анализ является одним из наиболее эффективных современных методов детального изучения закономерностей нестационарных временных рядов.
В связи со сказанным актуальным является разработка новых методов обнаружения и классификации аномальных эффектов геохимических данных.
В диссертационной работе автором разработан новый подход к построению алгоритмов обработки геохимических данных, который предполагает совмещение модели авторегрессии - проинтегрированного
Ф скользящего среднего (АРПСС) и быстрого вейвлет преобразования с целью повышения качества обработки геохимических данных. Данная задача становится реализуемой благодаря возможности вейвлет-разложения произвольного сигнала на составляющие (конструкция кратномаспггабного анализа). Эта конструкция позволяет работать с дискретными данными, дает информацию о структуре сигнала, позволяет отделить высокочастотные локальные нестационарности и провести дополнительный анализ компонент, получить информацию о масштабах процесса. Это играет важную роль в задачах обработки сигналов с такой сложной структурой, как вариации концентраций геохимических компонентов. Образующаяся при этом сглаженная составляющая ряда имеет более простую структуру и может быть аппроксимирована моделью АРПСС с целью выявления среднесрочных и долгосрочных аномальных эффектов. Формальная модель сигнала в данном случае имеет вид:
0, а, = v'z,- разностный
JMz м оператор, xi'bB.jjc(t) = 2JI2}i'(2Jt-kb0) — базисный вейвлет, Ч^-*— соответствующий ему двойственный, фх,.,фр- коэффициенты авторегрессии, e(t)— ошибка.
Цель и задачи диссертационной работы. Целью работы является разработка моделей автоматической обработки геохимических данных: обнаружения и классификации аномального поведения компонентов с целью выявления периодов высокой сейсмичности.
Для достижения этих целей в диссертации решались следующие задачи:
1. Разработка и исследование алгоритмов автоматического обнаружения изменения параметров модели сигнала применительно к задаче обработки и обнаружения аномального поведения геохимических данных.
2. Разработка способов классификации выявленных аномалий с целью предсказания наиболее сильных землетрясений Камчатского геодинамического полигона.
3. Разработка программного обеспечения системы для автоматического обнаружения и классификации выявленных аномалий на базе ПЭВМ.
4. Моделирование разработанных алгоритмов в задачах обработки и обнаружения аномального поведения геохимических данных.
Методы исследования. В диссертационной работе использовался аппарат теории случайных процессов, теории цифровой обработки сигналов, теории распознавания образов, теории построения математических моделей, методы вычислительной математики, основы функционального анализа.
Научную новизну работы составляет:
• Способ решения задачи обработки и обнаружения аномального поведения геохимических данных на основе совмещения модели авторегрессии - проинтегрированного скользящего среднего и быстрого вейвлет преобразования.
• Алгоритм классификации выявленной аномалии, основанный на использовании вейвлет - преобразования сигнала.
• Способ использования вейвлетов, построенных на основе сплайнов, обеспечивающий повышение эффективности и качества обработки данных.
• Конструкция вейвлет-пакетов, улучшающая частотную локализацию при проведения детального анализа выявленной аномалии в динамике геохимического компонента.
Практическая ценность работы заключается в следующем:
1. Разработаны конкретные модели и алгоритмы выделения и классификации аномалии в динамике геохимического компонента.
2. Разработан программный комплекс на ПЭВМ, обеспечивающий решение задач выделения и классификации аномалий накануне сейсмических событий.
3. Проведены экспериментальные исследования предложенных моделей и алгоритмов на реальных и модельных сигналах и получены i положительные результаты.
4. Разработанные методы можно применять для более широкого круга задач, в которых необходим анализ нестационарных сигналов со сложной структурой.
Внедрение результатов работы: Работа выполнялась в рамках НИР «Выявление среднесрочных и краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки с М>6 в вариациях динамики подпочвенного радона, водорода и пространственно — временных характеристик сейсмичности», поддержаной грантом РФФИ №02-05-64467, а также грантом РФФИ для студентов, аспирантов и молодых ученых №03-05-06453а за 2003 г.
Разработанные программные средства и методические материалы использовались в учебном процессе при проведении лабораторных и курсовых работ по курсу «Системы цифровой обработки сигналов», для студентов специальности 210100 в КамчатГТУ.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на научно-технических конференциях КамчатГТУ в 2000-2003 гг.; на Всероссийской научной конференции "Проектирование научных и инженерных приложений в среде Matlab", Москва: ИЛУ РАН 2002г; на Международной научно-практической конференции "Рыбохозяйственное образование Камчатки в XXI веке", Петропавловск-Камчатский, 15-16 октября 2002 г.; на Международной конференции по мягким вычислениям и измерениям (SCM'2003), - С.Петербург, 25-27 июня 2003 г.
Публикации. По теме диссертации опубликовано 8 печатных работ, из них 4 статьи, 4 доклада на международных и всероссийских научно-технических конференциях.
Заключение диссертация на тему "Исследование и разработка математических моделей и численных алгоритмов для решения задач обнаружения аномалий при обработке геохимических данных"
Выводы
Экспериментальные исследования на реальных и модельных сигналах подтвердили все описанные в предыдущих главах диссертации преимущества и возможности предлагаемой многоструктурной модели временных рядов, объединяющей в себе достоинства параметрического и непараметрического подходов к построению модели. Разработанная конструкция позволяет не только повысить качество обработки сигналов со сложной структурой данных, но и значительно расширяет возможности изучения подобных процессов.
Теория вейвлетов, имея в своем распоряжении широкий спектр базисных функций различной формы, открывает широкие возможности в обработке данных сигналов и примеры, рассмотренные в этой главе, наглядно демонстрируют это. Кратномаспггабное представление сигнала и конструкция вейвлет-пакетов позволяют провести детальный анализ составляющих процесса, выявить и классифицировать короткопериодные аномальные эффекты, и, в итоге, получать информацию о масштабах процесса, что невозможно было реализовать спектральными методами.
Идентификация модели АРПСС для сглаженной составляющей процесса позволяет получить надежные оценки характеристик процесса, выделить средне- и долго-срочные аномальные периоды, а также, решить задачу предсказания его поведения во времени.
ЗАКЛЮЧЕНИЕ
Проведенные исследования позволили разработать новые подходы к решению проблем обнаружения и классификации аномальных эффектов геохимических сигналов, показать возможности применения разработанных методов и алгоритмов в различных прикладных задачах.
Основные научные и практические результаты работы можно сформулировать следующим образом:
1. Разработана модель геохимических процессов и способ решения задачи обработки и обнаружения аномального поведения геохимических данных на основе совмещения модели авторегрессии-проинтегрированного скользящего среднего и быстрого вейвлет-преобразования.
2. Разработан способ классификации выявленных аномалий, основанный на использовании быстрого вейвлет-разложения сигнала.
3. Разработаны численные методы и способ использования вейвлетов, построенных на основе сплайнов, обеспечивающие повышение качества обработки данных.
4. Разработана конструкция вейвлет-пакетов, улучшающая частотную локализацию при проведении детального анализа выявленной аномалии в вариациях концентраций геохимических компонентов.
5. Реализован программный комплекс на ПЭВМ, выполнены экспериментальные исследования предложенных моделей, численных методов и алгоритмов на модельных и реальных сигналах и получены положительные результаты.
Дальнейшая работа может быть направлена на расширение количества видов аномальных эффектов, содержащихся в геохимических сигналах, с использованием широкого объема экспериментальных данных для различных условий регистрации.
170
Библиография Мандрикова, Оксана Викторовна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Хитаров Н. И., Войтов Г. И., Лебедев В. С. О геохимических предвестниках землетрясений.- В кн.: Поиски предвестников землетрясений на прогностических полигонах. М.:Наука, 1974, с. 165-170.
2. Ахундова С. Б., Мамед-Заде Р. Н. Проблема прогноза землетрясений в научной литературе.-Изв. АН СССР. Физика Земли, 1980, № 6, с.61-64.
3. Гидрогеохимические предвестники землетрясений. Под ред. Г. М. Варшала. М.: Наука, 1985.
4. Осика Д. Т. Опыт разработки и перспективы практического использования геохимических и гидрологических методов прогноза места, силы и времени мелкофокусных землетрясений.-Геохимия, 1979, № 3, с. 354-364.
5. Поиски предвестников землетрясений Под ред. Е. В. Саваренского. Ташкент: Фан, 1974. 264с.
6. Агамирзоев Р. А., Золотовицкая Т. А., Исмаил-Заде Т. А. и др. Поиски предвестников землетрясений в Азербайджане.- В кн.: Поиски предвестников землетрясений. Ташкент: Фан, 1976, с. 213-216.
7. Алексеев Ф. А., Войтов Т. Н. и др. О радиохимических, изотопных и геохимических эффектах в сейсмоактивных областях.- В кн.: Ядерная геология. М.:ОНТИ ВНИИЯГ, 1974, с.91-105.
8. Мирзоев К. М., Маламуд А. С. и др. Поиск пространственно-временных закономерностей изменения параметров, предваряющих сильное землетрясение. В кн.: Поиски предвестников землетрясений. Ташкент: Фан, 1976, с. 241-251.
9. Мавлянов Г. А., Султанходжаев А. Н. и др. Явление изменения химического состава подземных вод при землетрясении.- Диплом № 129 по заявке № 01-7928 от 14 апреля 1971 г. Бюл. № 42,1973.
10. Беляев А. А. Особенности радоновых прогнозных признаков землетрясений.- Геохимия, 2001, №12, с. 1355-1360.
11. Гидрогеохимические предвестники землетрясений. Под ред. Г. М. Варшала. В кн.: Желанкина Т. С., Кушнир А. Ф., Писаренко В. Ф. и др. Комплексный статистический анализ геохимических предвестников землетрясений. М.: Наука, 1985.С.135-148.
12. Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов. М.: Наука, 1983.
13. Обнаружение изменения свойств сигналов и динамических систем, (под ред. М. Бассвиль) М.: МИР , 1989.
14. В.Е. Привальский, В.А. Панченко, Е.Ю. Асарина. Модели временных рядов: СПб.: Гидрометеоиздат, 1992.
15. Дж. Бокс, Г. Дженкинс Анализ временных рядов прогноз и управление: Пер. с англ. М.: Мир, 1974.
16. Султанходжаев А. Н., Зиган Ф. Г. Методические рекомендации кгидросейсмологическим исследованиям. Ташкент: Фан, 1980. 52с.
17. И.Добеши. Десять лекций по вейвлетах, Пер. с английского, -Ижевск: НИЦ «Регулярная и хаотическая динамика».- 2001
18. К. Чуй. Введение в вейвлеты. Пер. с английского, М.: Мир.—2001.
19. Марпл.-мл. С. Л. Цифрофой спектральный анализ и его
-
Похожие работы
- Разработка и исследование алгоритмов обнаружения протяженных аномалий на многозональных изображениях
- Метод и вычислительное устройство автоматического обнаружения топологических аномалий на земной поверхности по космическим видеоизображениям
- Математическое и программное обеспечение задач обнаружения аномалий в поведении автоматизированных систем обработки информации
- Структурные модели и алгоритмы обнаружения аномалий в ионосферных сигналах
- Прогноз мелкоамплитудных тектонических нарушений угольных пластов по содержанию металлов-индикаторов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность