автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Алгоритмы обнаружения предвестников геодинамического события по временным рядам измерений электромагнитных сигналов

кандидата технических наук
Мертвецов, Александр Николаевич
город
Томск
год
2011
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Алгоритмы обнаружения предвестников геодинамического события по временным рядам измерений электромагнитных сигналов»

Автореферат диссертации по теме "Алгоритмы обнаружения предвестников геодинамического события по временным рядам измерений электромагнитных сигналов"

АЛГОРИТМЫ ОБНАРУЖЕНИЯ ПРЕДВЕСТНИКОВ ГЕОДИНАМИЧЕСКОГО СОБЫТИЯ ПО ВРЕМЕННЫМ РЯДАМ ИЗМЕРЕНИЙ ЭЛЕКТРОМАГНИТНЫХ СИГНАЛОВ

Специальность 05.13.18 — Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

- 1 ДЕК 2011

Томск 2011

005002983

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Национальный исследовательский Томский политехнический университет»

Научный руководитель:

доктор технических наук, профессор Букреев Виктор Григорьевич

Официальные оппоненты: доктор технических наук, профессор,

Лившиц Климентий Исаакович (Томский государственный университет)

доктор технических наук, профессор, Дмитриев Вячеслав Михайлович (Томский государственный университет систем управления и радиоэлектроники)

Ведущая организация:

Алтайский государственный университет

Защита состоится 22 декабря 2011 г. в 15:15 часов на заседании диссертационного совета Д 212.268.02 при Томском государственном университете систем управления и радиоэлектроники по адресу: 634050, г. Томск, пр. Ленина, 40, ауд. 203.

С диссертацией можно ознакомиться в научной библиотеке Томского государственного университета систем управления и радиоэлектроники по адресу: 634045, г. Томск, ул. Вершинина, 74.

Автореферат разослан 21 ноября 2011 г.

Ученый секретарь

диссертационного совета

Р.В. Мещеряков

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. В последние годы в районах отработки полезных ископаемых участились случаи проявления горных ударов, внезапных выбросов, горно-тектонических землетрясений и других геодинамических явлений. Эти процессы порождаются в массивах горных пород не только действием больших тектонических напряжений, но и увеличением глубины отработки месторождений, структурной неоднородностью массива и свойствами слагающих его горных пород. Крупные технологические взрывы, применяемые для обрушения рудных блоков на железорудных месторождениях, также сопровождаются мощными динамическими явлениями. Все это наносит значительный экономический ущерб промышленным предприятиям и гражданским объектам, а также ведет к травматизму и человеческим жертвам. Поэтому особую остроту приобрела проблема мониторинга изменения напряженно-деформированного состояния массивов горных пород. Для исключения последствий геодинамических явлений необходим надежный прогноз геомеханических условий ведения горных работ.

Одним из наиболее перспективных методов контроля изменения напряженно-деформированного состояния массивов горных пород, является бесконтактный способ, основанный на регистрации электромагнитных сигналов, возникающих при механическом воздействии на горные породы. При механоэлектрических преобразованиях параметры электромагнитных сигналов (ЭМС) несут информацию об изменении напряженно-деформированного состояния и процессах образования деструктивных зон.

В основе данного метода лежат исследования, начатые в конце 60-годов в Томском политехническом институте под руководством чл. корр. АПН, профессора A.A. Воробьева. Исследование механоэлектрических преобразований и проблемы обнаружения предвестников геодинамических явлений получило развитие в работах Гохберга М.Б., Соболева Г.А., Морозова В.Н., Курлени М.В., Мастова Ш.Р. и др.

Данные об изменении параметров ЭМС, получаемые при мониторинге изменений напряженно-деформированного состояния горных пород с использованием специальных регистраторов, представляют собой набор временных рядов. В настоящее время в геоинформатике разработкой методов и алгоритмов обнаружения аномалий (предвестников геодинамических явлений) во временных рядах занимаются А.Д. Гвишиани, С.М. Агаян, Ж. Злот-ники, J.-L. LeMouöl, Ш.Р. Богоутдинов. Однако до настоящего времени не существуют достоверных алгоритмов обнаружения предвестников, в силу того, что аналитическое описание параметров ЭМС или характеристик электромагнитной эмиссии (ЭМЭ) неполно или невозможно в силу их нелинейности и стохастичности.

Поэтому задача обнаружения предвестников геодинамических явлений по временным рядам измерений характеристик ЭМС является актуальной.

Одним из направлений определения аномалий во временных рядах является направление, связанное с применением алгебраического подхода (Ю.И. Журавлев), которое развивается в трудах ВЦ РАН как исследование и апробация технологии разметки временных рядов с позиций теоретико-множественного описания (К.В. Рудаков, Ю.В. Чехович).

Объектом исследования являются геодинамические явления, в процессе протекания которых возникающая электромагнитная эмиссия в горных породах служит источником измеряемых электромагнитных сигналов, образующих нестационарные стохастические временные ряды.

Предметом исследования являются модели предвестников геодинамических явлений и оптимальные алгоритмы их обнаружения.

Целью диссертационной работы является разработка и исследование эффективных алгоритмов обнаружения аномальных данных в нестационарных стохастических временных рядах.

Задачи исследований:

1. анализ методов обнаружения предвестников геодинамического события и программных комплексов, применяемых при их обнаружении;

2. формализация задачи обнаружения предвестников геодинамического события, как задачи разметки стохастического временного ряда;

3. описание класса алгоритмов, предназначенных для решения задачи обнаружения параметров предвестника геодинамического события;

4. разработка корректных алгоритмов разметки стохастического временного ряда и их сравнительный анализ;

5. постановка задачи многокритериального выбора оптимальной системы окрестностей и оценка эффективности численной процедуры построения оптимальной системы окрестностей;

6. разработка алгоритма обнаружения предвестников геодинамического события и их реализация в виде динамически подключаемых библиотек;

7. разработка программного комплекса и базы данных, предназначенных для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

Методы исследований. При решении поставленных задач использовались методы теории распознавания образов, теории принятия решений и многокритериального оценивания, теории нечетких множеств, формализма мультимножеств, методы теории вероятностей, информации и математической статистики. Для моделирования и разработки алгоритмов использовались приложения Matlab, Mathcad, OriginPro, для реализации алгоритмов и программного комплекса использовались методы программирования в среде разработки Microsoft Visual Studio 2008, платформа Microsoft.NET, технологии ASP.NET, Microsoft.NET Remoting. При проектировании и разработки базы данных использовались ERwin Data Modeler, СУБД Microsoft SQL Server Express 2005.

Научная новизна:

1. предложена модель предвестника геодинамического события, представляющая композицию неизвестных функций, интерпретируемых как параметры предвестника и отличающаяся тем, что позволяет формализовать решаемую задачу обнаружения предвестника, как задачу разметки стохастического временного ряда;

2. создан корректный алгоритм разметки стохастического временного ряда, позволяющий описать полезную составляющую исходного электромагнитного сигнала известными базисными функциями и отличающийся тем, что для описания фрагментов временного ряда используется их символьное представление;

3. предложена численная процедура расчета размера окрестностей значений временного ряда, позволяющая определить на основе решения задачи многокритериального выбора оптимальные базисные функции, аппроксимирующие неслучайную составляющую соответствующих фрагментов ряда.

Практическая ценность:

1. разработан программный комплекс с распределенной архитектурой, предназначенный для обработки геофизических электромагнитных данных, отличающийся организацией вычислений на стороне сервера, интеграцией с веб-приложениями и унифицированным описанием подключаемых модулей обработки данных;

2. создано клиентское desktop-приложение «ReDSS Geo», использующее интерфейс программирования приложений (набор интерфейсов) программного комплекса «ReDSS» для исследования разработанных алгоритмов анализа и мониторинга геофизических процессов, описание которых представлено в виде временных рядов;

3. разработана база данных результатов электромагнитных и акустических измерений геофизических процессов, предназначенная для структурирования и хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород, а также временных рядов полученных при разрушении образцов горных пород в лабораторных условиях.

Достоверность результатов работы подтверждается корректностью постановки задачи, сопоставимостью результатов теоретических исследований с существующими положениями проблемно-ориентированной теории, корректностью постановки экспериментов и обработки экспериментальных данных, качественным и количественным соответствием теоретических исследований и экспериментальных данных, полученными как лично автором, так и другими исследователями.

Реализация результатов работы.

Математические модели, алгоритмы и программное обеспечение, разработанные при выполнении диссертационной работы, использовались при выполнении грантов: РФФИ № 09-01-99014-р_офи «Разработка подходов к повышению эффективности методов и алгоритмов распознавания образов и оценки их качества», РФФИ № 11-07-00666-а «Исследование и разработка информационной системы мониторинга геодинамических процессов, основанной на электромагнитной эмиссии горных пород» и были встроены в программный комплекс «ЯеБ88», расположенный по адресу: http://redss.ru. Разработанные алгоритмы, программный комплекс и база данных используется в ПНИЛ ЭДиП ТПУ (г. Томск). Результаты исследований используются также в учебном процессе подготовки студентов энергетического института Национального исследовательского Томского политехнического университета в курсе «Комплексная автоматизация технологических процессов».

Основные защищаемые положения:

1. корректный алгоритм разметки стохастического временного ряда на основе символьного описания его фрагментов, позволяющий описать полезную составляющую исходного электромагнитного сигнала известными базисными функциями с уточнением условий его регулярности;

2. численная процедура построения системы окрестностей значений временного ряда, определяющая оптимальный выбор базисной функции на основе многокритериального оценивания и позволяющая увеличить качество их распознавания до 15%, по сравнению с традиционным подходом;

3. программный комплекс ИеБ8Б имеющий распределенную архитектуру, позволяющий тестировать новые методы и алгоритмы обработки и анализа временных рядов при проведении геофизических исследований.

Апробация работы. Результаты диссертационной работы докладывались на международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж, 2009 г.); 1-й международной научно-технической конференции КНИТ -2009 (Белгород, 2009 г.); XVII международной научно-практической конференции студентов, аспирантов и молодых ученых «Современные техника и технологии» (Томск, 2011 г.); научно-технических семинарах ПНИЛ ЭДиП и кафедры электропривода и электрооборудования ТПУ (Томск, 2009 - 2011 гг.).

Публикации. Результаты выполненных исследований отражены в 13 печатных работах, которые включают в себя 3 статьи в журналах, рекомендуемых ВАК РФ, 3 статьи в сборниках научных трудов, тезисы 4-х докладов на международных и всероссийских конференциях и 3 авторских свидетельства о государственной регистрации программ для ЭВМ.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложения. Общий объем работы составляет 148 страниц, в том числе рисунков - 42, таблиц -16, список литературы из 82 наименований, приложение на 15 страницах.

СОДЕРЖАНИЕ РАБОТЫ

Во введении показана актуальность диссертационной работы, сформулированы цель и задачи исследований, обозначены основные пункты научной новизны и практической значимости результатов исследований, представлена структура диссертации.

В первой главе дано краткое описание бесконтактного способа контроля изменения напряженно-деформированного состояния, основанного на регистрации электромагнитной эмиссии, возникающей при механическом на-гружении горных пород. Приводятся причины возникновения эмиссии и связь характеристик ЭМЭ с этапами деформирования. Дано описание исходных данных для исследований по обнаружению предвестников геодинамического события, проводимых в данной работе, которыми являются временные ряды измерений усредненной амплитуды ЭМС на частотах 2 кГц, 15 кГц, 100 кГц и в широкой полосе (ШП) от 1 до 100 кГц, полученные с помощью разработанного и изготовленного в ПНИЛ ЭДиП НИ ТПУ прибора РЕМС1.

Приводится краткий обзор методов обнаружения предвестников геодинамического события, исходными данными для которых являются временные ряды регистрируемых геофизических данных. В частности описываются методы основанные на статистическом подходе, регрессионных моделях, и спектральных характеристиках временных рядов, нейросетевые и нечеткие методы. Область применения каждого из рассмотренных методов ограничена множеством факторов, так как горный массив является сложной гетерогенной системой, и характеристики ЭМЭ зависят не только от прочности, но и от структурно-текстурных особенностей, проводимости, влажности и минерального состава.

Выполнен обзор программных комплексов (ПК) применяемых при обнаружении предвестников геодинамического события. Выделяются узкоспециализированные программные комплексы, которые содержат ограниченное число реализованных методов и алгоритмов и характеризуются отсутствием или малым количеством инструментария для анализа и обработки исходных данных и программные комплексы, предназначенные для решения широкого класса задач, которые содержат сравнительно большое количество реализованных методов и алгоритмов обработки и анализа данных. По итогам обзора формулируются основные требования к разрабатываемому программному комплексу.

Формулируется постановка задачи исследования. Изменение сигнала на этапе формирования очага разрушения (предвестника) горных пород, представляется в виде кусочно-заданной функции. Вводится понятие параметров предвестника, как набор функциональных зависимостей, с помощью которых можно описать изменение электромагнитного сигнала на этапе формирования очага разрушения.

Выделяется подзадача обнаружения параметров предвестника по временным рядам измерений характеристик электромагнитного сигнала, как этап обнаружения предвестников геодинамического события.

7

Во второй главе регистрируемый процесс изменения характеристик ЭМС предлагается представить в виде аддитивной смеси сигнала х(0 и помехи г](о, случайной составляющей наблюдаемого процесса, препятствующей достоверному восприятию последнего:

Я0 = *(0 + »?(0- (!)

Изменение сигнала х(1) на этапе формирования очага разрушения представляется в виде кусочно-заданной функции:

'/."(0. 'о < < ^

//(О, <' <'2 (2)

*«) =

/„'(О, '„.,<><'„

где = г.ЛГ-*ЛГ', N' = (1.....#»},*'={ 1.....У},

АеЛГ, уеЛ"', = П(г„г2) = 0(г,)-е(г2), = - функция Хеви-

сайда, (йу(г) - функция из набора = интерпретируемая как параметр предвестника, 10<(1<...<1п - моменты скачкообразного изменения вида функциональной зависимости (параметра предвестника).

Поскольку регистрируемый процесс у(г) подвергается дискретизации и квантованию, истинное значение дискретного сигнала представляется в виде суммы:

(3)

где к>о, у'к =у{Ш), д/ - интервал дискретизации, ек- погрешность квантования. Поскольку последовательность {ек} имеет случайный характер, то квантование обычно рассматривается как «белый» шум.

Принимая во внимание (1) и (3) исходные данные представляются в виде стохастического временного ряда (СВР), т.е. множества выборочных значений случайного процесса:

Ук=хк+т]к+ек, (4)

где хк = х(Ш), {¡]к} - «белый» шум с нулевым математическим ожиданием и неизвестной ограниченной дисперсией .

Вводится домен элементарных базисных функций Ф = {/„(£),у = 1,...,й}, где /„(к) - некоторая аналитически заданная функция. Полагается, что для каждого 1-го фрагмента СВР (4), регистрируемый процесс описывается моделью:

где i = l,...,/, л-; = f(k&t), At>0, /(/)eR - базисная функция из Ф, описывающая поведение неслучайной составляющей х[ в /-м фрагменте случайного временного ряда.

Стохастический временной ряд предлагается представить в виде множества в стохастических вектор-объектов1 s" =((/,, yt\...,(/„, у„)), п>\, tk,yk eR, =(/„}',)eR2, (k = Mf, At>0,tt <...<ij, yt, удовлетворяющий соотношению (4).

Для решения задачи обнаружения предвестника геодинамического события используется определения а и ß разметок временного ряда.

Любую последовательность меток ц" = (¿i,,...//„) из заданного алфавита символовМ = [ц,..., }, будем называть а-разметкой длины п, где метки (символы) //, соответствуют базисным функциям из

Ввиду того, что аналитическое описание функциональных зависимостей из Fa = {(tj), соответствующих j-му параметру предвестника, неизвестно,

экспертом задается их описание == (//,,...,//,„)<; М*, М" = {/,}, М* с М, е М

, j = l,...,J, i = ],...,т, на выбранном языке М.

Последовательность меток = (_£,,.../„) из заданного алфавита х, назовем ß-разметкой длины п, где метки х, соответствуют описаниям Xj,=(//,,...,//„) 6 Мх функциональных зависимостей из F„, = {ф1}.

Каждому вектор-объекту s", ставится в соответствие его допустимое описание (множество признаков) 1аЬ = {pn...,pj}j„b еЗ„ь cRJ, где р( - частота

вхождения метки х, из алфавита X в ß-разметку х" вектор-объекта s", ЗоЬ -

множество всех допустимых описаний.

Все допустимые описания 1„ь вектор-объектов, которые могут быть интерпретированы как «похожие» на признак предвестника геодинамического события, представляются в виде нечеткого множества2:

= (6) где g: ЗсЬ -> [0,1] - функция принадлежности, характеризующая степень принадлежности допустимого описания 1„ь вектор-объекта s" нечеткому множеству I w.

Было показано, что задача построения а, ß разметок по стохастическому временному ряду некорректны (так может быть несколько решений, удовлетворяющих заданным ограничениям), в связи с этим задача обнаружения предвестника reo динамического события была разбита на две подзадачи:

1. построения корректных алгоритмов а и ß разметки

2. построения оценки характеристической функции —[0,1], по обучающей выборке £ элементами которой являются вектор-объекты

1 Используется идеология разметки вектор-объеета (Чехович Ю.В.)

2 Zadeh L.A. Fuzzy sets. — Information and Control, 1965, vol.8, N 3,pp.338-353.

^({Ь'УЛ■■•>{1т>У„))> соответствующие этапу формирования очага разрушения, для различных образцов горных пород (формируется экспертами на основе результатов лабораторных испытаний).

Под корректным алгоритмом будем понимать такой алгоритм, который не допускает ошибок на обучающей выборке и удовлетворяет дополнительным ограничениям, которые задаются на основе содержательного представления об искомом отображении3.

Далее, согласно теории синтеза эффективных алгоритмов4 приводится описание класса корректных алгоритмов а, р разметки. Для этого были определены: рабочая, финальная, структурная информация, локальные и универсальные ограничения, условия разрешимости и регулярности.

Под рабочей информацией, понимаются временные ряды, как результаты измерений ЭМС при изменении напряженно-деформированного состояния горного массива или нагружении лабораторных образцов в последовательные моменты времени с определенным шагом дискретизации и представленные в виде множества 6 стохастических вектор-объектов.

Финальная информация представлена в виде множества пар -

вектор-объект и соответствующая ему а-разметка и множества троек (з\и",х") - вектор-объект и соответствующие ему аир разметки.

Структурная информация задается алфавитом а-разметки М, набором базисным функциям Ф = {/„(£), г = /г}, алфавитом р разметки X, набором описаний параметров предвестника м* и контрольной выборкой

Искомые алгоритмы Л": 5"М" и А" :ЛГ ->Х", где - множество всех различных вектор-объектов длины п, М", X" - множества всех различных аир разметок длины п, соответственно, удовлетворяют локальным ограничениям, если выполняются условия: Л" (.?") = //" и Л11 (э") = где тройка

= . а это объем контрольной выборки.

Для того чтобы искомые алгоритмы а" и а" удовлетворяли универсальным ограничениям, необходимо чтобы, вероятности правильной р-разметки, в случае =(//,) и вероятность присвоить Р-метку х, если истинная а-метка ц, входит в последовательность х, =(//1.,..,//„)еА/2 соответствующую р-метке х1, были отличны от нуля а вероятность присвоить р-метку х1, если истинная а-метка //, не входит в последовательность /у = (//[.....¿Ое М" соответствующую Р-метке х1 > была равна нулю.

Далее, используя понятие окрестности = .....,у1)),

/2 —+1 на основе анализа которой алгоритм л" а-разметки стохастиче-

3 Воронцов К.В. Локальные базисы в алгебраическом подходе к проблеме распознавания. Дис. канд. физ.-

мат. наук. М., 1999.

Журавлев Ю.И. Корректные алгебры над множествами некорректных (эвристических) алгоритмов. ]-Ш

// Кибернетика. - 1977. - № 4. - С. 5-17, 1977. - № 6. - С. 21-27, 1978. - № 2. - С. 35-43.

10

ского временного ряда принимает решение о разметке каждой точки s = {tj,yj) вектор-объекта s", показано, что разрешимость и регулярность задачи а, р разметки стохастического временного ряда, будет определяться выбором окрестности o(sy,uy) для каждой точки sj = {tj,yl) вектор объекта s".

В связи с этим ставится задача построения оптимальной системы окрестностей О", под которой понимается набор окрестностей o(sy,t/y),uy>0, соответствующих каждой точки Sj вектор-объекта s", обеспечивающий разрешимость и регулярность задачи а, р разметки.

Для построения алгоритмов из заданного класса корректных алгоритмов а, р разметки, предлагается использовать алгебраический подход5, основная идея которого состоит в построении корректных алгоритмических композиций, эффективность которых была бы выше отдельных алгоритмов.

Для построения алгоритмических композиций предлагается использовать корректирующие операции на основе модификации метода анализа иерархий.

В третьей главе приводится описание алгоритма а-разметки ARADS и разработанного алгоритма а-разметки SMA, алгоритма p-разметки стохастических временных рядов измерений характеристик ЭМС, численной процедуры построения оптимальной системы окрестностей и алгоритма обнаружения предвестников геодинамического события.

Алгоритм SMA (от Symbolic, Marking, Algorithm) основан на идее представления временного ряда длиной п в виде символьной последовательности (строки) произвольной длины w, (w < п, как правило w « п)6. Строка состоит из символов некоторого алфавита, мощностью а > 2.

Для того чтобы получить символьное описание, временной ряд предварительно нормируется, а затем разделяется на w равных по размеру участков, для каждого участка вычисляется среднее значение. Далее выбираются уровни Л, в зависимости от размера алфавита символов а, и при условии, что они разделяют пространство под кривой Гаусса на участки равной площади (рис. 1). В результате квантования получаем искомое символьное описание временного ряда.

Близость по заданной метрике, строки полученной для окрестности o(sj,Uj) точки Sj = (tj,yj) вектор-объекта s" и символьного описания функции из Ф = {fv(k),v = l,...,h}, определяет метку точки jy = (tnyj).

Для вычисления расстояния между символьными описаниями временных рядов, используются аналоги линейной, Евклидовой метрик и Чебышев-ского расстояния, р={р{,рг,ръ} определенные с использованием функции расстояния между символами алфавита а:

5 Рудаков К.В., Чехович Ю.В. Алгебраический подход к проблеме синтеза обучаемых алгоритмов выделения трендов // Доклады РАН. - 2003. -Т. 388. - № 1.- С. 33-36.

6 Lin, J., Keogh, Б., Lonardi, S., Chiu, В. A Symbolic Representation of Time Series, with Implications for Streaming Algorithms. In proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. San Diego, CA. June 13.

{О, если т-с <1

3 3 ,

тах(от,с)-1 - Ятт(т,с)• в пР°™*ном случае' где, т,с - номера символов в используемом алфавите а, х1 - уровни квантования (рис. 1).

.....Временной ряд -Среднее значение на интервале

Рис. 1. Представление временного ряда в виде символьной последовательности.

Далее, используя корректирующую операцию на основе модификации метода анализа иерархий, была построена композиция алгоритмов из класса А"(Ф,а,-к,р), где ре{р1,р2,ру}.

Экспериментально показано, что применение композиции алгоритмов а-разметки БМА уменьшает количество ошибочных разметок на 7% (табл.1). Используемая выборка формировалась из окрестностей (размером и, =4, и2 = 8, г/, =12, м4 =16, и5 = 20) точек реального временного ряда, полученного при лабораторном разрушении образца горной породы. Метка, соответствующая каждой окрестности из 5,1., определялась экспертом на основе фиксированного набора базисных функций Ф = {/ДА),V = 1,...,/?}.

Таблица 3.5 Сравнение качества разметки алгоритмом ЗМА выборки я].

по трем метрикам и композиции алгоритмов

Используемая метрика р Количество ошибочных разметок (щ т «=100)

и, =4 и2 =8 и, =12 к4= 16 и, =20

Евклидова метрика 19 26 30 29 33

Линейная метрика 18 28 36 35 45

Чебышевское расстояние 18 30 33 31 37

Композиция алгоритмов 17 20 24 24 26

Далее, был проведен сравнительный анализ корректных алгоритмов а-разметки стохастического временного ряда БМА и АЯАБЗ. Для этого использовалась выборка 5С2, состоящая из зашумленных (гауссовский шум с параметрами: N(0, 0.01), N(0, 0.02), N(0, 0.03), N(0, 0.05), N(0, 0.1), N(0, 0.2))

временных рядов, полученных дискретизацией значений функций из

Построена зависимость количества ошибочных разметок от параметров зашумления эталонных временных рядов (окрестностей размером и2 = 8), для алгоритмов БМА и АИАБЗ (рис. 2).

Сравнительный анализ алгоритмов показал, что корректный алгоритм а-разметки ЭМА, совершает от 2-х до 16% меньше ошибок разметки (в зависимости от параметров шума) чем алгоритм А11А08.

Для обеспечения разрешимости и регулярности задачи а, (3 разметки и уменьшения числа ошибочных разметок стохастического временного ряда, предложена численная процедура построения оптимальной системы окрестностей.

Обозначим О" множество всех возможных систем окрестностей О" ={оГ(5„ис),.-.,о,"(^,ис)} с размером и™" <ис ■си"™1 (итт >0 и и™ <п).

При построении численной процедуры определения системы окрестностей использовались следующие критерии оптимальности:

1. минимальная неопределенность разметки ц" вектор-объекта »".т.е.

минимум энтропийного критерия: = гДе

Рр =(р{1 - соответствующая функция вероятности распределения меток

из алфавита М а-разметки;

2. точность разметки, в смысле расстояния р{у,.,у'), где у,, у\ - признаки эталонных временных рядов полученных дискретизацией значений функций из Ф = {/„(*),у = 1,...,А} и признаки временного ряда соответствующего окрестности о"(5,,ис),о" еО" соответственно, определяемые используемым алгоритмом а-разметки л", для г=1

3. оптимальная система окрестностей О" должна иметь минимально возможный размер кс.

Процедура построения оптимальной системы окрестностей разделена на три этапа: предварительный выбор систем окрестностей из множества О" (этап предобработки); расчет критериев для каждой выбранной системы

-Л-

N{0,0.01)

_ь_I__1_I-1-1-

N10,0.02) N(0,0.03) N(0,0.05) N(0,0.1) N(0,0.2)

Рис. 2. Зависимость количества ошибочных разметок от параметров зашумления, при иг = 8, для корректных алгоритмов а-разметки: зеленым -АЯАВБ; синим -8МА

(этап расчета критериев); формирование множества Парето П(£) и выбор оптимальной системы окрестностей (этап принятия решения).

На этапе предобработки исходя из условия Н^Р* ,0")<ех , где #2(Р*,0") = ~ £ Л* 1о§2 (/>*)> Р* = (р?,-,р5) - вектор оценок вероятностей ме-

/е1.....,7

ток из алфавита X, определяемый по Р-разметке для системы окрестностей О" а в" пороговое значение энтропии, формируется множество 5" предварительно отобранных систем окрестностей и множество В векторов Р*.

На этапе расчета критериев, итеративно с заданной точностью е определяются оценки вероятностного распределения Р" = ,..., рЦ) всех меток из М, по распределению р* меток из X, при условии, что для вектор-объекта существует истинная разметка цп с вероятностным распределением Р". Для каждой системы окрестностей из £>", рассчитывается, используя Р", показатель неопределенности Н^Р^О") а-разметки ц" и точность разметки Д'*

В результате, на втором этапе процедуры для множества систем окрестностей 5" формируются множество критериев и э' (критерий №1 и №2).

На этапе принятия решения, для формирования парето-оптимального множества систем окрестностей П(Э£), были определены критерии МХс) = {н;\Хе}, и /2(Х(.) = р;|Х.}, ДеЭ", /1(ЛГ„) = {и,|ДГ,}, при усло-

вии что, Хс=0"{, Хс еХ, X = О". Для выбора оптимальной системы окрестностей из множества П(Х), применяется модификация метода анализа иерархий.

Для численной процедуры была определена оценка характерного времени сходимости Т5 » 30 (итераций), при этом использовалась зависимость

е(/) (рис 3) точности е расчета оценки Р" ={Рх,-,Рь), от времени работы процедуры I (количества итераций).

Для оценки эффективности процедуры построения оптимальной системы окрестности была сформирована выборка ={«,"}, путем зашумления эталонного временного ряда гауссовским шумом с параметрами N(0,0.001), N(0,0.005), N(0,0.01), N(0,0.05), N(0,0.1), N(0,0.2), N(0,0.3).

Относительное число ошибок Р-разметки полученной для вектор-

Рис. 3. Зависимость е(/)

объекта в" из , используя систему окрестностей О" размером и , определялось по формуле:

б» = б*(хГ.хГ) |м

Л 5

где, - разметка эталонного ряда, полученная при использовании оптимальной системы окрестностей данного ряда.

Из графиков зависимостей <2, (и) (рис. 4) видно, что размеру оптимальной системы окрестностей, определенной для зашумленного вектор-объекта я" е , соответствует локальный минимум относительного числа ошибок.

Под эффективностью понимается разность: <*>, =£)? (и;), где и, -

размер оптимальной системы окрестностей для эталонного ряда (без шума), н, - размер оптимальной системы окрестностей, рассчитанный для зашумленного вектор-объекта е .

а) б) в)

Размер системы окрестностей и

— . — — Размер оптимальной системы окрестностей рассчитанный для зашумленного ряда

— — — — Размер оптимальной системы окрестностей рассчитанный для эталонного ряда

Рис. 4. Зависимости (Э"(и) для вектор-объектов ь" е с параметрами за-шумления: а) N(0,0.005); б) N(0,0.01); г) N(0,0.05).

Из графика (рис. 5) зависимости эффективности численной процедуры построения оптимальной системы окрестностей, от параметров зашумле-ния вектор-объектов е 5"д,, видно, что использование численной процедуры построения оптимальной системы окрестностей позволяет повысить качество распознавания описаний параметров предвестника Мг (в смысле близости (3-разметки зашумленного вектор-объекта к (3-разметке не зашумленного вектор-объекта я"), до 15 %.

Далее, рассмотрен алгоритм обнаружения предвестников геодинамического события, который имеет два этапа:

1. этап обучения, на котором, по сформированной экспертами обучающей выборке £ = {£......для каждого вектор-объекта из набора

А-= (-'"ж > *}5к>к > ^шдг > вю/.-) с помощью алгоритмов а-р разметки определяются интервальные оценки частоты вхождения параметров предвестника, которые заданы описаниями мх;

Рис. 5. Эффективность 81 процедуры построения оптимальной системы окрестностей в зависимости от уровня, накладываемого на вектор-объект э" шума

о

1 2 3 4 5 6 ?

N(0,0.ПО I) N(0,0.005) N((1,0.01) N(0.0.05) N(0,0.1) N(0,0.2) N(0,0.3)

Номер веоор-обадкга в) / параметры чашумления

2. этап обнаружения (рис. 6), на котором, используя рассчитанные на этапе обучения интервальные оценки частоты вхождения параметров предвестника, алгоритмы а-Р разметки и численную процедуру построения оптимальной системы окрестностей, для каждого вектор-объекта из набора (»"»ь.>>) оценивается значения функции g{t), которые характеризуют степень принадлежности участка временного ряда к классу предвестников, заданному нечетким множеством (6).

Рис. 6. Блок схема алгоритма обнаружения предвестников геодинамического события (этап обнаружения).

Алгоритм обнаружения тестировался на временных рядах, полученных в ПНИЛ ЭДиП НИ ТПУ при разрушении лабораторных образцов (рис. 7) отобранных с железорудного месторождения и данных, полученных во время проведения технологических взрывов на шахте Таштагольская (рис. 8).

На рисунке 7 участок ряда, входящий в обучающую выборку, выделен синей штриховой линией, а участки, в которых возможно формирование очага разрушения, выделены зеленой штриховой линией.

Характеристическая функция g(k) имеет максимум в зоне предвестника предшествовавшей горному удару и равна нулю после технологического взрыва для данных, где горного удара не последовало (рис. 8).

- Характеристическая функция предвестника

- ШП, Образец N99

Рис. 7. Характеристическая функция g(k), построенная для временных рядов измерений ЭМС, полученных при лабораторном разрушении образцов №17 и №9.

0.35 0.30

500 1000 1500 гаю

Номер отеччтя к

- Характеристическая функция предвестника

- ШП, Образец №9

Рис. 8. Характеристическая функция g(k), построенная для временных рядов измерений ЭМС, полученных при полевых измерениях: в ноябре 2007 года (технологических взрыв и последовавший за ним горный удар) и августе 2009 года (технологический взрыв, горного удара не последовало).

В четвертой главе дано описание программного комплекса ReDSS, предназначенного для исследования и мониторинга процессов, описание которых представлено в виде временных рядов, кроме этого программный комплекс может использоваться для тестирования новых методов и алгоритмов обработки и анализа временных рядов. В программном комплексе ReDSS, применяются разработанные корректные алгоритмы а, р разметки, численная процедура построения оптимальной системы окрестностей и алгоритм обнаружения предвестников геодинамического события.

Основными отличиями ПК Кс088 от подобных комплексов является распределенная архитектура (рис. 9) и независимость от сторонних пакетов программ. Распределенная архитектура ПК позволяет оперировать

большими объемами данных (например, обучающие выборки в виде набора многомерных временных рядов), использовать набор разнообразных алгоритмов предназначенных для анализа и обработки временных рядов, удаленно.

На стороне сервера, развертывается база данных (в которой хранятся исходные данные, тестовые выборки), набор алгоритмов включенных в состав комплекса (выполненные в виде подключаемых модулей). Для настройки сервера, а также для демонстрации работы используемых ПК алгоритмов и просмотра списка подключенных модулей в состав комплекса входит \¥ЕВ-клиент. Работа с комплексом осуществляется при помощи клиента. Кроме того, к серверу можно подключаться из сторонних приложений, для этого доступны сборки с интерфейсами 1 и 2 (рис. 9).

Любой пользователь комплекса может добавить свой модуль в каталог алгоритмов, используя сборки с интерфейсами 1, 3 (рис. 9). Каждый модуль представляет собой отдельную библиотеку, подключаемую к ПК.

Рис. 9. Блок-схема программного комплекса

Для структурированного хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород, была

разработана база данных. Она может использоваться в различных интеллектуальных системах сбора и обработки информации для исследования геофизических процессов и в ПК Г<с058, как источник исходных данных или при формировании обучающих, контрольных, тестовых выборок.

Далее приводится описание У/ЕВ-клиента, который используется для демонстрации работы алгоритмов, реализованных в виде подключаемых модулей (которые хранятся на стороне сервера) и работы с базой данных результатов электромагнитных и акустических измерений геофизических процессов (основные страницы \\7ЕВ-клиента представлены на рис. 10).

Рис. 10. Основные страницы WEB-клиента

Используя интерфейс программирования приложений (набор интерфейсов), программного комплекса ReDSS, было реализовано клиентское desktop-приложение «ReDSS Geo» (главное окно программы показано на ри-

Алгоритмы разметки временного ряда SMA, ARADS, численная процедура построения оптимальной системы окрестностей и алгоритм обнаружения предвестника геодинамического события, реализованы в виде подключаемых модулей и размещены в каталоге алгоритмов сервера программного комплекса ReDSS.

Приложение «ReDSS Geo», предназначено для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

В заключении перечислены основные научные и практические результаты.

сунке 11).

3rwsi» j ; . . . j " ■ " ■14

PKxweit. I г -J . , r«*<X4.«(W45>»JVeOCM j

SwiH* Г"""...........................-......

Псыу-з«*чг»ж»»» (V ас eoiuwt " «aw« r IS,;* !" Uk Г a»™.,»«.

Рис. 11. Главное окно программы «ReDSS Geo»

ОСНОВНЫЕ НАУЧНЫЕ И ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ

1. Предложена математическая модель этапа формирования очага разрушения (предвестника), позволяющая описать изменение сигнала на этом этапе комбинацией функциональных зависимостей (параметров предвестника).

2. Разработан корректный алгоритм разметки стохастического временного ряда SMA. Алгоритм SMA по сравнению с алгоритмом ARADS в зависимости от параметров зашумления и размера окрестности, обеспечивает уменьшение количества ошибочных разметок до 22 %.

3. Для обеспечения разрешимости и регулярности задачи разметки и уменьшения числа ошибочных разметок стохастического временного ряда, разработана численная процедура построения оптимальной системы окрестностей, позволяющая снизить количество ошибок обнаружения параметра предвестника на 15%.

4. Создан алгоритм обнаружения предвестников геодинамического события, позволяющий оценить степень принадлежности стохастического временного ряда к классу предвестников. Алгоритм обнаружения был исследован на временных рядах, полученных в ПНИЛ ЭДиП ТПУ при разрушении лабораторных образцов отобранных с железорудного месторождения и данных, полученных при проведении технологических взрывов на шахте Ташта-гольская.

5. Разработан программный комплекс ReDSS, имеющий распределенную архитектуру. В программном комплексе используются разработанные алгоритмы, реализованные в виде подключаемых модулей. Используя интерфейс программирования приложений (набор интерфейсов) программного комплекса ReDSS, реализовано клиентское desktop-приложение «ReDSS Geo», предназначенное для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

6. Разработана база данных результатов электромагнитных и акустических измерений геофизических процессов, предназначенная для структурированного хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород. База данных используется в ПК ReDSS, как источник исходных данных или при формировании обучающих, контрольных, тестовых выборок.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Колесникова С.И., Букреев В.Г., Мертвецов А.Н., Цой Ю.Р. Информационная система для распознавания состояний стохастической системы // Программные продукты и системы. -2010. - № 4. - С. 128-132.

2. Колесникова С.И, Мертвецов А.Н. Метод разметки стохастического временного ряда // Труды Института Системного Анализа РАН. 2011. T.61.JV» 1.С. 48-59.

3. Беспалько A.A., Яворович Л.В., Колесникова С.И., Букреев

B.Г., Мертвецов А.Н., Федотов П.И. Исследование изменений характеристик электромагнитных сигналов при одноосном сжатии образцов горных пород Таштагольского рудника И Изв. вузов. Физика. - 2011. - Т.54. -№ 1/2. - С. 78-85.

4. Беспалько A.A., Яворович Л.В., Колесникова С.И., Букреев В.Г., Мертвецов А.Н., Федотов П.И. Деформирование и разрушение материалов с дефектами и динамически явления в горных породах и выработках И Материалы Юбилейной XX Международ, науч. Школы, Симферополь: Таврич. нац. ун-т, 2010.-С. 58-70.

5. Беспалько A.A., Букреев В.Г., Яворович Л.В., Мертвецов А.Н., Ви-итман Е.В., Колесникова С.И. Исследование процесса образования деструктивных зон в образцах горных пород по электромагнитной эмиссии // Материалы Международного симпозиума «Наноматериалы для защиты промышленных и подземных конструкций» и XI Международной конференции «Физика твердого тела» (ФТТ-Х1), 9-12 июня 2010 г., Усть-Каменогорск, 2010. -

C. 177-181.

6. Мертвецов А.Н. Алгоритм разметки временного ряда для построения модели предвестника геодинамического события // XVII Международная научно-практическая конференция студентов, аспирантов и молодых ученых «Современные техника и технологии» / Сборник трудов в 3-х томах. Т.2. -Томск: Изд-во Томского политехнического университета, 2011,- С. 386-387.

7. Мертвецов А.Н. Программный комплекс для обработки и анализа временных рядов // VIII Всероссийская научно-практическая конференция с международным участием «Современные информационные технологии в науке, образовании и практике» (2009 г., Оренбург, Россия): Труды конференции - Оренбург: ИПК ГОУ ОГУ, 2009. - С. 72-80.

8. Колесникова С.И., Мертвецов А.Н., Цой Ю.Р. Информационно-аналитическая поддержка обработки зашумленных временных рядов // 1-я Международная научно-техническая конференция КНИТ -2009 (8-9 октября 2009 г., Белгород, Россия): Труды конференции, в 2 т. Т.1. - M.: URSS, 2009. -С. 64-67.

9. Колесникова С.И., Букреев В.Г., Мертвецов А.Н., Цой Ю.Р. Информационно-диагностическое программное средство для распознавания состояний зашумленного динамического объекта // Материалы XXXVI Международной конференции и дискуссионного научного клуба «Информационные технологии в науке, образовании, телекоммуникации, бизнесе (IT+S&E'09)»

21

- Украина, Крым, Ялта-Гурзуф: Приложение к журналу «Открытое образование», 2009. - С. 92-94.

10. Букреев В.Г., Колесникова С.И., Мертвецов А.Н. Программный комплекс для обнаружения закономерностей во временных рядах в условиях неопределенности // Кибернетика и высокие технологии XXI века 13-15 мая 2009 г. Воронеж . Россия. НПФ «Саквоее» ООО. 2009,- С. 251-259.

11. Свидетельство об официальной регистрации программы ЭВМ №2010610441. Интеллектуальная модель распознавания состояний динамических систем «IReDSS» / А.Н. Мертвецов, С.И. Колесникова, В.Г. Букреев, Ю.Р. Цой, B.C. Лаходынов. Заявка 2009616425. Дата поступл. 16.11.09. Заре-гистр. 11.01.2010.

12. Свидетельство о государственной регистрации программ для ЭВМ №2011613749. Автоматическая разметка временного ряда с нелинейным трендом / Мертвецов А.Н., Колесникова С.И., Букреев В.Г. Заявка 2011611917. Дата поступл. 22.03.11. Зарегистр. 13.05.2011.

13. Свидетельство об официальной регистрации программы ЭВМ №2010620277. База данных результатов электромагнитных и акустических измерений геофизических процессов / A.A. Беспалько, В.Г. Букреев, С.И. Колесникова, А.Н. Мертвецов, Л.В. Яворович. Заявка 2010620117. Дата поступл. 19.03.10. Зарегистр. 14.05.2010.

Личный вклад автора. В публикациях [1,4,5,8,9,10] автором разработано программное обеспечение; в [2,3,11,12] разработано алгоритмическое и программное обеспечение; в [13] разработана база данных, и сопутствующее программное обеспечение. Все экспериментальные результаты получены лично автором.

Подписано к печати 18.11.2011. Формат 60x84/16. Бумага «Снегурочка».

Печать XEROX. Усл.печ.л. 2,04. Уч.-изд.п. 1,84. _Заказ 1643-11. Тираж 100 экз._

Томский политехнический университет Система менеджмента качества Томского политехнического университета сертифицирована NATIONAL QUALITY ASSURANCE по стандарту ISO 9001:2008

ШТНЬСТИ^ТПУ. 634050, г. Томск, пр. Ленина, 30

Тел./факс: 8(3822)56-35-35, www.tpu.ai

Оглавление автор диссертации — кандидата технических наук Мертвецов, Александр Николаевич

Обозначения и сокращения.

ВВЕДЕНИЕ.

Глава 1. МЕТОДЫ ОБНАРУЖЕНИЯ ПРЕДВЕСТНИКОВ ГЕОДИНАМИЧЕСКОГО СОБЫТИЯ.

1.1. Описание предметной области.

1.2. Обзор методов обнаружения предвестников геодинамического события

1.2.1. Методы, основанные на статистическом подходе, регрессионных моделях, и спектральных характеристиках временных рядов.

1.2.2. Нейросетевые и нечеткие методы.

1.3. Обзор программных комплексов применяемых при обнаружении предвестников геодинамического события.

1.4. Постановка задачи исследований.

Выводы.

Глава 2. МОДЕЛЬ ПРЕДВЕСТНИКОВ ГЕОДИНАМИЧЕСКОГО СОБЫТИЯ И ФОРАЛИЗАЦИЯ ЗАДАЧИ ИХ ОБНАРУЖЕНИЯ.

2.1. Модель изменения характеристик ЭМС на этапе формирования очага разрушения. Постановка задачи обнаружения предвестника геодинамического события.

2.2. Модель корректных алгоритмов, алгебраический подход к синтезу корректных алгоритмов.

2.3. Корректирующие операции на основе модификации метода анализа иерархий.

2.4. Описание класса алгоритмов предназначенных для решения задачи обнаружения параметров предвестника геодинамического события.

2.5. Задача построения оптимальной системы окрестностей.

Выводы.

Глава 3. АЛГОРИТМ ОБНАРУЖЕНИЯ ПРЕДВЕСТНИКОВ ГЕОДИНАМИЧЕСКОГО СОБЫТИЯ.

3.1. Корректные алгоритмы а-разметки стохастических временных рядов измерений ЭМС.

3.1.1. Корректный алгоритм а-разметки стохастического временного ряда ARADS.

3.1.2. Корректный алгоритм а-разметки стохастического временного ряда SMA

3.1.3. Сравнительный анализ алгоритмов а-разметки.

3.2. Корректный алгоритм ß-разметки.

3.3. Численная процедура построения оптимальной системы окрестностей.

3.4. Алгоритм обнаружения предвестников геодинамического события.

Выводы.

Глава 4. ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ ИССЛЕДОВАНИЯ ГЕОФИЗИЧЕСКИХ ДАННЫХ. БАЗА ДАННЫХ ГЕОФИЗИЧЕСКОГО ПРОЦЕССА.

4.1. Архитектура программного комплекса ReDSS.

4.2. База данных результатов электромагнитных и акустических измерений геофизических процессов.

4.3. WEB-клиент.

4.4. Программа «ReDSS Geo» для анализа и мониторинга геофизических процессов, описание которых представлено в виде временных рядов измерений

Выводы.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Мертвецов, Александр Николаевич

Актуальность работы. В последние годы в районах отработки полезных ископаемых участились случаи проявления горных ударов, внезапных выбросов, горно-тектонических землетрясений и других геодинамических явлений. Эти процессы порождаются в массивах горных пород не только действием больших тектонических напряжений, но и увеличением глубины отработки месторождений, структурной неоднородностью массива и свойствами слагающих его горных пород. Крупные технологические взрывы, применяемые для обрушения рудных блоков на железорудных месторождениях, также сопровождаются мощными динамическими явлениями. Все это наносит значительный экономический ущерб промышленным предприятиям и гражданским объектам, а также ведет к травматизму и человеческим жертвам. Поэтому особую остроту приобрела проблема мониторинга изменения напряженно-деформированного состояния массивов горных пород. Для исключения последствий геодинамических явлений необходим надежный прогноз геомеханических условий ведения горных работ.

Одним из наиболее перспективных методов контроля изменения напряженно-деформированного состояния массивов горных пород, является бесконтактный способ, основанный на регистрации электромагнитных сигналов, возникающих при механическом воздействии на горные породы. При механоэлек-трических преобразованиях параметры электромагнитных сигналов (ЭМС) несут информацию об изменении напряженно-деформированного состояния и процессах образования деструктивных зон.

В основе данного метода лежат исследования, начатые в конце 60-годов в Томском политехническом институте под руководством чл. корр. АПН, профессора A.A. Воробьева. Исследование механоэлектрических преобразований и проблемы обнаружения предвестников геодинамических явлений получило развитие в работах Гохберга М.Б., Соболева Г.А., Морозова В.Н., Курлени М.В., Мастова Ш.Р. и др.

Данные об изменении параметров ЭМС, получаемые при мониторинге изменений напряженно-деформированного состояния горных пород с использованием специальных регистраторов, представляют собой набор временных рядов. В настоящее время в геоинформатике разработкой методов и алгоритмов обнаружения аномалий (предвестников геодинамических явлений) во временных рядах занимаются А.Д. Гвишиани, С.М. Агаян, Ж. Злотники, 1.-Ь. ЬеМоиё1, Ш.Р. Богоутдинов. Однако до настоящего времени не существуют достоверных алгоритмов обнаружения предвестников, в силу того, что аналитическое описание параметров ЭМС или характеристик электромагнитной эмиссии (ЭМЭ) неполно или невозможно в силу их нелинейности и стохастичности.

Поэтому задача обнаружения предвестников геодинамических явлений по временным рядам измерений характеристик ЭМС является актуальной.

Одним из направлений определения аномалий во временных рядах является направление, связанное с применением алгебраического подхода (Ю.И. Журавлев), которое развивается в трудах ВЦ РАН как исследование и апробация технологии разметки временных рядов с позиций теоретико-множественного описания (К.В. Рудаков, Ю.В. Чехович).

Объектом исследования являются геодинамические явления, в процессе протекания которых возникающая электромагнитная эмиссия в горных породах служит источником измеряемых электромагнитных сигналов, образующих нестационарные стохастические временные ряды.

Предметом исследования являются модели предвестников геодинамических явлений и оптимальные алгоритмы их обнаружения.

Целью диссертационной работы является разработка и исследование эффективных алгоритмов обнаружения аномальных данных в нестационарных стохастических временных рядах.

Задачи исследований:

1. анализ методов обнаружения предвестников геодинамического события и программных комплексов, применяемых при их обнаружении;

2. формализация задачи обнаружения предвестников геодинамического события, как задачи разметки стохастического временного ряда;

3. описание класса алгоритмов, предназначенных для решения задачи обнаружения параметров предвестника геодинамического события;

4. разработка корректных алгоритмов разметки стохастического временного ряда и их сравнительный анализ;

5. постановка задачи многокритериального выбора оптимальной системы окрестностей и оценка эффективности численной процедуры построения оптимальной системы окрестностей;

6. разработка алгоритма обнаружения предвестников геодинамического события и их реализация в виде динамически подключаемых библиотек;

7. разработка программного комплекса и базы данных, предназначенных для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

Методы исследований. При решении поставленных задач использовались методы теории распознавания образов, теории принятия решений и многокритериального оценивания, теории нечетких множеств, формализма мультимножеств, методы теории вероятностей, информации и математической статистики. Для моделирования и разработки алгоритмов использовались приложения Matlab, Mathcad, OriginPro, для реализации алгоритмов и программного комплекса использовались методы программирования в среде разработки Microsoft Visual Studio 2008, платформа Microsoft.NET, технологии ASP.NET, Microsoft.NET Remoting. При проектировании и разработки базы данных использовались ERwin Data Modeler, СУБД Microsoft SQL Server Express 2005.

Достоверность результатов подтверждается корректностью постановки задачи, сопоставимостью результатов теоретических исследований с существующими положениями проблемно-ориентированной теории, корректностью постановки экспериментов и обработки экспериментальных данных, качественным и количественным соответствием теоретических исследований и экспериментальных данных, полученными как лично автором, так и другими исследователями.

Научная новизна:

1. предложена модель предвестника геодинамического события, представляющая композицию неизвестных функций, интерпретируемых как параметры предвестника и отличающаяся тем, что позволяет формализовать решаемую задачу обнаружения предвестника, как задачу разметки стохастического временного ряда;

2. создан корректный алгоритм разметки стохастического временного ряда, позволяющий описать полезную составляющую исходного электромагнитного сигнала известными базисными функциями и отличающийся тем, что для описания фрагментов временного ряда используется их символьное представление;

3. предложена численная процедура расчета размера окрестностей значений временного ряда, позволяющая определить на основе решения задачи многокритериального выбора оптимальные базисные функции, аппроксимирующие неслучайную составляющую соответствующих фрагментов ряда.

Практическая ценность:

1. разработан программный комплекс с распределенной архитектурой, предназначенный для обработки геофизических электромагнитных данных, отличающийся организацией вычислений на стороне сервера, интеграцией с веб-приложениями и унифицированным описанием подключаемых модулей обработки данных;

2. создано клиентское desktop-приложение «ReDSS Geo», использующее интерфейс программирования приложений (набор интерфейсов) программного комплекса «ReDSS» для исследования разработанных алгоритмов анализа и мониторинга геофизических процессов, описание которых представлено в виде временных рядов;

3. разработана база данных результатов электромагнитных и акустических измерений геофизических процессов, предназначенная для структурирования и хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород, а также временных рядов полученных при разрушении образцов горных пород в лабораторных условиях.

Реализация результатов работы.

Математические модели, алгоритмы и программное обеспечение, разработанные при выполнении диссертационной работы, использовались при выполнении грантов: РФФИ № 09-01-99014-рофи «Разработка подходов к повышению эффективности методов и алгоритмов распознавания образов и оценки их качества», РФФИ № 11-07-00666-а «Исследование и разработка информационной системы мониторинга геодинамических процессов, основанной на электромагнитной эмиссии горных пород» и были встроены в программный комплекс «ИеБЗБ», расположенный по адресу: http://redss.ru. Разработанные алгоритмы, программный комплекс и база данных используется в ПНИЛ ЭДиП ТПУ (г. Томск). Результаты исследований используются также в учебном процессе подготовки студентов энергетического института Национального исследовательского Томского политехнического университета в курсе «Комплексная автоматизация технологических процессов».

Основные защищаемые положения:

1. корректный алгоритм разметки стохастического временного ряда на основе символьного описания его фрагментов, позволяющий описать полезную составляющую исходного электромагнитного сигнала известными базисными функциями с уточнением условий его регулярности;

2. численная процедура построения системы окрестностей значений временного ряда, определяющая оптимальный выбор базисной функции на основе многокритериального оценивания и позволяющая увеличить качество их распознавания до 15%, по сравнению с традиционным подходом;

3. программный комплекс ЯеБЗЗ имеющий распределенную архитектуру, позволяющий тестировать новые методы и алгоритмы обработки и анализа временных рядов при проведении геофизических исследований.

Апробация работы. Результаты диссертационной работы докладывались на международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж, 2009 г.); 1-й международной научно-технической конференции КНИТ -2009 (Белгород, 2009 г.); XVII международной научно-практической конференции студентов, аспирантов и молодых ученых «Современные техника и технологии» (Томск, 2011 г.); научно-технических семинарах кафедры электропривода и электрооборудования ЭНИН ТПУ (Томск, 2009 - 2011 гг.).

Публикации. Результаты выполненных исследований отражены в 13 печатных работах, которые включают в себя 3 статьи в журналах, рекомендуемых ВАК РФ, 3 статьи в сборниках научных трудов, тезисы 4-х докладов на международных и всероссийских конференциях и 3 авторских свидетельства о государственной регистрации программ для ЭВМ.

Личный вклад автора. Все разработки и научные результаты, выносимые на защиту и изложенные в тексте диссертации, получены либо самим автором лично, либо при его непосредственном участии. Экспериментальные исследования и программная реализация выполнялись автором лично.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложения. Общий объем работы составляет 148 страниц, в том числе рисунков - 42, таблиц - 16, список литературы из 82 наименований, приложение на 15 страницах.

Заключение диссертация на тему "Алгоритмы обнаружения предвестников геодинамического события по временным рядам измерений электромагнитных сигналов"

Выводы

1. Приведено описание архитектуры разработанного программного комплекса ReDSS, который позволяет: тестировать новые методы и алгоритмы, предназначенные для обработки и анализа временных рядов; проводить исследование и мониторинг процессов, описание которых представлено в виде временных рядов. Программный комплекс ReDSS имеет распределенную архитектуру, которая позволяет оперировать большими объемами данных (например, обучающие выборки в виде набора многомерных временных рядов), использовать набор разнообразных алгоритмов предназначенных для анализа и обработки временных рядов, удаленно.

2. Представлено описание структуры базы данных результатов электромагнитных и акустических измерений геофизических процессов, разработанной и применяемой для структурирования и хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород, а также временных рядов полученных при разрушении образцов горных пород в лабораторных условиях. База данных используется в программном комплексе ReDSS для формирования обучающих, тестовых выборок при решении задачи обнаружения предвестника геодинамического события. Кроме этого база данных может быть применена в различных интеллектуальных системах сбора и обработки информации при исследовании геофизических процессов.

3. Приведено описание WEB-интерфейсов программного комплекса ReDSS и базы данных результатов электромагнитных и акустических измерений геофизических процессов. Разработанный WEB-интерфейс позволяет демонстрировать работу алгоритмов используемых в программном комплексе и управлять базой данных.

4. Используя интерфейс программирования приложений (набор интерфейсов), программного комплекса ReDSS, было реализовано клиентское desk-top-приложение «ReDSS Geo». Алгоритмы разметки временного ряда SMA, ARADS, численная процедура построения оптимальной системы окрестностей и алгоритм обнаружения предвестника геодинамического события, реализованы в виде подключаемых модулей и размещены в каталоге алгоритмов сервера программного комплекса ReDSS. Приложение «ReDSS Geo», предназначено для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

Результаты, представленные в 4-й главе, опубликованы в работах [74-81].

ЗАКЛЮЧЕНИЕ

В диссертационной работе получены следующие теоретические и практические результаты:

1. предложена математическая модель этапа формирования очага разрушения (предвестника), позволяющая описать изменение сигнала на этом этапе комбинацией функциональных зависимостей (параметров предвестника).

2. разработан корректный алгоритм разметки стохастического временного ряда SMA. Алгоритм SMA по сравнению с алгоритмом ARADS в зависимости от параметров зашумления и размера окрестности, обеспечивает уменьшение количества ошибочных разметок до 22 %.

3. для обеспечения разрешимости и регулярности задачи разметки и уменьшения числа ошибочных разметок стохастического временного ряда, разработана численная процедура построения оптимальной системы окрестностей, позволяющая снизить количество ошибок обнаружения параметра предвестника на 15%.

4. создан алгоритм обнаружения предвестников геодинамического события, позволяющий оценить степень принадлежности стохастического временного ряда к классу предвестников. Алгоритм обнаружения был исследован на временных рядах, полученных в ПНИЛ ЭДиП ТПУ при разрушении лабораторных образцов отобранных с железорудного месторождения и данных, полученных при проведении технологических взрывов на шахте Таштагольская.

5. разработан программный комплекс ReDSS, имеющий распределенную архитектуру. В программном комплексе используются разработанные алгоритмы, реализованные в виде подключаемых модулей. Используя интерфейс программирования приложений (набор интерфейсов) программного комплекса ReDSS, реализовано клиентское desktop-приложение «ReDSS Geo», предназначенное для исследования разработанных алгоритмов и мониторинга геофизических процессов, описание которых представлено в виде временных рядов.

6. разработана база данных результатов электромагнитных и акустических измерений геофизических процессов, предназначенная для структурированного хранения временных рядов, сформированных на основе зарегистрированных специальной аппаратурой с использованием соответствующих датчиков, установленных в массиве горных пород. База данных используется в ПК КеБЗБ, как источник исходных данных или при формировании обучающих, контрольных, тестовых выборок.

Библиография Мертвецов, Александр Николаевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Потураев В.Н., Булат А.Ф., Хохолев В.К. Об особенностях комплексной регистрации электромагнитного и акустического излучения при разрушении горных пород//ДАН СССР. 1989. - Т. 308. - N 6. - С.1351-1354.

2. Яворович JI.B. Взаимосвязь параметров электромагнитных сигналов с изменением напряженно-деформированного состояния горных пород: Дис. канд. техн. наук. Томск, 2005. 196 с.

3. Иванов В.В., Егоров П.В., Колпакова JI.A., Пимонов А.Г. Динамика трещин и электромагнитное излучение нагруженных горных пород // ФТПРПИ. 1988.-N5.-С. 20-27.

4. Гордеев В.Ф., Малышков Ю.П., Чахлов B.JI и др. Электромагнитная эмиссия диэлектрических материалов при статическом и динамическом воздействии //ЖТФ.- 1994. Т.64, в. 4. - С.57-67.

5. Bieniawski Z.T.: Mechanism of brittle fracture of rock CSIR Report, MEG580, Pretoria.-224, 1967.

6. Cook N.G.W.: Failure of rock. J. Rock Mech. Min. Sc.-1965.- №2.- P.389403.

7. Wawersik W.R. and Brace W.F.: Post failure behaviour of a granite and diabase. - Rock Mech., 1971.-№3.-P 61-85.

8. Мастов Ш.Р., Гольд P.M., Яворович JI.B. Влияние масштабного фактора на электромагнитную эмиссию/Томск, политех, институт.- Томск, 1987.- 12 с.-Деп. в ВИНИТИ 19.11.87, N 8167- В87.

9. Егоров П.В., Иванов В.В., Колпакова JI.A. О некоторых закономерностях импульсного электромагнитного излучения щелочногалоидных кристаллов и горных пород//ФТПРПИ. 1988.- N 1. - С. 67-70.

10. A.c. 1562449 СССР. Способ прогноза разрушения массива горных пород / М.В. Курленя, В.Н. Опарин, Г.Е. Яковицкая. Опубл. в Б.И. - 1990. -№17.

11. М.В. Курленя, А.Г. Вострецов, Г.И. Кулаков. Г.Е. Яковицкая. Регистрация и обработка сигналов электромагнитного излучения горных пород. Новосибирск: Издательство СО РАН. 2000 г, 231 с.

12. Курленя М.В., Кулаков Г.И., Яковицкая Г.Е. Спектрально-временной анализ электромагнитной эмиссии при трещинообразовании образцов горных пород//ФТПРПИ. 1993. - N 1. - С. 3 -13.

13. Кулаков Г.И., Яковицкая Г.Е. Особенности изменения спектра частот электромагнитного излучения при разрушении образцов горных пород//ПМТФ. 1994. - Т.35, N 5 (207). - С. 160 - 165.

14. Кулаков Г.И., Кривецкий A.B., Бритков H.A. и др. Электромагнитное излучение при разрушении стекол // Стекло и керамика. 1998. - № 4. - С. 7 -10.

15. Яковицкая Г.Е. Методы и технические средства диагностики критических состояний горных пород на основе электромагнитной эмиссии Новосибирск: Параллель, 2008. - 315 с.

16. Патент 2006884 РФ. Устройство для регистрации электромагнитного излучения, возникающего при трещинообразовании горных пород/ М.В. Курленя, Г.И. Кулаков, В.А. Марков, Г.Е. Яковицкая. Опубл. в Б.И. - 1994. - №2.

17. М.В. Курленя, А.Г. Вострецов, Г.И. Кулаков. Г.Е. Яковицкая. Регистрация и обработка сигналов электромагнитного излучения горных пород. Новосибирск: Издательство СО РАН. 2000 г, 231 с.

18. Пат. 2338065 РФ, МПК Е 21 С 39/00. Способ прогноза разрушения горных пород / В.Н. Опарин, А.Г. Вострецов, В.Е. Петров, Г.Е. Яковицкая. -Опубл. в БИ, 2008, № 35.

19. Поиск электромагнитных предвестников землетрясений / Под ред. М.Б. Гохберга. М.: ИФЗ АН СССР, 1988. - 167 с.

20. Кушнир А.Ф. Мостовой C.B. Статистический анализ геофизическихполей, Киев, Наукова думка, 1990,270с.

21. Любушин A.A. (мл), Копылова Г.Н. Многомерный вейвлет-анализ временных рядов электротеллурических наблюдений на Камчатке // Физика Земли. 2004. № 2. С. 82-96.

22. Томилин Н.Г., Дамаскинская Е.Е., Павлов П.И. Статистическая кинетика разрушения горных пород и прогноз сейсмических явлений //Физика твердого тела. 2005. - Т.47, вып. 5. - С. 955-959.

23. Romeo G. Seismic signal detection and classification using artificial neural networks. Special issue on the workshop "Planning and procedures for GSETT-3", Erice, November 10-14, 1993. Annali di Geofísica. Vol. XXXVII, N. 3, 1994, p. 343353.

24. Куравский JI. С., Баранов С. Н., Буланова О. Е., Кравчук Т. Е. Нейро-сетевая технология диагностики патологических состояний по аномалиям электроэнцефалограмм // Нейрокомпьютеры: разработка и применение.2007. № 4.

25. A.D. Gvishiani, S.M. Agayan, Sh.R. Bogoutdinov, S.A. Tikhotsky, J.Hinderer, J.Bonnin, M.Diament. Algorithm FLARS and recognition of time series anomalies. System Research & Information Technologies. 2004, no. 3, 7-16.

26. Нечеткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А.Поспелова. М.: Наука, Гл. ред. физ.-мат. лит., 1986 -321с.

27. Кедров O.K., Пермякова В.Е., Стеблов Г.М. Методы обнаружения слабых сейсмических явлений в пределах платформ. М., ОИФЗ РАН, 2000, 101с.

28. Введение в механику скальных пород: Пер. с англ. / Под ред. X. Бока. -М.: Мир, 1983.-276 с.

29. Степанов М. В. Изучение краткосрочных предвестников землетрясений методом электромагнитной эмиссии: Дис. канд. физ.-мат. наук. М., 2004.

30. Семенов Н.А. Методы автоматизированного проектирования системы прогнозирования землетрясений: Дис. канд. техн. наук. Санкт-Петербург, 2007. 136с.

31. Katkovnik, V., Egiazarian К., Astola J., Local Approximation Techniques in Signal and Image Processing, SPIE Press, Monograph Vol. PM157, September 2006. Hardcover, 576 pages.

32. Wavelab 850 Электронный ресурс./ Stanford University; Donoho D., Maleki A., Morteza S. Электрон.дан. - Stanford: Department of Statistics, [2011].- Режим доступа: http://www-stat.stanford.edu/~wavelab/, свободный. Загл. с экрана.

33. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Части 1 и 2. М.: «Мир», 1974. - 406 с.

34. Полигон алгоритмов Электронный ресурс.: система для массового тестирования алгоритмов классификации на реальных задачах.- Электрон.дан. -М., 2011. Режим доступа: http://poligon.machinelearning.ru/, свободный. - Загл. с экрана.

35. Луценко Е.В. Универсальная автоматизированная система распознавания образов "Эйдос" (версия 4.1).-Краснодар: КЮИ МВД РФ, 1995.- 76с.

36. Гольденберг Л.М., Матюшкин Б.Д., Поляк М.Н. Цифровая обработка сигналов. Справочник М.: Радио и связь, 1985. 312 с.

37. Колесникова С.И. Проблемно-ориентированные модели распознавания и оценивания состояний сложных объектов. Авторефер.дис. докт. техн. наук. Томск, 2011.

38. Чехович Ю.В. Элементы алгебраической теории синтеза обучаемых алгоритмов выделения трендов: Дис. канд. физ.-мат. наук. М., 2003.

39. Журавлев Ю.И. Корректные алгебры над множествами некорректных (эвристических) алгоритмов. 1-Ш // Кибернетика. 1977. - № 4. - С. 5-17, 1977. -№ 6. - С. 21-27,1978. - № 2. - С. 35-43.

40. Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики. 1979. -Т. 33. - С. 5-68.

41. Журавлёв Ю. И, Рудаков К. В. Об алгебраической коррекции процедур обработки (преобразования) информации // Проблемы прикладной математики и информатики. 1987. - С. 187-198.

42. Журавлев Ю.И. Об одном классе алгоритмов над конечными множествами, ДАН СССР. Т. 151-5. - 1963. - С. 1025-1028.

43. Рудаков К.В., Чехович Ю.В. Алгебраический подход к проблеме синтеза обучаемых алгоритмов выделения трендов // Доклады РАН. 2003. -Т. 388. - № 1.- С. 33-36.

44. Саати Т. Принятие решений. Метод анализа иерархий: Пер. с англ.-М.: "Радио и связь", 1993.- 320 с.

45. Саати Т.Л. Принятие решений при зависимостях и обратных связях: Аналитические сети. М.: Издательство ЛКИ, 2008. - 360 с.

46. Feigenbaum M.J. Universal Behavior in Nonlinear Systems. Los Alamos Science, 1980.-V.l.-№ 1.-P. 4-27.

47. Афанасьев B.H., Юзбашев M.M. Анализ временных рядов и прогнозирование. М.: Финансы и статистика, 2001. - 228 с

48. Безручко Б.П., Смирнов Д.А. Математическое моделирование и хаотические временные ряды. Саратов: ГосУНЦ «Колледж», 2005. - 320 с.

49. Мертвецов А.Н., Колесникова С.И. Метод разметки стохастического временного ряда // Труды Института Системного Анализа РАН. 2011. Т.61. № 1.С. 48-59.

50. Patel, P., Keogh, Е., Lin, J., Lonardi, S. Mining Motifs in Massive Time Series Databases. In proceedings of the 2002 IEEE International Conference on Data Mining. Maebashi City, Japan. Dec 9-12.

51. Keogh, Е., Chakrabarti, К., Pazzani, М. & Mehrotra, S. Locally Adaptive Dimensionality Reduction for Indexing Large Time Series Databases. In proceedings of ACM SIGMOD Conference on Management of Data. Santa Barbara, CA, 2001. P. 151-162.

52. Yi, В, K., & Faloutsos, C. Fast Time Sequence Indexing for Arbitrary Lp Norms. In proceedings of the 26st Int'l Conference on Very Large Databases., Cairo, Egypt. 2000. pp. 385-394.

53. Larsen, R. J. & Marx, M. L. An Introduction to Mathematical Statistics and Its Applications. Prentice all, Englewood, Cliffs, N.J. 2nd Edition. 2000. pp. 97-104.

54. Вапник B.H., Червоненкис А .Я. Теория распознавания образов. М.: Наука, 1974.-416 с.

55. Левенштейн В. Двоичные коды с исправлением выпадений, вставок и замещений символов // Доклады Академий Наук СССР 163.4:845-848. 1965.

56. Ukkonen, Е., Approximate string-matching with q-grams and maximal matches // Theoretical Computer Science. 1992. P. 191-211.

57. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. Н.: Наука. - 2007. - 255 с.

58. Шоломов JI.A. О собственной информации нечетких текстов // Нелинейная динамика и управление. Вып. 6. М.: Физматлит, 2008. - 340 с.

59. Галлагер Р. Теория информации и надежная связь. М., «Советское радио», 1974. - 720 с.

60. Редько В.Г., Цой Ю.Р. Оценка эффективности эволюционных алгоритмов // Доклады АН, 2005. Т. 404. N. 3. С. 312-315.

61. Заде JL Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. - 168 с

62. Мертвецов А.Н., Колесникова С.И., Букреев В.Г., Цой Ю.Р. Информационная система для распознавания состояний стохастической системы // Программные продукты и системы. 2010. - № 4 - С. 128-132.

63. Мертвецов А.Н., Колесникова С.И., Цой Ю.Р. Информационно-аналитическая поддержка обработки зашумленных временных рядов // Компьютерные науки и технологии: сб. трудов Первой Междунар. научно-практ. конф. Белгород: ГиК, 2009. - 4.1:- С. 186-190.

64. Свидетельство о государственной регистрации программ для ЭВМ №2011613749. Автоматическая разметка временного ряда с нелинейным трендом / Мертвецов А.Н., Колесникова С.И., Букреев В.Г. Заявка 2011611917. Дата поступл. 22.03.11. Зарегистр. 13.05.2011.

65. Маклин С., Нафтел Дж„ Уильяме К. Ml5 Microsoft .NET Remoting / Пер. с англ. M.: Издательско-торговый дом «Русская Редакция», 2003. 384 е.: ил.

66. Используемые лабораторные данные

67. При определении параметров предвестника геодинамического события использовались лабораторные данные при одноосном сжатии до разрушения 16-ти образов, с железорудного месторождения Таштагольское (Таблица П.1).