автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Задачи анализа сигналов на основе эмпирически восстановленной модели их формы
Автореферат диссертации по теме "Задачи анализа сигналов на основе эмпирически восстановленной модели их формы"
На правах рукописи
Цыбульская Надежда Дмитриевна
ЗАДАЧИ АНАЛИЗА СИГНАЛОВ НА ОСНОВЕ ЭМПИРИЧЕСКИ ВОССТАНОВЛЕННОЙ МОДЕЛИ ИХ ФОРМЫ
05.13.18 — Математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
6 НОЯ 2014
МОСКВА -2014
005554668
005554668
Работа выполнена на кафедре компьютерных методов физики физического факультета Московского государственного университета имени М.В. Ломоносова.
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
доктор физико-математических наук, профессор Чуличков Алексей Иванович
Впзильтер Юрий Валентинович, доктор физико-математических наук, ФГУП "Государственный научно-исследовательский институт авиационных систем", начальник подразделения
Николаев Дмитрий Петрович, кандидат физико-математических наук, Институт проблем передачи информации имени A.A. Харкевича РАН, заведующий сектором
ФГБУ "Институт прикладной геофизики
имени академика Е.К. Федорова"
Защита состоится 28 ноября 2014 г. в 16:00 на заседании диссертационного совета Д 501.002.09 при Московском государственном университете имени М.В. Ломоносова по адресу: 119991, Москва, Ленинские горы, дом 1, стр. 4, НИВЦ МГУ.
С диссертацией можно ознакомиться в Научной библиотеке МГУ имени М.В. Ломоносова (Ломоносовский проспект, 27) и на сайте: http://srcc.msu.ru/nivc/sci/dissert/dissert.html
Автореферат разослан «_»
2014 г.
Ученый секретарь диссертационного совета
В.В. Суворов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования. В экспериментальных исследованиях важную роль играют задачи интерпретации данных. К методам решения таких задач относятся методы теории измерительно-вычислительных систем (Ю.П. Пытьев, 2004), методы оптимального оценивания в математической статистике (Э. Леман, 1979) и др. (Н. Дрейпер, 2007; 3. Брандт, 2004; A.A. Самарский, 2009). Во всех указанных методах требуется точное знание полного математического описания измерительного эксперимента, включающего в себя модель изучаемого объекта, модель его взаимодействия с измерительным прибором, модель погрешности измерений и т.п.
Однако, на практике часто встречаются ситуации, когда задание полной математической модели невозможно. Несмотря на это, из экспериментальных данных все же можно извлечь важную информацию об исследуем объекте. Одним из методов, реализующих данную возможность, является метод морфологического анализа изображений (Ю.П. Пытьев, 1975; Ю.П. Пытьев, А.И. Чуличков, 2010).
В методах морфологического анализа считается, что изображение объектов содержит информацию как о самих объектах, так и об условиях их регистрации. Возможные изменения изображения при вариациях условий регистрации задаются в виде класса математических преобразований некоторого эталонного изображения сцены. Результаты этих преобразований интерпретируются как изображения, которые могут быть получены от эталонной сцены при некоторых допустимых условиях регистрации. Инвариант преобразований изменений изображений будет характеризовать изображаемую сцену, а не условия регистрации. Этот инвариант носит название формы изображения сцены.
В качестве примера рассмотрим изображение многогранника, рис. 1. На основании взаимного расположения однородно окрашенных областей поля зрения — формы — можно судить о составе сцены, геометрической форме ее объектов, их размерах, взаимном расположении и т.п., при этом не обязательно знать характеристики видеосистемы, режим освещения, оптические свойства поверхностей объектов сцены.
Несмотря на то, что изначально морфологический анализ Ю.П. Пытьева создавался для анализа изображений, его методы применимы для сигналов иной природы. Примером может служить задача дистанционного зондирования атмосферы, в которой при неизвестных характеристиках канала распространения сигнала расположение максимумов и минимумов - форма сигнала — позволяет в какой-то мере охарактеризовать источник, рис. 2.
Рис. 1. Изображение многогранника при различных условиях регистрации
На практике часто для построения формы задают множество всех сигналов, полученное при всевозможных условиях регистрации. Формально его можно получить из эталонного сигнала, применяя к нему преобразования, моделирующие допустимые условия регистрации. В том случае, когда полученное множество выпукло и замкнуто в евклидовом пространстве всех сигналов, ему взаимооднозначно соответствует оператор проецирования (проектор). Он определяется эталонным сигналом и классом всех его преобразований, не зависит от конкретных условий наблюдения и, наряду с множеством всех сигналов, также называется формой.
На практике не всегда удается априори построить форму сигнала. Например, по зашумленному изображению невозможно точно построить разбиение поля зрения на подмножества с постоянной яркостью. Также невозможно точно указать положения максимумов и минимумов сигнала при наличии шума.
Поэтому актуальна разработка методов приближенного построения формы сигналов по эмпирическим данным, а также методов интерпретации данных на основе приближенно полученной формы. Решению этих задач посвящена настоящая работа.
Цели и задачи работы. Целью работы является расширение области применимости методов морфологического анализа сигналов на случаи, когда информация об их форме априори недоступна и извлекается из тестовых наблюдений сигналов одной и той же формы, выполненных при наличии шума. Для реализации поставленной цели в диссертационной работе были решены следующие задачи, имеющие существенное значение для области цифровой обработки сигналов:
- разработаны математические методы эмпирического построения формы сигнала по данным наблюдений сигналов фиксированной (неизвестной) формы, выполненных при наличии шума;
| - разработаны методы оценки адекватности математических моделей,
используемых при эмпирическом построении формы;
- разработаны математические и численные методы решения задач морфологического анализа сигналов на основе эмпирически построенной формы;
- созданы эффективные комплексы программ, реализующие разработанные методы для решения реальных и модельных задач интерпретации данных.
Полученные новые научные результаты
1. Впервые поставлена и решена задача построения формы из принципа
Рис. 2. Инфразвуковой сигнал от наземного взрыва
максимальной надежности как линейного подпространства пространства всех сигналов на основании тестовых наблюдений, выполненных с погрешностью, а также задача проверки адекватности построенной формы.
2. Впервые поставлена и решена задача построения формы из принципа максимальной надежности как множества значений линейного оператора, восстанавливаемого по тестам. Введена характеристика проверки наличия линейной связи.
3. Разработана методика проверки близости предъявленной формы сигнала к эмпирически восстановленной форме как линейной оболочке тестовых сигналов, наблюдаемых с ошибкой, и как пространства значений восстановленного по тестам линейного оператора.
4. Создан алгоритм построения формы как выпуклого замкнутого конуса, основанный на упорядочении значений зарегистрированных сигналов.
5. Доказана теорема об остановке алгоритма упорядочивания значений зарегистрированных сигналов за конечное число шагов с вероятностью единица.
6. Разработана новая методика построения формы сигнала на основании изображения его вейвлет-епектра.
7. Создано новое программное обеспечение, зарегистрированное Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, свидетельства №2011614714, Х52013612369.
Положения, выдвигаемые для публичной защиты
1. Разработаны новые математические методы для построения формы сигналов по результатам тестовых измерений, выполненных при наличии шума и при различных (неизвестных) условиях регистрации, для следующих случаев:
- форма сигнала построена как линейное подпространство, в известном смысле близкое к результатам тестов;
- форма сигнала построена как конус евклидова пространства, образованный векторами, координаты которых упорядочены;
- форма сигнала построена как множество сигналов с характерными частотно-пространственными особенностями, определяемыми их вейвлет-спек-трами.
2. Созданы методы, позволяющие оценивать адекватность математических моделей, используемых для эмпирического построения формы.
3. Разработаны методы, алгоритмы и комплексы программ для решения задач морфологического анализа данных на основе эмпирически построенных форм сигналов.
Практическая значимость работы. Разработанные в диссертации методы могут быть использованы для решения задач узнавания, классификации и определения параметров сигналов в случае отсутствия априорной информации об источнике, а также для разработки программно-алгоритмического обеспечения. Результаты диссертационной работы были успешно при-
менены для решения следующих прикладных задач:
• Задача классификации акустических сигналов от ультразвукового модератора «Дельфин», осуществляющего диагностику высоковольтного электрооборудования с целью предотвращения аварий;
• Задача классификации инфразвуковых сигналов в атмосфере от различных источников: взрывов, горных обвалов, микробаромов, вулканической активности и полярных сияний (в рамках выполнения Договора о всеобъемлющем запрещении ядерных испытаний; программа зарегистрирована Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, свидетельство № 2011614714);
• Задача выявления инфразвуковых квазипериодических волн от известных источников в атмосфере при регистрации наземными датчиками в случае наличия сильных помех (в рамках выполнения Договора о всеобъемлющем запрещении ядерных испытаний; программа зарегистрирована Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, свидетельство № 2013612369);
• Задача исследования возможности определения качественного состава газовых смесей по откликам сенсоров полупроводниковых датчиков на основе тонких пленок SnO-z-
Методы исследования. В диссертации используются подходы теории морфологического анализа (Ю.П. Пытьев, А.И. Чуличков, 2010), теории измерительно-вычислительных систем (Ю.П. Пытьев, 2004), а также теории проверки статистических гипотез (Э. Леман, 1979). Численные эксперименты реализованы с использованием программ на базе платформы MatLab.
Научная обоснованность и достоверность. Достоверность полученных теоретических результатов гарантируется применением строгих математических методов, апробированных ранее для других задач. Достоверность прикладных результатов обеспечивается проверкой согласия использованных математических моделей и результатов с реальными данными.
Апробация результатов работы. Результаты, представленные в работе, докладывались на научных семинарах кафедры компьютерных методов физики МГУ, радиоакустической лаборатории ИФА РАН, московском морфологическом семинаре под руководством проф. Ю.П. Пытьева, научных семинарах "Математические методы в естественных науках" под руководством проф. А.Н. Боголюбова и "Обратные задачи математической физики" под руководством А.Б. Бакушинского, А.В.Тихонравова, А.Г.Яголы, а также на следующих конференциях: Международная конференция "Математика. Компьютер. Образование" (Дубна, 2008, 2012 г.г.; Пущино, 2009, 2010 г.); конференция "Консолидация усилий электроэнергетики и электротехники в условиях роста инвестиций. Перспективы технологии и электрооборудование" (Московская область, 2008 г.); Всероссийская конференция "Математические методы распознавания образов" (Суздаль, 2009 г.; Петрозаводск, 2011 г.); The 6th Southern Africa Regional Conference & Joint
Colloquium (Cigrc, 2009 г.); Comprehensive Nuclear-Test-Ban Trcary: Science and Technology (Austria, 2011, 2013 г.г.); Международная конференция "Интеллектуальные системы и компьютерные науки" (Москва, 2011 г.); The International Conference The Infrasound Technology Workshop (Jordan, 2011 г.; Republic of Korea, 2012 г.; Austria, 2013 г.); Сессия Российского акустического общества. Сессия Научного совета РАН по акустике (Таганрог, 2012 г.).
Публикации. Основные научные результаты диссертации отражены в 17 научный работах, в том числе в С статьях из списка журналов, рекомендованных ВАК.
Структура и объем диссертации. Диссертация состоит из "Введения", четырех глав, "Заключения", библиографии и "Приложения". Объём работы 135 страниц. Библиография включает в себя 101 печатную работу. Диссертация содержит 30 рисунков.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы исследования, сформулированы цель и основные задачи, научная новизна, теоретическая и практическая значимость полученных результатов. Дано краткое описание решаемых в работе задач и основных результатов.
Первая глава посвящена обзору методов морфологического анализа. Описываются основы подхода, а также вводятся базовые понятия метода в терминах анализа сигналов: математическая модель сигнала, пространство всех сигналов, понятие формы сигнала, сравнение сигналов по форме, проектор на форму. Описываются стандартные примеры форм изображений как линейного подпространства евклидова пространства, как выпуклого замкнутого конуса, образованного множеством изображений с заданным упорядочением яркостей пикселей, а также форма фрагмента изображения. Описываются основные подходы к решению задач морфологического анализа на основании априори построенной формы: узнавание объекта, классификация объектов, оценивание параметров объекта.
Во второй главе описываются методы эмпирического построения формы сигнала по набору тестовых измерений сигналов от одного и того же источника, полученных при различных неизвестных условиях регистрации.
Схема этих наблюдений записывается как
& = gi + fi, г = 1,...,п, (1)
где вектор г = 1,..., п - результат измерения тестового сигнала, заданного вектором g¡ £ ДЛ и искаженного шумом u¿. Векторы v¿ — взаимно независимые случайные элементы пространства /?Л с нулевыми математическими ожиданиями (£>,- = 0) и ковариационным оператором Е = а21 € (ЛЛ — Дл). Известно, что все тестовые сигналы g¡ 6 RA принадлежат неизвестному линейному подпространству L (форме сигналов g¡,..., дп).
Раздел 2.1 посвящен случаю, когда форма Уе, строится как линейное подпространство Ьт С размерности г пространства всех сигналов (векторов евклидова пространства), которое с точностью до шума содержит все предъявленные при обучении векторы £1,...
При фиксированной размерности г подпространства, оценивающего V},, задача ставится как задача поиска подпространства, которое с максимальной надежностью содержит все векторы ..., £„. Надежность определяется как минимальный уровень наиболее мощного критерия проверки статистической гипотезы, при котором эта гипотеза отвергается (Ю.П. Пытьев, 2004). В данном случае гипотеза формулируется как предположение о том, что в (1) все векторы дх,..., дп принадлежат линейному подпространству Ьг размерности г, а шум г/,, г = 1,... ,п, имеет нормальное распределение с нулевыми математическими ожиданиями (Ещ = 0) и ковариационным оператором Е = сг2Г.
Н : & ~ Ы(ди а21), д{ € Ьг, г = 1,..., п.
Альтернатива состоит в том, что хотя бы один из сигналов д\,... ,дп не принадлежит линейному подпространству Ьг:
£ : 6 ~ Щди а2/), Зг € {1,..., п} : дг £ Ьг.
Для заданного Ьг надежность этой статистической гипотезы равна «г(6. • • •, Сп) = 1 - Х)Г=1 II ~ П^)ег||2), где ПЬг — оператор ор-
тогонального проецирования в ДЛ' на линейное подпространство Ьг, У7^п ~ функция распределения Пирсона хи-квадрат с Ып степенями свободы. В работе показано, что линейное подпространство Ьг, на котором надежность а(£ъ • • • >£гг) принимает максимальное значение, строится как линейная оболочка г старших собственных векторов А;, г = 1,... ,г самосопряженного линейного оператора НЕ* (Ее = £"=1 г = 1,..., п): Уь = {£¿=1 аг-А{, а{ €
(-00,00), г = 1,...,п|.
Далее рассматривается вопрос о выборе размерности формы сигналов <7ь ... ,д„. Если для некоторого фиксированного г = г\ надежность гипотезы Н близка к нулю, то предположение о том, что форма сигналов д\,...,дп имеет размерность п неправдоподобна. С ростом г надежность растет, и начиная с некоторого значения г = г? становится близкой к единице. Это означает, что предположение д\,...,дп е ЬГ2 вполне правдоподобно. Как правило, переход от малых значений надежности к значениям порядка единицы происходит резко, рис. 3. В работе предлагается оценивать размерность формы г* как пограничную, отделяющую малые значения соответствующей надежности от значений, близких к единице.
После того, как эмпирически определена форма сигнала, решается вопрос о ее применении для анализа предъявленного сигнала д. Для этого разрабатываются методы принятия решения о принадлежности предъявленного сигнала д форме тестовых сигналов. При этом считается, что сигнал д наблюдается в шуме и, и доступным для наблюдения является сигнал
"О 10 20 30 40 50 60 70 ВО 90
Размерность г ? = 9 +
Критерием близости предъявленного сигнала по форме к те-
„ „ ^ „ стовым сигналам является надеж-
Рис. о. Характерный вид зависимости надежно-
ность гипотезы о том, что мате-
сти гипотезы ау от размерности г для набора из
матические ожидания как всех теп = 21 инфразвуковых сигналов от полярных
стовых сигналов, так и сигнала,
сиянии
предъявленного для анализа, принадлежат одному и тому же линейному подпространству Ь„ размерности г*.
Альтернатива же состоит в том, что эти математические ожидания не содержатся в Ь„. Чем меньше надежность гипотезы, тем меньше шансов на то, что (непосредственно ненаблюдаемые) сигналы ду,..., дп и д принадлежат одному и тому же подпространству размерности г*. В диссертации получено выражение для надежности этой гипотезы, дан критерий принятия решения (по уровню надежности) о том, что сигнал д принадлежит форме Уь-
В разделе 2.2 считается, что множество всех возможных сигналов заданного класса можно записать в виде Уа = {д £ : д = Л/, / 6 -Р}; здесь / € Е(> — вектор признаков, Ег — множество значений векторов-признаков, А 6 (Дл/ —> В.1*) — линейный оператор, который ставит в соответствие признакам / сигнал А/ заданной формы. Схему измерений в данном случае можно записать как
& = + = (2)
Эмпирическое построение формы сигналов У а осуществляется в виде оценки пространства значений линейного оператора, построенного по результатам измерений (2), отклика априори неизвестного оператора А на заданные тестовые векторы /ь ... ,/п. Векторы г = 1,... ,п есть взаимно независимые случайные элементы пространства ВА с нулевыми математическими ожиданиями (Ещ = 0) и ковариационной матрицей Е = а1! 6 (ДЛ —> Я14), моделирующие случайную погрешность измерений (шум).
Для построения формы рассматривается гипотеза Н(А) : & ~ а2/), г = 1 при альтернативе 1С(А) : & ~ сг2/), г =
1 ,...,п, и найдется хотя бы один вектор Ь¡< : Ьф А/?, г' = 1,..., п. Надеж-
5
5 0 35
6 03 с
£ 0.25
§ 02
X 0.15
I"
^ 0.05
ность этой гипотезы как функции линейного оператора А имеет вид
<*а(&, ...,&) = 1 - ^»(^¿116 - АЛИ2)- (з)
г=1
Линейный оператор А, при котором надежность (3) максимальна, определяется как решение вариационной задачи:
п
Л(6, • ..,£„)= аг8пип^ 116; - АМ2 = argmjn ЦН - АФ\& (4)
г—1 У
здесь введены следующие обозначения: для любого вектора д = (д1,..., qn) =■4 = Тл=\ = ХХ11гЯ Из (4) следует, что форму УА сигналов
= ^4/г 6 Я1*, г = 1, • • • ,п|, полученную из принципа максимальной надежности, определяет пространство значений ЩЕФ~) оператора А~ = ЕФ~.
Мерой согласия линейного оператора, связывающего данные {£1,... ,£„} и {/ь • ■ •> /п} в (2), выбрана максимальная по А надежность гипотезы 'Н(А), вычисляемая как а(Е, Ф) = гшгм ||Н — АФЩ = ||Н(1 — Ф~~Ф)||1-
Близость предъявленного сигнала £ = д + и = А/ 4- р по форме к тестовым сигналам определяется в работе на основании гипотезы о том, что сигнал д принадлежит пространству значений линейного оператора А против альтернативы, что данное условие не выполнено. В работе получено выражение для надежности этой гипотезы, дан критерий принятия решения (по уровню надежности) о том, что предъявленный сигнал д принадлежит форме Уд сигналов (2).
Предложенный метод оценки формы сигналов был применен для исследования возможности определения состава и концентрации газов смеси с помощью сенсоров на основе полупроводниковых пленок. Контроль за составом смеси осуществляется на основании измерения сигнала, проводимого по схеме 6 = + щ, г = 1,..., п. Значение параметра к определяет состав газа (компоненты, входящие в смесь, и их количество), а вектор / - их концентрации.
Отклики датчиков на изучаемую смесь газов моделировались численным решением задачи Коши, описывающей динамику проводимости полупроводникового сенсора в зависимости от концентрации и состава газовой смеси. В вычислительном эксперименте рассматривались смеси, состоящие из одной, двух и трех газовых компонент (использовались характеристики водорода, пропана и СО): к = 1,2, 3.
Расчеты показали возможность линейной аппроксимации оператора Ак в каждом тестовом эксперименте: форма сигнала датчика для каждой смеси газов для доступной точности измерений является одномерным линейным подпространством и может быть задана сингулярным вектором оператора ЕК(ФК)~, соответствующим максимальному сингулярному значению.
0.115
0.12
-Однокомпанентная смесь
-Двухкомпанентная смесь
-Трехкомпонентная смесь
На рис. 4 приведены графики главных сингулярных векторов операторов
о 09
для К = 1,2,3 и различных соотношений концентраций. Из рисунка видно, что подпространства, задающие форму сигналов, существенно отличаются для разных составов смеси, однако незначительно изменяются при изменении соотношений
0 10 20 30 40 50 60 70 Время, у.е.
80
90
концентраций в каждом фиксированном классе.
Рис. 4. Сингулярные векторы матрицы для
одно-, двух- и трехкомпонентных смесей (к = 1,2,3) в случае различных концентраций
Таким образом, на основе измерений выходных сигналов газочувствительного сенсора можно указать состав смеси, но не концентрацию со-
ставляющих ее газов, т.к. в эксперименте для этого недостаточно информации.
Раздел 2.3 посвящен эмпирическому построению формы в том случае, когда ее особенности заключены в ковариационных связях значений сигналов.
Измеряемые сигналы = ..., £Л'), г = 1,..., п рассматриваются как реализации стационарных случайных процессов. Для построения формы по методу "гусеницы" (Н.Э. Голяндина, 2004) вычисляются выборочные матрицы ковариации ад = Х^Х?, г = 1,..., (ТУ—М)п, где Х\ = (£},..., Х2 = (¿¡1). .. ... - выборочные векторы размерности М.
Форма сигналов из заданного класса вычислялась как среднее всех котя г 1 чг-Ч^-м)«
вариационных матриц: \У = 2^,1=1 юг-
Решение о принадлежности предъявленного сигнала £ конкретному классу основывается на методе проверки статистической гипотезы о том, что ковариационная матрица предъявляемого вектора есть IV, против альтернативы, что ковариационная матрица есть IV. Область 5 принятия гипотезы определяется как 5 = {х € Д° : (х, \У~1х) — (ж, ]¥~гх) < са}. Пороговое значение са является параметром задачи, регулирующим соотношение между ошибками первого и второго рода (Э. Леман, 1979).
Предложенный метод классификации сигналов был использован для исследования возможности классификации инфразвуковых сигналов атмосферы от различных источников: взрывы (класс № 1), горные обвалы (класс № 2), микробаромы (класс № 3), вулканическая активность (класс № 4) и полярные сияния (класс № 5). Для примера на рис. 5 приведен график матричных
элементов матрицы ковариации для сигналов от полярных сияний.
Из анализа результатов попарного разделения на пять классов можно сделать вывод, что предложенный алгоритм достаточно четко отделяет сигналы, относящиеся к классам взрывов и вулканической активности (множество № 1), от сигналов, относящихся к классам горных обвалов, микроба-ромов и полярных сияний (множество № 2). При этом все сигналы из множества № 1 были классифицированы верно, но также к этим классам были ошибочно отнесено 3 из 51 сигнала, принадлежащих множеству № 2. Рис. 5. Графическое представление матри-
Третья глава посвящена мето- цы ковариаций для класса полярных сия-ду построения формы, основанному на ний упорядочении значений амплитуд сигналов. Данный метод описывается на примере решения задачи анализа изображений сцены при различных условиях ее освещения, не изменяющих упорядочения зарегистрированных яркостей точек поля зрения.
Пусть идеальное изображение / сцены не наблюдается, и известен результат регистрации этой сцены в серии измерений, проводимых по схеме:
& = + г = 1,2,... ,п, (5)
где случайный вектор щ £ ДЛ моделирует погрешность измерения изображения Fj * / (шум); функции 6 Ff, г = 1,2,..., неизвестны, но задан класс ¥/ монотонных преобразований яркостей изображения. Множество V/ = {д € ДЛ : д = Д * /, Д е Г/-} выпукло и замкнуто в при фиксированном / 6 ДЛ . Случайные векторы щ £ ДА' независимы в совокупности и имеют нулевые математические ожидания (Ещ = 0), координаты вектора щ е ДЛ независимы и с вероятностью единица ограничены по модулю: < 6, г — 1,2,..] — 1,..., N. Задача состоит в том, чтобы по результатам наблюдений (5) охарактеризовать сцену, т.е. изображение /.
Рассмотрим функцию 7т(-): ДЛ —> {1,2,..., А^}, результатом дей-
ствия которой на вектор / = (/\ ..., /Л) £ Ддг является набор номеров его координат, упорядоченных по невозрастанию:
АЛ = т((/\/2,• • ■ ,/")) = (Л.Л,■ ■ Р1 > .Р >■■■> Р". (6)
Справедлива следующая теорема:
Теорема 1. Функция 7г(-) является максимальным инвариантом группы монотонных преобразований Г /■ пространства ДЛ'.
Другими словами, функцию 7г(-) можно рассматривать как форму изображения /. Следующий алгоритм реализует построение формы (определение упорядоченности координат вектора /). Для этого введем следующие обозначения: = I - Я*/'), <) = < = «$+<). здесь а, ¡3 = 1,..., Лг — номера координат соответствующих векторов, а < индекс тг указывает количество измерений, по которым производилось усреднение. Нап-м шаге для каждой ЛГ(ЛГ—1)/2 пары индексов (а,/3) принимается одно из решений:
- если > А(„), то принимается решение считать > О,
- если т]^ < — Д(„), то принимается решение Эг: считать < О,
- если < А(п), то принимается решение И: необходимо увеличить количество измерений п.
Если для всех пар (а, д) приняты только решения Бх или Эг, то алгоритм завершен, если же хотя бы для одной пары принято решение И, то в (5) добавляется еще одно измерение, и для нового набора изображений вновь проверяются условия решений вь 32 и И для всех N(N — 1)/2 пар (а < /3),
а,/3= 1,..., ЛГ.
В работе сформулирована и доказана теорема о том, что для любого конечного числа измерений (5), полученных от одной и той же сцены упорядоченность координат вектора / € определяется с вероятностью единица по конечному числу наблюдений £ь ... € ЯЛ'. Кроме того, даны выражения для оценки вероятностей ошибочных решений на каждом шаге алгоритма и в случае его остановки. Величина порога Д(п) определяется на основании ограничения вероятности ошибочных решений.
Проверка адекватности построенной модели в данном случае сводится к проверке предположения о том, что все изображения (5) получены от одной и той же (неизвестной) сцены. В работе получены оценки вероятности совпадения найденной упорядоченности координат вектора с их истинной упорядоченностью, кроме того, оцениваются вероятности ошибочных решений Б: и Эг-
В первой части четвертой главы эмпирическое построение формы производится на основании изображений вейвлет-спектров сигналов. При этом яркость изображения моделирует коэффициенты разложения вей-влет-спектра как функции масштаба и времени. Данный подход позволяет математически охарактеризовать существенные особенности сигнала с точки зрения его частотных составляющих, а также их относительного расположения во времени, и при этом минимизировать вклад случайных шумов и других составляющих, не являющихся существенными с точки зрения решаемой задачи. Во второй части главы приведен метод морфологического вейвлет-анализа, представляющий собой объединение методов морфологического н вейвлет-анализа.
Эмпирическое построение формы на основании изображений вейвлет-
спектра производится путем выделения масштабно-временных структур, имеющих вид геометрических областей постоянной яркости. Форма сигнала в этом случае представляет собой разбиение поля зрения изображения вей-влет-спектра на области постоянной яркости. Далее сигнал анализируется методами морфологического анализа на основании полученной формы.
Предложенный метод был применен при решении задачи классификации акустических сигналов от высоковольтного электрооборудования. Предполагается, что все получаемые акустические сигналы можно разделить на четыре класса, возникающих в результате одной из следующих ситуаций: одиночных искровых разрядов (класс № 1), одиночных частичных электрических разрядов (класс № 2), многочисленных разрядов (класс „ ^ ,, „, , гис. о. 1 ипичные веивлет-спектры каждого класса № 3), виброударных механических процессов (класс № 4). Разряды, соответствующие трем первым классам являются предвестниками аварии, последний класс вообще не связан с пробоями и представляет собой механические и т.п. шумы.
На основании изображений вейвлет-спектров сигналов, рис. 6 (в качестве базового вейвлета был выбран вей-влет Мейера), строились формы для каждого класса. Вид областей поля зрения, отвечающих областям постоянной яркости, изображен на рис. 7. Множества изображений сигналов для каждого из трех классов задаются как: = {ЛО) = Сх <
с2 2< с3}, У2 = {/2(х) = их ^ и2 Ъ "3}, "3 = = а1 < аг}- где
■фифч^ъ ~ индикаторы областей, изображенных на рис. 7.
Таким образом, форма для первых трех классов связывается с геометрической формой областей А2 и В\, В2 и Дз или и .02, соответственно.
Класс № 3
2000 «х» (ая еооо юооо Время, у.е.
2000 4000 6000 6000 ЮОСО
Время. у.е
2000 «ПО 6000 6000 10000
Время, у.е.
Рис. 7. Области постоянной яркости для каждого класса
V-! и и ^ I. ^ 1. 1 V IX /_1
Шумовые сигналы не имеют характерных четко выраженных областей постоянной яркости (рис. 6), поэтому если сигнал нельзя отнести ни к первому, ни ко второму, ни к третьему классам, его относят к сигналам посторонних шумов.
На основе морфологической близости построен метод классификации сигналов на четыре класса, дан численный алгоритм классификации и создано программное обеспечение решения задачи диагностики электрооборудования как задачи классификации формы изображений вейвлет-спектров ультразвуковых сигналов, зарегистрированных при инспектировании этого оборудования. Разработанный алгоритм дал верную классификацию для всех 22 проанализированных сигналов контрольной выборки.
Во второй части четвертой главы описывается метод морфологического вейвлет-анализа, позволяющий получать близость участков сигнала к эталону в зависимости от масштаба эталона и его положения во времени.
Считается, что сигнал является элементом линейного пространства область задания сигнала X С R1. Кроме того, задан базовый вейвлет ф(-) с носителем / €Е X, заданным эталонным сигналом. Рассматривается множество преобразований масштаба и сдвига базового вейвлета ф(-), таких, что результат /7iXo любого из этих преобразований целиком содержится в X {fi,xо е -Ю- Множество вейвлет-формы
УФ,ЪХ0 = {F * ф(7 • -х0), F е F^} (7)
есть множество фрагментов сигнала, имеющих форму базового вейвлета. Выражение ^(7 • —Хо) задает эталон вейвлет-формы сигнала, a F G F^, — моделирует изменение условий формирования сигнала.
Вместо скалярного произведения, используемого в стандартном вейвлет-анализе для характеристики сходства участков сигнала с вейвлет-формой, в морфологическом вейвлет-анализе используется морфологическая близость — мера близости фрагмента предъявленного сигнала д 6 С2И(Х) на подмножестве, полученном из / преобразованием масштаба 7 и сдвига на хо, к вей-влет-форме ^>(7 ' ~~ хо), построенная следующим образом:
{О, если д = const;
' 6СЛИ 9 ^ Const И 9 ^ 9' (8)
оо, если д = Рф,-у,х09-
Здесь РфП,Хо есть оператор проецирования на множество УфП:Хо в пространстве всех изображений, Pq — проектор на множество сигналов, равных константе почти всюду на X. Чем больше значение тем ближе фраг-
мент рассматриваемого сигнала д к вейвлет-форме ^(7 • — xq) по сравнению с постоянным сигналом.
Вычисление т^,ПгХо для всех 7 и хо, при которых / преобразуется в множество fy.Xo, целиком содержащееся в X, позволяет найти те значения, кото-
рые соответствуют максимальному сходству выделенного фрагмента сигнала с заданной вейвлет-формой.
Морфологические вейвлеты были применены для решения за- сигнала
дачи сравнения двух сигналов по форме. Сигнал регистрировался двумя каналами (а и Ь), рис. 8. Один из сигналов, сигнал а, выбирался для эмпирического построения форм: /(г) = а(аг,..., аг+м), где М — размерность формы, г = 1,...,(Л/"0 - М) - "номер" формы (ТУа — размерность сигнала а). Благодаря такому подходу в качестве формы берутся все участки сигнала а. Далее производилось сравнение другого сигнала, сигнала Ь, с полученными формами по морфологической
^ кчМ/
□ 5 10 15 20 25 30 Время,сек Сигнал Ь
-_jA*
15
Время,сек
Рис. 8. Графики сигнала, зарегистрированного двумя каналами
близости, аналогичной (8) (считалось, что 7=1, д ф const и д ф Рф,-у,хд)'-
1Ш)-Д>Ш)И2
ТФШо
(м) =
Здесь г=1,..., (N0, — М), ] = (Иъ — М), = Ь(Ь>,..., Ъ>+м) - части сигнала Ь. В (9) изменение вейвлет-формы связано только с преобразованиями сдвига по времени, но не масштаба.
а) Морфологическое сравнение по форме
Сигнал а, время, сек
Ь) Коэффициенты корреляции
10 15 20 25
Сигнал а, время, сек
Рис. 9. а) результат морфологического сравнения двух сигналов по форме; Ь) корреляции всех участков сигналов размерности М
Результат т^ф,<0(г,]) (9) морфологического сравнения двух сигналов по форме представлен на рис. 9а. Хорошо видны области максимального откли-
ка, соответствующие сходству сигналов. На рис. 9Ь представлены значения корреляций всех участков сигналов а и Ь размерности М. Данный метод выделяет дополнительные области максимального отклика, соответствующие схожести сигнала с шумовыми составляющими.
В заключении кратко сформулированы основные результаты и выводы, полученные в работе:
1. Разработаны новые математические и численные методы эмпирического построения формы на основании тестовых измерений. Эти методы позволяют решать задачи морфологического анализа при отсутствии априорно заданной формы и тем самым расширяют возможности применения методов морфологического анализа.
2. Предложены методы проверки адекватности эмпирически построенных форм. Данные методы позволяют проверить непротиворечивость используемых математических моделей восстановленных форм результатам регистрации тестовых сигналов.
3. На основании построенных форм разработаны математические методы и численные алгоритмы решения задач классификации и идентификации сигналов. Созданы комплексы программ, реализующие разработанные методы и алгоритмы.
4. Проведено сравнение и показана эффективность предложенных методов по сравнению с наиболее часто используемыми при анализе сигналов методами корреляционного анализа.
Рекомендации по применению полученных результатов. Разработанные в диссертации методы могут быть использованы для решения задач узнавания, классификации и определения параметров сигналов в случае отсутствия априорной информации об источнике, а также для разработки программно-алгоритмического обеспечения.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в журналах из перечня ВАК:
1. Цыбульская Н.Д., Куличков С.Н., Чуличков А.И. Исследование возможности классификации инфразвуковых сигналов от разных источников // Известия РАН. Физика атмосферы и океана. — М.: Наука, 2012 г. - Т. 48, № 4. - 434-441 с.
2. Цыбульская Н.Д., Чуличков А.И. Эмпирическое построение формы изображения сцены как инварианта его преобразований, сохраняющих упорядочение яркостей пикселей // Журнал вычислительной математики и математической физики. — М.: Наука, 2012 г. — Т. 52, Л'2 9. — 1735-1744 с.
3. Чуличков A.II., Демин Д.С., Копит Т.А., Цыбульская Н.Д. Анализ формы изображений, заданных с погрешностью // Интеллектуальные системы. - М., 2013. - Т. 17, вып. 1-4. - 117-121 с.
4. Чуличков А.И., Цыбульская Н.Д., Куличков С.Н. Исследование возможности классификации инфразвуковых сигналов методами проверки статистических гипотез // Вестник Московского университета. Сер.З. Физика. Астрономия. — М.: Изд-во МГУ, 2012 г. — № 2. — 20-22 с.
5. Чуличков А.И., Цыбульская Н.Д., Цветаев С.К., Сурконт О.С. Классификация акустических сигналов разрядных процессов в изоляции на основе формы их вейвлет-спектров // Вестник Московского университета. Сер.З. Физика. Астрономия. — М.: Изд-во МГУ, 2009 г. — № 2. — 103-105 с.
G. Чуличков А.И., Цыбульская Н.Д., Шахбазов С.Ю. Классификация сигналов по форме, модель которой определена эмпирически // Вестник Московского университета. Сер.З. Физика. Астрономия. — М.: Изд-во МГУ, 2010 г. - № 5. - 9-13 с.
Публикации в других научных изданиях:
7. Рошупкин М.Д., Сурконт О.С., Цветаев С.К., Цыбульская Н.Д., Чуличков А.И. Морфологический анализ акустических сигналов разрядных процессов изоляции // Тезисы докладов III Конференции-2008 "Консолидация усилий электроэнергетики и электротехники в условиях роста инвестиций. Перспективные технологии и электрооборудование". — М.,
2008 г. - 304-313 с.
8. Цыбульская Н.Д., Куличков С.И., Чуличков А.И. Распознавание сигналов от разных источников в атмосфере // Сборник трудов Научной конференции "Сессия Научного совета РАН по акустике и XXV сессия Российского акустического общества". — Таганрог, 2012 г. — Том 2. — 150-154 с.
9. Цыбульская Н.Д., Чуличков А.И. Эмпирическое упорядочение яркости пикселей изображения, задающее его форму // Труды 15-ой Всероссийской конференции "Математические методы распознавания образов". — Петрозаводск, 2011 г. — 444-447 с.
10. Чуличков А.И., Демин Д.С., Цыбульская Н.Д. Морфологический подход к вейвлет-анализу сигналов // Труды 14-ой Всероссийской конференции "Математические методы распознавания образов". — Суздаль,
2009 г. - 486-489 с.
11. Чуличков А.И., Матвеев Н.О., Цыбульская Н.Д., Куличков С.Н. Классификация инфразвуковых сигналов по локальным особенностям их формы // Труды 19-ой междунар. конф. "Математика. Компьютер. Образование". - Дубна, 2012 г. - 218 с.
12. Чуличков А.И., Цыбульская Н.Д. Построение модели измерительно-вычислительной системы по данным измерений тестов // Труды 15-ой международной конференции "Математика. Компьютер. Образование". - Дубна, 2008 г.
13. Чуличков А.И., Цыбульская Н.Д. Оценивание характеристик эталонного сигнала по набору тестовых измерений // Труды 17-ой международной конференции "Математика. Компьютер. Образование". — Пущино, 2010 г. - 52 с.
14. Чуличков А.И., Цыбульская Н.Д., Шахбазов С.Ю. Анализ данных на основе модели, построенной по тестам // Труды 16-ой международной конференции "Математика. Компьютер. Образование". — Пущино, 2009 г. - 201 с.
15. Chulichkov A.I., Tsybulskaya N.D., Surkont O.S. Roschupkin M.D., Tsvetaev S.K. Morphological Analysis of Acoustic Signals of Discharge Processes // Cigre 2009 6th Southern Africa Regional Conference. — Cape Town, 2009. - Paper PI 10.
16. Tsybulskaya N., Kulichkov S., Chulichkov A. Analysis of classification possibility infrasound signals from different sources based on correlation ability // CTBTO Science and Technology Conference. — Vienna, 2011. — T4-012.
17. Tsybulskaya N., Kulichkov S., Chulichkov A. The Method of Signal Analysis Based on the Mathematical Morphology (the Case of Model Experiment) // CTBTO Science and Technology Conference. — Vienna, 2013. — T3-033. — P. 94.
Свидетельства о государственной регистрации программ для ЭВМ:
1. Цыбульская Н.Д., Куличков С.Н., Чуличков А.И, Формозова Е.В., Шнипко Н.В. Программа для автоматической классификации инфразвуковых сигналов в атмосфере. Свидетельство №2011614714 от 16.06.2011.
2. Цыбульская Н.Д., Куличков С.Н., Чуличков А.II, Соловьев Д.Н., Цыбульская М.В., Буш Г.А. Программа для выявления квазнпериодиче-ского сигнала. Свидетельство №2013612369 от 26.02.2013.
Подписано в печать 20.09.2014 г. Формат А5 Бумага офсетная. Печать цифровая. Тираж 70 Экз. Заказ № 3143-9-14 Типография ООО "Ай-клуб" (Печатный салон МДМ) 119146, г. Москва, Комсомольский пр-кт, д.28 Тел. 8-495-782-88-39
-
Похожие работы
- Морфологические методы оценивания параметров микрообъектов
- Анализ применения нейронных сетей в некоторых задачах цифровой обработки изображений
- Фильтрация цифровых изображений на основе анализа главных компонент и нелокальной обработки
- Модели и алгоритмы сегментации и фильтрации аппликативных помех на изображениях
- Разработка и исследование алгоритмов восстановления изображений методами секвентного анализа
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность