автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Компьютерная обработка реальных сигналов спектральными методами и методами биоинформатики

кандидата технических наук
Хотова, Фатима Ансарбиевна
город
Смоленск
год
2012
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Компьютерная обработка реальных сигналов спектральными методами и методами биоинформатики»

Автореферат диссертации по теме "Компьютерная обработка реальных сигналов спектральными методами и методами биоинформатики"

00501»'^

На правах рукописи

ХОТОВА ФАТИМА АНСАРБИЕВІІА

КОМПЬЮТЕРНАЯ ОБРАБОТКА РЕАЛЬНЫХ СИГНАЛОВ СПЕКТРАЛЬНЫМИ МЕТОДАМИ И МЕТОДАМИ БИОИНФОРМАТИКИ

^ /

7

05.13.18 — Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

з т т

Казань-2012

005018793

Работа выполнена на кафедре информационных технологий федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Смоленский государственный университет» (СмолГУ)

Научный руководитель: доктор технических наук, профессор Дьяконов

Владимир Павлович

Официальные оппоненты: Холодное Владислав Алексеевич, доктор

технических наук, профессор, заведующий кафедрой математического моделирования и оптимизации химико-технологических процессов Санкт-Петербургского государственного технологического института (технического университета)

Герасимов Александр Викторович, доктор технических наук, профессор, профессор кафедры интеллектуальных систем и управления информационными ресурсами Казанского национального исследовательского технологического университета

Ведущая организация: Саратовский государственный технический

университет имени Гагарина Ю.А.

Защита диссертации состоится 24 мая 2012 г. в 16.00 на заседании диссертационного совета Д 212.080.13 при ФГБОУ ВПО «Казанский национальный исследовательский технологический университет» по адресу: 420015, г. Казань, ул. Карла Маркса, 68, в зале заседаний Ученого совета (А-330).

С диссертацией можно ознакомиться в фундаментальной библиотеке Казанского национального исследовательского технологического университета.

Автореферат разослан « №» апреля 2012 г.

Ученый секретарь

диссертационного совета Д 212.080.13 доктор технических наук,

профессор А.В. Клинов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. Достоверный и информативный анализ сигналов является актуальной научной задачей. Ныне она решается применением довольно дорогих цифровых измерительных приборов, прежде всего генераторов сигналов, осциллографов и анализаторов спектра. Другим важным направлением изучения сигналов является их математическое моделирование и анализ с помощью систем компьютерной математики (СКМ). Долгое время эти направления развивались отдельно.

В данной диссертации рассматривается возможность обработки реальных сигналов, получаемых при исследовании различных устройств, с помощью численных методов СКМ MATLAB. Под реальными сигналами понимаются сигналы, полученные с измерительных приборов.

Исследования, проведенные в данной диссертации, показали, что к числу наиболее мощных СКМ, ориентированных на численные методы вычислений, относится матричная система MATLAB. В ней большое внимание уделяется обработке сигналов, что подтверждается наличием нескольких пакетов расширения по обработке сигналов (Signal Processing Toolbox - пакет по обработке сигналов, Wavelet Toolbox - пакет по вейвлет-анализу, а также пакет имитационного блочного моделирования Simulink). Имеющиеся в системе и в данных пакетах методы и алгоритмы позволяют существенно улучшить процесс обработки сигналов и расширить возможности современных измерительных приборов. Так, в MATLAB спектральный анализ сигналов выполняется не только стандартным методом быстрого преобразования Фурье, но и десятками других методов, с большим числом окон. Есть и принципиально новые возможности, которых пока нет в измерительных приборах. К ним следует отнести короткое оконное преобразование Фурье, вейвлет-анализ, построение спектров в линейном масштабе, а также новейшие методы биоинформатики и масс-спектрального анализа.

В связи с этим в данной диссертации решается актуальная задача развития методов спектрального анализа как в частотной, так и во временной областях представления, исследования и анализа реальных сигналов (в том числе и нестационарных) с применением СКМ MATLAB.

Цель диссертационного исследования: разработка новой методики исследования реальных сигналов, полученных с цифровых измерительных приборов, эффективными средствами компьютерного моделирования на основе системы MATLAB и реализованных в ней численных методов, позволяющих повысить информативность получаемых результатов исследования.

Достижению поставленной цели способствует решение в диссертации следующих задач:

1. Анализ существующего технического обеспечения спектрального анализа с целью выявления возможностей в исследовании реальных сигналов.

2. Анализ существующих эффективных методов исследования сигналов, повышающих информативность получаемых результатов.

3. Исследование системы компьютерной математики MATLAB на наличие современных методов обработки и анализа сигналов.

4. Математическое моделирование тестовых сигналов для оценки эффективности современных методов анализа сигналов, реализованных в MATLAB.

5. Комплексное исследование реальных радиотехнических сигналов в процессе реализации современных эффективных численных методов в виде комплексов программных модулей на языке МАТЬАВ.

6. Разработка алгоритма предварительной обработки масс-спектров методами биоинформатики.

7. Разработка методики применения методов биоинформатики к радиотехническим сигналам.

Объект и предмет исследования. Объектами исследования являются матричная система компьютерной математики МАТЬАВ, современные измерительные приборы обработки сигналов, процессы компьютерной обработки сигналов. Предметом исследования являются спектральные методы и методы биоинформатики в обработке реальных сигналов.

Методом исследования является математическое моделирование с применением теоретических основ радиоэлектроники, радиотехники, биологии и генетики. В работе использованы методы математического анализа, оптимизации, аппроксимации, численные методы, язык программирования матричной СКМ МАТЬАВ.

Научная новизна. Интеграция измерительных приборов с системами компьютерной математики, позволяющая существенно расширить возможности измерительных приборов в обработке реальных сигналов, является новым направлением в радиотехнике и измерительной технике, в значительной мере определяющим пути дальнейшего развития современных цифровых измерительных приборов. В связи с этим научную новизну диссертационного исследования составляют:

1. Разработанная методика анализа реальных сигналов, получаемых с цифрового осциллографа, расширенными методами, имеющимися в СКМ МАТЬАВ. К данным методам относятся: метод кратковременного оконного преобразования Фурье, методы вейвлет-анализа (непрерывное вейвлет-преобразование, методы построения скейлограмм).

2. Разработанный алгоритм предварительной обработки спектров эффективными методами биоинформатики (метод перевыборки спектров, методы подавления шумов в спектре, метод автоматического поиска пиков спектра).

3. Разработанная методика обработки радиотехнических сигналов методами биоинформатики.

4. Разработанный и апробированный программный модуль, обеспечивающий стыковку цифрового осциллографа и системы МАТЬАВ и позволяющий импортировать реальные сигналы в рабочее пространство данной системы.

На защиту выносятся:

1. Методика исследования реальных сигналов методом кратковременного оконного Фурье-преобразования, методами вейвлет-анализа (непрерывное вейвлет-преобразование, методы построения скейлограмм).

2. Алгоритм предварительной обработки спектров эффективными методами биоинформатики (метод перевыборки спектров, методы подавления шумов в спектре, метод автоматического поиска пиков спектра).

3. Методика обработки радиотехнических сигналов методами биоинформатики.

4. Программный модуль, обеспечивающий стыковку цифровых осциллографа корпорации Tektronix и системы MATLAB и позволяющий импортировать реальные сигналы в данную систему.

Практическая значимость.

Методами математического моделирования реализована связь цифровых осциллографов фирмы Tektronix с матричной системой компьютерной математики MATLAB, что позволяет на практике осуществлять спектральный анализ реальных сигналов, полученных с осциллографов, расширенными методами, присущими данной системе.

Разработанная методика позволяет существенно улучшить обработку радиосигналов (например, в радиолокации, в беспроводных системах связи и т.д.), модулированных сигналов (при создании систем передачи информации), медицинских сигналов (вейвлет-обработка электроэнцефаллогрмм (ЭЭГ), электрокардиограмм и т.д.).

Предложенная методика применения методов биоинформатики к обработке реальных масс-спектров веществ имеет большое практическое значение в экологии (определение значений загрязнения воздуха, почвы, воды и растений и т.д.); в медицине (анализ микроэлементного состава биологических жидкостей человека на предмет выявления болезни или её риска; контроль хода лечения пациентов и т.д.); в криминалистике (проверка на допинг; контроль наркотических средств) и во многих других.

Кроме того, полученные и представленные результаты позволяют определять новые направления в развитии современных измерительных приборов.

Апробация работы. Основные результаты диссертации опубликованы в работах [1] - [11] и докладывались на Десятой молодежной научной школе-конференции «Лобачевские чтения-2011» (Казань, 2011 г.), Российской летней школе «Математическое моделирование фундаментальных объектов и явлений в системах компьютерной математики» (Казань, 2010 г.), на 8-Й, 9-й, 10-й и 11-й международных конференциях «Системы компьютерной математики и их приложения» (Смоленск, 2007-2010 гг.). Кроме того, материалы данной диссертационной работы вошли в монографию «Компьютерная математика в измерениях» [3], опубликованную в Смоленской военной академии войсковой ПВО РФ.

Публикации. По теме диссертации опубликовано 11 печатных работ, отражающих основные результаты диссертации, из них 2 работы в источниках, рекомендованных ВАК, 1 монография и 8 в научных изданиях.

Структура и объем работы. Диссертация состоит из введения, четырех глав, выводов, списка использованной литературы из 118 наименований, а также 4 приложений. Работа изложена на 162 страницах машинописного текста, включающего 3 таблицы, 74 рисунка.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цели и задачи исследования, указана научная новизна исследований и сформулированы научные положения и результаты, выносимые на защиту.

В первой главе рассмотрены особенности спектрального анализа для различных видов сигналов, проведен анализ современных методов спектрального анализа.

Важными сферами применения рядов Фурье являются радиотехнически расчеты. В них периодические сигналы обычно представляют как функции времен у(1) на отрезке [О,Г] с периодом Т = 1// , где - частота первой гармоник гармонического сигнала:

Я 0 СО!5(2я# ')+0), (1

г г

ак = ^ ¿>, = (2

о о

У непериодических сигналов спектр будет сплошным, а вместо амплитуд) гармоник он характеризуется спектральной плотностью сигнала:

= (2

Для цифровых (дискретных) сигналов применяется дискретное преобразовани Фурье (ДПФ):

и=0

где Х(т) - т-й компонент ДПФ, т - индекс ДПФ в частотной области, лг(и,) последовательность входных отсчетов (дискретный сигнал), N - количество отсчетов.

К цифровым сигналам чаще всего применяют алгоритм быстрог преобразования Фурье (БПФ). Все эти методы обобщены в диссертацш применительно к их реализации в созданном аппаратно-программном комплексе.

Выполнение БПФ производится для данных, представленных действительным числами - значениями исходного вектора V. Он должен иметь 2т составляющих, гд т - целое число. Элементы вектора, возвращаемого функцией прямого БПС соответствуют формуле:

л/лт?1

где п - число элементов вектора V, /' - мнимая единица, к - индекс суммирования (с 0 до и —1) и ] - номер гармоники (от 0 до и/2). Эти элементы вектор соответствуют следующим частотам:

/,=~/. « и

где - частота квантования сигнала, который подвергается БПФ. Элементы вектор! возвращаемого этой функцией, - в общем случае комплексные числа, даже есл сигнал представлен вещественными отсчетами.

Проведенный в рамках диссертационной работы анализ возможносте современных измерительных приборов по обработке сигналов, к которым относятс в первую очередь генераторы сигналов, осциллографы и анализаторы спектр! показал, что основной задачей этих приборов является исследование явлени и процессов окружающего мира. Другими словами, они позволяют исследоват и отображать реальные сигналы. С другой стороны, к основным недостатка большинства измерительных приборов спектрального анализа можно отнеси наличие только метода БПФ; недостаточное количество окон для проведени

оконного спектрального анализа реальных сигналов, сущность которого заключается в следующем.

Для спектрального анализа осциллографических (реальных) сигналов применение метода БПФ имеет ряд недостатков. Так, при выполнении БПФ предполагается, что временной сигнал повторяется бесконечно. Для целого числа циклов временной сигнал начинается и заканчивается на одном и том же уровне и в форме сигнала отсутствуют разрывы. При нецелом числе циклов сигнала во временной области начальная и конечная точки имеют разные уровни. Переход от начальной к конечной точке приводит к разрыву в форме сигнала, что, в свою очередь, вызывает появление высокочастотных составляющих переходного процесса (рис. 1).

Применение окна к сигналу во временной области изменяет форму сигнала таким образом, что начальное и конечное значение сближаются, в результате чего уменьшается величина разрыва (рис. 2).

ДПФ взвешенной окном последовательности приобретает форму:

,2лпт N

(7)

N-1 -_/-

и=0

где у/(п) — отсчеты окна, х(п) - исходная последовательность, N — число отсчетов, т, п -индексы последовательностей (0, 1,...,>4-1).

В большинстве измерительных приборов используется небольшое количество окон (3 - 6), в то время как их количество в настоящее время достигает десятков. При удачном подборе окон можно значительно повысить частотное разрешение спектров, подавить эффект Гиббса и улучшить вид спектров.

■\ЛЛЛЛ

ллллл

ил/да

Гбпф

йС

Рис. 1. Режима БПФ Рис. 2. Режим оконного БПФ

Избежать вышеуказанных проблем можно с помощью специальных приемов и предварительной обработки осциллограмм, однако большинство современных цифровых приборов использует простой алгоритм БПФ без дополнительного преобразования, что периодически приводит к искажениям в спектрах реальных сигналов.

В работе также проведен анализ существующих эффективных методов обработки различных сигналов. Показано, что все современные методы анализа сигналов имеются в СКМ МАТЬ А В и ее пакетах расширения, в связи с чем предполагается совместное применение измерительных приборов и данной системы. В ходе исследования было установлено, что использование СКМ МАТЬАВ применительно к реальным сигналам имеет следующие преимущества:

- расширенное количество методов спектрального анализа, включающих классические методы (метод периодограмм, метод Уэлча, многооконный метод), параметрические методы (автокорреляционный метод, метод Бурга, ковариационный метод и др.);

- десятки видов окон (треугольное, Блэкмана, Хэннинга, Хэмминга, Блэкмана-Харриса, плоское, Гаусса и многие другие);

- расширенные возможности визуализации данных (построение всевозможных 2-1) и 3-0 графиков, использование графических пользовательских интерфейсов;

- число математических операций с сигналами, полученными с нескольких каналов, значительно превышает те, которые реализуются в измерительных приборах;

- возможность построения спектров в логарифмическом и в линейном масштабе;

- возможность обработки нестационарных сигналов, сигналов в виде пачек импульсов;

- выполнение короткого оконного преобразования Фурье;

- вейвлет-анализ сигналов;

- методы биоинформатики (метод перевыборки спектров, методы сглаживания спектров, метод автоматического поиска пиков спектров) и др.

Последние пять из указанных преимуществ относятся к принципиально новым возможностям, которые не реализованы в большинстве измерительных приборов.

Таким образом, в первой главе данной работы обоснована необходимость совместного использования СКМ МАТЬАВ с измерительными приборами для анализа реальных сигналов с целью повышения его информативности.

Во второй главе на основании анализа, проведенного в первой главе данной диссертационной работы, и полученных выводов решены следующие задачи:

разработаны математические модели сигналов, необходимые для тестирования эффективности имеющихся в системе МАТЬАВ методов анализа сигналов;

- на разработанных моделях реализованы эффективные численные методы обработки сигналов (метод кратковременного оконного преобразования Фурье, методы вейвлет-анализа) в виде комплексов программ на языке системы МАТЬАВ.

Для оценки радиоимпульсов в виде пачек синусоид используется метод короткого (кратковременного) оконного Фурье-анализа:

Д/)= 1 х{1)-м,(1-Ъ)еп"рса. (8)

—00

где х(0- исходная функция, \у(иЪ) - оконная функция, параметр Ъ - сдвиг окна на временной оси задает его.

Для оценки эффективности использования данного метода разработаны примеры, доказывающие его преимущества перед обычным преобразованием Фурье при анализе не только радиоимпульсов, но и модулированных сигналов. Для каждого вида сигналов автором предложены свои параметры, позволяющие получать достоверные и информативные результаты анализа.

Также реализованы эффективные методы вейвлет-анализа сложных сигналов с локальными особенностями. Данные методы позволяют устранить основные недостатки разложения сигналов в ряды Фурье, связанные с ограниченной информативностью анализа нестационарных сигналов и практически полным отсутствием возможностей анализа их локальных особенностей.

При вейвлет-анализе сигнал s(t) задается в векторном пространстве в виде взвешенной суммы базисных функций Ц/к (/), помноженных на коэффициенты Ск как:

№=Hct(a,b)Vk(f,a,b), (9)

к

где параметр а задает ширину вейвлета, a b — его положение (перемещение по оси времени).

В основе непрерывного вейвлет-преобразования (НВП) лежит использование двух непрерывных и интегрируемых по всей оси t (или х) функций:

— вейвлет-функция psi if/(t) с нулевым значением интеграла ( Jy/{t)dt = 0 ),

определяющая детали сигнала и порождающая детализирующие коэффициенты;

— масштабирующая или скейлинг-функция phi ср(г) с единичным значением

интеграла ( J<p{t)dt = 1), определяющая грубое приближение (аппроксимацию) сигнала

и порождающая коэффициенты аппроксимации.

Прямое непрерывное вейвлет-преобразование сигнала s(t) задается вычислением вейвлет-коэффициентов по формуле:

С (а, b) = (s(<), b, t)) = } s(t)a-U2J^-~jdt. (10)

С учетом обычно ограниченной области определения сигналов и a,beR, аФ0 (10) можно представить в виде:

C(a,b) = \jS(t)a"ïV[^yt. (11)

Разработанные автором диссертационной работы примеры подтверждают эффективность использования вейвлет-анализа в случае, если сигнал имеет разрывы (2 разрыва в сигнале (рис. 3) отображаются четкими «зубцами» на вейвлет-спектрограмме).

i У

гашш ■мтш ш *M,J m

„—.—,—,—,——.—.—_

Рис. 3. Вейвлет-спектрограмма сигнала с разрывами

В ходе исследований были определены оптимальные параметры, к которым относится тип вейвлета (зут8) и значения шкалы а (1:128), позволяющие получить наилучшие результаты.

В работе также представлены достоинства одного из новых направлени непрерывного вейвлет-преобразования - построение скейлограмм (scalogram графиков распределения энергии сигнала (в %) для каждого коэффициент непрерывного вейвлет-преобразования.

В данном методе значения шкалы (scale values) определяют степень сжати (растяжения) вейвлета: малые значения сжимают вейвлет и коррелируют с высокими частотами входного сигнала, большие значения растягивают вейвлет и коррелирую с низкочастотными компонентами сигнала.

В работе проведен анализ нестационарных сигналов. Комплексно исследование таких сигналов классическим методом спектрального оценивани Уэлча и методом непрерывного вейвлет-преобразования дает представление н только о частотном составе данных сигналов, но и времени появления той или ино частоты в сигнале (рис. 4, 5).

Welch Power Spectral Density Estimate Analyzed Signal

2!чао!отнь 77 10 И4р X со зтов 1ЯКМ (их:

to 4Ь

Scalogram

Percentage of energy for each wavelet coefficient

SO 100 150 200 250 300 350 400 150 500 Frequency ¡Hz)

Рис. 4. Периодограмма Уэлча

400 500 Time (or Space) ь

Рис. 5. Скейлограмма синусоиды с меняющейся во времени частотой

На скейлограмме (рис. 5) две горизонтальные линии показываю соответствующие частотам показатели шкалы а.

Данные примеры подтверждает обозначенные преимущества вейвлет-анализ перед Фурье-анализом.

Таким образом, в ходе исследований в рамках второй главы подтверждаете необходимость совместного использования системы MATLAB с измерительным приборами, реализующими спектральный анализ сигналов.

В третьей главе впервые исследован пакет расширения системы MATLA Bioinformatics Toolbox, который представляет собой обширный набо инструментальных программных средств для работы в области биологии и генно: инженерии.

Пакет имеет следующие возможности:

- анализ генных цепочек (определяются основные статистически характеристики данных из области биологической информации и генной инженерии);

- филогенетический анализ (создание и управление деревом данных);

- анализ данных микроскопических множеств и их представление;

- статистическое изучение (классификация и идентификация особенносте" в наборах данных с помощью статистических инструментов изучения);

- масс-спектрометрический анализ (обработка масс-спектров веществ).

Биоинформатика - это прикладное использование современных информационных технологий для хранения, систематизации и сравнительного анализа данных, полученных и получаемых в ходе молекулярных, геномных и протеомных исследований, для моделирования отдельных процессов и взаимодействий в живом (зародилась в конце XX века).

Большая часть данной диссертационной работы посвящена исследованию и реализации эффективных численных методов масс-спектрометрического анализа. Суть анализа - в получении масс-спектрометрического сигнала исследуемого вещества и построении его спектрограммы, по пикам которой можно судить о составе этого вещества.

Впервые был разработан алгоритм предварительной обработки масс-спектров эффективными численными методами биоинформатики в области масс-спектрометрического анализа (метод перевыборки спектров, методы подавления шумов в масс-спектре, метод автоматического поиска пиков в спектре, методы кластеризации пиков в спектрах).

Данный алгоритм представлен на рис. 6:

Рис. 6. Алгоритм предварительной обработки масс-спектров веществ методами биоинформатики

1. Метод перевыборки спектров путем интерполяции (увеличение числа отсчетов), децимации (уменьшение) (см. рис. 7, 8).

2. Методы подавления шумов в спектрах (см. рис. 7, 8). В пакете МАТЬАВ по биоинформатике применяются метод сглаживания сигнала взвешенной локальной регрессией (метод [о^тевв) и метод сглаживания сигнала фильтрами Савицкого-Голея.

При сглаживании методом Ьхуеээ для каждого сглаживаемого значения данных, заданного в точке, выбирается набор из фиксированного числа рядом расположенных точек, каждой из которых назначается вес по следующей формуле:

/ зЛ

Ы(хк) /

где й?(х, ) - расстояние от хк до наиболее удаленной точки из набора.

Фильтры Савицкого-Голея осуществляют полиномиальную аппроксимацию отдельных кадров входного сигнала по критерию минимума квадратической ошибки. При этом практически установлено, что фильтры Савицкого-Голея лучше сохраняют

высокочастотные компоненты сигнала, однако обеспечивают худшее подавление шума по сравнению с обычными нерекурсивными фильтрами.

На разработанных примерах показано, что метод перевыборки эффективен при дальнейшей обработке больших массивов. Так, время сглаживания масс-спектра из 355760 отсчетов методом Савицкого-Голея после перевыборки снижается более чем в 30 раз, что доказывается рис. 7, 8.

3. Метод поиска пиков в спектрах - для решения использована входящая в пакет Bioinformatics Toolbox функция mspeaks(X, Y, ...'PropertyName', Property Value, ...), которая позволяет находить пики в зашумленном сигнале. Этот процесс состоит из трех последовательных этапов: 1) вейвлет-сглаживание сигнала; 2) нахождение всех пиков (через первую производную); 3) постфильтрация, т.е. отбрасывание тех пиков, которые не удовлетворяют определенным критериям, что уменьшает избыточность данных.

Рис. 7. Сглаживание сигнала методом Рис. 8. Сглаживание сигнала методом Савицкого-Голея до перевыборки Савицкого-Голея после перевыборки

Кроме того, в данной главе впервые предложена методика применения методов биоинформатики к радиотехническим сигналам. Данные методы, заимствованные из математики, радиотехники и др. смежных областей, имеют некоторые отличительные особенности, которые позволяют использовать их не только в биологии, генетике, протеомике и т.д., но и в радиотехнике. Среди таких особенностей автором установлены следующие:

1. Возможность предварительной обработки не одного конкретного сигнала или его спектра, а нескольких одновременно. Другими словами, появляется возможность обработки массивов сигналов (спектров). При этом в ходе исследований доказано, что такие сигналы должны существовать в одной и той же временной (частотной и др.) области.

2. Данные методы подразумевают комбинацию нескольких эффективных методов. Так, при перевыборке массивов сигналов можно применить комбинацию

интерполяции и децимации (изменение частоты дискретизации сигнала в ^раз:

сначала увеличение в М раз, а затем уменьшение в N раз). Поиск пиков в спектре сопровождается одновременно автоматическим (по умолчанию) вейвлет-подавлением шума в сигнале.

Разработаны математические модели двух зашумленных сигналов. Спектры этих сигналов обработаны рассмотренными выше методами биоинформатики. Показано, что при сглаживании сигнала методом Савицкого-Голея главными параметрами, определяющими эффективность его применения, являются ширина окна сглаживания и степень сглаживающего полинома. Экспериментально установлено, что чем меньше окно (span), тем лучше частотное разрешение, но хуже подавляется шум. Для устранения этого недостатка можно увеличить степень полинома При этом степень должна быть меньше размера окна. Так, на разработанных сигналах для окна = 20, эффективная степень полинома = 5. Если проводить сглаживание после перевыборки спектра, то увеличивать степень полинома не целесообразно.

Также экспериментально доказано, что лучше всего шум подавляет вейвлет-сглаживание при поиске пиков, шум сводится практически к минимуму.

Таким образом, в ходе исследований было установлено, что масс-спектрометрические методы, подразумевающие комбинацию нескольких эффективных методов предварительной обработки сигналов, хорошо подходят не только для масс-спектров веществ, но и для радиотехнических сигналов. При этом особенность их использования заключается в том, что они обрабатывают не единичные сигналы, а их массивы.

В четвертой главе разработана и апробирована новая методика обработки реальных сигналов (рис. 9), предполагающая создание программного модуля, обеспечивающего совместную работу измерительных приборов (осциллографа) и СКМ MATLAB для обработки реальных сигналов расширенными методами данной системы.

При этом в СКМ MATLAB были решены следующие задачи, которые невозможно решить средствами цифрового осциллографа:

построение спектра сигнала в линейном масштабе;

построение спектрограммы сигнала в виде пачки импульсов методом кратковременного оконного преобразования Фурье;

построение спектрограммы частотно-модулированного сигнала; реализация ввода осциллограмм с двух каналов и осуществление различных математических операций над ними;

реализация техники вейвлет-анализа реальных сигналов и построение вейвлет-спектрограммы высокого разрешения.

В вариантах разработанного программного комплекса были использованы современные цифровые осциллографы TDS2124, генератор произвольных функций AFG2101.

В заключении сформулированы основные выводы работы. Диссертация заканчивается списком использованных источников и приложением.

Цифровой

измерительный

прибор

т

Реальный сигнал к,

Методы

анализа

- метод БПФ;

- метод оконного

ПФ (3-6 типов

окон).

1. Анализ реальных радиосигналов

2. Анализ реальных модулированных сигналов

Л V

3. В ейвлет-

анализ реальных сложных сигналов с «тонкими» локальными особенностями

Л V

Аппаратная и программная совместимость прибора с СКМ MATLAB

USB

ПАКЕТ INSTRUMENT CONTROL TOOLBOX

Разработанный программный модуль стыковки прибора с системой МАТЬАВ на языке МАТЬАВ

СКМ MATLAB

Пакеты расширения

1. ПАКЕТ ПО ОБРАБОТКЕ СИГНАЛОВ SIGNAL PROCESSING TOOLBOX

- классические методы, параметрические методы, метод MUSIC, метод собственных значений;

- десятки видов окон (Блэкмана-Харриса, плоское, Гаусса, Кайзера, Парзена, экспоненциальное и другие);

- метод короткого оконного преобразования Фурье для анализа модулированных сигналов и т.д.

2. ПАКЕТ ПО ВЕЙВЛЕТ-АНАЛИЗУ

WAVELET TOOLBOX

- методы анализа нестационарных сигналов;

- методы выявления «тонких» особенностей сигнала;

- методы построения скейлограмм;

- методы очистки сигналов от шума и т.д.

3. ПАКЕТ ПО БИОИНФОРМАТИКЕ

BIOINFORMATICS TOOLBOX

- методы обработки масс-спектров: методы перевыборки масс-спектров, методы подавления шумов в масс-спектрах, методы автоматического поиска пиков масс-спекта

Рис. 9. Методика обработки реальных сигналов средствами СКМ МАТЬАВ

Основные результаты работы и выводы:

1. Проведен анализ и классификация современных серийных осциллографо и анализаторов спектра как основных измерительных приборов по обработк реальных сигналов. Выявлены недостатки, заключающиеся в недостаточно! количестве методов для проведения спектрального анализа сигналов.

2. Проведен анализ современных методов обработки сигналов, которы" показал, что в настоящее время существуют методы, значительно повышающи информативность получаемых результатов

3. Проведено исследование системы компьютерной математики МАТЬАЕ-подтверждающее наличие в ней всех современных методов обработки и анализ.' сигналов. К данным методам относятся: метод кратковременного оконног преобразования Фурье, методы вейвлет-анализа сигналов (непрерывное вейвлет-преобразование, построение скейлограмм), методы биоинформатики (мето перевыборки спектров, методы подавления шумов в спектре, метод автоматическог поиска пиков спектра). Тем самым обоснована необходимость применения методов

СКМ МАТЬАВ при обработке реальных радиотехнических сигналов для повышения информативности получаемых результатов.

4. Разработаны математические модели сигналов для тестирования эффективности современных методов анализа сигналов.

5. Проведено комплексное исследование реальных радиотехнических сигналов в процессе реализации современных эффективных численных методов в виде комплексов программных модулей на языке МАТЬАВ.

6. Разработан и апробирован программный комплекс в виде программ на языке системы МАТЬАВ, обеспечивающий стыковку цифрового осциллографа и системы МАТЬАВ и позволяющий осуществлять компьютерную обработку реальных сигналов расширенными методами, имеющимися в СКМ МАТЬАВ.

7. Разработан алгоритм предварительной обработки масс-спектров новейшими методами биоинформатики. К таким методам отнесены метод перевыборки, методы подавления шумов, метод поиска пиков. Все эти методы эффективны в комплексе. Отличительной особенностью этих методов является то, что они обрабатывают не единичный сигнал, а массив сигналов. Кроме того, эти методы подразумевают комбинацию нескольких эффективных методов (например, метод вейвлет-подавления шума).

8. Разработана методика применения методов биоинформатики к радиотехническим сигналам.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

I. Публикации в центральных изданиях, включенных в перечень периодических изданий ВАК РФ

1. Дьяконов В.П., Хотова Ф.А. Матричная система МАТЬАВ в биоинформатике // Информационные технологии. - 2009. - № 6. - С. 70 - 74.

2. Хотова Ф.А. Автоматический поиск пиков в спектре с помощью средств пакета биоинформатики системы МАТЬАВ // Известия Смоленского государственного университета Ежеквартальный журнал. - 2010. - № 2 (10). - С. 156 - 165.

II. Монография

3. Дьяконов В.П. Компьютерная математика в измерениях. / В.П. Дьяконов, Ф.А. Хотова. - Смоленск: ВА ПВО ВС РФ, 2010. - 238 с.

III. Публикации в других изданиях

4. Хотова Ф.А. Птичий грипп и системы компьютерной математики // Системы компьютерной математики и их приложения: материалы международной конференции / Мин-во образования и науки РФ; Смоленский гос. ун-т. - Смоленск: Изд-во СмолГУ, 2007. - Вып. 8. - С. 84 - 86.

5. Хотова Ф.А. О возможностях пакета по генетическим алгоритмам системы МАТЬАВ в решении оптимизационной задачи // Системы компьютерной математики и их приложения: материалы международной конференции - Смоленск: Изд-во СмолГУ, 2008. - Вып. 9. - С. 95 - 98.

6. Хотова Ф.А. Оконное преобразование Фурье в системе МАТЬАВ II Системы компьютерной математики и их приложения: материалы международной конференции. - Смоленск: Изд-во СмолГУ, 2009. - Вып. 10. - С. 103 - 108.

7. Хотова Ф.А. Кратковременное (оконное) преобразование Фурье в системе МАТЬАВ // Системы компьютерной математики и их приложения: материалы

XI международной научной конференции, посвященной 70-летию профессор

B.П. Дьяконова. - Смоленск: Изд-во СмолГУ, 2010. - Вып. 11. - С. 90 - 94.

8. Хотова Ф.А. Спектральный анализ реальных осциллограмм в систе\ МАТХАВ // Труды Российской летней школы' «Математическое моделирован» фундаментальных объектов и явлений в системах компьютерной математик* (ММ СКМ2) и Российского семинара «Нелинейные поля и релятивистская статистш в теории гравитации и космологии», 6-10 сентября 2010 г., Казань-Яльчик. - Казан Изд-во «Фолианть», 2010. - С. 104 - 112.

9. Хотова Ф.А. Краткий обзор возможностей пакета по генетически алгоритмам и алгоритмам прямого поиска системы МАТЬАВ II Извеси Смоленского государственного университета. Ежеквартальный журнал. - 2009. - № (6).-С. 189-203.

10. Хотова Ф.А. Реализация спектрального анализа в различных системг компьютерной математики // Сборник трудов Третьей ежегодной межрегионально научно-практическая конференции «Инфокоммуникационные технологи в региональном развитии», 11-12 февраля 2010 г., Смоленск. - Смоленск, 2010.

C. 347 - 350.

11. Хотова Ф.А. Преимущества совместного использования осциллографе с СКМ МАТЬАВ // Труды Математического центра имени Н.И. Лобачевскоп Материалы Десятой молодежной научной школы-конференции «Лобачевские чтец и: 2011», Казань, Казанское математическое общество, 31 октября - 4 ноября 2011 г. Казань, 2011. -Т.44. - С. 309-313.

Соискатель Ф.А. Хотова

Заказ № 0003 Тираж 110 экз.

Отпечатано в ГАУ ДПОС «СОИРО», г. Смоленск, ул. Октябрьской революции, 20А. Тел.: (4812) 38-94-43

Текст работы Хотова, Фатима Ансарбиевна, диссертация по теме Математическое моделирование, численные методы и комплексы программ

61 12-5/2733

Смоленский государственный университет

На правах рукописи

УДК 004.9

№ -ч

ХОТОВА Фатима Ансарбиевна

КОМПЬЮТЕРНАЯ ОБРАБОТКА РЕАЛЬНЫХ СИГНАЛОВ СПЕКТРАЛЬНЫМИ МЕТОДАМИ И МЕТОДАМИ БИОИНФОРМАТИКИ

05.13.18 - Математическое моделирование, численные методы и комплексы

программ

Диссертация

на соискание учёной степени кандидата технических наук

Научный руководитель -доктор технических наук, профессор Дьяконов В.П.

Смоленск - 2012

ОГЛАВЛЕНИЕ

Введение.......................................................................................................................5

Глава 1. Спектральный анализ и методы его проведения............... ......................14

1.1. Виды сигналов, их спектральный анализ...................................................14

1.2. Обзор и классификация методов спектрального анализа.........................22

1.2.1. Непараметрические (классические) методы спектрального анализа. 24

1.2.2. Параметрические методы спектрального анализа................................28

1.3. Современное состояние технического обеспечения спектрального анализа........................................................................................................................32

1.4. Реализация спектрального анализа в СКМ................................................36

Выводы..................................................................................................................38

Глава 2. Исследование возможностей матричной системы МАТЬАВ в проведении спектрального анализа.........................................................................39

2.1. Моделирование сигналов в системе МАТЬАВ..........................................39

2.2. Обзор и выбор окон для оконного спектрального анализа......................45

2.3. Кратковременное (короткое) оконное преобразование Фурье................51

2.4. Вейвлет-анализ сигналов..............................................................................55

Выводы..................................................................................................................62

Глава 3. Исследование программных средств биоинформатики в проведении спектрального анализа..............................................................................................64

3.1. Обзор возможностей пакета биоинформатики системы МАТЬАВ.........64

3.1.1. Доступ к мировым информационным ресурсам...................................66

3.1.2. Представление о генах и генных цепочках...........................................67

3.1.3. Анализ генетических цепочек.................................................................69

3.2. Исследование средств обработки массивов спектрограмм......................79

3.3. Методы уменьшения влияния шумов при спектральном анализе...........92

3.4. Применение кластеризации для выявления наиболее важных линий

спектрограмм.............................................................................................................99

Выводы................................................................................................................

Глава 4. Аппаратные и программные средства спектрального анализа............111

4.1. Подключение аппаратных средств спектрального анализа к ПК..........111

4.1.1. Порты для подключения измерительных приборов к компьютеру.. 112

4.1.2. Подключение к компьютеру осциллографа........................................114

4.2. Программные средства моделирования данных для спектрального анализа......................................................................................................................117

4.3. Программные модули спектрального анализа массивов данных..........118

4.4. Спектральный анализ реальных осциллограмм......................................124

4.4.1. Построение спектра реальных осциллограмм различными методами ............................................................................................................................131

4.4.2. Оценка в MATLAB спектра реальных сигналов в виде пачек и модулированных сигналов..............................................................................136

4.5. MATLAB-программа ввода осциллограмм с двух каналов...................140

4.6. Вейвлет-анализ реальных сигналов..........................................................143

4.6.1. Вейвлет-очистка сигнала от шума и компрессия сигнала.................145

4.6.2. Построение скейлограмм.......................................................................147

Выводы................................................................................................................149

Заключение..............................................................................................................151

Библиографический список использованной литературы..................................153

Приложение 1. Сравнительный анализ современных измерительных приборов

.........................................................................164

Таблица П. 1.1 Сравнительный анализ современных осциллографов..........164

Таблица П. 1.2 Сравнительный анализ современных анализаторов спектра 169

Приложение 2. Список программных модулей, использованных в данной диссертационной работе.........................................................................................172

Приложение 3. Спектральный анализ средствами различных систем компьютерной математики.....................................................................................180

Приложение 4. Методы расчета расстояний между кластерами, представленные в пакете Statistics Toolbox системы MATLAB.....................................................191

Введение

Согласно одному из основоположников математического моделирования, академику А.А. Самарскому [50], «математическое моделирование является неизбежной составляющей научно-технического прогресса.

Сама постановка вопроса о математическом моделировании какого-либо объекта порождает четкий план действий. Его можно условно разбить на три этапа: модель — алгоритм — программа (см. схему 1.).

Схема 1. Этапы математического моделирования (из книги [50]) На первом этапе выбирается (или строится) «эквивалент» объекта, отражающий в математической форме важнейшие его свойства — законы, которым он подчиняется, связи, присущие составляющим его частям, и т. д. Математическая модель (или ее фрагменты) исследуется теоретическими методами, что позволяет получить важные предварительные знания об объекте.

Второй этап — выбор (или разработка) алгоритма для реализации модели на компьютере. Модель представляется в форме, удобной для применения численных методов, определяется последовательность вычислительных и логических операций, которые нужно произвести, чтобы найти искомые величины с заданной точностью. Вычислительные алгоритмы должны не искажать основные свойства модели и, следовательно, исходного объекта, быть экономичными и адаптирующимися к особенностям решаемых задач и

используемых компьютеров.

На третьем этапе создаются программы, «переводящие» модель и алгоритм на доступный компьютеру язык. К ним также предъявляются

требования экономичности и адаптивности. Их можно назвать «электронным» эквивалентом изучаемого объекта, уже пригодным для непосредственного испытания на «экспериментальной установке» — компьютере.

Создав триаду «модель—алгоритм—программа», исследователь получает в руки универсальный, гибкий инструмент, который вначале отлаживается, тестируется в «пробных» вычислительных экспериментах. После того как адекватность (достаточное соответствие) триады исходному объекту удостоверена, с моделью проводятся разнообразные и подробные «опыты», дающие все требуемые качественные и количественные свойства и характеристики объекта. Процесс моделирования сопровождается улучшением и уточнением, по мере необходимости, всех звеньев триады» [50].

Моделирование обычно выполняется с целью познания свойств оригинала путем исследования его модели. Оправдано моделирование в том случае, когда оно проще создания самого оригинала или когда последний по каким-то причинам

лучше вообще не создавать.

Исключительно велика роль моделирования в ядерной физике и энергетике. Достаточно сказать, что замена натуральных ядерных испытаний моделированием не только экономит огромные средства, но и благоприятно сказывается на экологии планеты. Трудно переоценить роль моделирования в космонавтике и авиации, в предсказании погоды, в разведке природных ресурсов и т.д. Однако не только такие показательные примеры демонстрируют роль математического (и компьютерного) моделирования. На самом деле моделирование даже самых простых и широко распространенных устройств, например, работы электрического утюга, ведет к огромной экономии средств и улучшению качества массовых изделий. Чем сложнее проектируемый объект, тем, как правило, важнее роль моделирования в его изучении и создании. Самое широкое применение моделирование находит в механике и физике, электротехнике, радиотехнике и электронике, в технике

обработки сигналов [20].

Стремительно развивающиеся сегодня системы компьютерной математики являются достаточно мощным инструментом математического моделирования

различных явлений и процессов. Так следует отметить, немалую роль таких систем в моделировании задач обработки сигналов. Обусловлено это наличием в данных системах обширного набора средств, позволяющих существенно расширить возможности современных измерительных приборов спектрального анализа и улучшить результаты цифровой обработки сигналов. К примеру, в MATLAB спектральный анализ выполняется не только методом быстрого преобразования Фурье, но и десятками других методов и с большим числом окон. Есть и принципиально новые возможности и средства, которых нет в современных измерительных приборов или они не достаточно развиты. К ним следует отнести короткое оконное преобразование Фурье, вейвлет-преобразование, построение спектров в линейном масштабе, а также, например, методы биоинформатики и масс-спектрального анализа в решении задач обработки

различных сигналов.

Среди систем компьютерной математики, обладающих наиболее полным набором средств для решения задач спектрального анализа, а также задач, связанных с их применением в технике обработки сигналов и фильтрации, можно отметить системы Mathcad и MATLAB.

Обзор литературы по данной проблеме показал, что существует большое количество работ по основам спектрального анализа, цифровой обработки сигналов, алгоритмов БПФ, оконного преобразования Фурье, короткого оконного преобразования Фурье (Kay S.M. [77], Marple, S. L. [44], Oppenheim, А. V., and Schafer R. W. [46], Rabiner L. R. and Gold В [47], Bartlett M., Блейхут [7], Allen R.L., Mills D.W. [82], Welch P.D. [83], Mallat S. [79], Кайзер [78], Рэйдер, Хэмминг [68], Гольденберг JIM., Матюшкин Б.Д. и Поляк М.Н. [12, 13] и мн. др.), вейвлет-преобразования (A. Mertins [71], J. Gomes [76], I. Daubeshies [75], Y. Meyer [80] и мн. др.). Среди современных работ по данным направлениям можно отметить работы Воробьева В.И. и Грибунина В.Г. [10], Новикова JI.B. [45], Астафьевой H.B. [1], Дремина И.М. и Иванова О.В. [18], Смоленцева Н.К. [55], Раушера К, Йанссена Ф. и Минихольда Р. [48],

Куприянова М.С. и Матюшкина Б.Д. [42], Солониной А.И., Арбузова С.М.[54, 55] и др.

Что же касается литературы по решению задач спектрального анализа средствами системы компьютерной математики MATLAB, то здесь большой вклад сделан научной школой профессора В.П. Дьяконова [19-39]. Кроме того, можно отметить работы Сергиенко А.Б. [52], Рудакова П.И, Сафонова В.И. [49], Гонсалеса Р., Вудса Р., ЭддинсаС. [14], Солониной А.И., Арбузова С.М. [54, 55]. Однако в целом надо подчеркнуть, что сегодня в научной литературе уделено мало внимания современным методам спектрального анализа в СКМ MATLAB, особенно это касается методов биоинформатики и масс-спектрометрического анализа, роль которых исключительно велика не только в биологии и химии, но в других областях, включая обработку сигналов. Этим обусловливается теоретическая значимость данной диссертационной работы.

Достоверный и информативный анализ сигналов является актуальной научной задачей. Ныне она решается применением довольно дорогих цифровых измерительных приборов, прежде всего генераторов сигналов, осциллографов и анализаторов спектра. Другим важным направлением изучения сигналов является их математическое моделирование и анализ с помощью систем компьютерной математики (СКМ). Долгое время эти направления развивались отдельно.

В данной диссертации рассматривается возможность обработки реальных сигналов, получаемых при исследовании различных устройств, с помощью численных методов СКМ MATLAB. Под реальными сигналами понимаются сигналы, полученные с измерительных приборов.

Исследования, проведенные в данной диссертации, показали, что к числу наиболее мощных СКМ, ориентированных на численные методы вычислений, относится матричная система MATLAB. В ней большое внимание уделяется обработке сигналов, что подтверждается наличием нескольких пакетов расширения по обработке сигналов (Signal Processing Toolbox - пакет по обработке сигналов, Wavelet Toolbox - пакет по вейвлет-анализу, а также пакет

имитационного блочного моделирования БшшНпк). Имеющиеся в системе и в данных пакетах методы и алгоритмы позволяют существенно улучшить процесс обработки сигналов и расширить возможности современных измерительных приборов. Так, в МАТЬАВ спектральный анализ сигналов выполняется не только стандартным методом быстрого преобразования Фурье, но и десятками других методов, с большим числом окон. Есть и принципиально новые возможности, которых пока нет в измерительных приборах. К ним следует отнести короткое оконное преобразование Фурье, вейвлет-анализ, построение спектров в линейном масштабе, а также новейшие методы биоинформатики и масс-спектрального анализа.

В связи с этим в данной диссертации решается актуальная задача развития методов спектрального анализа как в частотной, так и во временной областях представления, исследования и анализа реальных сигналов (в том числе и нестационарных) с применением СКМ МАТЬАВ.

Цель диссертационного исследования: разработка новой методики исследования реальных сигналов, полученных с цифровых измерительных приборов, эффективными средствами компьютерного моделирования на основе системы МАТЬАВ и реализованных в ней численных методов, позволяющих повысить информативность получаемых результатов исследования.

Достижению поставленной цели способствует решение в диссертации

следующих задач:

1. Анализ существующего технического обеспечения спектрального анализа с целью выявления возможностей в исследовании реальных сигналов.

2. Анализ существующих эффективных методов исследования сигналов, повышающих информативность получаемых результатов.

3. Исследование системы компьютерной математики МАТЬАВ на наличие современных методов обработки и анализа сигналов.

4. Математическое моделирование тестовых сигналов для оценки эффективности современных методов анализа сигналов, реализованных в МАТЬАВ.

5. Комплексное исследование реальных радиотехнических сигналов в процессе реализации современных эффективных численных методов в виде комплексов программных модулей на языке МАТЬАВ.

6. Разработка методики предварительной обработки масс-спектров

методами биоинформатики.

7. Разработка методики применения методов биоинформатики к

радиотехническим сигналам.

Объект и предмет исследования. Объектами исследования являются матричная система компьютерной математики МАТЬАВ, современные измерительные приборы обработки сигналов, процессы компьютерной обработки сигналов. Предметом исследования являются спектральные методы и методы биоинформатики в обработке реальных сигналов.

Методом исследования является математическое моделирование с применением теоретических основ радиоэлектроники, радиотехники, биологии и генетики. В работе использованы методы математического анализа, оптимизации, аппроксимации, численные методы, язык программирования

матричной СКМ МАТЬАВ.

Научная новизна. Интеграция измерительных приборов с системами компьютерной математики, позволяющая существенно расширить возможности измерительных приборов в обработке реальных сигналов, является новым направлением в радиотехнике и измерительной технике, в значительной мере определяющим пути дальнейшего развития современных цифровых измерительных приборов. В связи с этим научную новизну диссертационного

исследования составляют:

1. Разработанная методика анализа реальных сигналов, получаемых с цифрового осциллографа, расширенными методами, имеющимися в СКМ МАТЬАВ. К данным методам относятся: метод кратковременного оконного преобразования Фурье, методы вейвлет-анализа (непрерывное вейвлет-преобразование, методы построения скейлограмм)

2. Разработанный алгоритм предварительной обработки спектров эффективными методами биоинформатики (метод перевыборки спектров, методы подавления шумов в спектре, метод автоматического поиска пиков спектра).

3. Разработанная методика обработки радиотехнических сигналов методами биоинформатики.

4. Разработанный и апробированный программный модуль, обеспечивающий стыковку цифрового осциллографа и системы MATLAB и позволяющий импортировать реальные сигналы в рабочее пространство данной системы.

На защиту выносятся:

1. Методика исследования реальных сигналов методом кратковременного оконного Фурье-преобразования, методами вейвлет-анализа (непрерывное вейвлет-преобразование, методы построения скейлограмм).

2. Алгоритм предварительной обработки спектров эффективными методами биоинформатики (метод перевыборки спектров, методы подавления шумов в спектре, метод автоматического поиска пиков спектра).

3. Методика обработки радиотехнических сигналов методами биоинформатики.

4. Программный модуль, обеспечивающий стыковку цифровых о�