автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Распознавание сигналов на основе статистик высоких порядков в условиях параметрической неопределенности

доктора технических наук
Латышев, Вячеслав Васильевич
город
Москва
год
1999
специальность ВАК РФ
05.12.04
цена
450 рублей
Диссертация по радиотехнике и связи на тему «Распознавание сигналов на основе статистик высоких порядков в условиях параметрической неопределенности»

Текст работы Латышев, Вячеслав Васильевич, диссертация по теме Радиотехника, в том числе системы и устройства телевидения

"7

Московский государственный авиационный институт (технический университет)

На правах рукописи

Латышев Вячеслав Васильевич

РАСПОЗНАВАНИЕ СИГНАЛОВ НА ОСНОВЕ СТАТИСТИК ВЫСОКИХ ПОРЯДКОВ В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ

НЕОПРЕДЕЛЕННОСТИ

Специальность: 05.12.04 - радиолокация и радионавигация

Диссертация на соискание ученой степени доктора технических наук

Москва 1999

7.2. Биспектральный анализ в нелинейной радиолокации . 226

5

Введение

Актуальность работы.

Рост скоростей полетов и расширение функциональных возможностей современных летательных аппаратов привели к усложнению задач, решаемых средствами радиолокации. В области военной техники это распознавание классов и типов целей, наблюдаемых радиолокатором в различных режимах работы, быстрое принятие решения об использовании и наведении высокоточного оружия. В гражданском применении — обеспечение безопасных условий полетов в сложных метеоусловиях, своевременное обнаружение и парирование сдвигов ветра, обнаружение и автоматический облет препятствий. Подобные задачи в качестве составного элемента включают проблему распознавания образов. Надежное ее решение связано с совершенствованием методов более полного извлечения информации из принимаемых радиолокационных сигналов. Традиционная техника обработки предъявляемых сигналов опирается на модели стационарных в широком смысле случайных сигналов. Отсюда распространенность спектральных и корреляционных методов обработки, использующих статистики 2-го порядка. Однако расширение классов задач диктует переход к моделям, характеризующимся стационарностью в узком смысле. В этом случае уже нельзя ограничиваться обработкой с использованием статистик только 2-го порядка.

В качестве примера можно привести задачу распознавания летательных аппаратов, попавших в поле зрения радиолокатора. Распространенным подходом является распознавание на основе траектор-ных и сигнальных признаков. Траекторными являются направление и скорость полета, скорость маневрирования. По этим признакам можно выделить классы быстро и относительно медленно перемещающихся летательных аппаратов. Сигнальные - это ЭПР, характеристики рассеяния, изменения спектра при рассеянии. При этом легко различаются крупные, средние и малоразмерные объекты. Классы, отличающиеся наличием винта (вертолеты) или его отсутствием.

6

Распознавание с точностью до таких больших классов очень далеко от потребностей современной авиационной техники. Более подробная классификация может быть получена на основе анализа тонкой структуры отраженного сигнала, выявлении особенностей, привнесенных в него эффектами вторичной модуляцией за счет вибрирующих и вращающихся элементов конструкции самолета. Первые работы на эту тему появились в 60-е годы. В [1, 2] описан так называемый турбинный эффект в спектральном портрете самолета, обусловленный отражением от вращающихся лопаток турбин или компрессоров. Появились первые системы распознавания, основанные на этом эффекте - CAVORT, множество патентов, главным образом США. Решение задачи распознавания на основе статистик 2-го порядка (корреляция, СПМ) не позволяет выявить детальные отличия отражений от объектов, характеризующихся близкими спектральными характеристиками, что связано,в частности, с потерей информации о фазовой структуре в статистиках 2-го порядка. Сохранение этой структуры можно было бы обеспечить за счет перехода к статистикам более высоких порядков. Их достоинства еще и в том, что они не связаны с ограничениями в виде гауссовских моделей.

В качестве другого примера можно привести активно развивающуюся в настоящее время область нелинейной радиолокации [3], в которой используются нелинейные эффекты, возникающие при отражениях радиолокационных сигналов. Помимо расширения спектра при нелинейных преобразованиях для характеристики отражающей и преломляющей среды чрезвычайно важны и возникающие фазовые связи между отдельными гармоническими составляющими. Снова приходим к заключению о полезности использования статистик высоких порядков, позволяющих выявлять подобную информацию.

Однако для использования статистик высоких порядков до последнего времени еще не была готова технологическая база в виде малогабаритных, маломощных и одновременно обладающих огромной производительностью микропроцессоров. В настоящее время такие предпосылки созданы и ведутся интенсивные исследования в обла-

7

сти использования статистик высоких порядков. Анализ публикаций показывает, что многие из полученных алгоритмов неустойчивы, так как основаны на обращениях матриц, которые могут оказаться слабо обусловленными. Кроме того, их практическое использование затруднено из-за большой вычислительной сложности. Подавляющее число публикации посвящено проблемам идентификации моделей и нет конкретных рекомендаций об использованиях результатов в задачах распознавания образов. Таким образом, разработка устойчивых, эффективных алгоритмов надежного распознавания радиолокационных объектов на основе использования статистик высоких порядков, пригодных для практической реализации на базе современной и перспективной вычислительной техники является актуальной.

Отметим, что в более общем контексте проблема распознавания образов, охватывает чрезвычайно большой круг практических задач. По сути дела к распознаванию образов сводятся любые задачи классификации объектов, ситуаций, процессов и т.д. на основании наблюдения выборочных величин или реализаций случайных процессов. В диссертации распознавание образов рассматривается для тех задач, которые характеризуются наблюдаемыми физическими сигналами -носителями информации, причем во всевозможных ситуациях содержат не только шумы или помехи, но и полезные сигналы, связанные с некоторыми распознаваемыми объектами или процессами. В соответствии с [4] под распознаванием образов будет пониматься установление принадлежности некоторого объекта (процесса, сигнала) к одному из заранее выделенных объектов - образу. Процесс распознавания основан на сопоставлении признаков исследуемого объекта с признаками известных объектов, в результате чего делается вывод о наиболее правдоподобном их соответствии. В этом смысле результаты диссертации могут найти более широкое применение и за рамками р адиолокации.

Насколько разнообразны задачи распознавания образов, настолько широк и спектр различных подходов и математического инструментария, применяемых для их решения. Здесь в качестве математи-

8

ческого аппарата используется теория проверки статистических гипотез. Это хорошо проработанная математическая дисциплина, ей по-

еи.

священо много публикаций и подробный пере^ их потребует много места, упомянем в алфавитном порядке лишь часть наиболее часто цитируемых и ставших уже классическими [5],...,[16]. Обращение к теории проверки гипотез обусловлено тем, что она адекватна статистической сущности процессов распознавания и органично сочетается с ними. При полностью известных законах распределения вероятностей распознаваемых ситуаций и наблюдаемых сигналов могут отыскиваться байесовы правила распознавания, минимизирующие средний риск. Однако в большинстве практических задач эти законы известны не полностью, в лучшем случае с точностью до совокупности некоторых параметров. Типична ситуация, когда наблюдаемые сигналы представляются функциями заданных видов, зависящими от некоторого числа неизвестных параметров (амплитуда, задержка радиолокационного сигнала, искажения спектров, обусловленные собственными вибрациями отражающих объектов, доплеровские смещения частоты). Эти параметры принимают разные значения при изменении внешних условий и обычно наблюдателю неизвестны. Кроме того, они могут изменяться в процессе наблюдения. Неизвестными дополнительными параметрами могут быть и параметры шумов, с которыми смешиваются сигналы, а так же любые другие параметры законов распределения вероятностей для величин, на основании наблюдения которых производится распознавание.

При наличии подобной параметрически заданной априорной неопределенности наиболее распространенный подход к задаче распознавания сводится к устранению неопределенности путем многоальтернативной проверки гипотез о значениях неизвестных параметров принимаемых сигналов. При этом оптимальные системы распознавания оказываются адаптивными, производящими наряду с распознаванием образов оценку параметров обстановки [15],...,[21]. Более простой вариант заключается в создании систем, инвариантных к величинам неизвестных параметров и их изменениям [22, 23]. Таким

9

образом, общие стратегии принятия решения разработаны. Что по сравнению с ними предлагается в данной диссертации?. Прежде всего отметим, что многие рекомендации, предлагаемые классической теорией трудно реализуемы на практике в условиях ограничений времени и вычислительных ресурсов, что, например, типично для радиолокационных применений в бортовых условиях. Для уменьшения трудоемкости решающего правила есть классический рецепт — сокращение размерности наблюдаемых данных [24]. Однако математически он строго обоснован только для гауссовских задач с априорно известными параметрами.

Проблема более полного выделения информации о свойствах и различиях сигналов различных классов непосредственно связана с выбором моделей наблюдаемых сигналов. Общие модели случайных процессов как измеримых функций в вероятностном пространстве [25],...,[41] используют аксиоматику Колмогорова, чрезвычайно полезны в теоретическом отношении, описывают как стационарные, так и нестационарные процессы, но для практического использования требуют конкретизации. Распространенной содержательной конкретизацией является линейная модель случайных процессов [42],...,[46]. Речь идет о представлении линейного процесса в виде некоторой линейной формы (в общем случае бесконечномерной), построенной по случайному базису с использованием детерминированных коэффициентов. В качестве примера можно указать стохастические интегралы [15, 36, 47], в которых фигурируют случайные процессы с независимыми приращениями (некоторые авторы называют его порождающим [48]) и с различными ядрами интегрального преобразования. Такое ядро называют импульсной переходной функцией [30] функцией Грина [37] или просто импульсной характеристикой [48]. Нестационарность данных моделируется изменением во времени ядра интегрального преобразования. Упрощение стохастических моделей позволяет перейти к квазидетерминированным и еще более простым детерминированным моделям [15].

На практике наиболее распространенной для описания нестацио-

10

нарных случайных процессов дискретного времени в настоящее время в задачах распознавания и классификации можно считать композиционную модель. Композиционный источник образуется конечным набором из статистически независимых субисточников, коммутируемых переключателем. Каждый субисточник создает стационарный случайный процесс со своими статистическими характеристиками. Положение переключателя в каждый момент времени выбирается случайно в соответствии с некоторым вероятностным законом. Выбранное положение определяет текущее состояние композиционного источника. Чаще всего полагается, что каждый субисточник формирует стационарный в широком смысле гауссовский процесс, а переключатель управляется марковской цепью первого порядка [49]. В связи с этим при обработке наблюдаемого случайного процесса в качестве признаков классификации используют различные статистики не выше второго порядка (корреляционные, спектральные, кеп-стральные). Если реальный процесс действительно гауссовский, они дают его полное описание. Однако многие известные в различных областях науки и техники сигналы не являются таковыми, в том числе и в задачах, связанных с распознаванием образов. Например, различного рода случайно модулированные радиосигналы, сигналы, отраженные от объектов с вибрирующими и вращающимися элементами конструкции и т.п. [15], процессы, прошедшие нелинейные преобразования [36, 50]. Отсюда следует, что статистики более высоких порядков, чем второй, являются инструментом повышения надежности распознавания. В области статистик высоких порядков в последнее время в зарубежных изданиях наблюдается возрастающий поток научных публикаций. Это касается как алгоритмов оценки статистик, так их практического применения. К сожалению в отечественной литературе эта тема освещена слабо. Основные фундаментальные результаты в свое время были заложены российскими учеными [25, 26, 51, 52]. Отметим также монографию [53], где хорошо изложены принципы кумулянтного анализа негауссовских случайных процессов. Однако в последние 15-20 лет эта тематика крайне редко

11

встречается в научных публикациях нашей страны [54, 55, 56, 57]. В связи с этим назрела необходимость в разработке пригодных для практической реализации алгоритмов оценки параметров моделей на основе статистик высоких порядков. В соответствии с [58] эту задачу будем рассматривать как идентификацию моделей.

Цель работы — разработка устойчивых, эффективных алгоритмов надежного распознавания радиолокационных объектов на основе использования статистик высоких порядков, пригодных для практической реализации на базе современной и перспективной вычислительной техники. Причем эти алгоритмы должны работать в условиях априорной неопределенности относительно параметров сигналов и помех.

Для достижения этой цели необходимо решить следующие основные задачи:

- распространение классических результатов сокращения размерности данных и формирования признаков классов на случай неизвестных и меняющихся параметров наблюдаемых сигналов:

- разработка простых и легко реализуемых на практике алгоритмов оценки неизвестных параметров сигналов;

-разработка алгоритмов идентификации моделей сигналов на основе статистик высоких порядков;

- построение процедур распознавания и классификации данных с неизвестными и меняющимися в процессе наблюдения параметрами;

- проверка работоспособности полученных алгоритмов на примерах, близких к реальным задачам.

Методы исследования. При решении поставленных задач используются методы теории вероятности, в частности, теории проверки статистических гипотез, теории марковских процессов, метод статистических испытаний, методы динамического программирования, матричный анализ, в том числе сингулярное разложение и теория матричных пучков.

Основные защищаемые положения.

1) на основе минимизации средних потерь фишеровской инфор-

12

мации при сокращении размерности данных разработан метод разложения распознаваемых сигналов с меняющимися параметрами в ортогональные ряды, обеспечивающий максимальную среди линейных преобразований концентрацию фишеровской информации о неизвестном параметре в первых членах ряда, а также формирующий инвариантные к этому параметру статистики в последних членах ряда;

2) путем максимизации отношения среднего расстояния между центрами классов в выборочном пространстве к их смещениям из-за вариации априорно неизвестных параметров разработан метод формирования устойчивых признаков для распознавания сигналов в условиях априорной неопределенности;

3) с использованием процедуры редуцирования ранга матричного пучка получены два класса алгоритмов идентификации параметров стационарных в узком смысле сигналов на основе статистик высоких порядков, сохраняющих фазовую информацию в сигналах, а также обеспечивающих повышение численной устойчивости и упрощение практической реализации по сравнению с известными из публикаций алгоритмами;

4) используя сочетание разработанных методов сокращения размерности данных с адаптивным байесовским подходом, созданы процедуры распознавания сигналов на основе статистик высоких порядков с использованием инвариантных признаков классов и с селекцией гипотез на этапе оценки неизвестных параметров, уменьшающие требования к быстродействию реализующей аппаратуры:

5) на основе разработанных методов формирования признаков классов и принципов динамического программирования получены алгоритмы распознавания сигналов с меняющимися в процессе наблюдения параметрами, которые требуют меньшего быстродействия и объема памяти процессоров по сравнению со случаем известной реализации метода динамического программирования.

Научная новизна результатов состоит В следующем.

- получено обобщение известного ортогонального разложения слу-

13

чайных процессов, обеспечивающее минимизацию средних потерь расстояний между точками выборочного п�