автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование алгоритмов адаптивного управления в системе эхоподавления

кандидата технических наук
Окунев, Александр Георгиевич
город
Нижний Новгород
год
2003
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование алгоритмов адаптивного управления в системе эхоподавления»

Автореферат диссертации по теме "Исследование алгоритмов адаптивного управления в системе эхоподавления"

На правах рукописи (Й

Окунев Александр Георгиевич

ИССЛЕДОВАНИЕ АЛГОРИТМОВ АДАПТИВНОГО УПРАВЛЕНИЯ В СИСТЕМЕ ЭХОПОДАВЛЕНИЯ

Специальность -05.13.01 -Системный анализ, управление и обработка информации (технические науки)

Автореферат

диссертации на соискание ученой степени кандидата технических

наук

г. Нижний Новгород 2003

Работа выполнена на кафедре «Теория цепей и телекоммуникации» Нижегородского государственного технического университета. Научный руководитель: кандидат технических наук,

доцент ЗУЕВ А.Б.

Официальные оппоненты: доктор технических наук,

профессор ПЛУЖНИКОВ А. Д.

кандидат технических наук, ЛОЕНКО И.Ф. Ведущая организация: НИИИС им. Седакова

Защита состоится «_»_2003г. в_часов

на заседании диссертационного совета Д212.165.05 в Нижегородском государственном техническом университете по адресу:

603600, г. Нижний Новгород, ГСП-41, ул. Минина, 24, корпус ,ауд.

С диссертацией можно ознакомиться в библиотеке НГТУ.

Автореферат разослан «_»_ 2003г.

Ученый секретарь Диссертационного совета

к.г.н., доцент Льва**»? Иванов А.П.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Каналы передачи информации являются важнейшей частью многих

информационных систем. Это относится и к системам, где канал передачи

служит для объединения информационной системы в единое целое, и к

системам, где канал передачи служит для сбора информации о внешних

объектах. Качество функционирования информационных систем часто

определяется интерференцией - эхом в каналах передачи информации. Для

улучшения качества функционирования применяются специальные алгоритмы

обработки, служащие для устранения эхосигналов, эти алгоритмы являются

неотъемлемой частью информационных систем.

Алгоритмы эхоподавления можно разделить на два больших класса.

Первый класс алгоритмов использует передачу тестирующего сигнала: по его

искажению на приемной стороне можно определить свойства

интерференционного канала передачи, а именно временные задержки

отраженных сигналов и их уровни. С учетом этой информации можно

нравиться от эхосигналов, внесенных интерференционным каналом передачи

данных. Помимо алгоритмов этого класса существует класс алгоритмов так

называемого "слепого" восстановления, когда передача тестирующего сигнала

невозможна и доступным для наблюдения является только сигнал на приемной

стороне. Эхоподавление в данном случае осуществляется посредством самого

принимаемого сигнала с использованием некоторых априорных сведений об

исходном сигнале, носящих статистический характер. Подобная задача

успешно решается в цифровых системах связи, где восстанавливаемый сигнал

является последовательностью с априори известной длительностью и числом

уровней. Именно это априорное знание и породило большое число

эффективных систем восстановления исходного сигнала. В перечисленных

случаях восстановление исходного сигнала осуществляется с помощью

инверсного цифрового фильтра, коэффициенты которого определяются

ра¡личными алгоритмами управления. I РОС.,НАЦИОНАЛЬНАЯ

1 БИБЛИОТЕКА

!

В диссертационной работе рассматривается случай, когда интерференционный канал передачи информации вносит большие временные запачдывания отраженных сигналов. Частным случаем таких интерференционных каналов является акустический канал передачи, где временные задержки отраженных сигналов могут иметь порядок сотен миллисекунд - единиц секунд. В данном случае для создания эффективной системы "слепого" эхоподавления необходимо построить инверсный фильтр, содержащий большое число (тысячи - десятки тысяч) весовых коэффициентов Большое число весовых коэффициентов системы эхоподавления потребовало исследования закономерностей её функционирования и создания эффективных алгоритмов управления такой системой.

Актуальной задачей, для случая акустического канала передачи, является улучшение разборчивости речевого сигнала, искаженного эховыми помехами с большими временными задержками посредством системы эхоподавления. Цель работы

Целью работы является исследование и разработка эффективных алгоритмов управления эхоподавителем с большим числом степеней свободы в системе цифровой обработки речевых сигналов для устранения отзвуков или эхосиг налов, вносимых системами с большим запаздыванием. Задачи работы

1. Исследование особенностей функционирования системы адаптивного эхоподавления, применяемой для качественного восстановления речевых сигналов.

2. Использование наиболее простых, с точки зрения программной реализации, алгоритмов восстановления информации. Экспериментальная проверка на пригодность LMS (Least Mean Square) и NLMS (Normalized Least Mean Square) алгоритмов для решения задачи адаптивного "слепого" эхоподавления.

3. Сияния.широкополосной помехи на качество восстановления.

{ е-■■ -»"■-!«, ,аи,| $

4. Исследование влияния нестационарности во времени акустической обстановки (перемещение источника исходного сигнала, изменение геометрии помещения и т.п.) на работу эхоподавителя.

5. Расчет ресурсных затрат на реализацию алгоритмов. Методы исследования

При разработке теоретических результатов диссертации использовались: аппарат теории управления, аппарат линейной алгебры, методы статистической радиотехники, теория адаптивной фильтрации. Экспериментальные исследования базировались на программных реализациях рассматриваемых алгоритмов и экспериментальных данных об акустике замкнутых акустических пространств. Научная новизна

1. Предложен алгоритм адаптивного управления эхоподавителем, учитывающий особенности слуха, позволяющий ослабить отзвуки (эхосигналы) акустического канала передачи с большими временными задержками.

2. Установлены зависимости качества эхоподавления от порядка фильтра, входящего в систему эхоподавления.

3. Получено выражение, позволяющее оценить потенциальное эхоподавление при заданных корреляционных свойствах сигнала и широкополосной помехи.

4. Выполнен анализ влияния нестационарности во времени параметров эхоформирующго канала на работу эхоподавителя.

5. Проведен сравнительный анализ эффективности адаптивных БИХ-фильтров и КИХ-фильтров для решения задачи эхоподавления.

Практическая ценность

В работе получены выражения, определяющие взаимосвязь между временем реверберации акустического канала передачи информации и оптимальным, с точки зрения качества эхоподавления, порядком адаптивного фильтра. Предложен эффективный (с точки зрения программной реализации и качества эхоподавления) алгоритм, реализующий адаптацию весовых

коэффициентов фильтра. Разработана компьютерная программа для выполнения адаптивного эхоподавления в записях речевых сигналов. Полученные результаты могут найти применение при акустических экспертизах, обработке звукозаписей на телевидении и радио, а также при дальнейших исследованиях в области разделения речевых сигналов. Апробация работы

Основные результаты работы были представлены на:

1. научно-технической конференции факультета информационных систем и технологий ФИСТ-2000 (г. Н. Новгород, 2000);

2. региональном молодежном научно-техническом форуме «Будущее технической науки нижегородского региона» (г. Н. Новгород, 2002);

3. всероссийских научно-технических конференциях ИСТ-2002, ИСТ-2003 (г. Н. Новгород, 2002, 2003).

Публикации

Основное содержание диссертации отражено в восьми печатных работах. Программа, реализующая ослабление отзвука помещения, зарегистрирована в Российском агентстве по патентам и товарным знакам (свидетельство №2003610702 от 20 марта 2003г). Положения, выиосимые на защиту

1. Алгоритм адаптивного управления системой эхоподавления, учитывающий особенности слуха.

2. Экспериментально определенные соотношения для расчета оптимального (с точки зрения эхоподавления) порядка адаптивного КИХ-фильтра.

3. Соотношение, позволяющее оценить достижимое качество эхоподавления при воздействии широкополосной помехи.

4. Результаты сравнительного анализа функционирования эхоподавителей на основе адаптивных КИХ и БИХ фильтров.

5. Результаты экспериментального сравнения часто используемых на практике алгоритмов адаптивного управления весовыми коэффициентами фильтров ЬМБ и ЫЬМБ с предложенным в работе алгоритмом.

Структура и объем работы

Диссертация состоит из введения, четырех глав, заключения, двух приложений и списка литературы.

Во введении обоснована актуальность диссертационной работы, сформулированы её цель и решаемые в работе задачи, определена новизна полученных результатов, их практическая значимость, сформулированы основные положения, выносимые на защиту, кратко изложено содержание диссертации.

Первая глава диссертации посвящена обзору методов "слепого" выравнивания, наиболее часто используемых для восстановления исходных сигналов. Рассматриваются достоинства и недостатки алгоритма максимального правдоподобия, алгоритмов с использованием кумулянта чешертого порядка, стохастических градиентных алгоритмов, а также потенциальная возможность их применения к восстановлению речевых си! налов.

В качестве исходного сигнала рассматривается речевой сигнал с интервалом корреляции т, = 20...30 мс. Если в акустическом канале передачи точка приема удалена от источника сигнала на расстояние большее чем радиус гулкости, то сделанная звукозапись может обладать плохой разборчивостью (радиус гулкости - это такое расстояние от источника сигнала до точки приема, на котором энергии прямого и отраженных сигналов становятся равными). Модель доступного для наблюдения дискретного сигнала, на ныходе канала передачи, определяется выражением

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

где и(п) - исходный сигнал,

J , .

х(") - ~ отзвук помещения, эхо,

а(- амплитуда>го отраженного сигнала,

- время задержки .¡-го отраженного сигнала относительно первого

пришедшего сигнала. Акустический канал передачи рассматривается, как линейная система с большими временными задержками (порядка сотен миллисекунд - единиц секунд) отраженных сигналов, вносящая частотные искажения (иногда будем называть эту систему эхоформирующим фильтром). Д'(и) - аддитивный шум, создаваемый другими акустическими источниками, находящимися в том же помещении или вне его, собственный шум устройства звукозаписи, и т.п.

Во второй главе показано, что устройство адаптивного линейного предсказания, построенное на основе КИХ-фильтра (рис.1), способно ослабить отзвуки помещения, т.е. скомпенсировать второе слагаемое в выражении (1).

Рис. 1

Здесь Т-декоррелирующая задержка,

АФ-адаптивный КИХ-фильтр,

х{п) -доступный для наблюдения сигнал,

у(п) - оценка эхосигнала,

<?(/?) - оценка исходного сигнала.

Ослабить отзвуки помещения можно минимизируя среднеквадратичное отклонение (СКО) сигнала на выходе предсказателя

А/[е2(и)]-ятп, где М-знак усреднения по времени.

При этом на декоррелирующую задержку необходимо наложить условие

т „<Т<Т„

где Т{ - время прихода первого эхосигнала (пороговое значение восприятия эха человеческим ухом 7] да ЗОмс).

Рассмотрено влияние аддитивной помехи Ы(п) на степень эхоподавления. Получена формула, позволяющая определить степень эхоподавления в зависимости от автокорреляционных свойств доступного для наблюдения сигнала х(п) и помехи М(п). Исходя из условия некоррелированности сигнала и помехи, была получена формула

где I. - степень эхоподавления,

Х = [л(«-Г), х(п - / - Г), ... ,х(п - /- Г)] - вектор столбец сигнала с эхом без аддитивной помехи,

N = [/V (п - Т), N (п - / - Г), ... ,N(>1-1 -Т)]- вектор столбец аддитивного

Выполнен анализ нестационарности во времени параметров канала передачи и её влияние на функционирование адаптивной системы эхоподавления для крайнего случая нестационарности, когда '¡-Л весовой коэффициент импульсной характеристики акустического канала передачи рассматривался, как стационарный случайный процесс а, = а, + Да, (и), где ¿7 - среднее значение весового коэффициента,

АаДи) - случайный процесс, определяющий отклонение .¡-го весового

коэффициента эхоформирующего фильтра от своего среднего значения. Интервал корреляции случайного процесса Да,(я) предполагался равным не более Т дискретных отсчетов, где Т- величина декоррелирующей задержки, применяемой в эхоподавителе. Случайные процессы и(п) и а,(я) -с гатистически независимы, т.е.

(2)

ID

M[a, («M«)J = М[а (WJM[«(«)], (3)

a случайные процессы, характеризующие отклонение различных коэффициентов от собственных средних значений, - некоррелированными

М[Да4 (и)Да, (и)] = 0, к * I. (4)

Показано, что в этом случае система эхоподавления на основе КИХ-фильтра настраивается таким образом, как если бы доступный для наблюдения сигнал формировался помещением со среднестатистической импульсной характеристикой

x(/t)-u(n)+¿5Ji<(n-7'l), (5)

/-i

где a, = /V/[a,(«)]. Из чего следует, что система адаптивного эхоподаления на основе линейного предсказателя не способна отслеживать быстрые изменения акустической обстановки, что ограничивает области её применения.

В третьей главе рассматривается адаптивный фильтр - эхоподавитель на основе БИХ-структуры (рис.2).Обозначения на рисунке аналогичны приведенным для рис. 1. Показана возможность применения БИХ-структуры для решения задачи восстановления исходного сигнала. Получены формулы для градиентного алгоритма адаптации весовых коэффициентов БИХ-филыра.

Рис.2

Из формул следует, что структурная схема, реализующая эхоподавление с помощью БИХ-фильтра, должна включать в себя 1+1 фильтр для получения вектора весовых коэффициентов адаптивного фильтра, что делает данную структуру громоздкой для адаптации. Кроме того, БИХ-фильтр в процессе адаптации требует проверки условий устойчивости. Наиболее просто проверка условий устойчивости может быть реализована в фильтрах, имеющих

и

решётчатую структуру. В работе показано: при величине декоррелирующей задержки Т > 1 коэффициенты адаптивной решетки должны быть заменены цифровыми фильтрами, что делает алгоритм адаптации весовых коэффициентов решетки громоздкой задачей, а саму решётчатую структуру неудобной для применения к восстановлению исходного речевого сигнала.

Четвертая глава посвящена численному моделированию работы систем эхоподавления, а также получению количественных оценок параметрок системы эхоподавления на КИХ-фильтре.

В результате численного моделирования получены соотношения, связывающие оптимальный порядок адаптивного КИХ-фильтра, с точки фения максимального эхоподавления, с временем реверберации акустического канала передачи

/ = (3...4)£ (4)

где / - порядок адаптивного фильтра, Д/ - интервал дискретизации, хе - время реверберации акустического канала передачи.

Минимизацию СКО сигнала на выходе адаптивной системы эхоподавления можно осуществлять с помощью наиболее простого ЬМБ алгоритма. Однако в случае небольшой длительности фрагмента входного сигнала х(п) (порядка единиц секунд) применение этого алгоритма дает существенную ошибку. Эта ошибка воспринимается на слух, как если бы исходный сигнал «(и) был записан в еще более гулком помещении. Эта проблема была решена с помощью предлагаемого в работе алгоритма управления эхоподавителем на КИХ-фильтре, названным алгоритмом годартовского типа (АГТ) (алгоритм Годарта наиболее часто используем в цифровых системах связи для восстановления двоичных последовательностей). Предлагаемый в работе алгоритм был получен на основе априорных сведений о том, что в речевом сигнале имеются паузы, а плотность распределения вероятностей фрагмента речевого сигнала длительностью в единицы секунд аппроксимируется гамма-

распределением. Формула для адаптации i-ro коэффициента инверсного КИХ-фильтра с целью упрощения вычислений была аппроксимирована выражением

/ . гл I тЛ e(n,F)x(n-i-T,F) a,{n + \,F)=a,{n,F)+M v ' / v ' >, (5)

где W (n,F -\)=(\-b]e{n,F -\\ + bWXn~},F -\) - огибающая выходного сигнала, v,b- константы, b < 1.

Для наилучшего эхоподавления фрагмент входного сигнала х{п) подается на инверсный фильтр многократно. Определяемая всякий раз после обработки фрагмента сигнала х(и) огибающая WXn,F-l) используется для адаптации коэффициентов инверсного фильтра при обработке этого же фрагмента сигнала х(п) в следующий раз (F-й раз). Этим достигается независимость огибающей выходного сигнала от текущего значения вектора весовых коэффициентов инверсного фильтра, что упрощает алгоритм поиска весовых коэффициентов.

Проведено сравнение предложенного алгоритма с LMS и NLMS алгоритмами, как по количественному критерию - степени эхоподавления, так и по субъективным критериям. Применение LMS алгоритма дало эхоподавление на 4,84 дБ (рис.Зв), NLMS алгоритм дал ослабление эхосигнала на 7,23 дБ (рис. Зг), а применение АГТ алгоритма дало ослабление эхосигнала на 6,93 дБ (рис.Зд). Хотя степень эхоподавления после применения АГТ алгоритма меньше по сравнению с NLMS алгоритмом, субъективное прослушивание показало, что применение алгоритма годартовского типа дало наибольшую "сухость звучания". Реализация исходного речевого сигнала показана на рис. За, реализация сигнала с эхом показана на рис.Зб.

Рис. 3.

С помощью численного моделирования было осуществлено ослабление отзвуков реального стационарного во времени акустического канала передачи. Акустические свойства канала передачи характеризовались индексом четкости й = -0.65 дБ. В записи ощущался характерный «эффект комнаты» (Индекс четкости - это отношение энергии импульсной характеристики акустического пространства, приходящей за первые пятьдесят миллисекунд, к энергии всей импульсной характеристики). Индекс четкости И = 0 дБ говорит о том, что все эхосигналы приходят в течение первых пятидесяти миллисекунд, их называют ■ акже ранними отражениями. Ранние отражения способны увеличить разборчивость речи. После обработки сигнала с эхом х(п) была получена оценка исходного сигнала и(п), как если бы запись была сделана в акустическом канале с индексом четкости й = -0.22 дБ, что свидетельствует об ослаблении «эффекта комнаты». Исходная импульсная характеристика эхоформирующего фильтра и импульсная характеристика каскадно

соединенных эхоформирующего и эхоподавляющего фильтров показаны на рис.4.

С помощью численного моделирования для случая, когда аддитивная помеха является белым шумом, установлена квазилинейная зависимость степени эхоподавления от отношения энергий сигнал/шум (рис.5).

С помощью численного моделирования показана неэффективность применения БИХ-фильтров по сравнению с КИХ-фильтрами для решения задачи адаптивной инверсной фильтрации, если порядок адаптивного БИХ-фильтра имел величину / > 700 коэффициентов. Зависимости степени эхоподавления от времени реверберации для КИХ и БИХ-фильтров показаны на рис.6.

«(О 1

05 0 -0 5

-0 02 0 0 02 0 04 0 06 0 08 0 1 0 12 014 t,e

gz(t) 1 05

0

-0 5 -1

-0 02 0 0 02 0 04 0 06 0 08 0 1 0 12 014 t,c

е)

Рис.4

а) типовая реализация ИХ акустического пространства, б) результирующая ИХ каскадно соединенных эхоформирующего и эхоподавляющего фильтра

i> 1 " 1......—т———г

- г

20

Ц дБ

18 16 14 12 10 8 е

4

0 2 1 в в 10 12 1« СЛИ, дБ

Рис. 5

Ь.дБ -2 -1 -6 -8 -10 -12 Л А -16 -18 -20 -22

О 200 400 600 800 1000 1200

Рис.6

Выполнен расчет ресурсных затрат на реализацию алгоритма годартовского типа и его сравнение с затратами на реализацию ЬМЭ алгоритма. Количество операций с плавающей точкой, необходимое для реализации алгоритмов адаптации весовых коэффициентов и количество отсчетов речевого сигнала с

эхом, которое надо обработать до заданного эхоподавления на 3 дБ, приведены в таблице 1. Скорость речи при этом составляла 5,4 слога/секунду.

Оценка времени выполнения программы на ПЭВМ с определенными микропроцессорами до заданной степени эхоподавления на 3 дБ показала, что АГТ дает существенный выигрыш по времени, что отражено в таблице 2. Оценка времени выполнения осуществлялась с помощью программы SANDRA 2003 (System ANalyser Diagnostic and Reporting Assistant). На рис. 7 показан процесс эхоподавления, осуществляемый LMS алгоритмом и алгоритмом годартовского типа (АГТ).

Таблица I

Операции необходимые для реализации алгоритмов

LMS АГТ

Количество сложений/вычитаний 2/ 2/+3

Количество умножений/делений 3/ 4/+2

Количество FLOPS для обработки одного отсчета входного сигнала 5/ 6/+5

Количество FLOPS, необходимых для подавления эха на ЗдБ. Порядок адат ивного фильтра /=8000 2,3463 •10" 1,2423-10"'

Таблица 2

Оценки времени выполнения программ адаптивного эхоподавления на ЗдБ

Наименование процессора Производительность (MFLOPS/c) Время выполнения, с

LMS АГТ

Intel P1I 400 МГц 512L2 536 437,7 23,2

Intel РШ 1 ГГц 256L2 1340 175,1 9,3

AMD Athlon Хр-2200 1,8 ГГц 512L2 2752 85,3 4,5

Intel PIV [2SMT] 2,8 ГГц 512L2 5250 44,7 2,4

и дБ 0

-1

-2

-3 -4 5 -6 -7 -8 -9

О 1 2 3 4 5 6 7 6

л, отсчеты х 10

Рис.7

В шключепии отмечены основные результаты, представленные в работе. В приложение 1 включены акты о внедрении результатов диссертационной работы.

В приложении 2 приводятся распечатки компьютерных программ, использованных для моделирования и получения результатов численного моделирования работы систем эхоподавления.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Предложен алгоритм управления системой, учитывающий особенности слуха. Подтверждена его эффективность по сравнению с ЬМЭ и ЫЬМБ алгоритмами, в том числе при субъективном прослушивании восстановленных сигналов.

2. Получены зависимости степени эхоподавления от порядка трансверсального фильтра и коэффициента сходимости алгоритма. Обнаружены оптимальные соотношения, связывающие порядок адаптивного фильтра и время реверберации акустического канала передачи информации.

*

АГГ

3. Выполнен анализ влияния нестационарности во времени параметров акустического канала передачи на работу эхопо давите ля.

4. Получено соотношение, определяющее достижимое качество эхоподавления при заданных корреляционных свойствах доступного для наблюдения сигнала и помехи.

5. Подтверждена возможность восстановления исходных речевых сигналов в случае реальной стационарной акустической обстановки. Получены количественные соотношения качества восстановления.

6. Показано, чго выигрыш от применения управляемой БИХ-структуры в качестве эхоподавителя становится несущественным с ростом порядка адаптивного фильтра.

7. Проведен расчет затрачиваемых ресурсов на реализацию алгоритмов.

ПУБЛИКАЦИИ ^

1. Бабушкин М.А., Зуев А.Б., Окунев А.Г. Компенсация нелинейных искажений при подавлении акустической обратной связи. // Научно-технич. конференция факультета информационных систем и технологий ФИСТ-2000: тез. докл.-Н.Новгород, 2000г.-С. 5-6.

2. Зуев А.Б., Окунев А.Г. Исследование влияния нестационарности импульсной характеристики акустического пространства на эхоподавление // Информационные системы и технологии ИСТ-2002:Тез.докл. всероссийской научно-технич. конф. -Н. Новгород, 2002г.-С. 12 .

3. Зуев А.Б., Окунев А.Г. САПР "визуального" проектирования алгоритмов и

систем ЦОС Hypersignal Block Diagram в учебной и научной работе // Chip '

News.- 2003.-№3.-С. 14-17.

4. Зуев А.Б., Окунев А.Г. Нелинейный стохастический градиентный алгоритм для адаптивного "слепого" эхоподавления в речевых сигналах // Информационные системы и технологии ИСТ-2003:Тез.докл. всероссийской научно-технич. конф. -Н. Новгород, 2003г.-С.Ю.

5 Окунев А.Г., Зуев А.Б. Эхо-подавитель на адаптивном фильтре: Межвуз. сб. науч трудов вып. 7 Радиоэлектронные и телекоммуникационные системы и устройства,-Н. Новгород, 2001г.-С.100-104.

К -269 1

0. Окунев Л. Г. Исследование влияния степени эхоподавления от времени л ^ ~ .

9004-4

реверберации акустического пространства И Будущее технической нау! '

I (ижегородского региона: Тез. Докл. Регионального иаучно-технич. фо 32749 14 мая 2002г. -И. Новгород. -С.30. 7. Окунев А.Г., Зуев А.Б. Исследование влияния аддитивного шума на степень "слепого" эхоподавления в системе с адаптивным фильтром: Сб. науч. трудов НГТУ вып.8 Радиоэлектронные и телекоммуникационные системы и устройства. -Н. Новгород, 2002г.-С30. ь Окунев А. Г. Применение полюсных фильтров для "слепого" эхоподав-

-- —~ии и технологии ИСТ-

(

Подписано в печать 26.06.03. Формат 60x84 '/16. Бумага офсетная. Печать офсетная. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ 503.

Нижегородский государственный технический университет. Типография НГТУ. 603600, Нижний Новгород, ул. Минина, 24.

Оглавление автор диссертации — кандидата технических наук Окунев, Александр Георгиевич

4 Стр.

ВВЕДЕНИЕ.

ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ И ОБЗОР СУЩЕСТВУЮЩИХ АЛГОРИТМОВ "СЛЕПОГО" ВОССТАНОВЛЕНИЯ СИГНАЛОВ

1.1 Постановка задачи.

1.2 Обзор наиболее часто используемых алгоритмов слепого выравнивания.

1.2.1 Слепое выравнивание, основанное на критерии максимального правдоподобия.

1.2.2 Метод с использованием статистик высокого порядка.

1.2.3 Стохастические градиентные алгоритмы.

ГЛАВА 2 СИСТЕМА ЭХОПОДАВЛЕНИЯ НА БАЗЕ УПРАВЛЯЕМОГО КИХ-ФИЛЬТРА

2.1 Компенсация эхосигналов с помощью инверсного адаптивного КИХ-фильтра.

2.2 Алгоритмы адаптации, условие сходимости алгоритма поиска весовых коэффициентов инверсного КИХ-фильтра.

2.3 Влияние аддитивной широкополосной помехи на степень слепого эхоподавления в системе с адаптивным инверсным КИХ-фильтром.

2.4 Влияние нестационарности акустической обстановки на эхоподавление.

ГЛАВА ЗСИСТТЕМА ЭХОПОДАВЛЕНИЯ НА БАЗЕ УПРАВЛЯЕМОГО БИХ-ФИЛЬТРА

3.1 Компенсация эхосигналов с помощью инверсного адаптивного БИХ-фильтра.

3.2 Сходимость алгоритма поиска коэффициентов инверсного БИХ-фильтра.

ГЛАВА 4 ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ РАБОТЫ СИСТЕМ АДАПТИВНОГО "СЛЕПОГО" ЭХОПОДАВЛЕНИЯ

4.1 Эхокомпенсация на гауссовом шуме.

4.2 Эхокомпенсация на речевом сигнале.

4.3 Использование нормализованных методов наименьших квадратов для восстановления сигналов малой длительности.

4.4 Восстановление речевого сигнала при моделировании реального стационарного акустического окружения.

4.5 Влияние аддитивного шума на степень эхоподавления.

4.6 Выигрыш, создаваемый применением БИХ-фильтра при восстановлении исходного сигнала.

4.7 Расчет ресурсов, необходимых для ослабления эхосигналов с помощью инверсного КИХ-фильтра.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Окунев, Александр Георгиевич

Во многих задачах обработки информации возникает необходимость ослабления эхосигналов, неизбежно возникающих в интерференционном канале передачи информации. Примером такой обработки может служить восстановление исходных двоичных последовательностей на приемной стороне в мобильных системах радиосвязи, где исходные двоичные последовательности искажены вследствие многолучевого распространения электромагнитных волн. Эта задача может быть решена, например, с помощью передачи тестирующего сигнала: по его искажению на приемной стороне можно определить свойства интерференционного канала передачи, а именно временные задержки отраженных сигналов и их уровни. С учетом этой информации можно избавиться от эхосигналов, внесенных интерференционным каналом передачи данных.

Помимо этого способа существует ряд способов так называемого "слепого" восстановления, когда передача тестирующего сигнала невозможна и доступным для наблюдения является только сигнал на приемной стороне. Эхоподавление в таких системах осуществляется посредством самого принимаемого сигнала с использованием некоторых априорных сведений об исходном сигнале, носящих статистический характер. Подобная задача успешно решается в цифровых системах связи, где восстанавливаемый сигнал является последовательностью с априори известной длительностью и числом уровней. Именно это априорное знание и породило большое число эффективных алгоритмов восстановления исходного сигнала.

Подобная же задача эхоподавления существует и в акустике, заключающаяся в улучшении разборчивости речи в записи, сделанной в гулком помещении. В качестве примеров можно привести репортажи, передаваемые с помощью электронных средств массовой информации, где запись речевого сигнала, сопровождаемого отзвуками помещения, становилась совершенно неразборчивой на слух, оперативная звукозапись, проводимая правоохранительными органами. Решение этой задачи с помощью цифровой обработки позволило бы облегчить работу криминалистов, судебных экспертов, звукорежиссеров и прочих специалистов, связанных со звукозаписью. Сложность задачи заключается в том, что для речевого сигнала неприменимы те же методы, что и для цифровых сигналов. Следует отметить, что задача "слепого" выравнивания является частным одномерным случаем задачи разделения "вслепую" сигналов, создаваемых различными источниками. В рассмотренной литературе [19,22,24,26,27,51,53,54] "слепое" разделение акустических сигналов проводилось либо в помещении с небольшим временем реверберации (порядка десятков миллисекунд), либо вообще с использованием в качестве моделей каналов передачи цифровых фильтров с длительностью импульсной характеристики не более ста дискретных отсчетов. В этих работах не рассматривалось разделение акустических сигналов, записанных в гулких помещениях. В связи с этим исследование алгоритмов эхоподавления именно в гулких помещениях с большим (порядка единиц-десятков секунд) временем реверберации является актуальной на сегодняшний день задачей.

Цель работы

Целью работы является исследование и разработка эффективных алгоритмов управления эхоподавителем в системе цифровой обработки речевых сигналов для устранения отзвуков или эхосигналов, вносимых гулкими акустическими пространствами.

Основные задачи работы:

1. Исследование особенностей систем адаптивного эхоподавления, применяемых для качественного восстановления речевых сигналов.

2. Использование наиболее простых, с точки зрения программной реализации, алгоритмов восстановления информации. Экспериментальная проверка на пригодность LMS (Least Mean Square) и NLMS (Normalized Least Mean Square) алгоритмов для решения задачи адаптивного "слепого" эхоподавления.

3. Оценка влияния широкополосной помехи на качество восстановления.

4. Исследование влияния нестационарности во времени акустической обстановки (перемещение источника исходного сигнала, изменение геометрии помещения и т.п.) на эхоподавление.

5. Расчет ресурсных затрат на реализацию алгоритмов.

Общая методика исследования

При разработке теоретических результатов диссертации использовались: аппарат линейной алгебры, методы статистической радиотехники, теория адаптивной фильтрации. Экспериментальные исследования базировались на программных реализациях рассматриваемых алгоритмов и экспериментальных данных об акустике замкнутых акустических пространств.

Научная новизна

1. Предложен нормализованный к энергии выходного сигнала алгоритм адаптивного управления коэффициентами инверсного фильтра, позволяющий ослабить отзвуки (эхосигналы) окружающего акустического пространства.

2. Установлены зависимости качества эхоподавления от порядка фильтра и времени реверберации.

3. Получено выражение, позволяющее оценить потенциальное эхоподавление при заданных корреляционных свойствах сигнала и широкополосной помехи.

4. Выполнен анализ влияния нестационарности акустической обстановки на работу системы эхоподавления для предельного случая нестационарности акустической обстановки (т.е. любой из отсчетов импульсной характеристики акустического пространства рассматривался как стационарный эргодический 8-коррелированный случайный процесс).

5. Проведен сравнительный анализ эффективности адаптивных БИХ-фильтров и КИХ-фильтров для решения задачи эхоподавления.

Практическая ценность

В работе получены выражения, позволяющие определить оптимальное число коэффициентов адаптивного трансверсального фильтра для наиболее эффективного эхоподавления. Предложен эффективный (с точки зрения программной реализации и качества эхоподавления) алгоритм, реализующий адаптацию весовых коэффициентов фильтра. Получено выражение для оценки потенциальной степени эхоподавления в случае воздействия широкополосной помехи. Разработана компьютерная программа для выполнения адаптивного эхоподавления в записях речевых сигналов. Полученные результаты могут найти применение при акустических экспертизах, обработке звукозаписей на телевидении и радио, а также при дальнейших исследованиях в области разделения сигналов, записанных в гулких помещениях.

Апробация работы

Основные результаты работы были представлены на:

1. научно-технической конференции факультета информационных систем и технологий ФИСТ-2000 (г. Н. Новгород, 2000);

2. региональном молодежном научно-техническом форуме «Будущее технической науки нижегородского региона» (г. Н. Новгород, 2002);

3. всероссийской научно-технической конференции ИСТ-2002, ИСТ-2003 (г. Н. Новгород, 2002, 2003).

Публикации

Основное содержание диссертации отражено в восьми печатных работах.

Положения, выносимые на защиту

1. Алгоритм адаптивного управления весовыми коэффициентами линейного предсказателя, служащего для эхоподавления в гулких помещениях с временем реверберации порядка единиц секунд.

2. Экспериментально определенные соотношения для расчета оптимального (с точки зрения эхоподавления) порядка адаптивного КИХ-фильтра.

3. Соотношение, позволяющее оценить достижимое качество эхоподавления при воздействии широкополосной помехи.

4. Результаты теоретического анализа нестационарности акустической обстановки.

5. Неэффективность применения БИХ-фильтров для решения задачи адаптивного эхоподавления в гулких помещениях по сравнению с КИХ-фильтрами.

6. Результаты экспериментального сравнения, известных на сегодняшний день, алгоритмов адаптивного управления весовыми коэффициентами фильтров LMS и NLMS с предложенным в работе алгоритмом.

Структура и объем работы

Диссертация состоит из введения, четырех глав, заключения, двух

Заключение диссертация на тему "Исследование алгоритмов адаптивного управления в системе эхоподавления"

Выводы

1. С помощью численного моделирования подтверждена возможность подавления эхосигналов с помощью алгоритма адаптивного линейного предсказания.

2. Получены зависимости степени эхоподавления от порядка трансверсального фильтра и коэффициента сходимости алгоритма. Обнаружены оптимальные соотношения, связывающие порядок адаптивного фильтра и время реверберации акустического пространства.

3. С помощью численного моделирования показана "проблема малой статистики".

4. Предложен алгоритм управления системой эхоподавления с нормализацией к энергии выходного сигнала применительно к речевым сигналам. Подтверждена его эффективность по сравнению с LMS и NLMS алгоритмами, в том числе при субъективном прослушивании восстановленных сигналов.

5. С помощью численного моделирования подтверждена возможность восстановления исходных речевых сигналов в случае реальной стационарной акустической обстановки. Получены количественные соотношения качества восстановления.

6. Подтвержена с помощью численного моделирования справедливость соотношения (2.24), определяющего достижимое качество эхоподавления для заданных корреляционных свойств доступного для наблюдения сигнала и помехи.

7. Выполнен анализ влияния нестационарности во времени акустической обстановки на работу эхоподавителя.

8. Показано с помощью численного моделирования, что выигрыш от применения управляемой БИХ-структуры в качестве эхоподавителя становится несущественным с ростом порядка адаптивного фильтра.

9. Выполнена оценка затрачиваемых ресурсов для реализации заданной степени эхоподавления -ЗдБ.

Заключение

В данной работе проведено исследование методов ослабления отзвуков акустических пространств с помощью алгоритмов адаптивных линейных предсказателей, построенных на основе КИХ и БИХ структур.

Основными результатами работы являются:

1. Показана возможность использования алгоритмов адаптивных линейных предсказателей, построенных на основе КИХ и БИХ фильтров, для ослабления отзвуков помещений.

2. Получены соотношения, определяющие оптимальный порядок эхоподавителя, построенного на основе КИХ-фильтра для наилучшего восстановления исходного сигнала.

3. Предложен новый нормализованный алгоритм адаптации коэффициентов фильтра годартовского типа, позволяющий улучшить степень "слепого " эхоподавления при входных речевых сигналах малой длительности, по сравнению с наиболее часто используемыми на практике LMS и NLMS алгоритмами при восстановлении речевого сигнала.

4. Получено выражение для оценки максимально возможного качества эхоподавления при воздействии широкополосной аддитивной помехи.

5. Выполнен анализ влияния нестационарности акустической обстановки на степень эхоподавления.

Библиография Окунев, Александр Георгиевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Анерт В., Райхардт В. основы техники звукоусиления: Пер. с нем.-М: Радио и Связь, 1984.-319с.

2. Бабушкин М.А., Зуев А.Б., Окунев А.Г. Компенсация нелинейных искажений при подавлении акустической обратной связи. // Научно-технич. конференция факультета информационных систем и технологий ФИСТ-2000: тез. докл.-Н.Новгород, 2000г.-С. 5-6.

3. Василенко Г.И. теория восстановления сигналов.-М.: Сов. Радио, 1979.-269с.

4. Зуев А.Б., Окунев А.Г. Исследование влияния нестационарности импульсной характеристики акустического пространства на эхоподавление // Информационные системы и технологии ИСТ-2002:Тез.докл. всероссийской научно-технич. конф. -Н. Новгород, 2002г.-С.12 .

5. Зуев А.Б., Окунев А.Г. САПР "визуального" проектирования алгоритмов и систем ЦОС Hypersignal Block Diagram в учебной и научной работе // Chip News.- 2003 .-№3.-С. 14-17.

6. Зуев А.Б., Окунев А.Г. Нелинейный стохастический градиентный алгоритм для адаптивного "слепого" эхоподавления в речевых сигналах // Информационные системы и технологии ИСТ-2003:Тез.докл. всероссийской научно-технич. конф. -Н. Новгород, 2003г.-С.10.

7. Окунев А.Г., Зуев А.Б. Эхо-подавитель на адаптивном фильтре: Межвуз. сб. науч. трудов вып. 7 Радиоэлектронные и телекоммуникационные системы и устройства, -Н. Новгород, 2001г.-С.100-104.

8. Окунев А.Г. Исследование влияния степени эхоподавления от времени реверберации акустического пространства // Будущее технической науки Нижегородского региона: Тез. Докл. Регионального научно-технич. форума 14 мая 2002г. -Н. Новгород. -С.30.

9. Окунев А.Г., Зуев А.Б. Исследование влияния аддитивного шума на степень "слепого" эхоподавления в системе с адаптивным фильтром: Сб. науч. трудов НГТУ вып.8 Радиоэлектронные и телекоммуникационные системы и устройства. -Н. Новгород, 2002г.-С30.

10. Ю.Окунев А. Г. Применение полюсных фильтров для "слепого" эхоподавления в речевых сигналах // Информационные системы и технологии ИСТ-2003:Тез.докл. всероссийской научно-технич. конф. -Н. Новгород, 2003г.-С.10-11.

11. Прокис Д. Цифровая связь: Пер. с англ.-М.: Радио и Связь, 2000.-797с.

12. Радиовещание и электроакустика: Учебник для вузов/ А.В. Выходец, М.В. Гитлиц, Ю.А. Ковалгин и др.; Под ред. М.В. Гитлица.-М.: Радио и связь, 1989.-432с.

13. З.Тихонов А.Н., Арсенин В. Я., Методы решения некорректных задач.-М.: Наука, 1974.

14. М.Уидроу Б. Стринз С. Адаптивная обработка сигналов: Пер. с англ.-М.: Радио и Связь, 1989.-439с.

15. Шелухин О.И. Лукьянцев Н.Ф. Цифровая обработка и передача речи.-М.-Радио и Связь, 2000.-797.

16. Abed-Meraim К., Moulines Е., Loubaton P. Prediction error method for second order blind identification: Algorithms and statistical performance // IEEE Tr. on Sig. Proc.-l 997.-Mar.-P. 409-511.

17. Abend K., Fritchman B. Statistical detection for communication channels with intersymbol interference // Proc. IEEE.-1970.-vol.58.-P779-785.

18. Baccarelli E., Galli S. A new approach based on "soft statistics" to the nonlinear blind deconvolution of unknown data channel // IEEE Trans. On Sig. Proc.-2001.-vol. 49.-P. 1481-1491.

19. Bell A., Sejnowski T. An information-maximization approach to blind separation and blind deconvolution//Neural computation.-1995.-vol.6.-P. 11291159.

20. Belfiore D., Park J. Jr. Decision feedback equalization // Proc IEEE.-1979.-vol. 67.-P. 1143-1156.

21. Bellini J. Bussgang techniques for blind equalization // GLOBECOM '86: proc.-Houston, 1986.-P. 46.11 -46.1.7.

22. Belouchrani A., Abed -Meraim K., Cardoso J. A blind source separation technique using second-order statistics // IEEE trans, on sig. Proc.-1997.vol. 45.-P. 434-444

23. Benveniste A., Goursat M. Blind equalizers // IEEE trans, on comm.-1983.-vol. 32.-P. 871-883.

24. Cao X., Liu R., General approach to blind source separation // IEEE trans, on Sig. Proc.-1996.-vol. 44.

25. Carayannis G., Manolakis D., Kalouptsidis N. A fast sequential algorithm for-least-squares filtering and prediction // IEEE trans, acoust., speech sig.proc.-1983.-vol. ASSP-31. P. 1394-1402.

26. Cardoso J., Laheld B. Equivariant adaptive source separation // IEEE trans, on sig. proc.-1996.vol. 44.-P.3017-3030.

27. Choi S. Cichoki A. Adaptive blind separation of speech signals: cocktail party problem //Inter, conf. on speech processing.: Proc.-Seoul, 1997.

28. Douglas S., Cichocki C., Amari S. Multichannel blind separation and deconvolution of sources with arbitrary distribution // Proc. IEEE worcshop newral networks for sig. proc.-1997.-P. 436-444.

29. Eweda E. Macchi O. Second order convergence analysis of stohastic adaptive linear filtering // IEEE trans, on automatic control.-1983. vol. 28.-P.76-85.

30. Ferrara E. Fast implementation of LMS adaptive filters // IEEE Trans, on acoustic speech and signal, proc.-1980.-vol. 28.-P. 474-478.

31. Gardner W. A new method of channel identification // IEEE trans, on comm.1991.-vol. 39.-P. 813-817.

32. George D., Bowen R., Storey J. An adaptive decision-feedback equalizer // IEEE trans, commun. tech.-1971.vol. com-19.-P. 281-293.

33. Giannakis G. Mendel J. Identification of nonminimum phase systems using higher-order statistics // IEEE Trans, on acoustic, speech and sig. proc.-1989.-vol. 37-P. 360-377.

34. Ghosh M. Weber C. Maximum likelihood blind equalization // SPIE conf.: Proc.-San Diego, 1991.

35. Godard D.N. Self-recovering equalization and carier-tracking in two-dimensional data communication systems // IEEE Trans, on comm.-1980.-vol. 28.-P.1867-1875.

36. Hassibi В., Sayed A., Kalath T. The //"optimility of the LMS algorithm // IEEE trans, on signal, proc.-1996.-vol. 44.-P. 267-280.

37. Hatzinakos D., Nikias C. Blind equalization using a tricepstrum -based algorithm // IEEE trans, on comm.-1991.vol. 39.-P. 669-682.

38. Haykin S. Adaptive filter theory .-third edition.-New Jersey.:Prentise hall, 1996.

39. Labat J., Macchi O., Laot C. Adaptive decision feedback equalization: Can you skip the training period // IEEE trans, comm.-1998.-vol. 46.-P.921-930.

40. Lee G., Gelfald S., Fitz M. Bayesian techniques for blind deconvolution // IEEE trans, comm.-1996.-vol. 44.-P.826-835.

41. Ling F. Proakis J. Adaptive lattice decision-feedback equalizers their performance and application to time variant multipath chanels //IEEE trans, commun.-1985.-vol. com-33.-P.348-356.

42. Long G., Ling F., Proakis J. The LMS algorithm with delayed coefficient adaptation // IEEE trans, acoust., speech sig.proc.-1989. Vol. ASSP-37.

43. Makhoul J. Linear prediction: atutorial review//Proc. IEEE.-1975.-№5.-vol. 63.-P.561-580.

44. Mboup M., Bonnet M., Bershad N. LMS coupled adaptive prediction and system identification: a statistical model and transient analysis // IEEE trans, sig. proc.-1994.-vol. 42.-P. 2607-2615.

45. Nikias C., Mendel J. Signal processing with higher-order spectra // IEEE sig. proc. magazine.-1993.-July.-P. 10-37.

46. Pham D.T., Garrat P. Blind separation of mixture of independent sources through a quasi-maximum likelihood approach // IEEE trans, on sig. proc.-1997.-vol 45.-P. 1712-1725.

47. Shalvi O. Weinstein E. New criteria for blind deconvolution of nonminimum phase systems // IEEE trans, of information theory.-1990.-vol. 36. P. 312-321.

48. Torkkola K. Blind separation of delayed sources based on information naximization // Inter, conf. on acoust., speech and sig. proc.: Proc. IEEE.-Atlanta,1996.

49. Weinstein E., Feder M., Oppenheim A. Multi-channel signal separation by decorrelation // IEEE trans, on speech and audio proc.-1993.-vol. 1 .-№4.-P. 405413.