автореферат диссертации по электротехнике, 05.09.08, диссертация на тему:Адаптивный алгоритм цифровой обработки звуковых сигналов для реставрации фонограмм

кандидата технических наук
Волков, Алексей Леонидович
город
Санкт-Петербург
год
2000
специальность ВАК РФ
05.09.08
цена
450 рублей
Диссертация по электротехнике на тему «Адаптивный алгоритм цифровой обработки звуковых сигналов для реставрации фонограмм»

Оглавление автор диссертации — кандидата технических наук Волков, Алексей Леонидович

СОДЕРЖАНИЕ

ВВЕДЕНИЕ.

Глава 1. ИМПУЛЬСНЫЕ ПОМЕХИ.

1.1. Источники импульсных помех.

1.2. Импульсные помехи фотофонограммы.

1.2.1. Временные характеристики.

1.2.2. Спектр.

1.3. Импульсные помехи механической фонограммы.

1.3.1. Временные характеристики.

1.3.2. Спектр.

Выводы.

Глава 2. МЕТОДЫ БОРЬБЫ С ИМПУЛЬСНЫМИ ПОМЕХАМИ

2.1. Аналоговые методы.,.

2.2. Цифровые методы.

2.2.1. Алгоритмы, работающие во временной области.

2.2.2. Алгоритмы, работающие в частотной области.

2.3. Фильтрация.

Выводы.

Глава 3. РАЗРАБОТКА АЛГОРИТМА.

3.1. Фильтр верхних частот.

3.2. Алгоритм обнаружения импульсной помехи.

3.3. Алгоритм выделения импульсной помехи.

3. 3.1. Оптическая фонограмма.

3.3.2. Механическая фонограмма.

3.4. Алгоритм восстановления полезного сигнала.

3.5. Алгоритм борьбы с импульсными помехами.

Выводы.

СОДЕРЖАНИЕ

Глава 4. ВЫБОР ПРОГРАММНО-АППАРАТНЫХ СРЕДСТВ

ПРОЕКТИРОВАНИЯ.

4.1. Требования к программно-аппаратной среде проектирования.

4.1.1. Формат данных.

4.1.2. Частота дискретизации и объем данных.

4.2. Выбор языка и среды программирования.

4.2.1. Выбор языка программирования.

4.2.2. Выбор процессора.

4.2.3. Выбор операционной среды.

4.3. Организация обработки больших массивов.

4.4. Ввод-вывод звуковых данных на компьютере.

Выводы.

Глава 5. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ РАЗРАБОТАННЫХ

АЛГОРИТМОВ.

5.1. Ввод управляющих величин.

5.1.1. Формат управляющего файла.

5.1.2. Процедура преобразования строки в число.

5.1.3. Процедура чтения управляющих величин.

5.2. Ввод исходной последовательности.

5.3. Фильтр высоких частот.

5.4. Обнаружение импульсных помех.

5.4.1. Процедура чтения-записи scaner.

5.4.2. Процедура обнаружения импульсных помех detector.

5.4.3. Процедура расчета стартовой суммы summer.

5.5. Выделение импульсной помехи.

5.6. Восстановление полезного сигнала.

5.6.1. Процедура быстрого преобразования Фурье.

5.6.2. Процедура обратного быстрого преобразования Фурье.

СОДЕРЖАНИЕ

5.6.3. Процедура восстановления полезного сигнала.

5.7. Создание результирующего файла.

5.8. Общая структура программы.

Выводы.

Глава 6. ОПТИМИЗАЦИЯ РАЗРАБОТАННЫХ АЛГОРИТМОВ.

6.1. Выбор управляющих величин для алгоритма восстановления полезного сигнала.

6.2. Выбор управляющих величин для алгоритма обнаружения импульсных помех.

6.2.1 Критерии качества работы алгоритма обнаружения.

6.2.2. Методика исследований.

6.2.3. Результаты исследований.

Выводы.

Введение 2000 год, диссертация по электротехнике, Волков, Алексей Леонидович

ВВЕДЕНИЕ

Реставрация фонограмм имеет большое значение в современной звукотехнике. Это, в первую очередь, связано с тем, что огромное количество фономатериалов, созданных в период от возникновения звукозаписи как таковой до, буквально, последнего времени (середина восьмидесятых - начало девяностых), записывалось различными методами, но всегда в аналоговой форме на физический носитель: магнитную ленту, шеллачный или виниловый диск, кинопленку. Неизбежным свойством любого носителя является «старение», т.е. снижение качества записи со временем. Причинами старения являются механический износ носителя и изменение его физических свойств при длительном хранении.

Решить эту проблему удалось только в последние годы с развитием цифровых методов в звукозаписи [36, 37, 43, 44] и с широким распространением нового носителя звукозаписи - компакт диска (СО). Применение цифрового способа записи звукового сигнала позволяет избежать ухудшения качества воспроизведенного фономатериала, связанного со старением материала носителя.

Поэтому возникла необходимость в перенесении фономатериалов с оптической, механической или магнитной фонограммы на современный носитель. Особенно это важно для механической фонограммы, так как с момента возникновения звукозаписи и на

ВВЕДЕНИЕ 6 протяжении практически полувека она оставалась единственным способом хранения фономатериала. Поэтому огромное количество грампластинок имеют культурную ценность, как для нашей страны, так и для всего мира.

Простая перезапись фономатериала с одного носителя на другой не представляет технических сложностей, но вместе с полезным сигналом на новый носитель переносятся все шумы и помехи, находящиеся на исходной фонограмме. Для того чтобы отделить полезный сигнал от шумов и помех и, таким образом, улучшить качество записи, необходимо проводить реставрацию фонограммы.

Подобная система цифровой реставрации фонодокументов была разработана в НИЦТД (научно-исследовательский центр технической документации) СССР в 1983-1984 гг [35]. Не смотря на свой почтенный возраст, данная система является одной из последних разработок в данной области в нашей стране.

Система работала по такой схеме:

1. фономатериал переводился в цифровую форму (при этом использовался АЦП с такими параметрами: количество разрядов -12, частота дискретизации - 32.7 кГц;

2. производилась обработка на ЭВМ, собственно реставрация;

3. отреставрированный материал переводился обратно в аналоговую форму и записывался на высококачественный носитель.

Как видно, основной недостаток этой системы заключался в том, что звуковые данные после реставрации снова переводились в

ВВЕДЕНИЕ 7 аналоговую форму. Кроме того, за последние пятнадцать лет технические характеристики ЭВМ очень сильно продвинулись вперед: рабочая частота процессоров увеличилась с единиц до сотен мегагерц, разрядность аппаратно поддерживаемых данных - с 8 до 64 и даже 128. Появились как широкодоступные универсальные персональные компьютеры, так и специализированные процессоры цифровой обработки сигналов, аппаратно поддерживающие такие операции как свертка и быстрое преобразование Фурье [23, 38-41].

Поэтому в настоящее время имеется необходимость в создании новой, более современной цифровой системы реставрации фонограмм.

Цель данной работы состоит в разработке цифровых алгоритмов для реставрации фонограмм, а именно, для борьбы с импульсными помехами различных видов фонограмм и программной реализации разработанных алгоритмов на одном из языков программирования и оптимизации предложенных алгоритмов.

Достижение поставленной цели требует решения следующих задач:

1. Исследовать импульсные помехи различных фонограмм во временной и спектральной областях. При этом определить такие параметры импульсных помех как вид сигнала помехи, амплитуда сигнала помехи, длительность сигнала помехи, энергетический спектр импульсной помехи.

2. Провести анализ существующих методов борьбы с импульсными помехами фонограмм. Выявить их недостатки и преиму

ВВЕДЕНИЕ 8 щества, проанализировать данные недостатки и преимущества, основываясь на исследование импульсных помех.

3. Разработать набор цифровых алгоритмов, позволяющих эффективно бороться с импульсными помехами различных видов фонограмм.

4. Создать программный продукт реализующий разработанные алгоритмы. Для этого необходимо решить несколько подзадач:

4.1. Выбрать формат для цифрового представления звуковых данных.

4.2. Определить способ ввода-вывода звуковых данных в- из компьютера.

4.3. Выбрать среду программирования: язык программирования, процессор, операционную среду.

4.4. Собственно создать требуемый программный продукт в выбранной среде проектирования.

5. Провести исследования работы программы на различных звуковых сигналах. Основываясь на результаты данных исследований, оптимизировать работу алгоритма.

В главе 1 проводится теоретические исследования импульсных помех двух видов фонограмм оптической и механической. Рассматриваются повреждения носителя, которые являются источниками импульсных помех. На основе анализа системы: носитель записи - воспроизводящий элемент, определяется характер сигнала импульсной помехи в воспроизведенном сигнале. Все

ВВЕДЕНИЕ 9 помехи для каждого вида фонограмм делятся по размеру и положению на поверхности носителя повреждения-источника помехи на несколько групп. Для каждой группы определяются вид сигнала помехи, амплитуда сигнала помехи, продолжительность сигнала помехи. Также в этой главе проводится анализ энергетического спектра импульсных помех данных видов фонограмм.

Глава 2 посвящена анализу существующих методов борьбы с импульсными помехами фонограмм. Все рассматриваемые методы классифицированы по способу представления звукового сигнала на аналоговые и цифровые. Цифровые, в свою очередь, классифицированы на алгоритмы, производящие обработку сигнала во временной области, и алгоритмы, работающие со спектральным представлением сигнала. Отдельно рассмотрена частотная фильтрация сигналов. Для всех рассмотренных методов приводятся характерные недостатки и преимущества, а также величины управляющие качеством обработки звукового сигнала.

Третья из отмеченных задач решена в главе 3, посвященной разработке алгоритмов для борьбы с импульсными помехами оптической и механической фонограммы. Процесс борьбы разбит на несколько этапов: фильтрация, обнаружение помехи, выделение помехи и восстановление полезного сигнала. Для каждого этапа предлагается свой алгоритм, а также предлагается общий алгоритм, связывающий все этапы борьбы с импульсными помехами фонограмм.

ВВЕДЕНИЕ Ю

В главе 4 решаются вопросы, связанные с выбором программно-аппаратной среды реализации алгоритмов, предложенных в предыдущей главе. Исходя из требований решаемой задачи, выбирается формат представления исходных и промежуточных данных. Выбирается язык программирования и рабочий процессор, который будет производить обработку данных. Также решается вопрос ввода-вывода звуковых данных в- из компьютера.

Глава 5 посвящена программной реализации алгоритмов предложенных в главе 3. Вся программа обработки сигнала разбита на несколько подпрограмм, каждая из которых реализует один из предложенных алгоритмов. В некоторых подпрограммах отдельно выделены еще несколько процедур, так, например, в подпрограмме восстановления полезного сигнала выделены процедуры прямого и обратного преобразования Фурье.

В главе 6 приводятся результаты исследований работы разработанной программы на двух различных по характеру отрезках фонограмм. По полученным данным проводится анализ зависимостей оптимальных значений величин, управляющих работой алгоритмов. Исходя из результатов анализа, предлагаются значения управляющих величин, дающие удовлетворительные результаты работы программного продукта на различных фонограммах. Научная значимость работы состоит в следующем: • проведены всесторонние исследования импульсных помех таких видов фонограмм как оптическая и механическая;

ВВЕДЕНИЕ 11

• предложен набор алгоритмов, позволяющий обнаруживать и выделять импульсную помеху в сигнале и восстанавливать полезный сигнал на ее месте, при этом, алгоритм выделения помехи разработан впервые;

• предложены критерии качества работы алгоритма обнаружения импульсных помех, и с их помощью оценена работа разработанных алгоритмов.

Практическая ценность работы состоит в том, что разработан набор алгоритмов, позволяющий эффективно бороться с импульсными помехами оптической и механической фонограмм. Создан программный продукт, реализующий алгоритмы, осуществляющие борьбу с импульсными помехами механической фонограммы. Данный продукт может быть использован самостоятельно для подавления импульсных помех механической фонограммы или включен в программный комплекс, предназначенный для комплексной реставрации фонограмм. На основе разработанного продукта и предложенных алгоритмов не представляет сложности создать аналогичный программный продукт для борьбы с импульсными помехами оптической фонограммы. На защиту выносятся следующие положения: 1. Исследование импульсных помех оптической фонограммы показало, что для данного вида фонограммы импульсные помехи малохарактерны. Их амплитуда не превосходит амплитуду максимального полезного сигнала. Форма сигнала

ВВЕДЕНИЕ 12 импульсной помехи ближе всего к трапецеидальному импульсу. Продолжительность импульсных помех оптической фонограммы 0,02-10 мс. Спектр импульсной помехи оптической фонограммы близок к спектру реальных звуковых сигналов.

2. Исследование импульсных помех механической фонограммы показало, что данный вид фонограммы содержит большое количество импульсных помех, часто с очень большой энергией. По своему характеру они ближе всего к производной 5-функции, которой часто сопутствует собственный колебательный процесс подвижной системы звукоснимателя. Частота собственных колебаний лежит в области средних частот: 700.2000 Гц. Длительность импульсных помех механической фонограммы от 0,02 до 7 мс. Спектр импульсной помехи механической фонограммы перекрывает весь звуковой диапазон, при этом основная энергия помехи сосредоточена в области средних и высоких частот.

3. Разработанный, на основе проведенных исследований импульсных помех различных видов фонограмм, набор цифровых алгоритмов позволяет обнаруживать и выделять импульсную помеху в сигнале, и далее восстанавливать на месте помехи полезный сигнал методом интерполяции.

4. Оптимизация разработанных алгоритмов позволяет добиться следующих результатов их работы: вероятность обнару

ВВЕДЕНИЕ 13 жения и подавления импульсной помехи фонограммы 0,930,96, при этом процент ложных срабатываний составляет

10-15%.

По результатам исследований и разработок опубликовано шесть работ. В том числе пять статей [11-15] и учебное пособие [16].

Диссертация состоит из введения, шести глав, заключения и приложений. Общий объем диссертации 198 страниц, 33 иллюстрации, 13 таблиц. Список литературы 45 наименований.

Заключение диссертация на тему "Адаптивный алгоритм цифровой обработки звуковых сигналов для реставрации фонограмм"

Выводы

1. В качестве значения для управляющих величин алгоритма восстановления полезного сигнала можно принять следующие: критерий окончания процесса итераций е = 0,03, стартовое значение критерия выбора у0 = 0,5. В большинстве случаев эти величины дадут удовлетворительной результат, но при необходимости их можно откорректировать.

2. Для управления работой процесса обнаружения импульсных помех в зависимости от характера обрабатываемого сигнала следует принимать следующие значения управляющих параметров:

• Для обработки записей музыкальных произведений: частота среза фильтра высоких частот /гр = 1,5 кГц, длина участка обнаружения импульсной помехи N = 300, значение порога срабатывания алгоритма обнаружения а =19.

• Для обработки сложных записей, содержащих шумовые эффекты, речь, музыку: граничная частота полосы пропускания /гр = 6,7 кГц, длины участка обнаружения N = 1000, значения порога срабатывания а =35.

При необходимости, эти величины можно откорректировать, пользуясь зависимостями их оптимизированных значений друг от друга (рис. 6.1-6.3).

ЗАКЛЮЧЕНИЕ

159

6. Совокупность теоретических и экспериментальных исследований, представленная в данной работе, содержит постановку и решение актуальной для звукотехники задачи - создания адаптивного алгоритма цифровой обработки звуковых сигналов для реставрации фонограмм.

Библиография Волков, Алексей Леонидович, диссертация по теме Электроакустика и звукотехника

1. Абель П. Язык Ассемблера для IBM PC и программирования / Пер. с англ. Ю. В. Сальникова. М.: Высш. шк., 1992.

2. Адаптивные фильтры: Пер. с англ. / Под ред. К. Ф. Н. Коуэна и П. М. Гранта. М.: Мир, 1988.

3. Акустика: Справочник / А. П. Ефимов, А. В. Никонов, М. А. Сапожков, В. И. Шоров; Под ред. М. А. Сапожкова. М.: Радио и связь, 1989.

4. Аполлонова Л. П., Шумова Н. Д. Грамзапись и ее воспроизведение. — М.: Энергия, 1973.

5. Аполлонова Л. П., Шумова Н. Д. Механическая звукозапись. -М.: Энергия, 1978.

6. Бургов В. А. Механическая запись: Конспект лекций. -Л.: ЛИКИ, 1983.

7. Бургов В. А. Основы записи и воспроизведения звука. -М.: Искусство, 1954.

8. Бургов В. А. Теория фонограмм. М.: Искусство, 1984.

9. Вахитов Я. 111. Теоретические основы электроакустики и электроакустическая аппаратура. М.: Искусство, 1982.

10. Ведение в цифровую фильтрацию: Пер. с англ. / Под ред. Л.И. Филипова. М.; Мир, 1976.

11. Волков А.Л. Борьба с импульсными помехами фонограмм с использованием методов цифровой обработки сигналов. В1. ЛИТЕРАТУРА161сб.: Проблемы развития техники, технологии и экономики кино и телевидения. Вып. 11. -Спб.: СПбГУКиТ, 1999. С. 72-83.

12. Волков А.Л. Борьба с импульсными помехами фонограмм с применением цифровой обработки сигналов. Депонированная рукопись № 170кт-Д00, в ОНТИ НИКФИ, 2000. - 18с.

13. Волков А.Л. Импульсные помехи механической фонограммы. -Депонированная рукопись № 169кт Д00, в ОНТИ НИКФИ, 2000. - 14с.

14. Волков А.Л. Импульсные помехи оптической фонограммы. -Депонированная рукопись № 171 кт Д00, в ОНТИ НИКФИ, 2000.-15с.

15. Волков А.Л. Ишуткин Ю.М. Методы борьбы с импульсными помехами. Депонированная рукопись № 168кт - Д00, в ОНТИ НИКФИ, 2000. - 16с.

16. Волков А.Л., Ишуткин Ю.М. Шумы и помехи в звукозаписи: Учебное пособие. СПб.: СПГУКиТ, 2000.

17. Гольденберг Л. М., Матюшкин Б. Д., Поляк М. Н. Цифровая обработка сигналов. М.: Радио и связь, 1990.

18. Гольденберг Л. М., Матюшкин Б. Д., Поляк М. Н. Цифровая обработка сигналов: Справочник. М.: Радио и связь, 1985.

19. Григорьев В. Л. Видеосистемы ПК фирмы IBM. М.: Радио и связь, 1993.

20. Зубков С. В. Assembler для DOS, Windows и Unix. М.: ДМК, 1999.1. ЛИТЕРАТУРА162

21. Ишуткин Ю. М., Раковский В. В. Измерения в аппаратуре записи и воспроизведения звука кинофильмов. М.: Искусство, 1985.

22. К. Паппас, У. Марри. Микропроцессор 80386: Справочник. -М.: Радио и связь, 1993.

23. М. С. Куприянов, Б. Д. Матюшкин. Цифровая обработка сигналов: процессора, алгоритмы, средства проектирования. СПб.: Политехника, 1998.

24. Орловский Г. Г. Введение в архитектуру микропроцессора 80386. СПб.: Сеанс-Пресс LTD, 1992.

25. Рабинер П., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978.

26. Рутников B.C. Фильтрация измерительных сигналов. -Л: Энергоатомиздат, 1990.

27. Т. Хоган. Аппаратные и программные средства персональных компьютеров: Справочник. В 2-х кн. Кн. 2. М.: Радио и связь, 1995.

28. Уваров В. К. Сигналы, искажения и помехи в канале передачи как предмет изучения: Учебное пособие. СПб.: СПИКиТ, -1994.

29. Фролов А. В., Фролов Г. В. Программирование видеоадаптеров. М.: ДИАЛОГ-МИФИ, 1995.

30. Харькевич А. А. Борьба с помехами. М.: Физматгиз,1965.

31. Харькевич А. А. Спектры и анализ. М.: Физматгиз,1963.1. ЛИТЕРАТУРА163

32. Хоган. Т. Аппаратные и программные средства персональных компьютеров: Справочник. В 2-х кн. Кн. 1. М.: Радио и связь, 1995.

33. Христиан Э., Эйзенман Е. Таблшицы и графики по расчету фильтров. Справочник : Пер. с англ./ Под ред. Белицко-го А.Ф. -М: Связь, 1975.

34. Цифровая фильтрация в электросвязи и радиотехнике / Брун-ченко A.B. и др. по ред. Гольденберга J1.M. М: Радио и связь, 1982.

35. Чичагов А. В. Цифровая реставрация фонодокументов на ЭВМ. Техника кино и телевидения 1986-№ 1, с7-11.

36. А. Oppenheim, R. Schafer. Discret-Time Signal Processing. Prentice Hall, Englewood Cliffs, New Jersy, 1989.

37. Digital Audio Signal Processing: An Anthology. Edited by John Strawn with contributions by J.W.Gordon, F.R.Moore, J.A.Moorer, T.L.Petersen, J.O.Smith, and J.Strawn — Los Altos, California, 1985.

38. DSP56000. Digital Signal Processor. Family Manual. 1992. Motorola Inc. (DSP56KFAMUM/AD).

39. DSP56100. Digital Signal Processor. Family Manual. 1993. Motorola Inc. (DSP561OOFM/AD).

40. DSP56800. Family Manual. 1996. Motorola Inc. (DSP56800FM/AD).1. ЛИТЕРАТУРА-J 64

41. DSP96002. IEEE Floating Point Dual-Port Proceccor. User's Manual. 1989. Motorola Inc. (DSP96002UM/AD).

42. L. Jackson. Digital Filters and Signal Processing. Klewer Academic Publishers, second edition, 1989.

43. M. Bellanger. Digital Processing of Signals. Theory and Practice. New York, NY:John Wiley and Sons, 1984.

44. R. Crochiere, L. Rabiner. Multirate Signal Processing. Englewood Cliffs, NJ: Prentice Hall, Inc. 1983.

45. VLSI and Modern Signal Processing / Editors: S.Y. Kung, H.J. Whitehouse and T. Kailath Prentice-Hall, Inc., Englewood Cliffs, New Jersey 07632, 1985.