автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении
Автореферат диссертации по теме "Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении"
На правах рукописи
Таранов Дмитрий Дмитриевич
АЛГОРИТМЫ ОБРАБОТКИ И МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ МУЗЫКАЛЬНЫХ АКУСТИЧЕСКИХ СИГНАЛОВ В ПОМЕЩЕНИИ
Специальности: 05.12.04 - Радиотехника, в том числе системы и устройства телевидения, 01.04.06 — Акустика
Автореферат диссертации на соискание ученой степени кандидата технических наук
5 ДЕК 2013
Таганрог-2013
005543626
Работа выполнена на кафедре теоретических основ радиотехники радиотехнического факультета Инженерно-технологической академии Федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет».
Научный руководитель: Рыжов В.П., доктор физико-математических наук, профессор Инженерно-технологической академии Южного федерального университета, г. Таганрог.
Официальные оппоненты:
Тимошенко В.И., доктор технических наук, профессор Инженерно-технологической академии Южного федерального университета, г. Таганрог.
Богосов В.А., кандидат технических наук, доцент Ростовского государственного университета путей сообщения, г. Ростов-на-Дону.
Ведущая организация: Федеральное государственное автономное образовательное учреждение высшего профессионального образования Дальневосточный федеральный университет.
Защита состоится «23» декабря 2013 г. в 1420 в ауд. Д-406 на заседании диссертационного совета Д 212.208.20 при Федеральном государственном автономном образовательном учреждении высшего профессионального образования «Южный федеральный университет» по адресу: пер. Некрасовский, 44, корп. Д, г. Таганрог, Ростовская обл., 347928.
С диссертацией можно ознакомиться в Зональной научной библиотеке Южного федерального университета по адресу: ул. Пушкинская, 148, г. Ростов-на-Дону, 344065.
Автореферат разослан «_» ноября 2013 г.
Ученый секретарь
диссертационного совета к.т.н., доцент В.В. Савельев
моделей динамической и спектральной обработок, а также пространственного позиционирования. Алгоритмы обработки музыкальных сигналов не стандартизованы. Несмотря на достигнутые в ряде приложений значительные успехи (бинауральная звукозапись, достоверно передающие характер реальных помещений реверберационные алгоритмы и т.д.), в большинстве своем они не имеют фундаментальной значимости. Как следствие, исследователи и разработчики алгоритмов обработки музыкальных сигналов зачастую вынуждены исходить из эвристических соображений при подборе параметров алгоритмов в отсутствие накопленной информационной базы.
Также следует отметить такой недостаток многих существующих методов обработки музыкальных сигналов, как чрезмерно формальный подход к задаче, т.е. недостаточный учет специфики музыкальных сигналов и особенностей человеческого слуха и, в частности, особенностей восприятия конкретного музыкального материала.
В сложившейся ситуации возрастающего спроса на звукозаписывающие и звуковоспроизводящие системы в музыкальной сфере для использования в разнообразных приложениях существует необходимость поиска новых подходов к решению данной задачи, обладающих достаточной универсальностью и обеспечивающих достоверностью звучания. Особое значение эта задача имеет для мобильных средств звуковоспроизведения.
Объектом исследования являются музыкальные акустические сигналы, не содержащие информацию о конкретном помещении, в котором они были записаны.
Предметом исследования являются методы обработки музыкальных сигналов с целью их пространственного позиционирования и пространственной окраски в заданном помещении.
Целью диссертационной работы является повышение эффективности пространственного позиционирования и пространственной окраски музыкальных акустических сигналов в заданном акустическом пространстве.
Основными задачами, которые требуется решить для достижения поставленной цели, являются:
1. моделирование свойств реальных помещений при создании фонограмм методом наложения;
2. повышение естественности звучания фонограмм;
3. увеличение степени локализации виртуальных источников звуковых сигналов при создании фонограмм;
4. обеспечение оперативности позиционирования источника звукового сигнала в реальном времени при одновременном снижении вычислительных затрат.
Научная новизна
В диссертационной работе получены следующие новые научные результаты:
1. Предложен метод бинаурального позиционирования источника звукового сигнала с использованием модели ушных раковин.
2. Разработан алгоритм бинаурального позиционирования источника звукового сигнала с использованием передаточной характеристики «искусственной головы», применимый в реальном времени.
3. Предложен алгоритм снижения вычислительных затрат бинаурального позиционирования с возможностью использования в реальном времени.
4. Разработан гибридный реверберационный алгоритм, основанный на использовании импульсных характеристик реальных или математически моделируемых помещений и модели поздних отражений.
5. Разработана методика оценки качества бинаурального пространственного позиционирования с использованием экспертных оценок.
Практическая значимость работы
1. Разработан алгоритм бинаурального позиционирования источника музыкального акустического сигнала относительно слушателя. Показано, что применение данного алгоритма имеет достаточно высокие локационные характеристики. В среднем, погрешность локации во фронтальной полуплоскости составляет 7°, в тыловой полуплоскости - 15°, что более чем на 20% превышает результаты распространенных коммерческих алгоритмов.
2. Разработан алгоритм искусственной реверберации, позволяющий повысить естественность звучания музыкального материала посредством помещения источника звука в акустическую среду, свойства которой максимально приближены к свойствам заданного помещения.
3. Предложен способ снижения вычислительных затрат, требуемых для бинаурального пространственного позиционирования сигнала, понижающий затраты ресурсов более, чем в 103 раз по сравнению с коммерческими сверточными алгоритмами. Алгоритм также позволяет реализовать динамическое пространственное позиционирование источника звукового сигнала в заданном акустическом пространстве.
Методы исследования основаны на использовании аппарата математической статистики, теории сигналов и их цифровой обработки. Использовались методы компьютерного моделирования, акустики, статистической радиотехники, цифровой обработки сигналов, прикладной статистики, а также некоторые положения психоакустики. Проверка теоретических выводов производилась путем проведения эксперимента с использованием экспертных оценок.
Использование результатов работы
Результаты исследований и разработанные программные продукты используются на студии звукозаписи (г. Батайск) для улучшения параметров художественной обработки музыкальных сигналов, а также в учебном процессе кафедры ТОР в курсах «Акустика» и «Компьютерный синтез сигналов и электромузыкальные инструменты» (специальность «Аудиовизуальная техника»).
Публикации
По результатам выполненных исследований опубликовано 7 работ, в том числе 2 статьи в рецензируемых журналах из списка ВАК РФ и 5 статей и тезисов в материалах Всероссийских научных конференций.
Основные положения, выносимые на защиту:
1. Повышение естественности звучания фонограмм с учетом специфики музыкальных сигналов возможно на основе одновременного учета как реверберационных свойств помещения, так и позиционирования источников звуковых сигналов.
2. Метод бинаурального позиционирования источника звукового сигнала, основанный на использовании междуушных временных задержек и модели ушных раковин, а также передаточной характеристики «искусственной головы», позволяет повысить точность пространственного позиционирования акустических сигналов.
3. Наибольшая естественность звучания музыкальных сигналов при минимальной затрате вычислительных ресурсов достигается при использовании гибридного реверберационного алгоритма, основанного на использовании импульсных характеристик реальных или математически моделируемых помещений и поздних отражений.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения и списка использованных литературных источников, содержащего 88 наименований. Общий объем работы составляет 141 страниц машинописного текста, включая 56 рисунков и 38 таблиц.
Основное содержание работы
Во введении обоснована актуальность темы, обозначено современное состояние исследований в области пространственной обработки музыкальных акустических сигналов, сформулированы цели исследования, отражены научная новизна и практическая значимость полученных результатов. Также сформулированы основные положения, выносимые на защиту.
В первой главе произведена формальная постановка задачи пространственной обработки музыкальных акустических сигналов. Описаны задачи, возникающие при записи музыкального материала, описаны некоторые особенности слухового восприятия человеческого слуха, а также общие сведения о слуховом аппарате человека. Рассмотрены статистические свойства музыкальных сигналов, приведен анализ спектрограмм различных музыкальных инструментов. Рассмотрены характеристики направленности музыкальных сигналов. При этом показано, что для большинства музыкальных инструментов характерна неравномерность характеристики направленности. Введено понятие аурализации. Отмечено что мотивацией создания систем аурализации является возможность посредством математических преобразований помещение некоторого мнимого источника звукового сигнала в произвольную акустическую среду, что во многих случаях субъективно положительно сказывается на его воспроизведении. Таким образом, возможным является моделирование, например, концертных залов, соборов и т.д., с целью создания максимального эффекта присутствия для слушателя. Рассмотрены известные модели
Таблица 1. - Результаты моделирования взаимных корреляционных
Азимут, град Трехмерная коррелограмма Усредненная по частоте коррелограмма
0 частота. Гц ! \ ! \ \ ^ / \ / \ / \ \ Г
200 %
-3000 -2000 -1000 0 1000 2000 3000 задерюа, мкс •3000 -2000 -1000 0 1000 2000 3000 задержка, икс
11! А А \ \
60 частота. П ниян \ \ \ / \ \J V
200 100 50 ШШШШШШШ
-3000 -2000 -1000 0 1000 2000 3000 задержка, мкс задери« а. мкс
90 «И =г гт U. 1500 о Шо С «80 5 500 ■480 А А . \ / \
•а
•}Ш -2Ш -Ш6 о юаа аш зооо задержка, мкс задержка, мкс
В третьей главе рассматривается моделирование пространственных характеристик слуха на основе модели искусственной головы.
Рассматривается система моделирования трехмерного акустического пространства с использованием функции HRTF (Head-Related Transfer Function), что позволяет учесть дифракция звуковых волн на поверхностях головы, ушных раковин, плеч, человеческого торса. При этом голова слушателя рассматривается как фильтр, а функция HRTF представляет собой передаточную функцию этого фильтра. Спектр сигнала, достигающего каждого уха слушателя, зависит от положения источника звукового сигнала, азимута, угла возвышения и т.д.
Предлагается алгоритм повышения эффективности аурализации. Описывается эксперимент по записи массива функций HRTF во временной области, приводится последовательность, в которой производился эксперимент, описываются использованные программные и аппаратные средства.
Приводятся подходы к формированию импульсных характеристик
Рис. 4 - Коррелограммы для двух пар импульсных характеристик, соответствующих левой и правой ушной раковине слушателя, при в=0° и в=30°.
Приводится алгоритм снижения вычислительных затрат алгоритма моделирования бинауральных свойств головы с использованием ФНЧ. Для сокращения вычислительных затрат было использовано известное свойство человеческого слуха, заключающееся в невозможности локализации звуковых сигналов частотой ниже 100 Гц. При этом производилась фильтрация входного сигнала согласно структурной схеме, приведенной на рисунке 5.
N4-1
п=0
Ы-1
гае: X х„,хп=х[/я)/п=п4/, (4)
п=0
1 N-1
у=Т7 Е уп-уп=у(/п)^п=пА/> (5)
п= 0
хп, уп - дискретные значения спектральных функций хф, уф в пределах заданного интервала.
задержка, отсчеты задержка, отсметы
Рис. 5 - Алгоритм первичной обработки сигнала
В связи с важной ролью реверберации при моделировании характеристик закрытого пространства, особое внимание уделено вопросам моделирование реверберационных свойств заданного помещения. Приводятся модели ревербераторов М. Шредера и Р. Мурера. Разработан гибридный
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
Достигнута основная цель — имитация трехмерного акустического пространства с высокой степенью достоверности, что подтверждено оценками экспертов.
Разработан гибридный реверберационный алгоритм, характеризующийся высокой естественностью результирующего отклика, а также экономией вычислительных ресурсов.
С высокой степенью достоверности имитированы реверберационные свойства помещения, что подтверждено экспертными оценками.
Достигнута высокая степень локализации мнимых источников звукового сигнала, при этом максимальная локализация была получена для широкополосных сигналов с жесткой атакой.
Разработаны алгоритмы, позволяющие имитировать акустические свойства реального помещения — геометрические размеры, характер отражений, реверберационные свойства. При этом учитывается влияние головы и торса слушателя на сигнал источника звука для каждого уха, что достигается применением «искусственной головы» при записи.
Проведены эксперименты с участием экспертов по сравнению алгоритмов аурализации. Результаты показали, что предложенный метод позволяет с высокой степенью достоверности имитировать эффект присутствия в реальном помещении с заданными свойствами, а также обеспечивает локализацию источника звука с заданным направлением (в общем случае — азимутом), и расстоянием относительно слушателя. Помимо этого, при необходимости возможна достаточно достоверная имитация перемещения источника звука в пространстве в любом направлении. Практически, возможности данного метода определяются лишь наличием базы данных по различным помещениям и быстродействием вычислительной техники, осуществляющей необходимые математические преобразования.
ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в центральных изданиях, рекомендованных
ВАКРФ
1.Таранов Д.Д. Гибридный реверберационный алгоритм [электронный ресурс] II «Инженерный вестник Дона», 2013, №3.
2.Таранов Д.Д. Алгоритм пространственного позиционирования акустичеких сигналов [электронный ресурс] // «Инженерный вестник Дона», 2013, №4.
Публикации в других изданиях
3.Таранов Д.Д., Гибридный реверберационный алгоритм. // Материалы Международной' научной конференции «Перспектива развития гуманитарных технических систем» - часть 3 - Таганрог: Изд-во ТТИ ЮФУ, 2012. - С. 4-7.
4.Таранов Д.Д. Алгоритмы обработки и моделирования пространственно-временных акустических сигналов // Материалы Всероссийской научной конференции «Инновационные процессы в гуманитарных, естественных и технических системах» — часть 3 — Таганрог: Изд-во ТТИ ЮФУ, 2012. - С. 61-66.
5.Таранов Д.Д. Гибридный реверберационный алгоритм. Сборник материалов научно-технической конференции КРЭС 2012, -1с.- 2012.
6.Таранов Д.Д. Имитация трехмерного акустического пространства // Материалы международной научной конференции «Информационное общество: идеи, технологии, системы» - часть 4 — Таганрог: Изд-во ТТИ ЮФУ, 2010. - С. 40-44.
7.Таранов Д.Д. Моделирование трехмерного акустического пространства
// Материалы дистанционной Всероссийской научной конференции
«Актуальные вопросы исследования общественных и технических систем» -часть 2 - Таганрог: Изд-во ТТИ ЮФУ, 2011. - С. 60-65.
Типография Инженерно-технологической академии Южного федерального университета в г. Таганроге пер. Некрасовский, 44, г. Таганрог, Ростовская область, ГСП-17А, 347928 Заказ № 292 Тираж 100 экз.
Текст работы Таранов, Дмитрий Дмитриевич, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
На правах рукописи 04201453354 Ъ^
Таранов Дмитрий Дмитриевич
АЛГОРИТМЫ ОБРАБОТКИ И МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ МУЗЫКАЛЬНЫХ АКУСТИЧЕСКИХ СИГНАЛОВ В ПОМЕЩЕНИИ
Специальности: 05.12.04 - Радиотехника, в том числе системы и устройства телевидения, 01.04.06 Акустика
ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук
Научный руководитель: доктор физико-математических наук, профессор
В.П. Рыжов
ТАГАНРОГ 2013
Содержание
Введение.......................................................................................4
Глава 1. Музыкальные сигналы в помещении и их восприятие человеком... 13
1.1 Задачи, возникающие при записи музыкальных сигналов....................13
1.2 Особенности слухового восприятия................................................13
1.3 Статистические свойства музыкальных сигналов..............................19
1.4 Понятие аурализации и особенности слухового восприятия................29
1.5 Постановка задачи исследования...................................................35
Глава 2. Анализ двумерных акустических музыкальных сигналов с использованием искусственной головы и моделей слуха...........................37
2.1 Модели слухового восприятия пространственных характеристик сигналов......................................................................................37
2.2 Реверберационные алгоритмы......................................................55
2.3 Модели восприятия искажений музыкальных сигналов......................60
2.4 Влияние нелинейных искажений на спектр музыкального сигнала........67
2.5 Особенности обработки музыкальных сигналов и существующие модели
их представления...........................................................................68
Глава 3. Моделирование пространственных характеристик слуха на основе
модели искусственной головы..........................................................71
3.1. Моделирование трехмерного пространства с использованием массива функций Head-Related Transfer Function (HRTF)....................................71
3.2 Экспериментальная запись массива функций HRTF во временной области.......................................................................................75
3.3 Формирование импульсных характеристик функции HRTF.............76
3.4 Моделирование бинауральных свойств головы, упрощение алгоритма моделирования, уменьшение вычислительных затрат...............................80
3.5 Моделирование реверберационных свойств помещения..................87
Глава 4. Экспериментальное исследование разработанных алгоритмов
с использованием экспертных оценок................................................107
4.1 Задачи и исходные данные эксперимента........................................106
4.2 Методика проведения эксперимента.............................................107
4.3 Возможности повышения достоверности результатов эксперимента.... 109
4.4 Проведение эксперимента.........................................................111
4.5 Интерпретация экспериментальных данных...................................126
4.6 Выводы по результатам эксперимента...........................................131
Заключение..................................................................................130
Список литературы.......................................................................132
Введение
Актуальность работы
Обработка акустических музыкальных сигналов в настоящее время представляет собой обширную область, научных исследований, инженерных разработок, программного обеспечения и алгоритмов на стыке таких направлений как акустика, радиотехника, звукорежиссура, прикладная статистика, психология.
Традиционно, задачи звукозаписывающей и техники сводились к наиболее точному воссозданию акустических условий, в которых производилась звукозапись. Однако, на сегодняшний день обработка акустических музыкальных сигналов, включая монтаж, сведение, мастеринг и др. имеет, прежде всего, художественный характер. Как правило, звукозапись, в том числе и многоканальная, производится последовательно, т.е. источники звукового сигнала - музыкальные инструменты, голоса исполнителей и художественные звуковые эффекты - записываются по очереди, а не одновременно. Обычно эта запись проходит в заглушённом помещении (имитация условий свободного поля) с целью дальнейшей динамической, спектральной и пространственной обработки. Среди приложений пространственной обработки музыкальных акустических сигналов стоит отметить такие как:
- моделирование свойств реальных помещений; при создании фонограмм методом наложения;
- повышение естественности звучания фонограмм;
- улучшение локализации источников звуковых сигналов при создании фонограмм;
- оперативность позиционирования источника звукового сигнала в реальном времени при одновременном снижении вычислительных затрат;
- создание дополнительных художественных музыкальных эффектов.
В нашей стране проблемой исследования и обработки музыкальных акустических сигналов занимались такие ученые как Алдошина И.А., Меер-зон Б.Я., Ковалгин Ю.А., Вологдин Э.И. Среди зарубежных исследователей следует отметить такие имена как Д. Уиллиамс, Б. Вебстер,У. Зольцер, В. Гарднер, Дж. Блауэрт и др.
Решение задачи пространственного позиционирования музыкальных акустических сигналов сопряжено с существенными сложностями, многие из которых в полной мере не разрешены на сегодняшний день. Первой из таких сложностей является субъективность восприятия музыкальных сигналов слушателем. Под субъективностью подразумевается как вариативность исполнения различного музыкального материала на одних и тех же музыкальных инструментах, так и трудности, связанные с формальным описанием параметров музыкального интонирования, звукоизвлечения и их объективным измерением.
Данные проблемы являются причиной того, что на данный момент ни в одном из направлений обработки музыкальных сигналов не существует общепринятых моделей динамической и спектральной обработок, а также пространственного позиционирования. Алгоритмы обработки музыкальных сигналов не стандартизованы. Несмотря на достигнутые в ряде приложений значительные успехи (бинауральная звукозапись, достоверно передающие характер реальных помещений реверберационные алгоритмы и т.д.), в большинстве своем они не имеют фундаментальной значимости. Как следствие, исследователи и разработчики алгоритмов обработки музыкальных сигналов зачастую вынуждены исходить из эвристических соображений при подборе параметров алгоритмов в отсутствие накопленной информационной базы.
Также следует отметить такой недостаток многих существующих методов обработки музыкальных сигналов как чрезмерно формальный подход к задаче, т.е. недостаточный учет специфики музыкальных сигналов и
особенностей человеческого слуха и, в частности, особенностей восприятия конкретного музыкального материала.
В сложившейся ситуации возрастающего спроса на звукозаписывающие и звуковоспроизводящие системы в музыкальной сфере для использования в разнообразных приложениях существует необходимость поиска новых подходов к решению данной задачи, обладающих достаточной универсальностью и достоверностью звучания.
Объектом исследования являются музыкальные акустические сигналы, не содержащие информацию о конкретном помещении, в котором они были записаны.
Предметом исследования являются методы обработки музыкальных сигналов с целью их пространственного позиционирования и пространственной окраски в заданном помещении.
Целью диссертационной работы является повышение эффективности пространственного позиционирования и пространственной окраски музыкальных акустических сигналов в заданном акустическом пространстве.
Основными задачами, которые требуется решить для достижения поставленной цели, являются:
- моделирование свойств реальных помещений при создании фонограмм методом наложения;
- повышение естественности звучания фонограмм;
- задача локализации виртуальных источников звуковых сигналов при создании фонограмм;
- повышение оперативности позиционирования источника звукового сигнала в реальном времени при одновременном снижении вычислительных затрат;
Научная новизна
В диссертационной работе получены следующие новые научные результаты:
1. Предложен метод бинаурального позиционирования источника звукового сигнала на основе междуушных временных задержек и модели ушных раковин.
2. Разработан метод бинаурального позиционирования источника звукового сигнала с использованием передаточной характеристики «искусственной головы», применимый в реальном времени.
3. Предложен алгоритм снижения вычислительных затрат бинаурального позиционирования с возможностью использования в реальном времени.
4. Разработан гибридный реверберационный алгоритм, основанный на использовании импульсных характеристик реальных или математически моделируемых помещений и модели поздних отражений.
5. Предложена методика оценки качества бинаурального пространственного позиционирования с использованием экспертных групп.
Практическая ценность работы
1. Разработан алгоритм, в котором реализовано бинауральное позиционирование источника музыкального акустического сигнала относительно слушателя. Показано, что применение данного метода имеет достаточно высокие локационные характеристики. В среднем, погрешность локации во фронтальной полуплоскости составляет 7°, в тыловой полуплоскости - 15°, что более, чем на 20% превышает результаты распространенных коммерческих алгоритмов.
2. Разработан реверберационный алгоритм, позволяющий повысить естественность звучания музыкального материала, посредством помещения источника звука в акустическую среду, свойства которой максимально приближены к свойствам данного реального помещения.
3. Предложен метод снижения вычислительных затрат, требуемых для бинаурального пространственного позиционирования сигнала, понижающий ресурсозатратность более, чем на два порядка по сравнению с коммерческими сверточными алгоритмами. Алгоритм также позволяет реализовать динамическое пространственное позиционирование источника звукового сигнала в заданном акустическом пространстве.
Методы исследования основаны на использовании аппарата математической статистики, теории сигналов. Использовались методы, компьютерного моделирования, акустики, статистической радиотехники, цифровой обработки сигналов, прикладной статистики, а также некоторые положения психоакустики. Проверка теоретических выводов производилась путем проведения эксперимента с использованием экспертных оценок.
Реализация результатов работы.
Результаты исследований и разработанные программные продукты используются на студии звукозаписи медиагруппы «Звукодел» (г. Батайск) для улучшения параметров художественной обработки музыкальных сигналов, а также в учебном процессе кафедры ТОР в курсах «Акустика» и «Компьютерный синтез сигналов и электромузыкальные инструменты» (специальность «Аудиовизуальная техника»).
Публикации.
По результатам выполненных исследований опубликовано 7 работ, в том числе 2 статьи в рецензируемых журналах из списка ВАК РФ и 5 статей и тезисов в материалах Всероссийских научных конференций.
Основные положения, выносимые на защиту:
1. Повышение естественности звучания фонограмм с учетом специфики музыкальных сигналов возможно на основе одновременного учета как реверберационных свойств помещения, так и позиционирования источников звуковых сигналов.
2. Метод бинаурального позиционирования источника звукового сигнала может быть основан на использовании междуушных временных задержек и модели ушных раковин, а также с использованием передаточной характеристики «искусственной головы».
3. Наибольшая естественность звучания музыкальных сигналов при минимальной затрате вычислительных ресурсов достигается при использовании гибридного реверберационного алгоритма, основанного на использовании импульсных характеристик реальных или математически моделируемых помещений и модели поздних отражений.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения и списка использованных литературных источников, содержащего 88 наименований. Общий объем работы составляет 141 страниц машинописного текста, включая 56 рисунков и 38 таблиц.
Во введении обоснована актуальность темы, обозначено современное состояние исследований в области пространственной обработки музыкальных акустических сигналов, сформулированы цели исследования, отражены научная новизна и практическая значимость полученных результатов. Также сформулированы основные положения, выносимые на защиту.
В первой главе произведена формальная постановка задачи пространственной обработки музыкальных акустических сигналов. Описаны задачи, возникающие при записи музыкального материала, описаны некоторые особенности слухового восприятия человеческого слуха, а также общие сведения о слуховом аппарате человека. Рассмотрены статистические свойства музыкальных сигналов, приведен анализ спектрограмм различных музыкальных инструментов. Рассмотрены характеристики направленности музыкальных сигналов. Используется) понятие аурализации, на основе которого рассмотрены известные модели локационных алгоритмов человеческого слуха.
Во второй главе производится анализ акустических полей и двумерных акустических сигналов с использованием искусственной головы и моделей слуха. Приводятся известные аурализационные модели: метод лучевой трассировки, метод энергетического перехода и метод виртуального источника. Предлагается аурализационный алгоритм на основе междуушной временной задержки и модели ушных раковин слушателя. Вводится понятие гамматонового фильтра, используемого при моделировании процессов фильтрации слуховой системой алгоритма. В качестве тестовых сигналов в эксперименте используется полосовой третьоктавный шум с центральной частотой 250 Гц. Результаты эксперимента представлены в виде изображений взаим-
ных корреляционных функций (трехмерные и усредненные по частоте ко-реллограммы). Приводятся существующие модели реверберационных алгоритмов. Рассматриваются модели восприятия искажений музыкальных сигналов. Приводятся графические результаты эксперимента по расчету корреляционной функции клиппированного и неклипированного сигнала в частотной области. Рассматриваются особенности обработки музыкальных сигналов и существующие модели их представления.
В третьей главе рассматривается моделирование пространственных характеристик слуха на основе модели искусственной головы. Рассматривается система моделирования трехмерного акустического пространства с использованием функции HRTF (Head-Related Transfer Function). Предлагается алгоритм повышения эффективности аурализаци. Описывается эксперимент по записи массива функций HRTF во временной области, приводится последовательность, в которой производился эксперимент, описываются использованные программные и аппаратные средства. Приводятся подходы к формированию импульсных характеристик функции HRTF, описывается эксперимент по моделированию функций HRTF. Приводится алгоритм моделирования бинауральных свойств головы слушателя на основе массива HRTF В. Гарднера и К. Мартина, рассматривается упрощение данного алгоритма, уменьшение его вычислительных затрат. Приводятся графики HRTF использованного массива во временной и частотной областях. Представлены графики корреляционных функций в частотной области для каждой пары импульсных характеристик. Соответствующих левой и правой ушной раковине слушателя. Приводится алгоритм снижения вычислительных затрат алгоритма с использованием ФНЧ Чебышева 5-го порядка. Описывается моделирование реверберационных свойств заданного помещения. Приводятся модели ревербераторов М. Шредера и Р. Мурера. Предлагается структурная схема разработанного гибридного алгоритма. Рассматриваются различные техники выполнения операции свертки с приведением вычислительных затрат. Приводятся импульсные характеристики трех реальных помещений, использован-
11
ные в гибридном реверберационном алгоритме. Рассчитываются вычислительные затраты алгоритма. Предлагается алгоритм моделирования импульсных характеристик помещения на основе геометрических соотношений и коэффициента поглощения отражающих поверхностей. Приводятся параметры, использованные для имитации импульсных характеристик трех реальных помещений. Описывается выбор длительности импульсной характеристики и фильтрация входного сигнала. Описываются блоки, использованные во второй части гибридного реверберационного алгоритма, приводятся графики их импульсных характеристик и АЧХ.
В четвертой главе представлены результаты экспериментов с участием экспертных групп. Была проведена серия из 5 экспериментов по прослушиванию аурализованных сигналов (музыкальных фраз, исполненных на шести различных музыка�
-
Похожие работы
- Моделирование и исследование аурализации при распространении волн
- Алгоритм и устройство с адаптивным управлением характеристикой направленности на основе пространственно-временной обработки сигналов
- Исследование и разработка цифровых алгоритмов обнаружения сигналов радиомикрофонов
- Энергоинформационный мониторинг телерадиовещания и мобильной радиосвязи
- Пространственно-временная обработка сигналов в ультразвуковой дефектоскопии в присутствии структурного шума
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства