автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.06, диссертация на тему:Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов

кандидата технических наук
Повинский, Юрий Владимирович
город
Санкт-Петербург
год
2013
специальность ВАК РФ
05.11.06
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов»

Автореферат диссертации по теме "Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов"

На правах рукописи

Повинский Юрий Владимирович

ОБОСНОВАНИЕ КОМПЛЕКСА ЭЛЕКТРОАКУСТИЧЕСКИХ ХАРАКТЕРИСТИК РЕЧЕВЫХ ГАРНИТУРНЫХ МИКРОФОНОВ ДЛЯ УСЛОВИЙ ПОВЫШЕННЫХ АКУСТИЧЕСКИХ ШУМОВ

Специальность 05.11.06 - Акустические приборы и системы

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

2 8 НОЯ 2013

Санкт-Петербург - 2013

005540497

Работа выполнена в Санкт-Петербургском государственном университете кино и телевидения на кафедре акустики и звукотехники

Научный руководитель: доктор технических наук, доцент,

Вахитов Шакир Яшэрович

Официальные оппоненты: доктор технических наук, доцент, ведущий

научный сотрудник ФГУП «Крыловский государственный научный центр» Майоров Василий Семенович

кандидат технических наук, президент ВосточноЕвропейской ассоциации акустиков Ахматов Андрей Андреевич

Ведущая организация: ОАО «НЛП «Дальняя связь», г. Санкт-Петербург

Защита состоится «19» декабря 2013 года в ЛЪЗо часов на заседании диссертационного совета Д210.021.01 в Санкт-Петербургском государственном университете кино и телевидения по адресу: 191119, Санкт-Петербург, ул. Правды, д. 13.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного университета кино и телевидения.

Автореферат разослан 15 ноября 2013г.

Ученый секретарь диссертационного совета

Гласман Константин Францевич

I ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации. На микрофон, используемый дня звукопередачи, действует звуковое давление не только от основного источника, но и от большого числа источников акустического шума, присутствие которых по той или иной причине является при звукопередаче неизбежным. Под акустическими шумами могут пониматься шумы любой природы, источники которых находятся на некотором расстоянии от микрофона. Например: посторонние голоса находящихся рядом людей, шум от приборов и механизмов, машин и т.д. При этом источники акустических шумов могут иметь заранее известное статичное местоположение либо появляться случайным образом, например, при нахождении микрофона на улице, в местах большого скопления людей, при выполнении бойцом спецназа боевого задания, в том числе находясь в перестрелке. Особенно актуальной задача получения разборчивого речевого сигнала становится в условиях повышенных акустических шумов (соизмеримых или даже превышающих по величине полезный звуковой сигнал) в аппаратуре связи и оповещения. Например: кабина пилота самолёта, в гусеничном транспорте, устройствах связи в условиях интенсивного городского шума, диспетчерская связь в условиях промышленного шума и т.д. Не правильно понятая или не расслышанная речь в определенных ситуациях может стоить жизни людей (в военной технике, авиации) либо привести к материальному ущербу (на производстве, строительстве).

На данный момент создано множество устройств, позволяющих повысить разборчивость речи в электрической части звукового тракта путем различных методов обработки сигнала. Например, наиболее распространенный метод повышения разборчивости речи заключается в применении различных электронных (как аналоговых, так и цифровых) шумоподавителей. Если такие устройства и позволяют отчасти решить проблему, то они имеют очень высокую стоимость, которая неприемлема для массового использования.

Микрофоны, используемые в современных противошумных гарнитурах, имеют самые разнообразные характеристики направленности и частотный диапазон. Универсальных высококачественных противошумных микрофонов с оптимальными характеристиками под всевозможные условия эксплуатации на данный момент практически не существует, во многом потому, что не выработано оптимальных критериев проектирования шумозащищенных микрофонов.

Объект исследования: направленные речевые микрофоны ближнего действия.

Целью работы является повышение эффективности выделения полезного речевого сигнала на фоне акустического шума высокого уровня путем оптимизации электроакустических характеристик речевых микрофонов.

Задачи диссертации:

- анализ технических характеристик существующих микрофонов, предназначенных для эксплуатации в повышенной шумовой обстановке;

- анализ существующих методов и принципов выделения полезного речевого сигнала на фоне шума;

- анализ спектральных характеристик акустических шумов. в условиях наиболее вероятного использования речевых микрофонов;

- разработка методики оценки эффективности шумозащищенности микрофона на основе существующих методов прогнозной оценки разборчивости речи;

- теоретические и экспериментальные исследования влияния типа характеристики направленности и частотной характеристики чувствительности микрофона на его шумозащищенность и разборчивость речи на его выходе;

- показ принципиальной возможности реализации шумозащищенного микрофона с оптимизированными параметрами.

Методы исследования. При решении поставленных задач применялись методы спектрального анализа, теории приближенных функций, методы математического моделирования, формантный метод прогноза разборчивости речи, метод артикуляционных испытаний, метод проектирования одномембранных конденсаторных микрофонов.

Научная новизна диссертационной работы состоит в следующем:

1) адаптированы формантные методики по оценке разборчивости речи М.А. Сапожкова и Н.Б. Покровского для расчета разборчивости по известным спектральным распределениям шума и речи в стандартных октавных и третьоктавных полосах;

2) показано, что розовый шум, наряду с равномерно маскирующим шумом, имеет наиболее сильный маскирующий эффект для речевого сигнала;

3) введено и обосновано новое понятие: «коэффициент повышения разборчивости» шумозащищенного микрофона, пропорциональный повышению слоговой разборчивости речи при использовании микрофона с любой частотно-пространственной характеристикой;

4) обоснована целесообразность применения микрофонов ближнего действия с «суперкардиоидной» характеристикой направленности, в качестве универсальной и оптимальной по шумозащищенности и величине повышения разборчивости речи в условиях повышенного акустического шума практически любого спектра.

Методологические и теоретические основы исследования составили научные труды отечественных и зарубежных ученых в области прикладной акустики - Иофе В.К., Сапожков М.А., Вахитов Я.Ш., Вахитов Ш.Я., а также в области речеобразования и теории разборчивости речи: Коллард Д., Покровский Н.Б.

Практическая значимость работы заключается в следующем:

1) Показано, что для предварительной оценки шумозащищенности микрофонов и звукового тракта в целом наиболее сильным маскирующим сигналом является равномерно маскирующий шум, а также «розовый» шум.

2) Адаптирована формантная методика оценки разборчивости речи для стандартных октавных и третьоктавных полос, что дает возможность использования стандартизованной аппаратуры (шумомеров, спектро-

анализаторов) в условиях измерений разборчивости речи на фоне реальных шумов, что ранее не было возможно.

3) Коррекция известной ранее методики проектирования микрофонов, основанная на разработанных в диссертации критериях, позволяет применять её при разработке шумозащищенных микрофонов ближнего действия.

Научные положения, выносимые на защиту:

1) доработанные в диссертации методики расчета разборчивости речи М.А. Сапожкова и Н.Б. Покровского справедливы для расчета и измерений в стандартных октавных и третьоктавных полосах с помощью аттестованной аппаратуры;

2) обоснован новый критерий оценки качества шумозащищенного микрофона - «коэффициент повышения разборчивости», величина которого пропорциональна повышению слоговой разборчивости речи при использовании микрофона?любой частотно-пространственной характеристикой;

3) тип характеристики направленности «суперкардиоида» является оптимальной по критериям шумозащищенности и разборчивости речи для микрофонов ближнего действия;

4) показано, что наиболее сильным маскирующим эффектом для речевого сигнала обладает, наряду с равномерно маскирующим, «розовый» шум.

Реализация результатов. Материалы диссертационной работы использовались в Федеральном государственном казенном учреждении «Войсковая часть 45187» при выполнении трех научно-исследовательских работ по гособоронзаказу. Имеется соответствующий акт внедрения.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались в двух сообщениях на научно-технических конференциях Санкт-Петербургского государственного университета кино и телевидения в 2009-2010 гг.

Публикации. Основные результаты проведенных исследований опубликованы в 5 печатных работах, из них - 2 статьи в рецензированных

журналах из списка ВАК.

Структура и объём работы. Диссертация содержит введение, основной текст из четырех глав, заключение, список литературы из 32 наименований. Объем основного текста с введением и заключением составляет 111 страниц, включая 52 рисунка на 50 страницах и 38 таблиц на 34 страницах.

II СОДЕРЖАНИЕ

Во введении обоснована актуальность темы исследования, сформулирована цель и задачи работы, приведено краткое содержание.

Глава I посвящена аналитическому обзору существующих способов повышения разборчивости речи на фоне помех.

В параграфе 1.1 рассмотрены акустические способы повышения разборчивости при помощи различных гарнитур головного ношения. Повышение отношения сигнал шум достигается за счет близкого расположения направленного микрофона ко рту говорящего. В параграфе рассмотрены

технические характеристики используемых микрофонов в шумозащищенных гарнитурах таких фирм, как David Clark (военная сфера, гражданская авиация), Sennheiser (авиадиспетчерская связь, гражданская авиация, теле-радиостудии), ЗМ Peltor и Flightcom. Также в параграфе 1.1 рассмотрены современные ларингофоны.

В параграфе 1.2 рассмотрен способ повышения разборчивости речи при помощи амплитудного ограничения сигнала. Повышение разборчивости достигается за счет выравнивания по амплитуде всех частотных компонент.

В параграфе 1.3 рассмотрен способ повышения разборчивости речи при помощи цифровой обработки сигналов. Рассмотрены принципы коррекции зашумленных сигналов методами винеровской и двухканальной адаптивной фильтрации. Также проанализированы технические характеристики программно-аппаратного комплекса шумоочистки на основе цифровой обработки сигналов, разработанного «Центром речевых технологий» («ЦРТ», Россия) «Sound Cleaner» и устройства «Золушка-микро-З».

Параграф 1.4 посвящен выводам по аналитическому обзору. Способы амплитудного ограничения и цифровой обработки подразумевают собой преобразование исходного сигнала, что в итоге приводит к неминуемым его искажениям. Это проявляется в искажении тембра голоса, потере узнаваемости, появлении побочных шумов. Кроме того, реализация этих способов повышения разборчивости в конкретных устройствах весьма трудоемка и требует значительных материальных затрат.

Повышение разборчивости речи на фоне шумов акустическим способом, т.е. за счет оптимизации параметров первого элемента звукового тракта -микрофона, является наиболее рациональным и экономически выгодным с точки зрения построения шумозащищенных систем и простым в реализации, т.к. не требует дополнительных обрабатывающих сигнал устройств. Применение шумостойких микрофонов не приводит к значительным искажениям и преобразованиям исходного речевого сигнала. Поэтому данный способ повышения разборчивости является наиболее востребованным на сегодняшний день.

Существующие противошумные гарнитуры имеют самый различный диапазон частот и характеристики направленности используемых в них микрофонов. Выбор тех или иных параметров микрофонов порой не всегда обоснован и не существует универсального шумозащищенного микрофона с оптимальными параметрами для разнообразных условий эксплуатации.

В ходе критического обзора также был поставлен вопрос оценки качества речевой информации на выходе шумозащищенного микрофона. Обозначена необходимость разработки методики прогнозной оценки разборчивости речи на выходе шумозащищенного микрофона с теми или иными характеристиками.

Глава II посвящена разработке методики прогнозной оценки разборчивости речи на выходе шумозащищенного микрофона, экспериментальной проверке разработанной методики.

В параграфе 2.1 рассматриваются существующие методы оценки разборчивости речи и определяется задача их доработки. Подробно изложены

особенности метода артикуляционных испытаний и формантных методов по версиям Н.Б. Покровского и М.А. Сапожкова. Методы, учитывающие влияние реверберационной помехи, не рассматривались в работе, так как было выявлено, что при минимально возможном фонде поглощения помещения минимальный радиус гулкости (на частоте 125 Гц) составляет 0,12 м, что в 5-12 раз превышает предполагаемое в эксплуатации расстояние расположения шумозащищенного микрофона от рта говорящего (0,01-0,05 м). Это говорит о значительном преобладании прямой составляющей над диффузной в данных условиях эксплуатации микрофона.

Метод артикуляционных испытаний является методом прямых измерений разборчивости речи, все остальные методы являются косвенными. Поэтому метод артикуляционных испытаний - единственный метод, с помощью которого можно проверить другие методики расчета и измерения разборчивости речи на объективность полученных результатов. Основной недостаток метода артикуляции - процедура измерений требует значительных затрат временных и человеческих ресурсов.

Формантные методы позволяют оценить разборчивость речи по известным спектральным распределениям речи и шумов. При этом авторы методик предлагают проводить расчет в равноартикуляционных полосах, что требует представления спектров речи и шумов в этих частотных полосах неодинаковой и нерегулярной ширины. При этом, ширина равноартикуляционных полос различна у авторов методик. Также авторы методик по-разному трактуют величину отношения сигнал-шум. Все это приводит к тому, что результаты расчета формантной разборчивости речи по методикам М.А. Сапожкова и Н.Б. Покровского значительно отличаются.

Полосы равной разборчивости являются неодинаковыми по ширине, что доставляет определенные неудобства при практическом применении формантного метода. Все шумомеры, с помощью которых измеряют спектры акустических шумов, производят измерения в стандартных октавных или третьоктавных полосах. Это делает невозможным перевод значений уровней, полученных в стандартных полосах, в значения уровней шумов в полосах равной разборчивости и ставит под вопрос практическую применимость существующих отечественных формантных методов. Поэтому целесообразно доработать методики М.А. Сапожкова и Н.Б. Покровского применительно к стандартным частотным полосам и провести экспериментальную проверку доработанной методики методом артикуляционных испытаний.

Параграф 2.2 посвящен доработке методик М.А. Сапожкова и Н.Б. Покровского применительно к стандартным октавным и третьоктавным полосам. При допущении, что характеристики коэффициентов разборчивости и коэффициентов восприятия от уровня ощущения формант не зависят от частотной полосы, формулы для вычисления формантной разборчивости А

преобразуются к виду:

для методики Н.Б. Покровского:

А=^Р(Е])-&р1, (1)

м

где Р{Е]) - коэффициент восприятия, Е] - уровень ощущения формант по Н.Б. Покровскому в г'-й октавной (третьоктавной) полосе, Ар, - весовой коэффициент в г'-й октавной (третьоктавной) полосе, п - число полос, для методики М.А. Сапожкова:

, (2)

ы

где т(Е1) - коэффициент разборчивости, Е, - уровень ощущения формант по М.А. Сапожкову в г'-й октавной (третьоктавной) полосе, Ар: — весовой коэффициент в г'-й октавной (третьоктавной) полосе, п - число полос. При этом для выражений (1) и (2) должно выполняться условие:

2>,= 1-

/-1

Данное преобразование позволяет осуществить расчет зависимости формантной разборчивости речи А (при отсутствии шума) от ширины частотной полосы/ полученной Н.Б. Покровским (рисунок 1).

0.8 0,6 0,4 0,2 0

100 1000 Частота, Гц 10000

Рисунок 1 - Формантная разборчивость в зависимости от ширины частотного диапазона Весовой коэффициент в г'-й полосе будет вычисляться как:

^pl = ]Adf=A{fв)-A{f„), (3)

где /„_ - верхняя граничная частота г'-й полосы частот, - нижняя граничная частота г'-й полосы частот.

Таким образом были вычислены весовые коэффициенты в границах стандартных октавных и третьоктавных полос частот, частотное распределение которых представлено графически на рисунках 2-3.

А

9 o.i S

I 0,06 I 0,04

I °'0! 0

Я

к

/ \

✓ \

i

p 0,25

I

«■ 0,15

S 0.«

\

V

\

250 500 1000

125 250 500 1000 2000 4000 8000 Частота, Гц

Рисунок 3 - Весовые коэффициенты Др в октавных полосах

Частота, Гц

Рисунок 2 - Весовые коэффициенты Др в третьоктавных полосах

Паратраф 2.3 посвящен экспериментальной проверке доработанных методик Н.Б. Покровского и МЛ. Сапожкова. Цель проверки - сопоставление рассчитанных значений слоговой разборчивости по доработанным методикам Н.Б. Покровского и М.А. Сапожкова с результатами артикуляционных испытаний.

Сначала была рассчитана слоговая разборчивость речи по двум доработанным методикам при маскировке речи «розовым» шумом при соотношениях сигнал-шум 9 и 3 дБ в диапазоне частот 125-8000 Гц.

Для проверки полученных результатов был поставлен эксперимент с привлечением артикуляционной бригады. В эксперименте определялась слоговая разборчивость методом артикуляционных испытаний по слоговым таблицам согласно ГОСТ Р 50840-95.

Записанные фонограммы микшировались с «розовым» шумом с соотношением сигнал-шум 3 и 9 дБ с поправкой на паузы. После обработки слоговые таблицы прослушивались аудиторами.

Результаты испытаний представлены в таблице 1.

Таблица 1 - Результаты артикуляционных испытаний

Отношение сигнал-шум 9 дБ

Слоговая разборчивость, % Мужчины Женщины

Диктор 1 Диктор 2 Диктор 3 Диктор 4 Диктор 5 Диктор б

Средн. по диктору 62 65 64 77 73 76

Средн. по всем дикторам 70

Отношение сигнал-шум 3 дБ

Слоговая разборчивость, % Мужчины Женщины

Диктор 1 Диктор 2 Диктор 3 Диктор 4 Диктор 5 Диктор 6

Средн. по диктору 35 33 37 48 42 44

Средн. по всем дикторам 40

В таблице 2 приведено сопоставление результатов расчета слоговой разборчивости по доработанным методикам Н.Б. Покровского и М.А. Сапожкова с результатами артикуляционных испытаний.

Таблица 2 - Сопоставление результатов расчета и эксперимента

Отношение сигнал-шум 9 дБ 3 дБ

Расчет по доработанной методике Н.Б. Покровского 66 39

Расчет по доработанной методике М.А. Сапожкова 62 32

Артикуляционные испытания 70 40

Рассчитанные значения слоговой разборчивости по доработанной методике Н.Б. Покровского более близки к результатам артикуляционных испытаний. Поэтому доработанная методика Н.Б. Покровского выбрана как наиболее пригодная для прогноза результатов работы.

Здесь следует отметить интересный побочный результат, полученный в ходе проведения артикуляционных испытаний (побочный в том, что он не имеет прямого отношения к теме диссертации). Слоговая разборчивость при маскировке речи широкополосными шумами у дикторов-женщин (см. таблицу 1) устойчиво (в среднем в 1,1-1,4 раза) превышает слоговую разборчивость дикторов-мужчин. Очевидно, это можно объяснить тем, что как максимум энергетического спектра женской речи, так и, по-видимому, формантные частоты сдвинуты по сравнению с мужскими голосами в более высокочастотную область, т.е. ближе к области максимальной чувствительности слуха. Представляется, что это обстоятельство должно учитываться при подборе (где это возможно) персонала, например, в диспетчерской связи, системах оповещения при работе в шумных помещениях.

Глава III посвящена выработке технических требований к шумозащищенному микрофону, выбору оптимальных параметров, определяющих его шумозащищенность - характеристики направленности и формы частотной характеристики чувствительности.

В первую очередь для проведения оценочных расчетов разборчивости речи в заданных условиях необходимо было определить частотное распределение спектральной плотности шума, при котором его маскирующее действие на речь максимально. С этой целью был проведен расчет слоговой разборчивости речи по разработанной ранее методике в условиях маскировки речи шумами с теоретическим распределением спектральной плотности -«белым», «розовым» и равномерно маскирующим при различном соотношении сигнал-шум.

В параграфе 3.1 изложен алгоритм расчета слоговой разборчивости в, %, при соотношениях сигнал-шум в диапазоне от минус 10 до плюс 15 дБ. Полученная зависимость слоговой разборчивости от отношения сигнал-шум для 3-х типов шумов приведена на рисунке 4.

|-100- Отличная -Белый шум - — Розовый шум - - - - Равномерно маскирующий шум - -х- - граница отличной понятности речи —«- - граница плохой понятности речи

понятн эсть речи

х,*

г-ж —

Плохая ятность ре

—0- поп чи Отношение '

-10 -8 -6 -4 -2 О 2 4 6 8 10 12 14 сигнал/шум, дБ

Рисунок 4 - Зависимость слоговой разборчивости от отношения сигнал-шум

Из полученной зависимости слоговой разборчивости от отношения сигнал-шум сделаны следующие выводы:

1) Наибольшее маскирующее воздействие на речевой сигнал оказывает равномерно маскирующий шум. Маскирующее действие «розового» шума отличается от него на 0-1 дБ.

2) Отличная понятность речи достигается при слоговой разборчивости не менее 80%, что соответствует отношению сигнал-шум более 14 дБ при маскировке речи шумов с любым из рассмотренных в работе спектральным распределением.

3)Предельно допустимая понятность речи достигается при значении слоговой разборчивости не менее 25% по шкале качества речи Н.Б. Покровского, что соответствует отношению сигнал-шум не менее 0,5 дБ для всех рассмотренных в данном разделе шумах.

Также в параграфе 3.1 было показано, что маскирующее воздействие на речь равномерно маскирующего шума максимально по сравнению с маскирующим действием шумов с любым иным распределением спектральной плотности на примере реальных шумов.

В оценочном расчете были использованы следующие спектры шумов:

- шумы, создаваемые в условиях крейсерского полета в кабинах экипажа

отечественных самолетов и вертолетов гражданской авиации;

- шумы в производственных помещениях и машинах;

- шумы ручных машин.

Параграф 3.2 посвящен обоснованию выбора оптимальной характеристики направленности микрофона по критериям шумозащищенности и разборчивости речи.

В параграфе произведены расчеты средних индексов шумозащищенности микрофонов Лг„оч,, по формуле (4) в диапазоне частот 125-8000 Гц для четырех типов характеристики направленности в условиях диффузного распределения шума вокруг микрофона с учетом влияния ближней зоны (см. таблицу 3).

мш,.срл =20%-

■ 4п

где Мсф - чувствительность микрофона в ближнем поле в /-Й третьоктавной полосе, - чувствительность микрофона в поле плоской волны в 2-й третьоктавной полосе, О - коэффициент направленности, п - число третьоктавных полос.

Таблица 3 - Средние индексы шумозащищенности в условиях диффузного шума на различных расстояниях от рта, дБ

Л, м «Кардиоида» «Восьмерка» «Суперкардиоида» «Гиперкардиоида »

0,050 9,1 13,1 11,1 12,5

0,025 13,1 18,1 15,5 17,2

0,010 19,9 25,6 22,6 24,5

Ранее считалось, что параметр качества шумозащищенных микрофонов -индекс шумозащищенности - являлся основным. Однако он не является достаточным, т.к. в расчет не принималась величина повышения разборчивости речи за счет повышения чувствительности микрофона в низкочастотной области рабочего диапазона.

Для оценки влияния типа характеристики направленности разрабатываемого микрофона на разборчивость речи было выдвинуто предположение, что величина повышения формантной разборчивости в 1-й полосе частот прямо пропорциональна произведению коэффициента шумозащищенности микрофона на весовой коэффициент в /-й полосе Др,-.

С этой целью был введен коэффициент повышения разборчивости речи Кпр, показывающий увеличение вероятности появления формант Ар в частотных полосах при использовании направленного микрофона в ближней зоне по отношению к дальней:

м.

сф,

4а,

(5)

где Мсф{ - чувствительность микрофона в ближнем поле в г-й третьоктавной полосе, Мщ- чувствительность микрофона в дальнем поле в ¡-й третьоктавной полосе, - коэффициент направленности.

Также был введен интегральный коэффициент повышения разборчивости речи К„рТ, показывающий степень повышения разборчивости во всем рабочем диапазоне частот:

КпРТ =ЦКпГ, ■ (6)

¡=1

Результаты расчета интегрального коэффициента повышения разборчивости на расстояниях 0,05,0,025 и 0,01 м от рта приведены в таблице 4.

Таблица 4 - Интегральный коэффициент повышения разборчивости на различных расстояниях от рта в условиях диффузного шума

«Кардиоида» «Восьмерка» «Суперкардиоида» «Гиперкардиоида»

0,050 2,07 2,67 2,45 2,72

0,025 2,67 4,12 3,35 3.89

0,010 4,90 8,98 6,55 1 7,98

Из результатов расчетов сделан вывод, что наибольший вклад в повышение разборчивости речи в условиях диффузного шума вносит микрофон с характеристикой направленности «восьмерка» практически на всех исследуемых расстояниях от рта.

Далее была доказана справедливость введения коэффициента повышения разборчивости посредством прямого расчета слоговой разборчивости речи при маскировке равномерно маскирующим шумом с учетом величин шумоподавления рассмотренными направленными микрофонами.

Величина повышения слоговой разборчивости при использовании направленного микрофона в ближней зоне при заданном отношении сигнал-шум:

Д5 = 5и-50,%, (7)

где - слоговая разборчивость на выходе направленного микрофона в ближней зоне, - слоговая разборчивость на выходе направленного микрофона в поле плоской волны.

Был произведен расчет слоговой разборчивости речи Б0 и Бм при отношениях сигнал-шум от минус 10 до плюс 10 дБ с шагом 5 дБ по доработанной методике Н.Б. Покровского. Результаты расчетов приведены графически в виде зависимостей величины повышения слоговой разборчивости от отношения сигнал-шум при маскировке речи равномерно маскирующим шумом (рисунок 5).

Повышение слоговой разборчивости ¿8, %

Повышение слоговой разборчивости ДЭ, %

-40-

Уу7

N

-10-

- кардиоида

- восьмерка

- суперкард иоида

- гиперкард иоида

-10 -5 0 5 10

Отношение сигнал/шум, дБ

Расстояние от рта 5 см

Повышение слоговой разборчивости ДБ, %

-70--

>->

-10-

-восьмерка

- суперкарл оида

- гиперкардр сида

-50—1 -

—и

-Г7

V ^

/ / -20-

/ -15— -10-

- кардиоида

- восьмерка

- суперкардо овда

-гигеркардг оцда

Отношение сигнал/шум, дБ

Расстояние от рта 2,5 см

-10 -! О 5 10

Отношение сипн;ь'шум, дБ

Расстояние от рта 1 см

Рисунок 5 - Величина повышения слоговой разборчивости при использовании направленных микрофонов в условиях диффузно распределенного шума

Проведенные исследования показали, что введенный ранее интегральный коэффициент повышения разборчивости прямо пропорционален фактической величине повышения слоговой разборчивости и полученные результаты подтверждают выдвинутое ранее предположение.

Полученную оценку шумозащищенности микрофона нельзя считать достаточной, т.к. коэффициент направленности микрофона £1 определяется в условиях чисто диффузного поля шумов. Однако равномерное распределение акустических помех вокруг микрофона, особенно ближнего действия, на практике встречается крайне редко. Зачастую приходится сталкиваться с источником акустических помех, расположенным в задней полусфере относительно микрофона. Даже при чисто диффузном распределении источников шума при расположении микрофона вблизи головы происходит экранировка источников шума из передней полусферы.

Величина ослабления шума головой Д£)Ч, определяется как

ДБ, (8)

где Х0 - уровень звукового давления в отсутствии экранировки, ¿зхр — уровень звукового давления за головой.

Измеренные в звукомерной заглушённой камере величины экранировки головой в диапазоне частот 125-8000 Гц при расположении микрофона на расстоянии 10 и 50 мм от рта представлены на рисунке 6.

Величина экранировки шума головой ДЬэкр, дБ 25

/

10 и 1М /

$0 мм

125 200 315 500 800 1250 2000 3150 5000 8000 Частота, Гц

Рисунок 6 - Величина подавления шума головой за счет дифракции

В частотном диапазоне 125-500 Гц экранировка шума головой выражена крайне слабо из-за дифракции звуковых волн. Средняя величина подавления шума в этом диапазоне составляет 0,6 дБ. В диапазоне частот 630-8000 Гц величина ослабления шума головой весьма существенна и этот факт необходимо учитывать при выборе оптимальной характеристики направленности шумозащищенного микрофона. Средняя величина подавления шума в диапазоне 630-8000 Гц составила 5,7 дБ на расстоянии 10 мм от рта и 3,2 дБ на расстоянии 50 мм. Таким образом, общая энергия шума в передней полусфере, принимаемая ненаправленным микрофоном вблизи рта, уменьшилась примерно в 2-4 раза за счет экранирующего действия головы.

Так как в диапазоне частот 125-500 Гц экранировки шума головой практически не происходит, то шумозащищенность микрофона в этом диапазоне должна определяться в условиях диффузного шума, т.е. коэффициентом направленности О по формуле (4).

Индекс шумозащищенности в диапазоне частот 630-8000 Гц целесообразно оценить используя отношение коэффициентов направленности в передней и задней полусферах С1фт. Величина Пфт физически показывает степень подавления шумов из задней полусферы по сравнению с полезным сигналом из передней полусферы микрофона, т.е. при условии, что уровень полезного сигнала в передней полусфере существенно преобладает над уровнем шума. В данном диапазоне частот индекс шумозащищенности будет определяться как

N..

шз.ср.1

= 2018-

м..

(9)

где Мсф - чувствительность микрофона в ближнем поле в 1-й третьоктавной полосе, М - чувствительность микрофона в дальнем поле в 1-й третьоктавной полосе, Пф„- отношение коэффициентов направленности в передней и задней полусферах, п - число полос.

Рассчитанные индексы шумозащищенности приведены в таблице 5.

Таблица 5 - Средние индексы шумозащищенности в условиях распределения шума в заднем полупространстве на различных расстояниях микрофона от рта, дБ

Характеристика направленности «Кардиоида» «Восьмерка» «Суперкардиоида» «Гиперкардиоида»

Расстояние от рта, м 0,05

Л^ср, дБ (125-500 Гц) 13,2 18,6 15,7 17,5

•Матер., ДБ (630-8000Гц) 9,3 2,0 12,6 9,5

Расстояние от рта, ы 0,025

Л^су, дБ (125-500 Гц) 18,6 24,4 21,4 23,2

дБ (630-8000Гц) 10,6 4,8 14,4 11,7

Расстояние от рта, м 0,01

Кшз.сР, дБ (125-500 Гц) 26,4 32,4 29,2 31,1

Миз.сР„ дБ (630-8000Гц) 14,7 10,9 19,2 17,0

Используя полученные частотные зависимости индекса шумозащищенности, также были рассчитаны интегральные коэффициенты повышения разборчивости для 4-х типов характеристики направленности микрофона. Результаты расчета сведены в таблицу 6.

Таблица 6 - Интегральный коэффициент повышения разборчивости КПрЕ на различных расстояниях от рта в условиях распределения шума в заднем полупространстве

Я, м «Кардиоида» «Восьмерка» «Суперкардиоида» «Гиперкардиоида»

0,050 3,0 1,9 43 3,3

0,025 3,7 зд 5,5 4,6

0,010 6,5 6,9 10,3 9,3

Из приведенных выше результатов расчетов можно сделать вывод, что наилучшие показатели индексов шумозащищенности и коэффициентов повышения разборчивости у микрофона, обладающего «суперкардиоидной» характеристикой направленности с учетом экранировки шума головой на всех исследуемых расстояниях от рта.

Также как и в предыдущем варианте распределения шума для проверки полученных коэффициентов повышения разборчивости был произведен прямой расчет слоговой разборчивости при маскировке речи равномерно маскирующим шумом с учетом полученных величин шумоподавления. Результаты расчетов представлены графически в виде зависимостей величины повышения слоговой разборчивости от отношения сигнал-шум (рисунок 7).

Повышение слоговой разборчивости ДЭ, %

Повышение слоговой разборчивости ДБ, %

-0-

Отношение сигнал/шум, дБ

Расстояние от рта 5 см

Повышение слоговой разборчивости ДБ, %

Отношение сигнал/шум, дБ

Расстояние от рта 2,5 см

Отношение сигтал/шум, дБ

Расстояние от рта 1 см

Рисунок 7 - Величина повышения слоговой разборчивости при использовании направленных микрофонов в условиях распределения шума преимущественно в заднем полупространстве

Данные расчеты также исчерпывающе показали, что введенный коэффициент повышения разборчивости прямо пропорционален фактической величине повышения слоговой разборчивости и полученные результаты полностью согласуются со значениями суммарных коэффициентов повышения разборчивости из таблицы 6.

Параграф 3.3 посвящен экспериментальным исследованиям по выбору оптимальной формы частотной характеристики чувствительности шумозащищенного микрофона.

Основным методом исследования здесь является метод артикуляционных испытаний. Кроме основного критерия - разборчивость речи - в испытаниях также учитывалась комфортность приема речи, утомляемость операторов.

Как известно из теории радиотехники, любой линейный тракт передачи информации в идеале должен иметь частотнонезависимую амплитудно-частотную и линейную фазо-частотную характеристики. Однако для речевых трактов критерии оптимума передачи сигналов могут быть иными. В большей степени это касается формы амплитудно-частотной характеристики (АЧХ) тракта. Так,М.А. Сапожков в своих работах принимает за оптимальную форму АЧХ речевого тракта АЧХ, возрастающую с крутизной 6 дБ/октаву в сторону верхних частот. В работах автора утверждается, что такая форма АЧХ способствует улучшению качества звучания речи и даже приводит к повышению её разборчивости в условиях шума. Однако, к сожалению, ни в

одной из своих работ М.А. Сапожков не приводит никаких цифр о величине повышения разборчивости речи на фоне помех при данной форме АЧХ тракта.

В диссертационной работе была поставлена задача определения величины повышения разборчивости на выходе речевого тракта, имеющего форму АЧХ, возрастающую с крутизной 6 дБ/октаву в сторону верхних частот до 1250 Гц (рисунок 8, кривая 2), по сравнению с таким же трактом, имеющим частотнонезависимую АЧХ (рисунок 8, кривая 1).

в, дБ

200 1250 8000 " £Гц

Рисунок 8 - АЧХ испытуемого тракта

К тому же такая тенденция АЧХ близка к тенденции АЧХ направленных микрофонов для современных систем звукоусиления речи в условиях шума. Наклон частотной характеристики с тенденцией б дБ/октаву до предельной частоты 1250 Гц выбран из тех соображений, что дальнейшее возрастание коэффициента передачи фильтра с частотой в условиях шума приводит к субъективному дискомфорту слушателя принимаемой речевой информации, т.к. высокочастотные составляющие начинают сильно превалировать над низкочастотными и приходится напрягать слух, а также с увеличением времени слушания происходит явное ухудшение разборчивости.

Для проверки выдвинутого предположения, что тенденция АЧХ тракта 6 дБ/октаву будет иметь выигрыш по величине разборчивости, был поставлен эксперимент с привлечением артикуляционной бригады. В эксперименте определялась слоговая разборчивость методом артикуляционных испытаний по слоговым таблицам согласно ГОСТ Р 50840-95. Фонограммы слоговых таблиц микшировались с «розовым» шумом с соотношением сигнал-шум 3 и 9 дБ. Подробное описание эксперимента изложено в диссертации.

В таблицах 7-8 приведены результаты эксперимента.

Без фильтра

Слоговая разборчивость Мужчины Женщины

Диктор 1 Диктор 2 Диктор 3 Диктор 4 Диктор 5 Диктор б

Ср. по диктору 35 33 37 48 42 44

Ср. по всем дикторам 40

С фильтром

Слоговая разборчивость Мужчины Женщины

Диктор 1 Диктор 2 Диктор 3 Диктор 4 Диктор 5 Диктор 6

Ср. по диктору 42 39 38 51 45 46

Ср. по всем дикторам 44

Таблица 8 - Слоговая разборчивость речи при соотношении сигнал-шум 9 дБ, %

Слоговая разборчивость

Ср. по диктору

Ср. по всем дикторам

Вез фильтра

Мужчины

Диктор 1

62

Диктор 2

65

Диктор 3

64

Женщины

Диктор 4

77

Диктор 5

73

Диктор 6

76

70

Слоговая разборчивость

tCp. по диктору Ср. по всем дикторам

С фильтром

Мужчины

Диктор 1 Диктор 2

64

67

Диктор 3

65

Женщины

Диктор 4

79

Диктор 5

75

70

Диктор 6

71

При соотношении сигнал-шум 3 дБ выявлено незначительное повышение слоговой разборчивости речи с применением фильтра с крутизной частотной характеристики б дБ/октаву, как по разборчивости каждого диктора в отдельности, так и по средней разборчивости по всем дикторам на 4 % (с 40 до 44 %). При соотношении сигнал-шум 9 дБ повышения разборчивости речи с использованием фильтра не выявлено. Слоговая разборчивость в тракте без фильтра и с фильтром составила в среднем 70 %.

Адекватность полученных результатов подтверждается расчетными значениями разборчивости речи по доработанной нами методике Н.Б. Покровского. При соотношении сигнал-шум 3 дБ расчетная слоговая разборчивость речи составляет 37 %, экспериментальная по всем дикторам -40 %. При соотношении сигнал-шум 9 дБ расчетная слоговая разборчивость составляет 64 %, экспериментальная по всем дикторам - 70 %.

Повышение разборчивости речи при соотношении сигнал-шум 3 дБ совершенно несущественно и едва будет заметно в разговорной речи, т.к., например, словесная разборчивость в этом случае увеличится на 2 %, а фразовая на 1 %. Однако аудиторами было отмечено субъективное повышение комфортности звучания зашумленных слоговых таблиц при использовании фильтра с крутизной 6 дБ/октаву в сторону верхних частот от 125 до 1250 Гц. Это может быть объяснено эффектом маскировки высокочастотных составляющих спектра речевого сигнала, имеющих малый уровень, низкочастотными, имеющими более высокий уровень по сравнению с высокочастотными. Применение фильтра позволяет «выровнять» спектр речевого сигнала, что приводит к более комфортному восприятию речевой информации, слушатель воспринимает зашумленную речь с меньшим напряжением. Поэтому такая форма частотной характеристики чувствительности принята за оптимальную в условиях повышенного акустического шума.

Основные выводы по главе III:

1) Тип характеристики направленности микрофона «суперкардиоида» является оптимальной по критериям шумозащищенности и разборчивости речи при условии распределения шума преимущественно в заднем полупространстве

относительно акустической оси микрофона.

2) Форма частотной характеристики чувствительности шумозащищенного микрофона, возрастающая с крутизной б дБ/октаву в сторону верхних частот от 125 до 1250 Гц. и имеющая плоскую характеристику в диапазоне 1250-8000 Гц, обеспечивает наилучшую комфортность восприятия зашумленной речи, а также наименьшую утомляемость операторов.

В главе IV показана принципиальная возможность конструктивной реализации миниатюрного шумозащищенного микрофона электретного типа. Был произведен расчет всех конструктивных, акустико-механических и электроакустических характеристик капсюля. Согласно нашим требованиям микрофон должен был иметь характеристику направленности «суперкардиоида» в рабочем диапазоне частот 125-8000 Гц. Общая неравномерность частотной характеристики чувствительности в номинальном диапазоне частот на рабочих расстояниях 25-50 мм не более 9 дБ. Диаметр капсюля - 8 мм.

Основная идея в проектировании микрофона данного типа заключалась в компенсации подъема частотной характеристики чувствительности на рабочих расстояниях до заданной в техническом задании величины с сохранением формы частотной характеристики спадающей к нижним частотам. При этом необходимо было обеспечить требуемую направленность в рабочем диапазоне частот.

Частотные характеристики величины подъема чувствительности М, дБ, на рабочих расстояниях (Я/=25 мм и Л2=50 мм) приведены на рисунке 9.

я

Частота, Гц

Рисунок 9 - Величина подъема чувствительности микрофона на рабочих расстояниях

Компенсацию подъема чувствительности в диапазоне нижних частот удалось реализовать за счет подбора гибкости мембраны, обеспечивающей значение первой резонансной частоты мембраны, превышающее опорную частоту более чем в 2 раза. При значении опорной частоты 8000 Гц значение резонансной частоты мембраны составило 17120 Гц.

Частотная характеристика чувствительности разработанного капсюля в поле плоской волны дБ, и итоговые частотные характеристики чувствительности на рабочих расстояниях приведены на рисунках 10 и 11 соответственно.

Рисунок 10 - Неравномерность чувствительности микрофона в поле плоской волны

¡2 £

1С 5 С -5 -10

-Чм

-111=25 мы 112=50 мм

1000

10000

Частота, Гц

Рисунок 11 - Неравномерность чувствительности микрофона на рабочих расстояниях и

Подробная последовательность расчета всех параметров капсюля микрофона изложена в диссертации. Разработанный шумозащищенный микрофон можно использовать в составе головных гарнитур.

В заключении сформулированы основные результаты проведенных исследований, которые состоят в следующем:

1. Для прогнозной оценки разборчивости речи на выходе шумозащищенного микрофона достаточно ограничиться формантными методами, т.к.; во-первых, реверберационная помеха не оказывает влияния на разборчивость при расположении направленного микрофона на расстоянии 0,01-0,05 м от рта говорящего, во-вторых, величина прямого сигнала и его отражений в нашем случае существенно меньше величины шума.

2. Существующие формантные методики Н.Б. Покровского и М.А. Сапожкова не позволяют проводить расчет с известной заранее погрешностью с использованием спектров шумов, измеренных стандартизованными приборами в стандартных октавных или третьоктавных полосах, потому эти методики требуют доработки. В результате проделанной нами работы методики Н.Б. Покровского и М.А. Сапожкова адаптированы для измерений и расчета ^ разборчивости речи в стандартных октавных и третьоктавных полосах частот, найдены весовые коэффициенты для полос диапазона 125-8000 Гц.

3. Проведена экспериментальная проверка результатов расчета слоговой разборчивости речи по доработанным нами методикам Н.Б. Покровского и

М.А. Сапожкова посредством метода артикуляционных испытаний. Результаты эксперимента свидетельствуют о хорошем соответствии результатов расчета по доработанной нами методике Н.Б. Покровского результатам, полученные в ходе артикуляционных испытаний.

4. Наибольшее маскирующее воздействие на речевой сигнал оказывают равномерно маскирующий и «розовый» шумы. Маскирующее действие любого реального шума меньше маскирующего действия равномерно маскирующего и «розового» шума. Поэтому стандартный «розовый» шум целесообразно использовать для оценки разборчивости и шумозащищенности.

5. Отличная понятность речи достигается при слоговой разборчивости не менее 80%, что соответствует отношению сигнал/шум более 14 дБ при маскировке речи шумом с любым из рассмотренных в работе спектральным распределением. Предельно допустимая понятность речи достигается при значении слоговой разборчивости не менее 25%, что соответствует отношению сигнал/шум не менее 0,5 дБ как для розового, так и для равномерно маскирующего шумов.

6. Тип характеристики направленности микрофона «восьмерка» является оптимальной по критериям шумозащищенности и разборчивости речи при условии диффузного распределения шума вокруг микрофона.

7. Тип характеристики направленности микрофона «суперкардиоида» является оптимальной по критериям шумозащищенности и разборчивости речи при условии распределения шума в заднем полупространстве относительно акустической оси микрофона.

8. Экспериментально показано, что расположение микрофона вблизи головы на расстоянии 0,01-0,05 м от нее в зашумленной обстановке соответствует условию распределения шума в заднем полупространстве относительно акустической оси микрофона за счет экранирующего действия головы в диапазоне частот 630-8000 Гц.

9. Форма частотной характеристики чувствительности шумозащищенного микрофона, возрастающая с крутизной 6 дБ/октаву в сторону верхних частот от 125 до 1250 Гц и имеющая плоскую характеристику в диапазоне 1250-8000 Гц, обеспечивает наилучшую комфортность восприятия зашумленной речи.

10. Речь дикторов-женщин имеет большую разборчивость по сравнению с речью дикторов-мужчин в одинаковых условиях зашумления, что дает важную информацию с точки зрения выбора соответствующего персонала.

11. Показана принципиальная возможность конструктивной реализации миниатюрного шумозащищенного гарнитурного микрофона электретного типа, соответствующего нашим требованиям. Компенсацию подъема чувствительности в диапазоне нижних частот удалось реализовать за счет подбора первой резонансной частоты мембраны, значительно превышающей верхнюю граничную частоту рабочего диапазона частот.

Публикации соискателя в рецензируемых научных журналах и изданиях:

1. Ю.В. Повинский, Ш.Я. Вахитов. Выбор оптимальной характеристики направленности микрофонов, исходя из шумозащищенности и разборчивости речи // Мир техники кино. 2012. № 23. С. 36-39.

2. Ю.В. Повинский. Оценка влияния места установки акустических систем в помещении на искажения речевого сигнала // Специальная техника, Москва, 2012.

Прочие публикации соискателя:

1. Повинский Ю.В. Расчет разборчивости речи в условиях шума с теоретическим распределением спектральной плотности. // Материалы научных и творческих конференций институтов и факультетов СПбГУКиТ «Неделя науки и творчества - 2009», СПб, 2009, С. 73.

2. Повинский Ю.В. Выбор оптимальных характеристик микрофона для условий сильных акустических шумов исходя из шумозащищенности и разборчивости речи. // Материалы научных и творческих конференций институтов и факультетов СПбГУКиТ «Неделя науки и творчества - 2011», СПб, 2011. С. 26-27.

3. Ю.В. Повинский, Ш.Я. Вахитов. Оптимизация амплитудно-частотной характеристики речевого тракта по критерию разборчивости речи // Сборник статей Международной научно-практической конференции «Наука и образование XXI века»: в 5 ч. Ч.З - Уфа: РИД БашГУ, 2013, С. 284-291.

Подписано в печать 31,10.2013 г. Формат 60x84 1/16. Бумага офсетная. Печ.л.1,0. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ 490.

Подразделение оперативной полиграфии СПбГУКиТ. 192102. Санкт-Петербург, ул. Бухарестская, 22.

Текст работы Повинский, Юрий Владимирович, диссертация по теме Акустические приборы и системы

Санкт-Петербургский Государственный Университет Кино и Телевидения

На правах рукописи

04201454579

Повинский Юрий Владимирович

ОБОСНОВАНИЕ КОМПЛЕКСА ЭЛЕКТРОАКУСТИЧЕСКИХ ХАРАКТЕРИСТИК РЕЧЕВЫХ ГАРНИТУРНЫХ МИКРОФОНОВ ДЛЯ УСЛОВИЙ ПОВЫШЕННЫХ АКУСТИЧЕСКИХ ШУМОВ Специальность 05.11.06 - Акустические приборы и системы

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель: д.т.н., доцент Вахитов Шакир Яшэрович

Санкт-Петербург - 2013

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ....................................................................................................................................................4

1 ОБЗОР СУЩЕСТВУЮЩИХ СПОСОБОВ ПОВЫШЕНИЯ КАЧЕСТВА РЕЧИ НА ФОНЕ ПОМЕХ..............................................................................7

1.1 Акустические способы повышения разборчивости речи......................................7

1.2 Амплитудное ограничение..............................................................................................................13

1.3 Цифровая обработка сигналов......................................................................................................14

1.3.1 Винеровская фильтрация....................................................................................................................15

1.3.2 Адаптивная фильтрация......................................................................................................................17

1.3.3 Программно-аппаратные средства повышения разборчивости речи, основанные на цифровой обработке сигнала..................................................................19

1.4 Выводы по главе........................................................................................................................................22

1.5 Постановка задачи....................................................................................................................................23

2 РАЗРАБОТКА МЕТОДИКИ ПРОГНОЗНОЙ ОЦЕНКИ РАЗБОРЧИВОСТИ РЕЧИ НА ВЫХОДЕ ШУМОЗАЩШЦЕННОГО МИКРОФОНА............................................................................................................................................25

2.1 Анализ существующих методик оценки разборчивости речи............................25

2.1.1 Метод артикуляционных испытаний........................................................................................26

2.1.2 Формантные методы................................................................................................................................28

2.2 Доработка методик Н.Б. Покровского и М.А. Сапожкова..................................38

2.3 Экспериментальная проверка доработанных методик Н.Б. Покровского и М.А. Сапожкова....................................................................................41

2.4 Выводы по главе........................................................................................................................................48

3 ОПРЕДЕЛЕНИЕ ТЕХНИЧЕСКИХ ТРЕБОВАНИЙ К ШУМОЗАЩИЩЕННОМУ МИКРОФОНУ......................................................................50

3.1 Расчет разборчивости речи в условиях шума с теоретическим распределением спектральной плотности............................................................................50

3.2 Выбор оптимальной характеристики направленности микрофона, исходя из шумозащищеннности и разборчивости речи........................................60

3.3 Выбор оптимальной формы частотной характеристики чувствительности микрофона........................................................................................................83

3.4 Выводы по главе........................................................................................................................................90

4 ПРИМЕР РЕАЛИЗАЦИИ ШУМОЗАЩИЩЕННОГО МИКРОФОНА.. 91

4.1 Техническое задание..............................................................................................................................91

4.2 Расчет основных параметров капсюля....................................................................................92

4.2.1 Предварительный расчет параметров преобразователя и размеров капсюля............................................................................................................................................................92

4.2.2 Предварительный расчет акустико-механических параметров......................95

4.2.3 Расчет внутренней конструкции капсюля..........................................................................97

4.2.4 Расчет основных электроакустических параметров микрофона....................101

ЗАКЛЮЧЕНИЕ..........................................................................................................................................105

Список литературы..................................................................................................................................108

ПРИЛОЖЕНИЕ 1. Акт о реализации результатов диссертационной

работы Повинского Юрия Владимировича........................................................................111

ВВЕДЕНИЕ

На микрофон, используемый для звукопередачи, действует звуковое давление не только от основного источника, но и от большого числа источников акустического шума, присутствие которых по той или иной причине является при звукопередаче неизбежным. Под акустическими шумами могут пониматься шумы любой природы, источники которых находятся на некотором расстоянии от микрофона. Например: посторонние голоса, находящихся рядом людей, шум от приборов и механизмов, машин и т.д. При этом, источники акустических шумов могут иметь заранее известное статичное местоположение, либо появляться случайным образом, например, при нахождении микрофона на улице, в местах большого скопления людей, при выполнении бойцом спецназа боевого задания, в том числе находясь в перестрелке. Особенно актуальной задача получения разборчивого речевого сигнала становится в условиях сильных акустических шумов (соизмеримых или даже превышающих по величине полезный звуковой сигнал) в аппаратуре связи и оповещения. Например: кабина пилота самолёта, в гусеничном транспорте, устройствах связи в условиях интенсивного городского шума, диспетчерская связь в условиях промышленного шума и т.д. Неправильно понятая или не расслышанная речь в определенных ситуациях может стоить жизни людей (в военной технике, авиации), либо привести к материальному ущербу (на производстве, строительстве).

На данный момент создано множество устройств, позволяющих повысить разборчивость речи в электрической части звукового тракта путем различных методов обработки сигнала. Например, наиболее распространенный метод повышения разборчивости речи заключается в применении различных электронных (как аналоговых, так и цифровых) шумоподавителей. Если такие устройства и позволяют отчасти решить проблему, то они имеют очень высокую стоимость, которая неприемлема для массового использования.

Микрофоны, используемые в современных противошумных гарнитурах, имеют самые разнообразные характеристики направленности и частотный диапазон. Универсальных высококачественных противошумных микрофонов с

оптимальными характеристиками под всевозможные условия эксплуатации на данный момент практически не существует, во многом потому, что не выработано оптимальных критериев проектирования шумозащищенных микрофонов.

Целью работы является повышение эффективности выделения полезного речевого сигнала на фоне акустического шума высокого уровня путем оптимизации электроакустических характеристик речевых микрофонов.

Научная новизна диссертационной работы состоит в следующем:

1) формантные методики по оценке разборчивости речи М.А. Сапожкова и Н.Б. Покровского адаптированы для расчета разборчивости по известным спектральным распределениям шума и речи в стандартных октавных и третьоктавных полосах;

2) показано, что розовый шум, наряду с равномерно маскирующим шумом, имеет наиболее сильный маскирующий эффект для речевого сигнала;

3) введено и обосновано новое понятие: «коэффициент повышения разборчивости» шумозащищенного микрофона, пропорциональный повышению слоговой разборчивости речи при использовании микрофона с любой частотно-пространственной характеристикой;

4) обоснована целесообразность применения микрофонов ближнего действия с «суперкардиоидной» характеристикой направленности, в качестве универсальной и оптимальной по шумозащищенности и величине повышения разборчивости речи в условиях повышенного акустического шума практически любого спектра.

Практическая значимость работы заключается в следующем:

1) показано, что для предварительной оценки шумозащищенности микрофонов и звукового тракта в целом наиболее сильным маскирующим сигналом является равномерно маскирующий шум, а также «розовый» шум.

2) адаптирована формантная методика оценки разборчивости речи для стандартных октавных и третьоктавных полос, что дает возможность использования стандартизованной аппаратуры (шумомеров, спектро-

анализаторов) в условиях измерений разборчивости речи на фоне реальных шумов, что ранее не было возможно.

3) коррекция известной ранее методики проектирования микрофонов, основанная на разработанных в диссертации критериях, позволяет применять её при разработке шумозащищенных микрофонов ближнего действия.

Методологические и теоретические основы исследования составили научные труды отечественных и зарубежных ученых в области прикладной акустики -Иофе В.К., Сапожков М.А., Вахитов Я.Ш., Вахитов Ш.Я., а также в области речеобразования и теории разборчивости речи: Коллард Д., Покровский Н.Б.

Научные положения, выносимые на защиту:

1) доработанные в диссертации методики расчета разборчивости речи М.А. Сапожкова и Н.Б. Покровского справедливы для расчета и измерений в стандартных октавных и третьоктавных полосах с помощью аттестованной аппаратуры;

2) обоснован новый критерий оценки качества шумозащищенного микрофона - «коэффициент повышения разборчивости», величина которого пропорциональна повышению слоговой разборчивости речи при использовании микрофона с любой частотно-пространственной характеристикой;

3) тип характеристики направленности «суперкардиоида» является оптимальной по критериям шумозащищенности и разборчивости речи для микрофонов ближнего действия;

4) показано, что наиболее сильным маскирующим эффектом для речевого сигнала обладает, наряду с равномерно маскирующим, «розовый» шум.

Материалы диссертационной работы использовались в Федеральном государственном казенном учреждении «Войсковая часть 45187» при выполнении трех научно-исследовательских работ по гособоронзаказу. Имеется соответствующий акт внедрения.

1 ОБЗОР СУЩЕСТВУЮЩИХ СПОСОБОВ ПОВЫШЕНИЯ КАЧЕСТВА РЕЧИ НА ФОНЕ ПОМЕХ

Одним из методов повышения разборчивости речи является снижение уровней шумов. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровнями речи у слушателя по прямому звуку. Это возможно реализовать следующим образом: повышением уровня речи говорящего, приближением микрофона ко рту и уменьшением динамического диапазона (путем приближения минимального уровня прямого звука к максимальному), увеличением индекса тракта.

1.1 Акустические способы повышения разборчивости речи

На микрофон, используемый для звукопередачи, действует звуковое давление не только от основного источника, но и от большого числа источников акустического шума, присутствие которых по той или иной причине является при звукопередаче неизбежным. Увеличения соотношения «полезный сигнал-шум» теоретически можно добиваться с помощью спектральной и пространственной селекции полезного сигнала, а также используя определенные свойства направленных микрофонов в поле сферической волны ближнего источника [1, с. 89-95]. На практике спектральная селекция полезного сигнала в воздушной акустике встречается крайне редко, так как спектры большинства реальных шумов близки или совпадают со спектром полезного сигнала. Исключение пожалуй составляет только интенсивные низкочастотные составляющие транспортных и некоторых промышленных шумов, которые в случае необходимости обрезают фильтром с частотой среза 200-300, а в ряде случаев и с 500 Гц, естественно, с частью спектра полезного сигнала.

Наиболее эффективным способом увеличения дальности приема является повышение коэффициента направленности микрофона или микрофонного устройства. Если под полезным сигналом понимается речь, то весьма желательно, чтобы острая характеристика направленности сохранялась в речевом диапазоне

частот (100-10000 Гц), или хотя бы в диапазоне 200-7000 Гц, особенно если важна не только разборчивость, но и надежная идентификация голоса. Направляя акустическую ось направленного микрофона на источник полезного акустического сигнала, удается повысить соотношение сигнал/шум. Такой метод довольно высоко эффективен, если местоположение помехи статично и заранее известно.

Повышение разборчивости речи на фоне шумов за счет оптимизации параметров первого элемента звукового тракта - микрофона - является наиболее экономически выгодным с точки зрения построения шумозащищенных систем, а также довольно простым в реализации, т.к. не требует дополнительных обрабатывающих сигнал устройств. Поэтому данный способ повышения разборчивости является наиболее востребованным на сегодняшний день.

В настоящее время для повышения разборчивости речи в шумной обстановке используют различные системы гарнитурного типа. Гарнитуры, как правило, представляют собой головные телефоны или наушники с прикрепленным к ним микрофоном, выведенным на гибком или жестком креплении ко рту оператора. Повышение отношения сигнал/шум на выходе микрофона достигается за счет малого удаления микрофона от рта оператора в совокупности с применением направленного микрофона и ветрозащиты.

Рассмотрим типовые гарнитурные системы, предлагаемые на рынке для различных сфер деятельности.

В сферах военной и гражданской авиации, армии и флота (в том числе в войсках стран НАТО) общемировую известность получили гарнитуры фирмы David Clark (США) [2]. Фирма выпускает широчайший ассортимент гарнитур различного назначения. Для примера на рисунке 1.1 показан внешний вид авиационной гарнитуры типа Н3335, предназначенной для пилотов самолетов.

Рисунок 1.1 - Авиационная гарнитура David Clark Н3335

Практически во всех гарнитурах David Clark используются два типа микрофонов, произведенные фирмой Acousticom (США): электретные типа 5720-СА и динамические типа M-87/AIC [3].

По данным производителя электретный микрофон Acousticom 5720-СА (рисунок 1.2) имеет следующие технические характеристики:

-частотный диапазон: 100-10000 Гц;

-индекс шумозащищенности: 15 дБ;

- коэффициент нелинейных искажений: 6 % при уровне звукового давления 114 дБ;

-сопротивление: 150±20 Ом;

- напряжение питания: 9-28 В;

- диапазон рабочих температур: от минус 55°С до +85 °С;

- габаритные размеры: 44,5 х 12,7 х 19,1 мм.

Рисунок 1.2 - Электретный микрофон фирмы Acousticom 5720-СА

Динамический микрофон АсоиБЙсот М-87/А1С (рисунок 1.3) применяется преимущественно в военных целях и обладает следующими техническими характеристиками [4]:

- частотный диапазон: 200-6000 Гц;

- индекс шумозащищенности: 15 дБ;

- диапазон рабочих температур: от минус 55°С до +85 °С.

Данные о характеристиках направленности микрофонов Acousticom 5720-СА и M-87/AIC производитель умалчивает.

Стоит также отметить, что микрофоны Acousticom 5720-СА и M-87/AIC используются в некоторых моделях гарнитур фирм Sennheiser (Германия), Flightcom (США), ЗМ Peltor (Швеция).

Фирма David Clark также выпускает гарнитуры нагубного ношения, например, авиационные гарнитуры типа Н3310 (рисунок 1.4).

Рисунок 1.3 - Динамический микрофон фирмы Acousticom M-87/AIC

f

Рисунок 1.4 - Авиационная гарнитура David Clark Н3310 с нагубным креплением

микрофона

Внутрь шумозащитного экрана встроен микрофон Асоизйсот 5720-СА. По данным производителя применение шумозащитного экрана с амбушюром позволяет увеличить шумоподавление до 25 дБ. В тоже время, помимо доставления определенного дискомфорта для пилота при ношении данной гарнитуры, не исключено проникновение шума через щели в заглушке, а также возникновение побочного шума, обусловленного сокращением мышц лица.

Не менее крупным производителем широкого спектра гарнитур различного назначения является немецкая фирма ЗеплЬ^Бег. Фирма выпускает противошумные гарнитуры для гражданской авиации, авиадиспетчерской связи, телекоммуникаций, теле- и радиостудий, бытового назначения. К примеру, на рисунке 1.5 показан внешний вид гарнитуры, предназначенной для пилотов пропеллерной авиации.

Рисунок 1.5 - Гарнитура фирмы 8еппЬе1зег НМЕС 461 Наибольший интерес представляют технические характеристики микрофонов, используемых в гарнитурах Бепп^^зег. В таблице 1.1 приведены технические характеристики микрофонов от гарнитур, предназначенных для эксплуатации в повышенной шумовой обстановке, на основе данных производителя [5; 6; 7; 8].

Таблица 1.1 - Основные характеристики микрофонов, используемых в гарнитурах фирмы 8еппЬе1зег

Модель Назначение Микрофон (тип электроакустич. преобразователя) Характеристика направленности Частотный диапазон, Гц

НМБ 280 РгоГГеззюпа1 телекоммуникации динамический «суперкардиоида» 50-13500

НМБ 26 теле- радиостудии ВМО 424 динамический «гиперкардиоида» 40-16000

НМЕ 26-4 теле-радиостудии ВМЕ 4-2 электретный «кардиоида» 40-20000

НМБ 46-3-6 авиадиспетчерская связь ВМБ 46-413 динамический «суперкардиоида» 100-12000

НМЕ 43-3 авиадиспетчерская связь электретный - 400-4500

НМЕС 26 кабина пилота самолета МКЕ46 электретный - 100-6000

НМЕС 46 кабина пилота самолета ВКЕ 46 электретный - 350-6000

НМЕ 100 кабина пилота самолета МКЕ 45-2 электретный - 500-5000

НМЕС 461 кабина вертолета МКЕ 45-1 электретный «восьмерка» 300-5000

НМБС 372 кабина вертолета М-8