автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.18, диссертация на тему:Исследование тонального метода оценки разборчивости речи при бинауральном прослушивании

кандидата технических наук
Мохд Мохсин
город
Санкт-Петербург
год
2006
специальность ВАК РФ
05.11.18
цена
450 рублей
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Исследование тонального метода оценки разборчивости речи при бинауральном прослушивании»

Автореферат диссертации по теме "Исследование тонального метода оценки разборчивости речи при бинауральном прослушивании"

На правах рукописи

мохд мохсин

ИССЛЕДОВАНИЕ ТОНАЛЬНОГО МЕТОДА

ОЦЕНКИ РАЗБОРЧИВОСТИ РЕЧИ ПРИ БИНАУРАЛЬНОМ ПРОСЛУШИВАНИИ

Специальность: 05.11Л 8 - Приборы и методы преобразования изображений и звука

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт — Петербург 2006

Работа выполнена на кафедре звукотехники Санкт-Петербургского государственного университета кино и телевидения.

Научный руководитель - кандидат технических наук, профессор

Ершов Константин Григорьевич

Официальные оппоненты - доктор технических наук

Майоров Василий Семенович

Защита состоится 28 декабря 2006 года в 11:00 часов на заседании диссертационного совета Д210.021.01 в Санкт-Петербургском государственном университете кино н телевидения fio адресу:191119,Санкт -Петербург, ул. Правды, д. 13.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного университета кино и телевидения.

Автореферат разослан Z-П- Н- 2006г.

кандидат технических наук, с.н.с. Ахматов Андрей Андреевич

Ведущая организация

ООО "Неватон".

Ученый секретарь диссертационного сове-

Г

К.Ф. Гласман

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Акустические процессы, сопровождающие звукопередачу сишалов ■ (натуральных звучаний) в кино, телевидении, радиовещании, радио- и /или телефонной связи и др., достаточно сложны и многообразны, поэтому до настоящего времени единого подхода (теории) к их описанию с позиций слухового восприятия не существует.

Известной проблемой звукопередачи в кипо является ' неполное соответствие зрительному образу, в первую очередь, в модельном «ближнем» звуковом поле (в крупных планах изображения) йз-за различия физических процессов и характеров восприятия информации.

Если требуемое звуковое сопровождение кино- и видеопоказов более или менее удовлетворяется соответствующими технологическими регламентами и нормативами по звукоизоляции и звукопоглощению помещений записи и воспроизведения, то качество звука в телевещании имеет определенные ограничения. Здесь, несмотря на полный набор акустических средств при «передаче» звука, его качество значительно ухудшается при приеме из-за отсутствия необходимого оборудования в типовых условиях для массового зрителя. Подобная, но более сложная задача стоит и перед радио-(громкоговорящим) вещанием.где кроме отмеченного требуется обеспечить наибольшую натуральность, например, музыкально-драматических передач чисто звуковыми методами и средствами. Пока это доступно только для проводных и радиосетей, например, на центральном и региональном каналах Российской Федерации.

Наиболее сложная ситуация в настоящее время сложилась с обеспечением требуемых характеристик и соответствующей оценки звукопередачи в трактах проводной и радиотелефонной связи. Основной особенностью таких трактов является то, что здесь звукопередача оказывается «закороченной» в сравнительно малом пространстве на голову слушателя, одновременно, - речевого «источника». При этом прием . осуществляется на одно (реже - два) ухо, считается «по давлению», посредством головного телефона (ГТ), а передача — из ротового отверстия (скользящее падение) к микрофону телефонной трубки (или гарнитуры) через, можно сказать, поверхностный (=шаровой) слой воздуха. Понятно, что в таких условиях практически в полной мере проявляются физические и психоакустические эффекты как ближнего (по акустике) поля действия. сигнала, так и воздействия дальнего поля мультипликативных и аддитивных помех. Качество звукопередачи таких, как правило, монофонических (одноканальных) трактов, даже с нормативными электрическими параметрами, речи (по разборчивости), оказывается недостаточным, в первую очередь из-за неблагоприятного соотношения звуковых давлений рс (речевого сигнала) и р„ (акустических помех) или их уровней и как при передаче, так и особенно при приёме.

Отмеченные аспекты звукопередачи с акцентом на последний, как наиболее востребованный, в полной мере относятся к состоянию и качеству

средств связи многонациональной Республики Афганистан. Мпоголетняя война, агрессивные смены правящих и оккупационных режимов привели к значительным разрушениям производственных, общественных и жилых зданий, физическому и моральному износу макро- и микроструктур систем культурной и технической коммуникаций. В настоящее время в республике с населением около 18 миллионов человек имеется 4 кино- и телестудий, 2 концертных зала и 120 кинотеатров; «действует» всего 15 старых коммутаторных станций проводной связи (ТС) и 4 сравнительно новые базовые станции (BS) сотовой связи (РС). Средняя плотность телефонизации (число проводных и радиотелефонов на 100 жителей) пе превышает, соответственно, 12 и 19 единиц. Более 40% населения проживает в горных местностях на высоте более 2000 м над уровнем моря, где ТС и РС затруднены из-за резких переходов от дневных к ночным температурам и мощных флуктуаций «розы» ветров, влияющих на акустические и электромагнитные поля. В стране официально действуют два государственных языка «дари» (Иранского) и «пушто» (Арабского происхождения), на которых общаются около половины (афганцы) населения. Для другой половины (в сумме), примерно по 1 млн, имеют хождение туркменский, узбекский, пащаий и индийский языки. Остальная часть (кочевники и полукочевники ~ 3 млн.) имеет смешанные диалекты.

С изложенных позиций общей проблемы звукопередачи в коммуникационных системах, исследование новых методов (средств) оценки и повышения разборчивости речи является вполне актуальным, особенно с учетом перспективной компьютеризации процессов голосового общения «человек-машина».

Цель и задачи диссертационной работы. Целью настоящей работы является исследование квазибинауральной технологии по оценке разборчивости' речи (РР) на основе тонального (формантного) метода при прослушивании по давлению (через головные телефоны) в монофоническом (одноканальном) тракте двухпроводной телефонной (и радио) линии связи путем моделирования естественного бинаурального восприятия. Для достижения поставленной цели необходимо решить следующие задачи:

- выявление'различий комплексных свойств слуха при моно- и бипаураль-ном прослушивании звука по давлению в сравнении с естественным восприятием;

- исследования, на основе градиентного принципа зв^сотге^е^ачи (звукоприема), артикуляционного и тонального (формантного)7-оцеики разборчивости речи с диотической шумовой маскировкой при монауральном и квазибинауральном прослушиваниях;

обоснование преимуществ квазибинауральной технологии при нормированных исходных данных для оценки разборчивости речи по давлению в монофонических трактах связи, а также выявление в них фазовой зависимости восприятия линейных и нелинейных искажений;

- сравнение результатов оценки разборчивости речи артикуляционным и предложенным методами при одних и тех же режимах квазибинауралыюго и монаурального прослушивания по давлению; -

- разработка макетов аппаратурной реализации предложенного метода в одноканальных трактах радио- и проводной связи.

На основании решений поставленных задач на защиту выносятся следующие основные положения работы'.

1. Результаты исследования качественных и количественных изменений свойств слуха при переходе от «полевых» измерений разборчивости речи к измерениям по давлению.

2., Методика моделирования факторов естественного моно- и бина-урального восприятия на основе градиентного принципа звукопередачи при прослушивании по давлению и градиенту давления с введением электрического сдвига по фазе между напряжениями, подводимыми к головным телефонам.

3. Способы повышения качества приема звука на фоне акустических помех в одноканальных трактах радио- и проводной связи на основе коррекции фазовой зависимости чувствительности, частотной избирательности, нелинейных искажений слухового восприятия по давлению в области низких частот.

Личное участие автора в получении результатов, изложенных е диссертации.

Все основные научные результаты, представлетше в диссертационной работе, получены автором единолично. В совместных публикациях автору принадлежит теоретическая проработка и организация экспериментов, а соавторам - проведение экспертиз и обобщение полученных результатов.

Научная новизна результатов работы заключается в обосновании градиентного принципа звукопередачи, разработке квазибинауральнсй технологии тонального (формантпого) метода измерения разборчивости речи, моделирующей пространственные моно- и бинауральные свойства слуха, и выявлении фазовой зависимости ширины критических полос слуха и гармонических искажений при бинауральном восприятии звука по давлению.

Практическая значимость работы определяется:

- обоснованием основных причин понижения качества звукопередачи по давлению в одноканальных трактах радио- и проводной связи с повышенным уровнем внешних помех;

- обоснованием и реализацией градиентного принципа звукопередачи (звукоприема) для мензурального и бинаурального прослушивания;

- разработкой методики определения зависимости ширины критических полос слуха от вносимых фаз квазибинауралыюго прослушивания;

- расчетом и его экспериментальным подтверждением низкочастотной зависимости сквозной чувствительности головных телефонов при диетической, дихотической и квадратурной звукопередачах по давлению;

- разработкой макетов конструкций и электрических схем одинарного и двойного фазовращателя с коммутируемыми дискретными сдвигами фазы 0,45,90,135,180 и 270° и равномерной частотной характеристикой в диапазоне 20...4000 Гц, а также - микротелефонной трубки с двумя телефонами.

Результаты диссертационной работы реализованы в:

- научной работе, кафедры звукотехнгаси по хоздоговорным темам (отраслевой план ФА по культуре и кинематографии), связанным с проблемой соответствия зрительного и слухового образов в «ближнем» поле при демонстрации кино- и видеофильмов;

- экспериментальных исследованиях бакалавров, магистров и аспирантов кафедры акустики, связанных с моделированием пространственного бинауралыюго слуха на базе двухмикрофонпой «искусственной» головы;

- учебном процессе студентов 4 и 5 курсов ФАВТ на кафедрах звукотехники и акустики при проведении лабораторных работ по оценке разборчивости речи в электрических и электроакустических трактах.

Апробация работы. Отдельные вопросы и разделы диссертации . докладывались и обсуждались на:

- семинаре кафедры звукотехники СПбГУКиТ, ноябрь 2003г.;

- XI международном конгрессе «Звук и вибрация», Санкт - Петербург, июль 2004 г.;

- научно-технической конференции ФАВТ СПбГУКиТ, апрель 2005г.;

- всероссийской конференции НТОРЭС им. Л.С.Попова, Москва, . июнь 2005г.

Полностью содержание диссертации обсуждалось на заседании кафедры звукотехники СПбГУКиТ в мае 2006г.

Публикации. По основному содержанию работы опубликовано пять работ, из них (кроме тезисов)- два доклада в электронном виде на английском языке в материалах XI международного конгресса и три статьи в сборнике научных трудов СПбГУКиТ (выпуск 17 и 18).

Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения, списка литературы, включающего 101 наименование, и одного приложения. Основной текст содержит 124 страниц с 51 рисунками и 8 таблицами.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована актуальность темы работы, сформулированы цель и задачи исследований, изложена аннотация содержания.

В первом разделе представлен обзор литературных источников и нормативных документов, в котором обобщены сведения о методах расчета и измерения разборчивости речи, их сравнительная оценка, имеющая важное значение для данных исследований. Кроме того, в этом разделе даны сведения об учете влияния различных факторов (по акустике) при

субъективном прослушивании речевых сигналов по давлению в трактах проводной и радиосвязи.

В типовых трактах (общего применения) проводной связи обычно используются двухпроводные линии (абонентские шлейфы) с дуплексной (одновременной) передачей и приемом с помощью дифференциальных и балансных устройств. Примерно такой же принцип характерен и для абонентской радиосвязи, К числу основных нормируемых МКТТ параметров, определяющих качество таких трактов, относятся:

1. Ортотелефонный эталоп (G) качества голоса в передающей части (речевой источник) абонентской линии, имитирующий пространственную передачу голоса двух расположенных друг против друга собеседников на расстоянии 1мв условиях свободного поля.

2. Эталон (эквивалент) затухания (Z), характеризующий качество передачи голоса аппаратами двух абонентов и каналом связи (КС) в диапазоне 300...3400Гц слушающему при наличии нормируемых шумов, искажений и других мешающих факторов.

3. Качество слухового восприятия (S) на выходе (в приемной части) тракта, которое характеризует понятность или разборчивость речи воспринимаемого голоса говорящего абонента.

Как правило, первые два параметра, при заданных характеристиках приемных и передающих электроакустических преобразователей, сравнительно легко обеспечиваются чисто электрическими средствами. В то же время третий, наиболее важный параметр, может прогнозироваться только при обобщенных (идеализированных) известных акустических условиях.

Так, для обычной телефонной пары абонентов с типовыми микротелефонными трубками с монотическим (ипсалатералыюм) прослушивании слоговая разборчивость регламентируется на уровне не менее 80% при эквивалентном затухании не более ЗОдБ, нелинейными искажениями менее 5% и уровнем шума в помещении, не превышающем бОдБ. Понятно, что такой односторонний прием исключает естественное восприятие, особенно при воздействии на свободное ухо помех речевого типа. Поэтому для повышения уровня громкости Lc (уровня давления Nc) речевого сигнала не менее, чем на ЗдБ, в более шумных условиях используются два синфазво включаемые головные телефоны (ГТ). Такой диотический (с фазовым сдвигом \}г=0°) прием с головными телефонами, совмещенными с шумозащитными шлемами, при прежней монотической передаче с одного микрофона, характерен и для радиосвязи в средствах наземного, воздушного и водного транспорта.

Микротелефонная гарнитура, но также с одним телефоном типа «intra — aural» (внутри уха), используется и в сотовой связи в условиях повышенного шума, например, при вождении автомобиля. Возможное применение в «мобильниках» двух ГТ с более широкими частотным и динамическим диапазонами позволит прослушивать стереопередачи, но при моноприеме с диотическим режимом общения с абонентами.

s

Традиционный подход к учету влияния шумов на условия по давлению и « в поле» базируется на их нормировании и измерениях с использованием частотной коррекции (при значительной низкочастотной фильтрации) по кривой «А», приближенно обратной кривой бинаурального восприятия гармонических (тональных) колебаний в условиях свободного поля при уровнях громкости 40...50 фон (40...50 дБ). При этом, конечно, не исключается влияние низкочастотных и даже инфразвуковых колебаний более высоких уровней на слуховой аппарат человека. Установлено, что колебания с частотами 2...100Гц при уровнях, соответственно, 140...80дБ воспринимаются не как гармонические - чистые тона, а в виде сочетаний слуховых, тактильных и даже вибрационных ощущений. Длительное их воздействие вызывает деформацию барабанных перепонок и увеличение постоянного смещения порога слышимости преимущественно в области низких и средних частот, наиболее характерной для восприятия речи.

Нормальные уровни колебаний низких и инфразвуковых частот техногенного происхождения достаточно известны и, как правило, используются при разработке средств защиты, а также - элементов акустического и электроакустического оборудования применительно к замкнутым пространствам (помещениям) в городах и индустриальных центрах. Для сельских, особенно горных, местностей подобные колебания, но естествегашго происхождения, часто более высоких уровней, обычно не нормируются, хотя также оказывают влияние на слух. Выполненный для таких условий анализ показал, что данные помехи с уровнем до 140 дБ распространяются на большие расстояния практически без потерь, а нестабильность местных метеоусловий воздушной среды приводит к хаотическим изменениям и полезного сигнала с асинхронизмом в местах приема и передачи.

Как отмечалось, комплексная оценка звуковых (речевых) трактов и систем осуществляется посредством универсального субъективного критерия - разборчивости речи, учитывающего не только свойства слуха, но и свойства голосового аппарата человека. Впервые этот критерий был использован в 1910 . г. Кемпбеллом для оценки результатов артикуляционных измерений качества именно телефонных линий связи. Предложенный артикуляционный метод не претерпел принципиальных изменений и. до настоящего времени с применением лишь более совершенной контрольно-измерительной аппаратуры и компьютерных технологий. служит определенным эталоном (нормой стандартизации) всех звуковых средств информации и коммуникаций. .

Однако при всех своих достоинствах практическая реализация метода отличается значительными экономическими и временными затратами, а главное - он не является абсолютным из-за существующей пока невозможности стабилизировать и физически измерять в случайных временных интервалах громкость и тембр речи даже в достаточно

ограниченных динамическом и частотном диапазонах. Б ¿лыиая

статистическая стабильность таких параметров характерна для так называемых полусубъективных методов (по определению Л. Беранека), примерами которых являются формантный (М.Сапожков, РФ) и индексные: А1 (артикуляции) и вП (разборчивости речи), предложенные Стейнбергом и Френчем (США). Здесь разборчивость речи в одноканальных трактах определяется расчетным путем по результатам дискретной слуховой оценки (уровня ощущения) в задаваемых инструментально условно равноартикуляционных или стандартных 1/1, 1/3 октавных полосах при разных уровнях шумовой маскировки. Данные методы стандартизованы и имеют широкое применение в проводной и радиосвязи.

Менее трудоемкими являются объективные (чисто аппаратурные) методы, которые по моделям речевых сигналов измеряют ряд параметров, моделирующих восприятие речи под влиянием аддитивных и мультипликативных помех, формируемых помещениями, открытыми площадками и т.п. К таким методам относятся ЯТ1 (индекс передачи речи), 11А8Т1 (быстрый индекс передачи речи), % АЬсопб (процент артикуляционных потерь) и ряд других. Основным недостатком их является применение для измерений монофонических трактов.

Рассмотренные аспекты первого раздела работы в соответствии с поставленной целью определяют задачи диссертационной работы и дают все основания считать наиболее целесообразным для реализации квазибинауральной технологии - формантный метод оценки разборчивости речи, особенно удобный в сложных языковых и местных условиях.

Во втором разделе анализируются методы и устройства защиты от влияния низкочастотных помех на каналы связи. Рассматриваются возможности формантного метода оценки разборчивости в условиях воздействия нестационарных шумов.

В связи с известной сложностью субъективной экспертизы, которую трудно реализовать для множества конкретных условий, нормативные методы объективной оценки и расчета разборчивости основаны на статистическом процессе слухового восприятия формант речевого сигнала, маскируемого шумом. Такая формантная разборчивость определяется произведением частотного Б и динамического Б диапазонов тракта

А- аРБ, (1)

где а — коэффициент пропорциональности.

Считая, что объем информации И, передаваемый за время Т, также пропорционален А, получим зависимость формантной разборчивости от объема информации в единицу времени. Следовательно, разделяя весь речевой частотный диапазон на полосы равной формантной разборчивости, близкие к критическим полосам слухового восприятия (для русской речи их 20), можно определить результирующую разборчивость как сумму ее вкладов в отдельных частотных полосах, каждая из которых в идеальном случае будет давать по 5% всей формантной разборчивости тракта, т.е.

А = 0.05|Х (2)

¡-1

где Щ =/(£,) - коэффициент разборчивости в Т полосе.

Коэффициент = /СЕ,) представляет собой относительную вероятность приема сигнала в зависимости от среднего уровня сигнала по сравнению со средним уровнем шума, т.е. уровня ощущения (слухового восприятия). Эта зависимость совпадает с кривой интегрального уровня формант и приводится з справочниках. Формантные уровни составляют более 98% уровней речи, и поэтому средний уровень ощущения легко определяется в каждой полосе

^-[л.-лд. (3)

Из сравнения расчетных и экспериментальных данных оценки разборчивости по формантному методу показывается, что тракты, в которых шумы имеют равномерный характер огибающей своего спектра, дают хорошее совпадение расчетных и измеренных значений разборчивости. Однако при шумах с резким падением уровня спектра к высоким частотам погрешность расчёта оказывается значительной. Такое расхождение результатов расчёта и эксперимента для шумов с подающей к высоким частотам огибающей спектра можно объяснить тем, что при расчёте спектр такого шума заменяется шумом гладкого спектра, спектральный уровень которую имеет определенную величину, а его общий уровень остаётся прежним.

Описывается методика применение формантной теории к условиям шумов, спектра которых отличается от гладких с уточнением расчетных постоянных и частотных полос равной разборчивости. По результатам проведенных исследований было показано, что по зависимости словесной \У разборчивости от слоговой Б, полученной по артикуляционному методу на арабском языке, имеется возможность, с введением вычисленных поправок,^ перейти к необходимой зависимости слоговой разборчивости от формантной Л, но для английского языка.

Данные поправки определялись по равноартикуляционным полосам для английской речи с учетом полосы раздела (1930Гц) между 10 и 11 полосами, где значение слоговой разборчивости при А = 0,5 составляет 60 % что совпадает с результатами артикуляционных измерений по разработанным таблицам звукосочетаний для арабской речи. В целом это подтверждает известные данные о близости по звуковой структуре английского к арабскому языку.

Процесс влияния низкочастотных помех при моноприеме рассмотрим, считая, что в процессе восприятия участвует не только ипсапатеральное (ИУ) приемное ухо, но и контралатералыгое ухо (КУ). Причем телефон не герметично зафиксирован на ИУ так, что имеется некоторый канал «утечки» воздуха из замкнутого объема V между диафрагмой ГТ и барабанной перепонкой. Тогда в интервале изменений среднего (избыточного)

наружного давления помех Рн „ по, например, гармоническому закону на уровне Ро— атмосферного (статического) давления

Рю =Р0+ Pus =Ро+ Рим cos cot объемная скорость v воздуха в канале не зависит от давления. Так, например, при понижении наружного давления за счет переменной составляющей из объема выйдет количество воздуха, равное vpulAt, что приведет к понижению внутреннего давления в объеме V на Арвн, т.е. в пределе

[ri^-vfa+P^cosat)^t = -VdPm . (4)

Из общего решения (4) с некоторой постоянной В

Pu3=pe„coS((vt-cp) + B-e'"v (5)

следует, что амплитуда составляющей давления внутри объема и его сдвиг по фазе будут

Рен = Р„.п] л/1 + («0Т, <р= arctg сотк. (6)

где тк = св Zn - постоянная времени канала как произведите гибкости воздуха в объеме на полное сопротивление канала.

Таким образом, фазовые различия помех, действующих на ИУ и ИК, определяют принципиальный недостаток мопоприема и только симметрия в воздействии помех (при двух ГТ) обеспечивает их определенное ослабление.

В третьем разделе излагаются результаты исследований градиентного принципа звукопередачи (звукоприема) в каналах связи. В идеализированных условиях «свободного» поля без мультипликативных и аддитивных помех (в варианте заглушённой камеры) звукопередача в общем виде описывается выражением

рс(Хс-сои) = ри[Хи-,Р0{со^)}, (7)

где р(и р« - звуковые давления в точках (зонах) расположения слушателя Xe£(xciyc;zc) и источника звука Хие(хи',уи',ги) для трехмерной системы координат (x,y,z);

Pa{ca\t)- частотная и временная зависимости акустической мощности источника.

В таком варианте (прямая звукопередача) (7), без учета важной составляющей первичного звукового поля — колебательной скорости определяет зависимость рс только от свойств источников (в том числе и речевого) и служит моделью для получения усредненных данных по результатам многочисленных субъективных экспертиз основных коррелятов бинауральных слуховых стимулов. Ими являются: громкость (рс) или уровень громкости Lc (Nc), высота z\ (как функция критических полос- групп слуха /ся) и в комплексе - тембр

ZJZI.^AfJ $ ЛГ£[Ш,(/СГ);Д/СГ], (8)

где ЛГЕ -спектр звука источника как функция уровней звукового

давления N( в обычно 1/3 октавных полосах с центральными частотами Ди и Д^ - субъективное и стандартное промежутки времени усреднения.

Как отмечалось, в натурных «полевых» условиях (помещениях, на открытых площадках и т.п.) влияние. мультипликативных и аддитивных помех (более или менее известных) приводит к изменению практически всех субъективных и объективных параметров звукопередачи и её характеристик.

Телефонная (и радио) связь между говорящим и слушающим абонентами существенно отлается от прямой (акустической) звукопередачи, в первую очередь, из-за наличия вторичного электроакустического тракта, который существенно нарушает условия как передачи (через микрофон), так и приема (через телефон). Последнее приводит к тому, что вместо пространственного «полевого» звука его прием ограничивается давлением ближнего поля (при непосредственном контакте телефона с ухом слушателя) и, что особенно важно, исключением всех дифракционных и бинауральных эффектов, свойственных естествешюму слуховому восприятию. В общем виде без учета действия помех такая звукопередача приближенно описывается выражением

"д V ит

V г.

= ти^и\хи;РМ*)}, (9)

где Ъц и у — эквивалентное затухание и усиление линии; иг и иа - напряжение, подводимое к телефону и снимаемое с микрофона.

Здесь звуковое давление Рс, действующее на ухо слушателя, определяется относительной деформацией АК/К замкнутого (в норме) объема V воздуха между диафрагмой (мембраной) телефона и барабанной перепонкой при возбуждении используемого электроакустического преобразователя телефона подводимым напряжением.

Такие условия прослушивания изменяют область слухового восприятия со смещением уровней порогов (до 10 дБ) и частотных зависимостей изофоп, нейтрализуют волновую зону воздушного пространства вокруг головы и временные, фазовые, и интенсивные разницы между ушами (при двух телефонах) для полезного ситала. А при отсутствии возможности восприятия колебательной скорости пространственная локализация заменяется ограниченной (в голозе) интенсивной латералкзацкей. Кроме того,' усиливается воздействие- на слуховой аппарат синфазных с низкочастотным выделением внешних помех из-за известной слабой, частотнозависимой звукоизоляции обычных ГТ.

Однако, как показано нами, известная нормативная методика «одноушного» прослушивания не является полностью адекватной естественному бинауральному восприятию из-за заметного различия в характерах сигнала, воспринимаемого уже менее чувствительным (-5...-6дБ)

ухом, закрытым телефоном, и восприятия (можно полагать) только шума «свободным» (пормальной чувствительности) ухом. Поэтому . в сложных акустических условиях связи используют второй головной телефон, включаемый электрически обычно параллельно, т. е. синфазно (диотически: \|я=0). Такое включение повышает уровень сигнала и благодаря эффекту бинауралыгой разности уровня маскировки (БРУМ) в сравнении с монауральным уровнем улучшает качество звукопередачи.

Действительно t как показывают многочислешгые исследования звукопередачи с ГТ, обобщенные Й. Блауэртом, бинауральная разность уровней тонального (БРУМ) и особенно речевого (БРУР) сигналов относительно монаурального (опорного) уровня при диетическом прослушивании оказывается заметно меньше, чем при дихотическом (\)/ >0). Такие результаты объясняются тем, что дихотический режим больше соответствует бинауральному восприятию «в поле» по ряду гипотез (моделей): векторной, корреляционной, совпадения и др., которые, как в отдельности, так и в целом не полностью совпадают с субъективной оценкой. Одной из причин расхождения, по нашему мнению, является отсутствие учета важного локализационного признака - градиента давления в ближней зоне источника, совпадающего по направлению с колебательной скоростью. Все изложенное послужило основанием для разработки градиентного принципа звукопередачи путем фазового (дихотическот) разделения электрического напряжения сигнала, подводимого к электроакустическим преобразователям, при этом для монаурального приема использовались два телефона, включенные со сдвигом 180°, что привело к проявлению направленности излучения с уменьшением отдачи в области низких частот.

Реальная помехозащищенность и более высокая разборчивость по артикуляционному методу были получены при квазибипауральных (два ГТ в гарнитуре) и монаурального (два ГТ в трубке) режимах электрического их включения в зависимости от относительного урояня енёшнего шума, создаваемого громкоговорящей системой в полузаглушенной комнате (с отражающим полом). Для монаурального режима в телефонном отсеке типовой микротелефонной трубки, но со сквозными • - отверстиями звукоизлучения ' во внутреннюю (к уху) и внешнюю стороны, были размещены (тыл к тылу - "bask to bask") два телефонных капсюля. Электрическое их включение также обеспечивалось двойным фазовращателем для диотического (*]/=0) или дихотических (у=90°;1803) режимов, что обеспечивает классический переход на низких и средних частотах от монопольного к дипольному источнику.

Средние результаты артикуляционных измерений в данных режимах включения ГТ уже указанной группой студентов с типовой обработкой погрешностей представлены на рис.1,а (с телефонной гарнитурой) и рис. 1,6 (с микротелефонной трубкой).

а)

б)

80

70

180°

.....У,

о - \о_ 90° моко /7 * /

X / / / / //

г

M es

90

ВО

-20

-30

-50

50

180*

90*

tf Г

У

N «Б

-20 -30

Рис.1

Как видно, моделирование по градиенту давления монауралыюго прослушивания, так и бинаурального прослушивания по, условно, давлению вполне соответствует реальным условиям восприятия «в поле» », когда человек выделяет необходимый (на данный момент) сигнал на фоне шума, компенсируя последний на уровне центральной нервной системы. Такая компенсация характерна для дихо- и монотического (\|/=180°) режимов (с двумя ГТ) прослушивания речевых сигналов по градиенту давления. Наибольшая компенсация проявляется с использованием ГТ. в гарнитуре, когда образуется своего рода дифференциальная мостовая схема с симметричным воздействием на уши сигнала и помех. При наличии каналов "утечки" воздуха с примерно одинаковыми постоянными ге(б) выполняется условие равновесия "моста" и полная компенсация помех, действующих па слушателя синфазно и даже диффузно.

Такой же подход был использован нами для расчета квазибинауральной форматной разборчивости по тональному методу с использованием измерительной установки, структурная схема которой представлена на рис.2. В данной схеме, кроме фиксированного сдвига по фазе для гармонических колебаний от генератора 1, показана возможность введения широкополосного изменения фазы для шума от генератора 6 с помощью двойного фазовращателя 8. В том и другом случаях определяющим является задаваемый электрический сдвиг по фазе \|Ь, так как переменный акустический набег фазы фа = kd (где к=со/с — волновое число) на расстоянии ci, =0,02 м между диафрагмой ГТ и барабанной перепонкой уха слушателя и

даже на d1 ~ 0,15...0,2 м [«внутреппем» (или внешнем) пути прохождения звука через голову (или её огибания) при бинауральном слушании], оказывается сравнительно небольшим, особенно в области низких частот.

Рис.2

На рис.2 введены следующие обозначения элементов: 1 - генератор синусоидальных сигналов, 2- вольтметр, 3 - стереоусилитель, 4 - слушатель, 5- головные телефоны, 6 - генератор шума, 7- полосовой фильтр, 8 - двойной фазовращатель, 9 - двухканальный осциллограф, 10 - двухкапальный анализатор спектра, 11- микрофоны

Влияние фазовых сдвигов \|/э и фа на суммарный уровень звукового давления в одном (N1,2) или другом (N2,1) ухе слушателя можно определить по рассмотренной зависимости результата взаимодействия двух одинаковых по уровням (N¡=N2) «монопольных» источников, но с разными фазами, в условно замкнутом объеме

2| 1+ ^ соз^з

(10)

Расчет разборчивости производился по результатам монауралыюго (типового) и квазибинаурального (с постоянными по частоте фазовыми сдвигами 0, 90 и 180°), прослушиваний тональных сигналов звуковых частот, но одного и того же уровня 65 дБ (при подведении напряжения ис=ЗмВ к телефонам с более или менее равномерной чувствительностью 98 дБ/ мВт) в каждой из 20 полос равной разборчивости. Тональный сигнал маскировался соответствующими октавными полосами «розового» тума. Заметность проявления ощущения тона как при уровне шума Мш.мин-(«близкого» к демаскировке) фиксировалась по вольтметру путем измерения среднеквадратичного значения иш.мн„., так и при его «близкой» маскировке N ш.макс (иш мин). По среднеарифметическому значению этих напряжений и Ш1=( иш,мян +иш,«ах)/2 определяется средний уровень ощущения данной тональной составляющей в «Ь> полосе

|АЕ,.| = 201§^Ч0. (11)

ш

Затем по уровню ощущения ДЕ; находился соответствующий коэффициент разборчивости А;(°/о) и в целом общая формантам разборчивость Ао как сумма всех частотных составляющих А>, но с учетом

конкретного, а не пятипроцентного (идеального) вклада. Измерение уровня ощущения проводилось 10 студентами выпускных групп кафедр акустики и звукотехники, результаты которых усреднялись по формуле (с обычной методикой выборки ошибки)

A«.o. = L~r, (12)

1 п

где п - число слушателей.

Тестированная зависимость S от формантной А„.0 в широкой полосе (250-8600 Гц) позволяет определить величину ожидаемой слоговой разборчивости речи S при звукопередаче в данном тракте с шумовой помехой и заданном уровне сигнала, но с различными фазами. Значения S и An o показаны в таблице.

Таблица. 1

Вид разборчивости Монауральный режим Квазибинэуральный режим с фазой

Левое ухо Правое ухо 0° 90° 180°

Формантная А, % 23,2 20,2 24,8 31,3 34,1

Слоговая S, % 41,7 36,6 44,6 57,3 60,9

Таким образом, несмотря на сравнительно невысокие результаты (неизолированное помещение, нестабильность показаний, собственные шумы аппаратуры и т.д.), в целом, проявилось заметное (15%) преимущество квазибинауральных режимов. Так, ожидаемое качество звукопередачи речи по давлению (по расчетной S) в используемых моно- и диотическом (0°) режимах — удовлетворительное, а в дихотическом режиме (90 и 180°) — хорошее.

Сравнение результатов расчета слоговой разборчивости по результатом "полусубьективного" тонального метода с "чисто" субъективным артикуляциошюм методом проводилось на измерительной установке, подобной предыдущей, но в качестве источника сигнала использовался магнитофон, на котором записаны дикторские артикуляционные таблицы слогов по ГОСТ 16600-72, двойной фазовращатель, обеспечивающий сдвиг фазы (0...1800), и генератор шума, создающий широкополосную помеху «розовой шум» различного уровня. Результаты измерений представлены на рис,3,а, где кривая 1 получена по тональному, а кривая 2- по артикуляционному методам. Кривая 3 соответствует фазированпому приращению AS (БРУР) без маскировки. Здесь же (рис.3,б) показаны зависимости разборчивости речи при различных фазовых сдвигах сигнала от уровня шума относительно среднего уровня слогов речи.

Рис.3

Понятно, такое моделирование не соответствует реальным условиям прослушивания по давлению (посредством одного или двух ГТ) из-за. акустически неразделенных речевого сигнала и шумовой помехи, которые здесь взаимодействуют между собой в чисто электрической форме, однако, даже в таком режиме прослушивания слуховой аппарат человека избирательно реагирует на фазовые различия сигнала при его выделении из "смеси".

В целом, можно полагать, что рассмотренная квазибинауральная технология вполне приемлема и для оценки слоговой разборчивости арабской речи на оспове ее взаимосвязи с уровнем ощущения формант, установленной ранее на кафедре акустики СПбГУКиТ.

Четвертый раздел посвящен исследованию фазовой зависимости частотной избирательности слуха и восприятия нелинейных искажений при прослушивании по давлению.

Рассмотренные зависимости разборчивости речи от вносимых'фазовых сдвигов напряжений, подводимых кГТ, могут быть объяснены различной частотной (шириной .критических полос) избирательностью слуха. Последнее известно только для монотического и диетического' режимов включения ГТ при прослушивании по давлению, несмотря на известные данные о влиянии сдвига фаз между огибающими сигнала и масксра на пороги прослушивания в пределах одних и тех же критических полос.

По классической концепции Флетчера ширина каждой из этих полос равна такому количеству децибел, на которые уровень чистого гона должен быть выше уровня ощущения пгума, чтобы быть слышимым. Известно, что ширина критических полос АГб при бинауральном восприятии заметно меньше монауральной ДГМ, что свидетельствует о большей частотной избирательности.

Оценить раздельно и независимо друг от друга итгтерауральные различия в бинауральных сигналах, которые, надо полагать, были необходимы Флетчеру при исследованиях частотной избирательности слуха при шумовой маскировке в поле, практически невозможно. Однако при

прослушивании по давлению (через головные телефоны), т.е. при "закороченной"(минимально-фазовой) звукопередаче, такая возможность появляется, особенно с использованием такой меры качества, как интерауральная когерентность, т.е. схожесть сигналов, поступающих к правому и левому уху. Чем меньше корреляция (схожесть) этих сигналов, тем выше будут показатели избирательности, БРУМ, разборчивости и т.п. Это не противоречит среднестатистическим объективным данным, поскольку компоненты звука с заметной аддитивной и даже мультипликативной составляющими всегда слабо коррелированы между собой. Учитывая эти предпосылки, нами были проведены эксперименты по оценке ширины критической полосы, а также бинауральной разницы уровня маскировки, в функции частоты й фазы сигнала (рис.2). В качестве маскируемого был использован тональный сигнал, а в качестве маскера узко- и широкополосные «розовые шумы». Исследовались режимы бинауральной подачи сигналов со сдвигами О, 90, 180°. Шум во всех случаях подавался сипфазно. Амплитудно-частотная зависимость БРУМ (относительный уровень громкости или звукового давления тона по сравнению с опорным —. монауральным) определялась при соответствующей дихотической или монотической (одноухой) маскировке широкополосным "розовым" шумом,. т.е.

Ш ^20lg<UJU6v), (13)

где UM и U6.v. - значения напряжений, подводимых к ГТ в монауральном (UM) и бинауральном (UG^ - с различной фазой у) при соответствующих фиксируемых громкостях (контролируемых по напряжениям UM.m. и и6ш) маскирующего шума.

Изменения БРУМ при заданных фазовых сдвигах позволили выявить и более интересную зависимость ширины критических полос Af. Для этого, как и в предыдущих случаях, выявлялась узкополосная маскировка тонального сигнала при монауральном восприятии. Затем, плавно изменяя частоту тона (меньше fmin или больше fmax относительно fu установленного фильтра), добивались демаскировки последнего. Границы демаскировки определяли ширину критической полосы монаурального прослушивания AfM = fnM -fmm при одном и том же уровне (напряжения) шума. Подобная процедура измерений использовалась и для оценки ДГ6(\[/) при бинауральном прослушивании, которая оказалась меньше AfM с наибольшим расхождешгем на высоких частотах (рис.4).

юо во во'

70

ео

30 40 30 20 10

- 1

1(м) 1 /■.• ,

-< ч \\ У /У Г /У /

( > • 3(0") Л' .• ¿у

< V-

...... ^ «> - "'«ч и-.. '' ■

(,Гц

12е

10ОО 2000

Рис.4

Согласно рисунку наименьшее отличие от ДГМ наблюдается при

фазах 0 и 90°, а наибольшую разницу между АГб.(у) и АГМ дает сдвиг по фазе бинауральных тонов при у=180°. В то же время сдвиг у=90а приводит к некоторой средней частотной зависимости между кривыми Д^ для синфазного и противофазного режимов.

Таким образом, можно заключить, что дихотическое предъявление звуковых сигналов при бипауральном прослушивании по давлению приводит не только к измененшо порогов маскировки в сравнении с монауральной подачей, по и выявляет более высокую частотную избирательность слуха.

Монотическая (одноканальная) звукопередача используется и для измерения нелинейных искажений в трактах звукопередачи, включая проводную и радиосвязь. Поэтому исходя из имеющегося представления о фазозависимом характере слухового восприятия нами было проведено исследование, заметиостп нелинейных искажений при дихотической подаче тональных ецшалор дю отношению к монауральной как функции частоты и фазы. Как выяснилось,- субъективное восприятие нелинейных искажений имеет ярко выраженный фазозаписимый характер. Вопреки классическим представлениям заметность второй гармоники не всегда оказывается ниже заметности третьей гармоники. При фазовых различиях в 90 и 270° заметность этих гармоник имеет волновой характер со сдвигом 180".

Заключение

Основные результаты работы состоят в следующем: 1.Показйно, что основными параметрами, характеризующими в целом качество телефонной связи, являются: качество голоса в акустических условиях его передачи, качество передачи голоса в виде эквивалента затухания в канале связи и качество слухового восприятия речи в акустических условиях его приема.

2.Акустические условия в открытом (мобильном) пространстве как при передаче, так и приеме речи при проводной и радиосвязи, удовлетворяющие в принципе полевым (без мультипликативных помех) условиям, оказываются малопригодными из -за "низкого" уровня сигнала и значительного уровня низкочастотных помех. Особое влияние здесь оказывают ветровые помехи, локальные изменения и микроколебания атмосферного давления, а также "псевдозвуки".

3.Выявлены существенные различия (по давлению до ЮдБ) комплексных свойств слуха при моно- и бинауральных прослушиваниях по давлению и в «поле», что ограничивает традиционный объективный контроль звукопередачи в трактах связи по уровню звука в дБ А.

4.Впёрвые предложена для телефонной и радиосвязи дифференциальная (симметричная) система защиты от помех, которая по сравнению с обычной несимметричной улучшает условия звукопередачи речевого сигнала с меньшими нелинейными искажениями за счет липеаризации акустической нагрузки на электромеханической преобразователь телефона и расширяет динамический диапазон передачи по верхнему переделу.

5.Впервые обоснован и реализован градиентный принцип звукопередачи путём фазового (дихотического) разделения электрического напряжения сигнала, подводимого к электроакустическим преобразователям телефонов.

6.Показано, что использование градиентного принципа возбуждения преобразователей телефона в микротелефонной трубке при моноприеме, независимого от утечек воздуха из объема между диафрагмой и барабанной перепонкой, обеспечивает естественный монауральный прием (по мнению Г.Бекеши) колебательной скорости, характерной для идентификации и локализации акустической мощности источника в поле и компенсации (потерянных) в канале связи эффектов ближнего поля голосового аппарата человека.

7,Обнаружено, что подведение к телефонам напряжений со сдвигом фазы у=180° приводит к латерализационному эффекту расщепления звукового образа внутри головы на два (вблизи ушей), более свойственному слуховому восприятию в поле, вместо одного образа при

В.Доказано, что наиболее удобным для технических измерений разборчивости речи в условиях действия низкочастотных шумов высокого уровня и языковых барьеров является тональный метод, не требующий квалифицированных дикторов, слушателей и сложного оборудования. Этот метод позволяет по стандартной зависимости слоговой разборчивости от формантной для английской речи определить аналогичную для близкого по фонетической и формантной структуре —арабского языка.

9.Показано, что гармоническое возбуждение телефонов при определении разборчивости речи по тональному методу с бинауральной технологией, в условиях действия низкочастотных помех, позволяет воспринимать сигнал даже с уровнем ниже уровня помех, с отношением пропорциональным логарифму частотной полосы шума.

Ю.Выявлена при квазибинауральном режиме прослушивания по давлению фазовая зависимость ширины критических полос слуха с дихотической подачей тонального сигнала и диетической маскировкой. Наименьшая ширина критических полос по сравнению с моноуральным режимом наблюдается при электрическом сдвиге фазы \р=180°.

11.Подтверждены субъективные дшпше прослушивания в поле о зависимости слухового восприятия нелинейных искажений от положения головы слушателя по результатам фазозависимого восприятия нелинейных искажений. Для ряда звуковых колебаний эта зависимость имеет волновой характер.

По результатам диссертации опубликованы следующие работы:

1. М. Mokhd, Panin A., Davidov V. "A comparative estimation of harmonic distortions at a mono-and binaural audition in accordance with pressure" Proceedings of the Eleventh International Congress on Sound and Vibration 5-8 July 2004.St.Pctersburg, Russia Published by International Institute Acoustics Vibration, p.1707-1714.

2. M. Mokhd, Panin A., Davidov V. "About a dependence of the critical hearing bandwidth on binaural phase shifts." Proceedings of the Eleventh International Congress on Sound and Vibration 5-8 July 2004St. Petersburg, Russia. Published by International Institute Acoustics Vibration, p. 1715 -1720.

3. Панин A.B., Мохд M., Давыдов В.В.//0 влиянии фазовых различий на частотную избирательность слуха по давлению: Сб. науч. тр./ СПбГУКиТ-СПб., 2004.-Вьш.17. с.36-42

4. Мохд М. //Применение тонального метода к бшшуральной оценке разборчивости речи по давлению: Сб. науч. тр. / СПбГУКи'Г. -СПб.,2004.-Выл .17. с.42-48

5.Мохд М., Робонен Д.В., Ершов К.Г.//Анализ тонального и артикуляционного метода оценки разборчивости речи при дихотической звукопередаче: Сб. науч. тр./СПбГУКиТ.-СПб.,2005.- Вып. 18. с.58-64

Тип. СПбГУКиТ. Зак. tó/Тир. 100 экз. 21.11.06 г.

Оглавление автор диссертации — кандидата технических наук Мохд Мохсин

Введение.

Раздел 1. Структура и особенности звукопередачи в проводной -и радиосвязи.

1.1. Структура и контроль качества трактов звукопередачи в связи.

1.2. Влияние акустических условий на прием речевых сигналов.

1.3. Основные методы оценки разборчивости в трактах звукопередачи.

Выводы.

Раздел 2. Исследование приемов защиты от влияния низкочастотных помех на каналы связи.

2.1. Возможности форматного метода оценки разборчивости в условиях воздействия нестационарных низкочастотных помех (шумов).

2.2. Исследование компенсационных методов акустической защиты от низкочастотных помех при приеме речевых сигналов.

Выводы.

Раздел 3. Исследование градиентного принципа звукоприема (звукопередачи) в каналах связи.

3.1. Обоснование градиентного принципа звукоприема (звукопередачи).

3.2. Монауральная оценки разборчивости речи по градиенту давления.

3.3. Квазибинауральная технология оценки разборчивости речи по давлению.

Выводы.

1*аздел 4. исследование влияние дихотическои звукопередачи по давлению на восприятие линейных и нелинейных искажений.

4.1 ьлияние фазовых различии на частотную изоирательность слуха.

4.1. ьосприятие нелинейных искажении при дихотическои звукопередаче.

4.3. Сравнение слуховой оценки нелинейных искажении при прослушивании по давлению и "в поле".

Выводы.

Введение 2006 год, диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам, Мохд Мохсин

Акустические процессы, сопровождающие звукопередачу сигналов (натуральных звучаний) в кино, телевидении, радиовещании, радио- и /или телефонной связи и др., достаточно сложны и многообразны, поэтому до настоящего времени единого подхода (теории) к их описанию с позиций слухового восприятия не существует. При этом качественно «массовая» или индивидуальная оценка звукового сигнала происходит не вообще (слушать -не значит слышать), а с учетом его динамики в определенных интервале времени, диапазоне частот, телесном углу и т.д. Границы, в которых заключены (и даже нормируются) значения этих "объективных" параметров определяют точность и, можно понимать, «верность» используемого теоретического анализа, расчета или метода измерений в сравнении со слуховыми стимулами. Последние обычно сводится к громкости, высоте, а в комплексном (интегральном) виде -тембру звука и, конечно, к разборчивости речи с учетом, в последнее время, пространственных и временных зависимостей как в техническом, так и экономическом смыслах.

Известной проблемой звукопередачи в кино является неполное соответствие зрительному образу, в первую очередь, в модельном «ближнем» звуковом поле (в крупных планах изображения) из -за различия физических процессов и характеров восприятия информация. При зрительном восприятии полезный сигнал, как правило, отраженный (а прямой -помеха) имеет мнимый характер с практической независимостью от расстояния, а нервные импульсы от рецептов глаз, поступающие в левое и правое полушария головного мозга, не имеют заметной корреляционной связи, несмотря на эффекты конвергенции и дивергенции. В тоже время слуховой аппарат фиксирует по временным и пространственным зависимостям «жесткой связки» бинаурального восприятия именно прямой звук в виде производных параметров акустической мощности источника, а мультипликативные (отраженные) и аддитивные (внешние шумы) составляющие выделяются как помехи. Понятно, что наиболее информационное преобладание зрительного образа нивелирует недостатки звука, особенно, при многоканальном воспроизведении.

Если требуемое звуковое сопровождение кино -видеопоказа более или менее удовлетворяется соответствующими технологическими регламентами и нормативами по звукоизоляции и звукопоглощению помещений записи и воспроизведения, то качество звука в телевещании имеет определенные ограничения. Здесь, несмотря на полный набор акустических средств при «передаче» звука, его качество значительно ухудшается при приеме из-за отсутствия необходимого оборудования в типовых условиях для массового зрителя. Подобная, но более сложная задача стоит и перед радио-(громкоговорящим) вещанием, где кроме отмеченного требуется обеспечить наибольшую натуральность, например, музыкально-драматических передач чисто звуковыми методами и средствами. Пока это доступно только для проводных и радиосетей, например, на центральном и региональных каналах

Российской Федерации.

Наиболее сложная ситуация в настоящее время сложилась с обеспечением требуемых характеристик и соответствующей оценки звукопередачи в трактах проводной и радиотелефонной связи. Основной особенностью таких трактов является то, что здесь звукопередача оказывается «закороченной» в сравнительно малом пространстве на голову слушателя, одновременно - речевого «источника». При этом прием осуществляется на одно (реже - два) ухо, считается «по давлению», посредством головного телефона (ГТ), а передача - из ротового отверстия (скользящее падение) к микрофону телефонной трубки (или гарнитуры) через, можно сказать, поверхностный (-шаровой) слой воздуха. Понятно, что в таких условиях практически в полной мере проявляются физические и психоакустические эффекты как ближнего (по акустике) поля действия сигнала, так и неограниченного воздействия дальнего поля мультипликативных и аддитивных помех. Качество звукопередачи таких, как правило, монофонических (одноканальных) трактов, даже с нормативными электрическими параметрами, речи (по разборчивости) оказывается недостаточным, в первую очередь из-за неблагоприятного соотношения звуковых давлений рс (речевого сигнала) и р„ (акустических помех) или их уровней Nc и N„ как при передаче, так и особенно при приёме.

Отмеченные аспекты звукопередачи с акцентом на последний, как наиболее востребованный, в полной мере относятся к состоянию и качеству средств связи многонациональной Республики Афганистан. Многолетняя война, агрессивные смены правящих и оккупационных режимов привели к значительным разрушениям производственных, общественных и жилых зданий, физическому и моральному износу макро- и микроструктур систем культурной и технической коммуникаций. В настоящее время в республике с населением около 18 миллионов человек имеется 4 кино - и телестудий, 2 концертных зала и 120 кинотеатров; «действует» всего 15 старых коммутаторных станций проводной связи (ТС) и 4 сравнительно новые базовые станции (BS) сотовой связи (PC). Средняя плотность телефонизации (число проводных и радиотелефонов на 100 жителей) не превышает, соответственно, 12 и 19 единиц. Более 40 % населения проживает в горных местностях на высоте более 2000м над уровнем моря, где ТС и PC затруднены из - за резких переходов от дневных к ночным температурам и мощных флуктуаций «розы» ветров, влияющих на акустические и электромагнитные поля. В стране официально действуют два государственных языка «дари» (Иранского) и «пушто» (Арабского происхождения), на которых общаются около половины (афганцы) населения. Для другой половины (в сумме), примерно по 1 млн, имеют хождение туркменский, узбекский, пащаий и индийский языки. Остальная часть (кочевники и полукочевники ~ 3 млн.) имеет смешанные диалекты.

С изложенных позиций общей проблемы звукопередачи в коммуникационных системах, исследование новых методов (средств) оценки и повышения разборчивости речи является вполне актуальным, осооенно с учетом перспективной компьютеризации процессов голосового общения «человек-машина». Выбор наиболее подходящих средств и исследование новых методов контроля звукопередачи, как обычно, определяется назначением, особенностями сигнала и его приема и, кроме того, объемом или уровнем получаемой информации. Эти факторы, а так же акустические условия, в которых осуществляется звукопередача и её контроль в значительной мере влияют на выбор необходимых систем или методов.

Так, применение одних, в виде эталонных или образцовых, например, экспертного артикуляционного метода, позволяет осуществить контроль в самом широком плане, где первостепенным является получение наиболее точных результатов, а сложность экспертизы и ограничение во времени не принимается во внимание. В силу трудоемкости такие методы служат главным образом для аттестации и сертификации трактов на производстве, а их техническое применение редко выходит за пределы специальных лабораторий.

Применение других, эксплуатационного типа, более широко используется па практике. Здесь главным является проведение быстрых и простых испытаний, например, при введении в строй той или иной линии, абонентского узла связи, либо вообще в нестационарных условиях для оценки технического состояния во время работы. В первом случае задачей контроля является обнаружение брака при монтаже оборудования, определение дефектов и аттестация трактов связи. Во втором случае проверяется соответствие элементов трактов заданным параметрам, потребность в ремонте и остаточная работоспособность. Результаты контроля считаются нормальными, если погрешность, например, в оценке разборчивости речи передаваемого тракта не превосходит погрешности оценки самих систем или методов контроля, а также погрешностей элементов тракта. Аппаратурное оборудование таких средств и методы контроля должны быть достаточно простыми.

Поэтому целью настоящей работы является исследование лабораторных или технических средств квазибинауральной технологии по оценке разборчивости речи (РР) на основе тонального (формантного) метода при прослушивании по давлению (через головные телефоны) в монофоническом (одноканальном) тракте двухпроводной телефонной (и радио) линии связи путем моделирования естественного бинаурального восприятия. Для достижения поставленной цели необходимо решить следующие задачи:

- выявление различий комплексных свойств слуха при моно - и бинауральном прослушивании звука по давлению в сравнении с естественным восприятием;

- исследование, на основе градиентного принципа звукопередачи (звукоприема) артикуляционного и тонального (формантного) методов оценки разборчивости речи с диотической шумовой маскировкой при квазибинауральном прослушивании; обоснование преимуществ квазибинауральной технологии при нормированных исходных данных для оценки разборчивости речи по давлению в монофонических трактах связи, а также выявление в них фазовой зависимости восприятия линейных и нелинейных искажений;

- сравнение результатов оценки разборчивости речи артикуляционным и предложенным методами при одних и тех же режимах квазибинаурального и монаурального прослушивания по давлению;

- разработка макетов аппаратурной реализации предложенного метода в одноканальных трактах радио- и проводной связи.

Решения данных задач и составляют содержание диссертации, которая состоит из четырех разделов.

В первом разделе обобщаются литературные данные о структуре и особенностях монаурального приема и, в целом, звукопередачи в проводной -и радиосвязи. Анализируется влияние на звукопередачу в открытом пространстве (горных местностях) и помещениях низкочастотных помех естественного происхождения с высокими уровнями. Проводится сравнение объективных и субъективных методов контроля и оценки разборчивости речи. Из анализа таких данных с учетом языковых барьеров и нормативных методов контроля звукопередачи в связи предлагается концепция исследования наиболее удобного и достаточно точного (для рассмотренных условий)- полусубъективного формантного метода.

Во втором разделе рассматривается теоретические предпосылки квазибинауральной технологии оценки разборчивости речи по давлению на основе формантного метода. Анализируется связь между субъективными (и объективными) параметрами "полевой" и телефонной звукопередач как методология бинаурального моделирование восприятия по давлению. Показывается, что такой режим достаточно просто обеспечивается путем электрического фазового расщепления моноканала на два с дихотическим предъявлением звука на правое и левое уши. Такое воздействие повышает громкость звука, а благодаря эффекту бинауральной разности уровня маскировки (БРУМ) в сравнении с моноуральным уровнем приема, понижает эффект восприятия акустических помех.

В третьем разделе рассматриваются основные этапы исследования и практической реализации квазибинауральной технологии формантного метода определения разборчивости речи по давлению. Показывается, что наиболее удовлетворительные результаты контроля и повышения разборчивости осуществляется при противофазном включении двух телефонов в гарнитуре. По сравнению с синфазным включении ГТ и, тем более, монауральным режимом, разборчивость речи повышается на 7. .15%. Обосновывается возможность применение в микротелефонной трубке двух ГТ по типу размещения "тыл к тылу" (bask to bask) и также с противофазным включением. Такая конфигурация реализует прием звука по градиенту давления, обеспечивающим в ближнем поле повышение уровня громкости в речевом диапазоне не менее 5 фон.

В четвертом последнем разделе исследуются фазовые зависимости слухового восприятия линейных и нелинейных искажений. Показывается, что дихотическое предъявление звука при квазабинауральном прослуплавании по давлению приводит не только к изменению порогов маскировки в сравнении с монауральной подачей, но и выявляет более высокую частотную избирательность слуха. Выяснено влияние бинауральных различий сигналов и на восприятие нелинейных искажений, которые в определенном диапазоне частот зависят от положения головы слушателя.

В заключении приводится сводка общих выводов по результатам диссертационной работы.

Заключение диссертация на тему "Исследование тонального метода оценки разборчивости речи при бинауральном прослушивании"

Основные результаты работы состоят в следующем:

1.Показано, что основными параметрами, характеризующими в целом качество телефонной связи, являются: качество голоса в акустических условиях его передачи, качество передачи голоса в виде эквивалента затухания в канале связи и качество слухового восприятия речи в акустических условиях его приема.

2.Акустические условия в открытом (мобильном) пространстве как при передаче, так и приеме речи при проводной -и радиосвязи, удовлетворяющие в принципе полевым (без мультипликативных помех) условиям, оказываются малопригодными из-за "низкого" уровня сигнала и значительного уровня низкочастотных помех. Особое влияние здесь оказывают ветровые помехи, локальные изменения и микроколебания атмосферного давления, а также "псевдозвуки".

3.Выявлены существенные различия (по давлению до ЮдБ) комплексных свойств слуха при моно- и бинауральных прослушиваниях по давлению и в «поде», что ограничивает традиционный объективный контроль звукопередачи в трактах связи по уровню звука в дБ А.

4.Впервые предложена для телефонной -и радиосвязи дифференциальная (симметричная) система защиты от помех, которая по сравнению с обычной несимметричной улучшает условия звукопередачи речевого сигнала с меньшими нелинейными искажениями за счет линеаризации акустической нагрузки на электромеханической преобразователь телефона и расширяет динамический диапазон передачи по верхнему переделу.

5.Впервые обоснован и реализован градиентный принцип звукопередачи путём фазового (дихотического) разделения электрического напряжения сигнала, подводимого к электроакустическим преобразователям телефонов.

6.Показано, что использование градиентного принципа возбуждения преобразователей телефона в микротелефонной трубке при моноприеме, независимого от утечек воздуха из объема между диафрагмой и барабанной перепонкой, обеспечивает естественный монауральный прием (по мнению Г.Бекеши) колебательной скорости, характерной для идентификации и локализации акустической мощности источника в поле и компенсации (потерянных) в канале связи эффектов ближнего поля голосового аппарата человека.

7.0бнаружено, что подведение к телефонам напряжений со сдвигом фазы \j/=180° приводит к латерализационному эффекту расщепления звукового образа внутри головы на два (вблизи ушей), более свойственному слуховому восприятию в поле, вместо одного образа при y|f=0°.

8.Доказано, что наиболее удобным для технических измерений разборчивости речи в условиях действия низкочастотных шумов высокого уровня и языковых барьеров является тональный метод, не требующий квалифицированных дикторов, слушателей и сложного оборудования. Этот метод позволяет по стандартной зависимости слоговой разборчивости от формантной для английской речи определить аналогичную для близкого по фонетической и формантной структуре -арабского языка.

9.Показано, что гармоническое возбуждение телефонов при определении разборчивости речи по тональному методу с бинауральной технологией, в условиях действия низкочастотных помех, позволяет воспринимать сигнал даже с уровнем ниже уровня помех, с отношением пропорциональным логарифму частотной полосы шума.

Ю.Выявлена при квазибинауральном режиме прослушивания по давлению фазовая зависимость ширины критических полос слуха с дихотической подачей тонального сигнала и диотической маскировкой. Наименьшая ширина критических полос по сравнению с монауральным режимом наблюдается при электрическом сдвиге фазы \j/=180°.

11 .Подтверждены субъективные данные прослушивания в поле о зависимости слухового восприятия нелинейных искажений от положения головы слушателя по результатам фазозависимого восприятия нелинейных искажений. Для ряда звуковых колебаний эта зависимость имеет волновой характер.

По результатам диссертации опубликованы следующие работы:

1. М. Mokhd, Panin A., Davidov V. "A comparative estimation of harmonic distortions at a mono-and binaural audition in accordance with pressure" Proceedings of the Eleventh International Congress on Sound and Vibration 5-8 July 2004 St. Petersburg, Russia. Published by International Institute Acoustics Vibration, p.1707-1714.

2. M. Mokhd, Panin A., Davidov V. "About a dependence of the critical hearing bandwidth on binaural phase shifts." Proceedings of the Eleventh International Congress on Sound and Vibration 5-8 July 2004 St. Petersburg, Russia. Published by International Institute Acoustics Vibration, p.l715 -1720.

3. Панин A.B., Мохд M., Давыдов В.В.О влиянии фазовых различий на частотную избирательность слуха по давлению: Сб. науч. тр./ СПбГУКиТ-СПб, 2004.-Вып.17. с.36-42.

4. Мохд М. Применение тонального метода к бинауральной оценке разборчивости речи по давлению: Сб. науч. тр. / СПбГУКиТ. -СПб.,2004.-Вып .17. с.42-48

5.Мохд М., Робонен Д.В., Ершов К.Г. Анализ тонального и артикуляционного метода оценки разборчивости речи при дихотической звукопередаче: Сб. науч. тр./СПбГУКиТ.-СПб.,2005.- Вып. 18. с.58-64.

ЗАКЛЮЧЕНИЕ

Библиография Мохд Мохсин, диссертация по теме Приборы и методы преобразования изображений и звука

1.Концепция создания и развития сетей связи страны / В.К.Евсеев, О.Г.Мясников, Е.Г. Гундарев и др.// Техника средств связи. Сер. Техника проводной связи.-1989, Вып. 1.

2. Калинцев Ю.К. Разборчивости речи в цифровых вокодерах. М: Радио и связь, 1991.

3. Руководящий документ по общегосударственной систем автоматизированной телефонной связи (ОГСТС) -М.: Радио и связь,1982.

4. ГОСТ21655-87. Каналы и тракты магистральной первичной сети ЕАСС. Электрические параметры и методы измерений.

5. ГОСТ22504-83. Тракты звукового вещания. -М.: Изд-во стандартов, 1994.6 .ГОСТ13107-79 (с изменениям в 1994г) Устройства приема и передачи речи. -М.: Изд-во стандартов, 1994г.

6. Дмитриенко И.Е. и др. Измерения в устройствах автоматики, телемеханики и связи. М: Изд-во "Транспорт", 1969.

7. Глухов А.А. Основы звукового вещания. -М.: "Связь", 1977.

8. Рекомендации МККТТР.53. Псофометры приборы для объективных измерений шумов в каналах связи. Оранжевая книга, Т.У.Женева, 1977.

9. Пестриков В.М. Азбука сотового телефона.-СПб.: Наука и техника, 2003.1 l.http://gsmphones.nm.ru//-Mo6nribHbie телефоны системы GSM.

10. Михайлов В.Г., Златоустова JI.B. Измерения параметров речи / Под ред. М.А. Сапожкова. -М.: Радио и связь, 1987.

11. МКТТ. Документ XII Исследовательской комиссии №12-Е, вклад Японии. Женева, 1972.

12. Рекомендации МККТТС.131. Зеленая книга, T.III.1. Женева, 1973.

13. Покровский Н.Б. Расчет и измерение разборчивости речи. -М.: Связь, 1962.

14. Рекомендации МККТТС.131. Материалы 5 пленарной ассамблеи. Зеленая книга, Т. III. 1. Женева, 1972.

15. Снижение шумов в зданиях и жилых районах / Г.Л. Осипов, Е.Я. Юдин и под ред. Г.ЛОсипова и Е.Я.Юдина. -М.: Стройиздат, 1987.

16. Ахметзянов И.М., Гребеньков С.В., Ломов О.П. Шум и инфразвук. Гигиенические аспекты. -СПб.: Бип,2002.

17. Прихода А.Г. Барометрическое нивелирование. -М.: Недра, 1972.19.a. "i^j^^jjbjjV' lH^j^0 fblbjhj 1лjj .Уткин Т.С., к.т.н. Гулам Дастагир С., перевод "САО" Общая метрология, 1970.20. jjjjjduijljbt^UJiljAj^l^l^^lA^jjUj^ljjjjjuij-iilj»" Training

18. Manual For Agro meteorological Classic stations, Rain gauge and Snow gauge observation Kabul, Afghanistan, November, 2003.

19. Поверочная схема для акустических измерительных приборов, применяемых в воздушной среде. -М.: Изд-во стандартов, 1966.

20. Рейтер Э.И.Ветровая нагрузка на сооружения. -M.-JL: ГОНТИ, 1958.

21. Кречмер С.И. Исследование микропульсаций температурного поля в атмосфере. -М.: ДАН СССР,84.1,1952.

22. Повх И.Л. Аэродинамический эксперимент в машиностроении. -М-Л.: Машгиз, 1959.

23. Красильников В.А., Обухов A.M. О распространении волн в среде со случайными неоднородностями (обзор). -М.: Акустический журнал, т.Н, Вып.2., 1956.

24. Голубев И.Ф. Вязкость газов и газовых смесей. -М.: Физматгиз,1959.

25. Вожжова А.И, Захаров В.К. Защита от шума и вибраций на современных средствах транспорта. -Л.: Медицина, 1968.

26. Самойлов А.О., Пономаренко Г.Н., Енин Л.Д., Низкочастотная биоакустика.- С.П.: Реферс,1994.

27. Беранек Л.Л. Акустические измерения. М.: Иностр. Лит -ра, 1952.

28. ГОСТ 51061-97. Параметры качества речи и методы ее измерения. -М.: Изд-во стандартов, 1996.

29. ГОСТ 16600-72. Передача речи по трактам радиотелефонной связи.-М.: Изд-во стандартов, 1972.

30. ANSI S3.2-1989.-Method for measurement the Iatelligilility of Speech over Communication Systems.

31. ГОСТ 25902-83. Зрительные залы. Метод определения разборчивости речи. -М: Изд-во стандартов, 1983.

32. ГОСТ 7153-68. Аппараты телефонные общего применения. Методы испытаний. -М.: Стандартгиз, 1969.

33. Алдошина И.А. Основы психоакустики. Слух и речь. -М.: Звукорежиссер, № 5,8,2002.

34. Зб.Черри К. Человек и информация./Пер.с анг. -М.:Связь.1972.

35. Сапожков М.А. Речевой сигнал в кибернетике и связи. -М.: Госиздат по вопросом связи и радио, 1963.

36. Сапожков М.А. Электроакустика. Учебник для вузов. -М.: Связь, 1978.

37. Акустика: Справочник / А.П. Шоров., А.В.Никонов и др. Под ред. М.А. Сапожкова -М.: Радио и связь, 1989.

38. Иофе В.К., Янпольский А.А. Расчетные графики и таблицы по электроакустике. -М.-Л.: Госэнергоиздат,1954.

39. Вемян Г.В. Передача речи по сетям электросвязи. -М.: Радио и связь, 1985.

40. Труды МККТТ по телефонным сообщениям на дальнее расстояние. -М.: Связьидат,1933.43 .Быков Ю.С. Теория разборчивости в линиях связи. -М.: Оборонгиз,1954.

41. Рашевский Я.И., Каргашин В.Л. Обзор зарубежных методов определения разборчивости речи // Специальная техника//, № 3,4,5,6,2002.

42. Вахитов Я.Ш., Гончарук Н.А. Объективные методы оценки разборчивости речи (обзор). -С.П.: Сб. науч. трудов СПГУКиТ, №18,2005.

43. ANSI. S3.5-1989.-Method for Calculation of the Articulation Index.

44. ГОСТ 8031-78 (переиздание в 1998г) Аппараты телефонные. Тональный метод измерения разборчивости речи. -М.: Изд-во стандартов, 1998.

45. Абу Хиджаа Р. Разработка требований к кинематографическому каналу звукопередачи с учетом фонетических особенностей современного арабского языка. Автореферат и дис -ция на соискание ученой степени к.т.н., -Л.: Изд. ЛИКИ, 1987.

46. Щиржецкий Х.А., Макриненко Л.И. Основные направления развития методов исследования и оценки акустического качества зрительных залов. -М.: Сб.Трудов НИИСФД980.

47. Бенцианова Ю.Е., Виноградова Э.Л. Критерии оценки акустического качества помещений. -М.: НИКФИ, 1982.

48. Beranek L.L Music, Acoustics and Architecture. -New York London, John Willey and Sons, 1962.

49. Flectcher H. Speech and hearing in Communication. D.V. Nostrand Сотр., 1953.

50. Кнудсен B.O.Архитектурная акустика. -Харьков -Киев: ГНТ изд-во Украины ,1936.

51. Макриненко Л.И. Акустика общественных зданий. -М.: Стройиздат, 1986.

52. Анерт В., Стеффен Ф. Техника звукоусиления. -М.: Изд-во "Леруша", 2003.

53. Houtgast Т., Steeneken Н. Modulation Transfer Function in room acoustics as a predictor of speech intelligibity . Acustica 28.66,1973.

54. Peutz V. Articulation loss of consonants as a criterion for speech transmission in a room.JAES, 19,1971.

55. Цвикер Э., Фелькеллер Р.Ухо как приемник информации./ Пер.с нем. Под ред. Б.Г. Белкина. -М.: Связь, 1971.

56. Покровский Н.Б., Варшавский Л.А. Теория разборчивости речи и постоянные русской речи. -Л.: Труды Академии ВКАС,№40,1954.

57. Покровский Н.Б. Метод расчета разборчивости речи в условиях сильного шума при произвольной огибающей его спектра -М.: АКИН. Тезисы докладов 6 Всесоюзной акустической конференции, 1968.

58. Быков. Ю.С. Теория разборчивости речи и повышение эффективности радиотелефонной связи.- М.-Л.: Госэнергоиздат, 1959.

59. French N., Steinberg J. Factors governing the Intelligibility of Speech Sound.- JASA, v.19, № 1,1947.

60. Полковский И.М., Ткаченко А.Д. Электроакустические тракты с обратной связью.- М.: Связь, 1969.

61. Фант Г. Акустическая теория речеобразования. -М.: Наука, 1964.

62. Фланаган Д. Анализ, синтез и восприятие речи. -М.: Связь, 1968.

63. БондаркоЛ.В., Загоруйко Н.Г. и др. Модель восприятия речи человеком .-Н.: Сибир. отд."Наука", 1968.

64. Альтман Я.А., Вайтулевич С.Ф. Слуховые вызванные потенциалы человека и локализация источника звука.-С.П.отд."Наука", 1992.

65. Кравчун П.Н. Генерация и методы снижения шума и звуковой вибрации. -М.: Изд -во МГУ, 1991.

66. Блауэрт Й. Пространственный слух /Пер. с нем. -М.: Энергия, 1979.

67. Анерт В., Райхардт В. Основы техники звукоусиления / Пер. с нем. -М.: Радио и связь, 1984.

68. Семякин Ф.В. Теория и практика звукорежиссуры. -JL: Изд-во ЛИКИ, 1990.

69. Релей Д. Теория звука, Т.2.-М.: Госизд. тех. -теор. лит -ры, 1955.

70. Лэмб Г. Динамическая теория звука. М.: Гос. изд. физ.-мат. лит -ры, 1960.

71. Экспериментальная психология, т.2./ Под ред. С.С. Стивенса. М.: Изд-во ин. лит -ры, 1963.

72. Скучик Е. Основы акустики, Т.2 М.: Изд-во ин. лит -ры, 1959.

73. Вартанян И.А. Звук слух - мозг. - Л.: Наука, Лен. отд., 1981.79.01son H.F. System Responsive to Energy Flow of sound waves. U.S.

74. Patent №1.892.644, (1932).

75. Gade S. Sound intensity and its application in Noise Control. Sound and Vibration, March, 1985.

76. Зверев В.А. Радиооптика (Преобразование сигналов в радио и оптике).-М.: Сов.радио,1975.

77. Харкевич А.А. Избранные труды.Т.З (Теория информации).-М.: Изд -во"Наука",1973.

78. Скучик Е. Основы акустики (2изд.).Т.2. -М.: Изд -во "Мир",1976.

79. Morse Р.М. Vibration and Sound. -New York, 1948.

80. АндреевЕ.В., Сасковец Н.Г., Терехин B.M. Методика электроакустического моделирования звуковых полей в заглушённой камере. -М.: Сб. Трудов НИИСФ,1983.

81. Сасковец Н.Г. Влияние параметров звукового поля помещения на разборчивость речи и методы оценки. -М.: НИКСФ. Автореф. дис. на соискание уч.ст.к.т.н.,1987.

82. Фурдуев В.В. Электроакустика. -М.-Л.:Гос. изд.тех.-теор.лит-ры,1948.

83. Вахитов Я.Ш. Теоретические основы электроакустики и электроакустическая аппаратура. -М.: Искусство, 1982.

84. Лившиц С.Я. Курс архитектурной акустики. -М. -Л.: Главн. ред.стр. лит-ры, 1937.

85. Эфрусси М.М. Слуховые аппараты и аудиометры. -М.: Энергия,1978.

86. Экспериментальная радиооптика./Под. ред. В.А.Зверева и Н.С .Степанова-М.: Наука, 1979.

87. Баскаков С.И. Радиотехнические цепи и сигналы -М: Высшая школа, 1988.

88. Ишуткин Ю.М. Разработка теории модуляционного анализа -синтеза звуковых сигналов и её практическое применение в технике записи звука кинофильмов. -JL: Изд-во ЛИКИ. Автореферат и диссертация на соискание уч.ст.д.т.н.,1988.

89. Давыдов В.В. Лобанов В.В. Низкочастотный громкоговоритель. Авт. св -во СССР №1573472. -М.: Бюл. изобр. СССР,№12,1991.95.01son Н.Е. Gradient Loud speakers. -JAES, V.21, №7, 1973.

90. Vanderkoy J., Lipshitz S. Power Response of Loud speakers with Non coincident Drivers. -JAES, V.34, №4, 1986.

91. Мохд M. Применение тонального метода к бинауральной оценке разборчивости речи по давлению: Сб. науч. тр. / СПбГУКиТ. -СПб.,2004.-Вып.17. с.42-48.

92. Мохд М., Робонен Д.В., Ершов К.Г. Анализ тонального и артикуляционного метода оценки разборчивости речи при дихотической звукопередаче: Сб. Науч. тр./СПбГУКиТ.-СПб.,2005.- Вып. 18. с.58-64.

93. ЮО.Панин A.B., Мохд M., Давыдов В.В. О влиянии фазовых различий на частотную избирательность слуха по давлению: Сб. науч. трудов СПбГУКиТ.-СПб., 2004. -Вып. 17. с.36-42.