автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.18, диссертация на тему:Разработка метода и технических средств компандирования спектров речевых сигналов

кандидата технических наук
Маркин, Дмитрий Николаевич
город
Санкт-Петербург
год
2008
специальность ВАК РФ
05.11.18
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Разработка метода и технических средств компандирования спектров речевых сигналов»

Автореферат диссертации по теме "Разработка метода и технических средств компандирования спектров речевых сигналов"

На правах рукописи

Маркин Дмитрий Николаевич

РАЗРАБОТКА МЕТОДА И ТЕХНИЧЕСКИХ СРЕДСТВ КОМПАНДИРОВАНИЯ СПЕКТРОВ РЕЧЕВЫХ СИГНАЛОВ

Специальность 05.11.18 Приборы и методы преобразования изображений и звука

Автореферат диссертации на соискание ученой степени кандидата технических наук 1 2 ДЕК 2008

Сашег-Петербург - 2008

003457362

Работа выполнена на кафедре акустики Санкт-Петербургского государственного университета кино и телевидения

Научный руководитель - доктор технических наук, профессор Уваров Владимир Константинович

Официальные оппоненты:

доктор технических наук Майоров Василий Семенович; кандидат технических наук Плющёв Владимир Михайлович

Ведущая организация - ОАО НПП «Дальняя связь»

Защита состоится «23» декабря 2008 г. в /3 часов на заседании диссертационного совета Д 210.021.01 в Санкт-Петербургском государственном университете кино и телевидения по адресу: 191119, Санкт-Петербург, ул. Правды, д. 13

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного университета кино и телевидения.

Автореферат разослан ноября 2008 г.

Ученый секретарь диссертационного совете

кандидат технических наук, профессор

К.Ф. Гласман

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования.

Число средств передачи информации по радиоканалу непрерывно возрастает. При этом речевая коммуникация (телефония) до сих пор остается одним из наиболее оперативных и востребованных способов непосредственного обмена информацией между людьми. На сегодняшний день число абонентов средств радиотелефонии значительно превышает количество абонентов фиксированных сетей общего пользования, поэтому проблема эффективного использования радиочастотного спектра становится все острее, так как радиочастотный спектр является ограниченным нево-зобновляемым ресурсом. Одним из путей эффективного использования радиочастотного ресурса является сжатие спектра передаваемых сигналов, в частности речевых, как занимающих значительную долю среди всех транслируемых по радиоканалу сигналов.

Несмотря на то, что проблема компандирования спектра речевых сигналов (РС) на сегодняшний день достаточно успешно решается средствами статистической теории с устранением психоакустической избыточности, поиск решений данной проблемы на базе альтернативных теоретических представлений не только не потерял своей актуальности, но и приобрел еще большую остроту с развитием телекоммуникационных технологий, что объясняется ограниченными возможностями известных методов при возрастающей потребности. Одним из теоретических фундаментов, который традиционно рассматривается в качестве основы для решения обозначенной проблемы, является модуляционная теория звуковых сигналив, в этом направлении ориентирована данная работа.'

Разработка новых эффективных способов компандирования спектра РС является актуальной, прежде всего, для систем радиосвязи, в том числе специализированных систем подвижной радиосвязи. Также это актуально для систем записи и хранения больших массивов речевой информации.

Объект исследования: обработка речевых сигналов.

Предмет исследования: Компандирование (сжатие - восстановление) спектра речевых сигналов при их обработке на основе математической модели модуляционной теории.

Основная цель исследования заключается в разработке эффективного метода компандирования спектра речевых сигналов.

В соответствии с основной целью и предметом исследования определены следующие основные задачи исследования:

- экспериментально исследовать свойства функций, описывающих речевые сигналы в математической модели модуляционной теории;

- разработать новую психоакустическую модель, учитывающую особенности слухового восприятия модулированных по амплитуде и частоте сигналов;

- разработать метод и технические средства компандирования спектра речевых сигналов при обработке их природных модулирующих функций;

- экспериментально исследовать эффективность разработанного метода компандирования спектра речевых сигналов;

- обеспечить внедрение результатов, полученных в диссертационном исследовании, в учебный процесс и практику научных исследований.

Методологическую и теоретическую основы исследования составили научные труды отечественных и зарубежных авторов в теории функций, физиологии слуха и речи, теории информации, спектральной теории и модуляционной теории.

Методы исследования. Во время проведения исследования применялись методы математического анализа; спектрального анализа (теоретического и экспериментального); компьютерного моделирования; артикуляционных измерений, и др.

Научная новизна исследования:

1. На основе экспериментальных измерений параметров мгновенной частоты речевых сигналов внесены уточнения в сделанные ранее выводы о

свойствах мгновенной частоты фонем русского языка: во-первых, модулирующие частоты природной частотной модуляции гласных звуков русской речи могут принимать значения выше 1 кГц, во-вторых, природная несущая частота гласных звуков русской речи, как правило, не равняется частоте основного тона голоса.

2. Для устранения психофизической избыточности речевых сигналов с целью сжатия их спектра предложена новая психоакустическая модель, учитывающая особенности слухового восприятия модулированных по амплитуде и частоте сигналов.

3. Для русского языка экспериментально установлено, что модулирующие частоты природных амплитудной и частотной модуляций речевого сигнала в значительной степени совпадают.

4. Для русского языка экспериментально установлено, что при сохранении информации о величине природной несущей частоты речевого сигнала можно незаметно для слуха подменить составляющие спектра сигнала, обусловленные его природной частотной модуляцией, аналогичными спектральными составляющими, обусловленными его природной амплитудной модуляцией.

5. На основе предложенной психоакустической модели разработан способ и устройство компандирования спектра речевого сигнала при делении мгновенных частот сигнала и его огибающей и ограничении сверху спектров огибающей огибающей, косинусов фазы сигнала и огибающей с деленными мгновенными частотами. Экспериментально оценена эффективность компандирования спектра речи разработанным способом.

Научная ценность результатов исследования заключается в том, что полученные в ходе работы при выполнении данного диссертационного исследования научные и технические результаты (например, предложенная новая психоакустическая модель слухового восприятия, установленные факты совпадения и возможности незаметной для слуха подмены модулирующих частот природных амплитудной и частотной модуляций речевых

сигнапов) могут быть использованы при создании новых методов и средств обработки речевых сигналов на основе математической модели модуляционной теории.

Практическая значимость работы. Проведенные теоретические и экспериментальные исследования позволили разработать эффективный способ и устройство компандирования спектров РС при обработке их природных модулирующих функций. Реализация цифровыми средствами разработанного способа компандирования спектра РС в современных системах радиосвязи позволит увеличить эффективность использования радиочастотного ресурса.

Реализация результатов диссертационной работы. Материалы диссертационной работы внедрены в учебный процесс и научно-исследовательскую работу Института ФСБ России (г. Санкт-Петербург) и кафедры акустики Санкт-Петербургского государственного университета кино и телевидения, а также в НИР ООО «Неватон». Внедрение результатов диссертационной работы подтверждено соответствующими актами.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались в трех сообщениях на научно-технических конференциях Санкт-Петербургского государственного университета кино и телевидения в 2006-2007 годах.

Публикации. По материалам выполненных исследований опубликовано 11 печатных работ, в которых изложено основное содержание диссертации: 10 статей, и одна заявка на «Способ и устройство сжатия спектра речевых сигналов», по которой получен патент РФ на изобретение.

Личный вклад автора. Все основные научные результаты, изложенные в диссертационной работе, получены автором лично. Все публикации написаны автором диссертации под редакцией и при общем научном руководстве соавторов.

Структура и объем работы. Диссертация содержит введение, основной текст из четырех глав, заключение, список использованной литерату-

ры и приложение. Объем основного текста с введением и заключением составляет 193 страницы, включая 57 рисунков на 46 страницах и 2 таблицы на 2 страницах. Список использованной литературы содержит 138 наименований.

На защиту выносятся следующие положения:

1. Для сжатия спектра речевого сигнала на основе математической модели модуляционной теории необходимо сжимать спектры огибающей и косинуса фазы сигнала.

2. Модулирующие частоты природной амплитудной и природной частотной модуляций речевых сигналов в значительной степени совпадают

3. Установлена возможность в определенных пределах незаметной для человеческого слуха подмены модулирующих частот природной частотной модуляции на аналогичные модулирующие частоты природной амплитудной модуляции речевых сигналов.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы проблема, основная цель и задачи исследования, дана характеристика работы, сформулированы основные положения, выносимые на защиту, описана структура диссертации.

В первой главе с позиций теории информации, теории спектров и модуляционной теории звуковых сигналов обозначена проблема сжатия спектра РС. Обоснована необходимость продолжения развития модуляционной теории звуковых сигналов, изучающей свойства натуральных акустических сигналов. Обоснована необходимость сжатия спектра речевых сигналов для повышения эффективности использования частотного ресурса каналов передачи речи. Показано развитие и современное состояние решения проблемы компандирования спеюра РС с целью их трансляции по каналам связи. Приведены зависимости качества речи от степени компрессии спектра РС наиболее популярными современными методами.

Сжатие спектра РС возможно за счет уменьшения их статистической

и психоакустической избыточностей. В современных системах радиотелефонии с целью сжатия спектра речевых сигналов наиболее широкое применение нашли гибридные вокодеры, уменьшающие как психоакустическую, так и статистическую избыточности. Достаточно низкое качество получаемой речи при сравнительно невысокой степени сжатия ее спектра современными методами обосновывает необходимость поиска новых путей эффективного решения данной проблемы на базе альтернативных теоретических представлений.

Проведен обзор исследовательских работ, посвященных решению проблемы сжатия спектра РС на базе модуляционных представлений. На основе анализа приведенных работ в конце первой главы делаются выводы о возможности решения проблемы компандарования спектра РС на основе модуляционной теории и формулируются основные задачи настоящего диссертационного исследования: исследовать свойства функций, описывающих РС в математической модели модуляционной теории; разработать методы сжатия спектров огибающей и косинуса фазы РС.

Во второй главе приводятся результаты экспериментальных исследований спектральных и информационных свойств огибающей и косинуса фазы речевых сигналов.

Экспериментально исследованы соотношения между спектром речевого сигнала и спектрами субсигналов его огибающей и косинуса фазы, выделяемых в канале неполного модуляционного анализа. Установлено, что верхние граничные частоты спектров огибающей и косинуса фазы РС практически соответствуют верхней граничной частоте спектра самого сигнала. Также установлено, что значительная часть информации, содержащейся в речевом сигнале, одновременно отражена в его огибающей, и в косинусе фазы, то есть дублируется (рис. 1), а часть информации о речевом сигнале отражена либо только в его огибающей, либо только в косинусе фазы. Информация о значениях природных модулирующих частот речевого сигнала в высокой степени дублируется (модулирующие частоты при-

родных амплитудной и частотной модуляций в значительной мере совпадают). Информация о значении несущей частоты речевого сигнала и о ее относительно медленном изменении при переходе от одного звука речи к другому содержится только в косинусе фазы (мгновенной частоте).

Спектр сигнала

Л Л \ Л

А ж

V \ И V 1

I 1»' Частей», Гц

Спаатр вгибающем

т 1 а 1 1 1

1 к/ V и 1

'и 1.

1 ■ ■

Спектр косинуса фазы

Рис. 1. Спектры речевого сигнала, его огибающей и косинуса фазы для звука «А»

Обоснован выбор определения разборчивости речи по слоговой артикуляции. Измерены зависимости разборчивости речи от верхних граничных частот спектров косинуса фазы и огибающей РС (рис. 2, 3) при их раздельном ограничении сверху с помощью ФНЧ. Все эксперименты по определению слоговой разборчивости проводились в строгом соответствии с

требованиями ГОСТ Р 50840 - 95. По полученным результатам делается вывод, что косинус фазы речевого сигнала играет большую роль в передаче семантической информации речи, так как разборчивость речи быстрее снижается при уменьшении верхней граничной частоты спектра косинуса фазы, то есть высокочастотные компоненты спектра косинуса фазы более информативны, чем аналогичные компоненты спектра огибающей РС. При ограничении сверху спектра косинуса фазы сигнала теряется не только информация о модулирующих частотах природной частотной модуляции и девиации мгновенной частоты РС, но и информация о величине природной несущей частоты сигнала, что существенно влияет на разборчивость речи.

во

I

к 40

3

20

100 1 -1й 1 1 № 4 Частота срыя ФНЧ (, Гц

€> •€> ОСШЮдБ О* О ОСПШлБ О €» ОСШЗОдБ

Рис. 2. Зависимость слоговой разборчивости речи от верхней граничной частоты спектра огибающей речевого сигнала при исходном косинусе фазы (для разных отношений сигнал/шум - ОСШ)

аГ

1

3

юо j ю 1 1 ю 4

Частот» срез» ФНЧ Г, Гц

€> "€> ОСШЮдБ о-О ОСШ20дБ О ' чЭ ОСШ 3 0 дБ

Рис. 3. Зависимость слоговой разборчивости речи от верхней граничной частоты спектра косинуса фазы речевого сигнала при исходной огибающей (для разных ОСШ)

Экспериментально установлено, что временные сдвиги между субсигналами огибающей и косинуса фазы речевых сигналов при их раздельной обработке в канале неполного модуляционного анализа-синтеза оказывают заметное влияние на качество и разборчивость синтезируемой репродукции речи, так как такие относительные временные расхождения приводят к появлению частотных искажений в синтезированном сигнале.

По результатам экспериментальных исследований спектральных и информационных свойств огибающей и косинуса фазы РС делаются выводы о значении этих функций в передаче речевой информации. Косинус фазы играет большую роль в передаче информации о согласных фонемах, а огибающая - о гласных фонемах русского языка. Огибающая речевого сигнала больше отвечает за качество передачи речи. Косинус фазы речевого сигнала в большей мере определяет передачу семантической информации. Делается вывод о нецелесообразности применения ограничения сверху спектров косинуса фазы и огибающей РС для сокращения полосы частот канала связи, требующейся для трансляции речи. Делается вывод, что для сжатия спектра РС на основе модуляционной теории звуковых сигналов и передачи речи с коммерческим качеством (не ниже первого класса качества речи по ГОСТ Р 50840 - 95) необходимо передавать огибающую и косинус фазы сигнала и сжимать спектры как огибающей, так и косинуса фазы.

В третьей главе разрабатывается математическая основа способа сжатия спектра РС на базе математической модели модуляционной теории.

Прежде всего, математически строго обосновывается возможность применения преобразования Гильберта к звуковым сигналам (являющимся относительно широкополосными), на использовании которого строится модуляционная теория. Тем самым показывается, что для описания звуковых сигналов непротиворечиво и теоретически обоснованно может быть использована математическая модель модуляционной теории.

В математической модели модуляционной теории любой звуковой

сигнал s(t) описывается в виде сложно-модулированного (одновременно по амплитуде и частоте) процесса, то есть в виде произведения огибающей S(t) (амплитудно-модулирующей функции) и косинуса фазы cos<p(t) (частотно-модулированной функции) сигнала

t

s(t) = S(t)cos<p(t) = S(t)cos Ji0(t)dt, (1)

0

где <p(t) - текущая фаза сигнала, <a(t) - мгновенная частота (частотно-модулирующая функция) сигнала. Функции S(t) и cos<p(t) являются функциями первой ступени модуляционного разложения (неполного модуляционного анализа) сигнала.

Огибающая сигнала s(t) определяется следующим образом

S(t) = Vs2(t) + s2(t), (2)

где s(t) - исходный сигнал, s(t) - опорный сигнал, сопряженный по Гильберту с сигналом s(t)

s(t)«H[s(t)] = ij^dT. (3)

Ранее* было экспериментально установлено, что выделение мгновенной частоты (ü(t) звуковых сигналов в виде субсигнала даже без выполнения с ней каких-либо преобразований приводит к неустранимым искажениям в синтезируемой на ее основе репродукции звукового сигнала. Поэтому для обработки мгновенной частоты звуковых сигналов отказались от необходимости ее детектирования, были разработаны методы и средства для обработки модулирующих функций S(t) и co(t) звуковых сигналов без их детектирования. Также было установлено, что без детектирования частотно-модулирующей функции co(t) сигнала невозможно сжать ее спектр, так как она стоит аргументом под функцией косинуса.

В работе для сжатия спектра огибающей и косинуса фазы речевого сигнала предлагается углубить разложение сигнала по модулирующим функциям, описывать сигнал в рамках двух ступеней модуляционного раз-

"Уеаров В К. Точное компандирование частотного и динамического диапазонов звуковых сигналов -СПб.-. СПбГУКиТ, 2001. - 326 с

ложения. Из формулы (2) видно, что огибающая сигнала является неотрицательной функцией времени, в ее спектре содержится ненулевая постоянная составляющая. В соответствии со спектральными представлениями спектр огибающей можно разделить на две смежные области - низкочастотную и высокочастотную, поэтому в работе функцию предлагается представлять в виде суммы неотрицательной низкочастотной и знакопеременной высокочастотной частей (рис. 4)

8(1) = 8ИЧ(0 + 8В,(^. (4)

а)

1 6 18

б)

М 08

!£ II

в)

к

»Ж ■ТО 90 ШМШи 1 1 -ж!

«Л / Г

0.« ов

Рис. 4. Разделение огибающей речевого сигнала на низкочастотную и высокочастотную составляющие: а) речевой сигнал; б) огибающая речевого сигнала; в) низкочастотная составляющая огибающей сигнала; г) высокочастотная составляющая огибающей сигнала

- 14В соответствии с модуляционными представлениями высокочастотная составляющая огибающей может быть представлена в виде

8вч(0 = 88(0С05Ч)5(1)! (5)

где БбСО и созсрэ^) - огибающая и косинус фазы огибающей сигнала, функции второй ступени модуляционного разложения сигала. Следовательно, огибающую речевого сигнала можно записать в виде

8(1) = 8„(1) + 8ВЧ (1) = + Б^Осоз <р8(1). (6)

В работе предложено речевые сигналы описывать функциями двух

ступеней модуляционного разложения следующим образом -

= + 85(1)со& <Р8(1)]С05 / и0(О + (о„(Осо8/сот(ОсИ «И, (7)

(Л о )

где (й0(1) - природная несущая частота сигнала, ю^) - девиация мгновенной частоты сигнала, Шщ^) - модулирующая частота природной частотной модуляции сигнала. Описание речевого сигнала в виде сложно-модулированного процесса моделью (7) совпадает по виду с формулой при объединении классических амплитудной и частотной модуляций, при модуляции гармоническими сигналами

I

8(О = [и0 +имСС«С01Ш(]С08/(ю0 +<о„ сое оэ^!^ ■ (8)

о

Разница в том, что в формуле (7) все параметры сигнала являются функциями времени, а в модели (8) - постоянными величинами.

Разработан способ и устройство для двухступенного модуляционного разложения речевых сигналов в соответствии с их представлением моделью (7). Структурная схема разработанного способа представлена на рис. 5. Для двухступенного модуляционного разложения РС предлагается последовательно выполнить два раза процедуру неполного модуляционного анализа сигнала. Приведены характеристики и описание работы отдельных блоков и узлов разработанного устройства для выполнения двух ступеней модуляционного разложения речевых сигналов.

В четвертой главе, прежде всего, экспериментально определены условия выполнения второй ступени модуляционного разложения РС: 1) оп-

Рис. 5. Структурная схема устройства для двухступепного модуляционного разложения речевых сигналов. А1, А2 - первый и второй анализаторы; Д01, Д02 - детекторы огибающей; ДКФ1, ДКФ2 - детекторы косинуса файл; ФВЧ - фильтр высоких частот с граничной частотой 15 Гц; Выч - вычитатель сигналов

ределены оптимальные с точки зрения обеспечения качества передачи речи параметры и схема устройства для двухступенного модуляционного разложения РС; 2) экспериментально установлено, что преобразование Гильберта огибающей РС необходимо выполнять в полосе частот приблизительно 15Гц-4кГц (при ограничении спектра речевого сигнала верхней граничной частотой 4кГц); 3) установлено, что для обеспечения коммерческого качества передачи речи (не ниже первого класса качества по ГОСТ Р 50840 - 95) при двухступенном модуляционном разложении необходимо передавать низкочастотную часть огибающей РС Бич®.

Экспериментально исследованы спектральные и информационные свойства огибающей, косинуса фазы и мгновенной частоты огибающей РС. Установлено, что верхние границы спектров огибающей и косинуса фазы огибающей близки к верхней границе спектра самого сигнала. Также установлено, что модулирующие частоты природных частотных модуляций сигнала и его огибающей в значительной степени совпадают. Часть информации дублируется в модулирующих функциях второй ступени модуляционного разложения речевого сигнала.

Для некоторых фонем русского языка, для мужского и женского голо-

сов проведено измерение основных параметров (при описании моделью частотной модуляции) мгновенной частоты речевого сигнала и мгновенной частоты огибающей сигнала. Исследование мгновенной частоты огибающей РС выполнено впервые. Экспериментально установлено, что: во-первых, модулирующие частоты природной частотной модуляции гласных фонем русского языка могут принимать значения превышающие 1 кГц, во-вторых, для всех фонем русского языка природная несущая частота сигнала превышает несущую частоту огибающей сигнала, в-третьих, несущие частоты звуков русской речи могут принимать значения приблизительно от ста герц до нескольких килогерц, а модулирующие частоты - приблизительно от семидесяти герц до нескольких килогерц, причём низким модулирующим частотам соответствуют низкие значения несущей частоты.

Теоретически и экспериментально исследовано влияние ограничения сверху спектра косинуса фазы сигнала без деления мгновенной частоты и с делением мгновенной частоты. Установлено, что при соответствующем подборе коэффициента деления мгновенной частоты и верхней граничной частоты фильтра низких частот ограничение сверху спектра косинуса фазы с деленной мгновенной частотой после восстановления масштаба мгновенной частоты эквивалентно ограничению сверху спектра мгновенной частоты, при этом сохраняется величина природной несущей частоты и часть модулирующих частот природной частотной модуляции сигнала.

В работе для сжатия спектра РС на базе математической модели модуляционной теории при устранении психофизической избыточности сигнала предложена новая психоакустическая модель, учитывающая особенности слухового восприятия модулированных по амплитуде и частоте сигналов. Ранее* было экспериментально установлено, что человеческий слух различает амплитудную и частотную модуляции только в пределах одной частотной группы (в случае равенства несущих и модулирующих частот амплитудной и частотной модуляций, когда энергетические спектры час-

'Цвикер Э„ Фельдкеляер Р. Ухо как приемник информации - M ■ Связь, 1971 - 255 с

тотно- и амплитудно- модулированного сигналов совпадают). На рис. 6 представлена экспериментально полученная зависимость слухового различения амплитудной и частотной модуляций от значения несущей частоты.

500

т юо ¡0

3050 100 200 500гц1 "2 5 Ю/~кГц

Рис. 6. Зависимость граничной частоты слуховой дифференциации амплитудной и частотной модуляций от несущей частоты (по (Цвикер Э., Фельдкеллер Р. Ухо как приёмник информации. - М.: Связь, 1971, с. 190])

В области спектральных частот, где сосредоточена основная часть энергии речевых сигналов (100 - 3000 Гц) ширина критической полосы чувствительности к разнице амплитудной и частотной модуляций составляет приблизительно 50 - 250 Гц (рис. 6), для большей части значений модулирующих частот природных модуляций речевых сигналов спектральные продукты амплитудной и частотной модуляций выходят за пределы одной частотной группы, то есть не различаются на слух.

Экспериментально установлено, что при сохранении информации о величине природной несущей частоты незаметно для человеческого слуха можно подменить природную частотную модуляцию речевых сигналов их природной амплитудной модуляцией, так как их модулирующие частоты в значительной степени совпадают, а спектральные продукты выходят за пределы одной частотной группы.

На основе экспериментально полученных данных о свойствах функций двух ступеней модуляционного разложения РС и предложенной психоакустической модели разработан способ и устройство компандирования спектра РС (структурная схема которого изображена на рис. 7) при деле-

нии мгновенной частоты сигнала и его огибающей и ограничении сверху спектров огибающей огибающей, косинусов фазы сигнала и огибающей с деленными мгновенными частотами. При такой обработке сигнала частично ограничивается сверху спектр частотно-модулирующей функции сигнала, сохраняется информация о величине природной несущей частоты РС и ее изменении при переходе от одного звука речи к другому. Информация о природных модулирующих частотах речевого сигнала передается, в основном, в амплитудно-модулирующей функции РС, чей спектр сжимается на передающей стороне и восстанавливается на приемной стороне. На приемной стороне часть модулирующих частот природной частотной модуляции незаметно для слуха подменяется модулирующими частотами природной амплитудной модуляции сигнала. На разработанные способ и устройство получен патент РФ на изобретение.

8(0 Бвчю 5„ч(1)

СЖАТИЕ СПЕКТРА ВОССТАНОВЛЕНИЕ СПЕКТРА

(Передающая сторона) (Приемная сторона)

Рис. 7. Структурная схема способа компаидирования спектра речевых сигналов при обработке модулирующих функций двух ступеней модуляционного разложения. А1, А2 -первый и второй анализаторы (рис. 5); ДЧ1, ДЧ2 - делители мгновенной частоты в 32 раза; ФНЧ1, ФНЧ2, ФНЧЗ - фильтры низких частот; КУ - комбинирующее устройс!-во; РУ - распределительное устройство; УЧ1, УЧ2 - умножители мгновенной частоты в 32 раза; СИНТЕЗАТОР - синтезатор, состоящий из двух перемножителей и сумматора

На передающей стороне сигнал разделяется на функции: Энч^), созср5;(1), сояф(1). После этого мгновенная частота сигнала и его огибающей делится в 32 раза, спектры косинусов фазы сигнала и его огибающей после

деления мгновенной частоты ограничиваются сверху с помощью фильтров низких частот, полученные таким образом функции после их объединения методами вторичного уплотнения в комбинирующем устройстве передаются по каналу связи. На приемной стороне восстанавливается масштаб мгновенных частот сигнала и его огибающей, после чего по формуле

5вьЦ(*) = [8нч(1) + 8вч0)СО5<р5в0)]СО8фв0) (9)

формируется репродукция речевого сигнала.

На рис. 8 приведена измеренная зависимость слоговой разборчивости речи от полосы частот канала связи при компандировании спектра РС разработанным способом (2). По этим результатам оценена эффективность разработанного способа компандирования спегара речевых сигналов.

т

80

£

Й

а 60

а

$

I

5 40

В

ё

о

20

100 1 10 3 1 10 * Полос» частот кяпвля Г, Гц

Рис. 8. Зависимость слоговой разборчивости речи от полосы частот канала связи при сжатии спектра речевого сигнала разработанным способом

Сжимая спектр РС разработанным способом, полосу частот канала связи можно сократить примерно до 220 Гц, слоговая разборчивость при этом составит не ниже 86%, что соответствует первому классу качества речи по разборчивости в соответствии с ГОСТ Р 50840 - 95 для систем передачи речи с пониженными скоростями.

ЗАКЛЮЧЕНИЕ

1. На основе результатов экспериментальных исследований сделаны выводы, что для обеспечения коммерческого качества передачи речи (не

220 11 л?

* г У

ниже первого класса качества в соответствии с ГОСТ Р 50840 - 95) и решетя задачи эффективного компандирования спектра речевых сигналов на основе модуляционной теории необходимо передавать огибающую и косинус фазы, и сжимать спектры огибающей, и косинуса фазы сигнала.

2. Экспериментально установлено, что модулирующие частоты природной амплитудной и природной частотной модуляций речевых сигналов в значительной степени совпадают.

3. Для сжатия спектра речевых сигналов на основе модуляционной теории при устранении психофизической избыточности сигнала предложена новая психоакустическая модель, учитывающая особенности слухового восприятия модулированных по амплитуде и частоте процессов. Человеческий слух различает амплитудную и частотную модуляции только в пределах одной частотной группы слуха.

4. Экспериментально установлено, что при сохранении информации о величине природной несущей частоты речевых сигналов можно незаметно для слуха подменить модулирующие частоты природной частотной модуляции на аналогичные модулирующие частоты природной амплитудной модуляции речевых сигналов.

5. На основе предложенной психоакустической модели разработан способ и устройство компандирования спектра речевых сигналов при обработке их модулирующих функций двух ступеней модуляционного разложения: при ограничении сверху спектра природной частотно-модулирующей функции сигнала, сохранении информации о величине природной несущей частоты сигнала и сжатии спектра природной амплитудно-модулирующей функции сигнала. Информация о природной модуляции речевого сигнала передается, в основном, в его природной амплитудно-модулирующей функции. На приемной стороне незаметно для слуха недостающие модулирующие частоты природной частотной модуляции речевого сигнала заменяются аналогичными модулирующими частотами природной амплитудной модуляции сигнала. На разработанные способ и

устройство для его реализации получен патент РФ на изобретение.

6. Разработанный способ компандирования спектра речевого сигнала позволяет сократить полосу частот, требуемую для передачи речи по каналу связи с качеством не ниже первого класса по разборчивости в соответствии с ГОСТ Р 50840 - 95 (для систем передачи речи с пониженными скоростями), примерно до 220 Гц. Выигрыш в полосе частот канала связи при этом составляет около 15 раз (по отношению к полосе 3400 Гц, принятой для телефонных сетей общего пользования). При менее жестких требованиях к качеству речи и более высоких требованиях к степени компрессии (например, в частных коммерческих и специализированных системах связи) полосу частот канала связи можно сократить еще больше, например, приблизительно до 170 Гц, то есть в 20 раз, обеспечивая при этом второй класс качества по разборчивости речи в соответствии с ГОСТ Р 50840 - 95 (для систем передачи речи с пониженными скоростями).

7. Результаты диссертационного исследования внедрены в учебный процесс и научно-исследовательскую работу Института ФСБ России (г. Санкт-Петербург) и кафедры акустики Санкт-Петербургского государственного университета кино и телевидения, а также в НИР ООО «Неватон».

В диссертации поставлена и решена актуальная научно-техническая задача в области преобразования речевых сигналов. На основании выполненных исследований в диссертации изложены научно обоснованные технические разработки, имеющие значение для экономики страны. Разработаны способ и устройство компандирования спектра речевых сигналов при обработке их модулирующих функций двух ступеней модуляционного разложения.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ ОПУБЛИКОВАНО В СЛЕДУЮЩИХ РАБОТАХ

1. Маркин Д.Н., Уваров В.К. К вопросу о необходимой точности настройки звеньев фазовращателя в канале модуляционного анализа-синтеза// Проблемы развития кинематографа и телевидения/Сборник научных тру-

дов СПбГУКиТ, Вып. 18. - СПб.: Изд. СПбГУКиТ, 2005гС. 69 - 79.

2. Маркин Д.Н., Уваров В.К Результаты новых исследований на основе модуляционной теории звуковых сигналов/В сб. Факультету аудиовизуальной техники - 75 лет. - СПб.: Изд. СПбГУКиТ, 2005гС. 36-41.

3. Маркин Д.Н., Уваров В,К. О применении преобразования Гильберта к звуковым сигналам. Деп. рук. № 186кт-Д07, ОНТИ НИКФИ, 2007. - 12 с.

4. Маркин Д.Н., Уваров В.К. Актуальность исследования свойств модулирующих функций огибающей речевых сигналов. Деп. рук. № 183кт-Д07, ОНТИ НИКФИ, 2007. - 22 с.

5. Маркин Д.Н., Уваров В.К. Результаты исследований, подтверждающих возможность технической реализации второй ступени модуляционного разложения речевых сигналов. Деп. рук. № 185кт-Д07, ОНТИ НИКФИ, 2007. - 26 с.

6. Маркин Д.Н., Уваров В.К. Математическая модель огибающей речевых сигналов и способ реализации второй ступени модуляционного разложения речевого сигнала. Деп. рук. № 187кт-Д07, ОНТИ НИКФИ, 2007. - 14 с.

7. Маркин Д.Н., Уваров В.К. Обзор исследований, посвященных решению задачи сжатия спектра речевых сигналов на основе модуляционных представлений. Деп. рук. № 182кт-Д07, ОНТИ НИКФИ, 2007. - 24 с.

8. Маркин Д.Н., Уваров В.К. Результаты практических исследований соотношений между спектрами сигнала, его огибающей, косинуса фазы и мгновенной частоты. Деп. рук. № 181кт-Д07, ОНТИ НИКФИ, 2007. - 32 с.

9. Маркин Д.Н., Уваров В.К. Результаты практических исследований информационных свойств огибающей и косинуса фазы речевых сигналов. Деп. рук. № 188кг-Д07, ОНТИ НИКФИ, 2007. - 28 с.

10. Маркин Д.Н., Осгашевский Е.Н., Уваров В.К. Время-часшшый анализ сигналов. Деп. рук. № 184кт-Д07, ОНТИ НИКФИ, 2007. - 38 с.

11. Маркин Д.Н., Уваров В.К. Способ и устройство сжатия спектра речевых сигналов. Патент РФ на изобретение № 2320028. Приоритет от 27.09.2006. //БИ № 8,20.03.2008. -11 с.

Подписано в печать 13.11.08 г. Формат 60x84 1/16. Бумага офсетная. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ Л74.

Подразделение оперативной полиграфии ФГОУ ВПО СПбГУКиТ. 192102. Санкт-Петербург, ул. Бухарестская, 22.

Оглавление автор диссертации — кандидата технических наук Маркин, Дмитрий Николаевич

ВВЕДЕНИЕ.

Глава 1. ПРОБЛЕМА СЖАТИЯ СПЕКТРА РЕЧЕВЫХ СИГНАЛОВ. ОБЗОР ИССЛЕДОВАНИЙ, ПОСВЯЩЕННЫХ СЖАТИЮ СПЕКТРА РЕЧИ НА ОСНОВЕ МОДУЛЯЦИОННОЙ ТЕОРИИ.

1.1.0 необходимости продолжения проведения исследований в рамках модуляционной теории звуковых сигналов.

1.2. Необходимость решения задачи сжатия спектра речевых сигналов.

1.3. Методы сжатия спектра речи с устранением информационной и статистической избыточности.

1.4. О проблеме сжатия спектра речи с позиций теории информации.

1.5. Обзор исследований, посвященных решению задачи сжатия спектра речевых сигналов на основе модуляционных представлений.

1.5.1. Первые идеи о сжатии спектра речи на базе теории модуляции.

1.5.2. Методы сжатия спектра речи при делении мгновенной частоты и передаче косинуса фазы сигнала, а также при передаче мгновенной частоты и огибающей сигнала.

1.5.3. Современное состояние проблемы сжатия спектра речевых сигналов на базе модуляционной теории.

1.6. Сжатие спектра речевых сигналов с общих позиций теории модуляции.

Введение 2008 год, диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам, Маркин, Дмитрий Николаевич

Настоящая диссертационная работа посвящена разработке метода командирования (сжатия-восстановления) спектра речевых сигналов средствами модуляционной теории.

Актуальность исследования. Особенностью современного этапа развития общества является усиление роли информации во всех основных сферах человеческой деятельности [135], переход общества практически во всемирном масштабе от индустриального к информационному, когда информация стала важнейшим стратегическим ресурсом [136].

Число средств1 передачи информации по радиоканалу непрерывно возрастает. Речевая коммуникация (телефония) остается одним из наиболее оперативных и востребованных способов непосредственного обмена информацией между людьми. Количество абонентов, пользующихся услугами телефонной связи, ежегодно увеличивается. На сегодняшний день число абонентов средств подвижной радиосвязи (радиотелефонии) значительно превышает количество стационарных телефонов, включенных в фиксированные сети. Наиболее интенсивно развивающейся областью передачи речи в настоящее время являются системы мобильной радиосвязи [72, с. 3].

Увеличение потока передаваемых по радиоканалу сообщений приводит к усилению значения проблемы эффективного использования радиочастотного спектра, так как радиочастотный спектр является невозобнов-ляемым ограниченным ресурсом. Одним из путей эффективного использования радиочастотного ресурса является сжатие спектра передаваемых сигналов, в частности речевых как занимающих значительную долю среди всех сигналов, транслируемых по радиоканалу [72, с. 4].

Над решением задачи сжатия спектра речевых сигналов исследователи работают, по крайней мере, на протяжении последних восьмидесяти лет. За это время сформировалось основное направление ее решения, получившее в настоящее время наиболее широкое применение, сжатие спектра речи при устранении статистической и психофизической избыточности с использованием методов линейного предсказания. Однако, несмотря на то, что проблема сжатия спектра речевых сигналов на сегодняшний день достаточно успешно решается средствами статистической теории, поиск других теоретических оснований для ее решения не только не прекращается, но и усилился в последние годы, что обосновывается ограниченными возможностями известных методов при возрастающей потребности.

Радикальное решение проблемы сжатия спектра речевых сигналов в настоящее время не найдено, и ее решение не только не потеряло своей актуальности на сегодняшний день, но и приобрело еще большую остроту с развитием телекоммуникационных технологий.

Модуляционная теория является теоретическим фундаментом, который традиционно рассматривается в качестве основы для поиска решения обозначенной проблемы. В рамках данного направления по существу решений пока не было найдено, однако интерес к нему в последние годы возрос, о чем свидетельствуют появившиеся в последние годы публикации [88 - 90, 94 - 97], посвященные данной тематике.

В модели модуляционной теории сигналы описываются как сложно-модулированные (одновременно по амплитуде и частоте) процессы, в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Установлено, что спектры огибающей и косинуса фазы речевых сигналов обладают примерно одинаковой верхней границей и занимают приблизительно одну область частот. Также установлено, что для обеспечения коммерческого качества передачи речи (не ниже первого класса качества речи по ГОСТ Р 50840 - 95) необходимо передавать как огибающую, так и косинус фазы речевых сигналов. Из этого следует, что для сжатия спектра речевого сигнала на основе модели модуляционной теории необходимо сжимать как спектр огибающей, так и спектр косинуса фазы. Для сжатия спектра огибающей речевых сигналов предлагается выполнить вторую ступень модуляционного разложения сигнала, то есть разложить огибающую сигнала на ее огибающую и косинус фазы. После чего обработкой модулирующих функций второй ступени модуляционного разложения речевого сигнала добиться уменьшения полосы частот его огибающей. Для сжатия спектра косинуса фазы речевого сигнала предлагается выполнять деление мгновенной частоты сигнала без ее выделения и ограничивать сверху спектр косинуса фазы сигнала с деленной мгновенной частотой.

Разработка нового эффективного способа компандирования спектра речевых сигналов является актуальной, прежде всего, для систем радиосвязи (например, специализированных систем подвижной радиосвязи). Также это актуально для систем записи и хранения больших массивов речевой информации.

Объект исследования: обработка речевых сигналов.

Предмет исследования: Компандирование (сжатие - восстановление) спектра речевых сигналов при их обработке на основе математической модели модуляционной теории.

Основная цель исследования заключается в разработке эффективного метода компандирования спектра речевых сигналов.

В соответствии с основной целью и предметом исследования определены следующие основные задачи исследования:

- экспериментально исследовать свойства функций, описывающих речевые сигналы в математической модели модуляционной теории;

- разработать новую психоакустическую модель, учитывающую особенности слухового восприятия модулированных по амплитуде и частоте сигналов;

- разработать метод и технические средства компандирования спектра речевых сигналов при обработке их природных модулирующих функций;

- экспериментально исследовать эффективность разработанного метода компандирования спектра речевых сигналов;

-9- обеспечить внедрение результатов, полученных в диссертационном исследовании, в учебный процесс и практику научных исследований.

Методологическую и теоретическую основы исследования составили научные труды отечественных и зарубежных авторов в теории функций, физиологии слуха и речи, теории информации, спектральной теории и модуляционной теории.

Методы исследования. Во время проведения исследования применялись методы математического анализа; спектрального анализа (теоретического и экспериментального); компьютерного моделирования; артикуляI ционных измерений, и др.

Информационная база исследования. В качестве информационных источников исследования использованы:

- научные источники в виде данных из книг, журнальных статей, научных докладов и отчетов о научно-исследовательской работе, материалов научных конференций и семинаров;

- официальные документы в виде ГОСТов;

- результаты собственных расчетов и проведенных экспериментов.

Научная новизна исследования:

1. На основе экспериментальных измерений параметров мгновенной частоты речевых сигналов внесены уточнения в сделанные ранее выводы о свойствах мгновенной частоты фонем русского языка: во-первых, модулирующие частоты природной частотной модуляции гласных звуков русской речи могут принимать значения выше 1 кГц, во-вторых, природная несущая частота гласных звуков русской речи, как правило, не равняется частоте основного тона голоса.

2. Для устранения психофизической избыточности речевых сигналов с целью сжатия их спектра предложена новая психоакустическая модель, учитывающая особенности слухового восприятия модулированных по амплитуде и частоте сигналов.

3. Для русской речи экспериментально установлено, что модулирующие частоты природных амплитудной и частотной модуляций речевого сигнала в значительной степени совпадают.

4. Экспериментально установлено, что несущая частота речевого сигнала для всех фонем русского языка превышает несущую частоту огибающей сигнала.

5. Для русского языка экспериментально установлено, что при сохранении информации о величине природной несущей частоты речевого сигнала можно незаметно для слуха подменить составляющие спектра сигнала, обусловленных его природной частотной модуляцией, аналогичными спектральными составляющими, обусловленными его природной амплитудной модуляцией.

6. На основе предложенной психоакустической модели разработан способ и устройство компандирования спектра речевых сигналов при де лении мгновенной частоты сигнала и его огибающей и ограничении сверху спектров огибающей огибающей, косинусов фазы сигнала и огибающей с деленными мгновенными частотами. Экспериментально оценена эффективность компандирования спектра речи разработанным способом.

Научная ценность результатов исследования заключается в том, что полученные в ходе работы при выполнении данного диссертационного исследования научные и технические результаты (например, предложенная новая психоакустическая модель слухового восприятия, установленные факты совпадения и возможности незаметной для слуха подмены модулирующих частот природных частотной и амплитудной модуляций речевых сигналов) могут быть использованы при создании новых методов и средств обработки речевых сигналов на основе математической модели модуляционной теории.

Практическая значимость работы:

Проведенные теоретические и экспериментальные исследования позволили разработать эффективный способ и устройство компандирования спектров PC при обработке их природных модулирующих функций. Реализация цифровыми средствами разработанного способа компандирования спектра PC в современных системах радиосвязи позволит увеличить эффективность использования радиочастотного ресурса.

Реализация результатов диссертационной работы.

Материалы диссертационной работы использованы:

1. В учебном процессе и НИР кафедры акустики Санкт-Петербургского государственного университета кино и телевидения.

2. В учебном процессе и НИР Института ФСБ России (г. Санкт-Петербург).

3. В НИР ООО «Неватон».

Внедрение результатов диссертационной работы подтверждено соответствующими актами.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались в трех сообщениях на научно-технических конференциях Санкт-Петербургского государственного университета кино и телевидения в 2006-2007 годах.

Публикации. Основное содержание диссертации изложено в 10 опубликованных и депонированных статьях, а также одной заявке на «Способ и устройство сжатия спектра речевых сигналов», по которой получен патент РФ на изобретение.

Структура и объем работы. Диссертация содержит введение, основной текст из четырех глав, заключение, список использованной литературы и приложение. Объем основного текста с введением и заключением составляет 193 страницы, включая 57 рисунков на 46 страницах и 2 таблицы на 2 страницах. Список использованной литературы содержит 138 наименований.

Заключение диссертация на тему "Разработка метода и технических средств компандирования спектров речевых сигналов"

ЗАКЛЮЧЕНИЕ

Одним из основных способов эффективного использования радиочастотного ресурса является применение методов сжатия спектра передаваемых сигналов. В объеме сигналов, передаваемых по радиоканалу, речевые сигналы занимают одно из первых мест, поэтому задача эффективного сжатия спектра речевых сигналов на фундаменте различных теоретических основ является актуальной. В ходе разработки способа компандирования спектра речевых сигналов на основе модуляционных представлений получены следующие теоретические и практические результаты:

1. На основе результатов экспериментальных исследований информационных и спектральных свойств огибающей и косинуса фазы речевых сигналов сделаны следующие основные выводы: а) для обеспечения коммерческого качества передачи речи (не ниже первого класса качества по разборчивости в соответствии с ГОСТ Р 50840 - 95 [49]) и решения задачи эффективного обратимого сжатия спектра речевых сигналов на основе модели модуляционной теории необходимо передавать с соответствующим качеством и огибающую, и косинус фазы сигнала, а также отдельно сжимать как спектр огибающей, так и спектр косинуса фазы сигнала.

2. Для решения задачи сжатия спектра огибающей речевых сигналов в соответствии с концепцией многоступенного модуляционного разложения звуковых сигналов исследовалась вторая ступень модуляционного разложение речевых сигналов. Для описания огибающей речевых сигналов в рамках двухступенного модуляционного разложения предложена спектрально-модуляционная модель, на основе которой разработан способ и устройство для двухступенного модуляционного разложения речевых сигналов. Впервые на практике технически выполнено двухступенное модуляционное разложение речевых сигналов, для чего экспериментально определены условия выполнения двух ступеней модуляционного разложения речевых сигналов - определены границы частотного диапазона огибающей речевых сигналов, в котором необходимо выполнять преобразование Гильберта, чтобы определить опорный сигнал для огибающей речевого сигнала.

3. Впервые экспериментально исследованы информационные и спектральные свойства огибающей, косинуса фазы и мгновенной частоты второй ступени модуляционного разложения речевых сигналов. Впервые для некоторых фонем русского языка, для мужского и женского голосов, экспериментально измерены основные параметры мгновенной частоты второй ступени модуляционного разложения речевого сигнала, при описании ее моделью частотной модуляции. На основе результатов исследований зависимости разборчивости речи от параметров обработки функций второй ступени модуляционного разложения речевых сигналов разработан способ и устройство обратимого сжатия спектра огибающей речевых сигналов при двухступенном модуляционном разложении речевого сигнала, ограничении сверху спектра огибающей огибающей и ограничении сверху спектра косинуса фазы огибающей с деленной мгновенной частотой.

4. Для сжатия спектра речевых сигналов на основе модуляционной теории впервые предложена новая психоакустическая модель, учитывающая особенности слухового восприятия модулированных по амплитуде и частоте сигналов. Впервые экспериментально установлено, что при сохранении информации о природной несущей частоте речевых сигналов возможна незаметная для слуха подмена модулирующих частот природной частотной модуляции аналогичными модулирующими частотами природной амплитудной модуляции речевых сигналов, в том числе при сжатии спектра огибающей сигнала разработанным способом.

5. Для решения задачи сжатия спектра косинуса фазы речевых сигналов исследовалось влияние на разборчивость речи ограничения сверху спектра косинуса фазы сигнала с деленной мгновенной частотой. Теоретически и экспериментально исследовано изменение мгновенной частоты речевых сигналов при ограничении сверху спектра косинуса фазы сигнала с деленной мгновенной частотой. Разработан способ и устройство обратимого сжатия спектра речевых сигналов при обработке модулирующих функций двух ступеней их модуляционного разложения. На разработанные способ и устройство для его реализации получен патент РФ на изобретение.

6. Разработанный способ компандирования спектра речевого сигнала позволяет сократить полосу частот канала связи, требуемую для передачи речи с качеством не ниже первого класса (для систем передачи речи с пониженными скоростями по ГОСТ Р 50840 - 95), примерно до 220 Гц. Выигрыш в полосе частот канала связи составляет около 15 раз (по отношению к полосе 3400 Гц, принятой для телефонных сетей общего пользования). При менее жестких требованиях к качеству речи и более высоких требованиях к степени компрессии (например, в коммерческих и специализированных системах связи) может быть получен более существенный выигрыш в полосе частот. С помощью разработанного способа компандирования спектра речевого сигнала полосу частот канала связи можно сократить приблизительно до 170 Гц, порядка 20 раз, обеспечивая второй класс качества по разборчивости речи в соответствии с ГОСТ Р 50840 - 95 [49] (для систем передачи речи с пониженными скоростями).

7. Результаты диссертационного исследования внедрены в учебный процесс и научно-исследовательскую работу Института ФСБ России (г. С.Петербург) и кафедры акустики Санкт-Петербургского государственного университета кино и телевидения, а также в научно-исследовательскую работу ООО «Неватон».

В данном диссертационном исследовании поставлена и решена актуальная научно-техническая задача в области обработки речевых сигналов. На основании выполненных исследований в диссертации изложены научно обоснованные технические разработки имеющие значение для экономики и обороноспособности страны. Разработаны способ и устройство компандирования спектра речевых сигналов при обработке модулирующих функций двух ступеней модуляционного разложения.

Библиография Маркин, Дмитрий Николаевич, диссертация по теме Приборы и методы преобразования изображений и звука

1. Oswald J.R.V. The Theory of Analytic Band-Limited Signals Applied to Carrier Systems. IRE Transactions on Circuit Theory, vol. 3, № 4, December 1956. pp. 244 - 257.

2. Баскаков С.И. Радиотехнические цепи и сигналы: Уч. пос. для вузов. 3-е изд., перераб. и доп. М.: Высшая школа, 2000. - 462 с.

3. Gabor D. Theory of communications. The Journal of the Institute of Electrical Engineers, Part III (Radio and Communication Engineering), vol. 93, № 26, November 1946. pp. 429 - 457.

4. Бунгшович В.И. Флуктуационные процессы в радиоприёмных устройствах. М.: Советское радио, 1951. - 360 с.

5. Свешников А.А. Прикладные методы теории случайных функций. 2-е изд., перераб. и доп. М.: Наука, 1968. - 464 с.

6. Левин Б.Р. Теоретические основы статистической радиотехники. Книга первая. М.: Советское радио, 1969. - 752 с.

7. Рытое С.М. Введение в статистическую радиофизику. Ч. I. Случайные процессы. М.: Наука, 1976. - 496 с.

8. Дёч Р. Нелинейные преобразования случайных процессов. М.: Советское радио, 1965. - 208 с.

9. Френке Л. Теория сигналов. М.: Советское радио, 1974. - 344 с.

10. DugundjiJ. Envelopes and pre-envelopes of real waveforms. IRE Transactions on Information Theory, vol. 4, № l5 March 1958. pp. 53 - 57.

11. Вакман Д.Е., Вайнштейн Л.А. Амплитуда, фаза, частота основныепонятия теории колебаний. Успехи физических наук, том. 123, вып. 4, декабрь 1977. С. 657 - 682. '

12. Вакман Д.Е. Об определении понятий амплитуды, фазы и мгновенной частоты сигнала. Радиотехника и электроника, № 5, 1972. С. 972 -978.

13. Коржик В.И., Финк Л.М., Щелкунов К.Н. Расчёт помехоустойчивости систем передачи дискретных сообщений: Справочник. М.: Радио и связь, 1981.-232 с.

14. Уваров В.К. Точное компандирование частотного и динамического диапазонов звуковых сигналов. СПб.: СПбГУКиТ, 2001. - 326 с.

15. Теория передачи сигналов. Учебник для вузов/Зюко А.Г., Кловский Д.Д., Назаров М.В., Финк Л.М. М.: Связь, 1980. - 288 с.

16. Аблазов В.И., Гупал В.И., Згурский А.В. Преобразование, запись и воспроизведение речевых сигналов. Киев: Лыбидь, 1991. - 207 с.

17. Hilbert D. Gottinger Nachr. 1904. pp. 213 259.

18. Математическая энциклопедия. В пяти томах./Т. I. М.: Изд-во «Советская энциклопедия», 1977. - 1152 с.

19. Мышкис А.Д. Математика для технических вузов: Специальные курсы. 2-е изд. СПб.: Лань, 2002. - 640 с.

20. Литвинчук Г.С. Краевые задачи и сингулярные интегральные уравнения со сдвигом. М.: Наука, 1977. - 448 с.

21. Смирнов В.И. Курс высшей математики. В пяти томах./Изд. 21-е, сте-реотипное./Т. II. М.: «Наука», 1974. - 656 с.

22. Смирнов В.И. Курс высшей математики. В пяти томах./Изд. 9-е, сте-реотипное./Т. III, Ч. 2. -М.: Наука, 1974. 672 с.

23. Титчмарш Е. Введение в теорию интегралов Фурье. М.: ОГИЗ, 1948. -479 с.

24. Князев П.Н. Интегральные преобразования./Под ред. Ф.Д. Гахова. -М.: Едиториал УРСС, 2004. 200 с.

25. Лаврентьев М.А., Шабат Б.В. Методы теории функций комплексного- 179 переменного ./Изд. 2-е. -М.: ФМ, 1958. 680 с.

26. Мусхелишвили Н.И. Сингулярные интегральные уравнения. Граничные задачи теории функций и некоторые их приложения к математической физике. M.-JL: ОГИЗ, 1946. - 448 с.

27. Ишуткип Ю.М., Уваров В.К. Основы модуляционных преобразований звуковых сигналов./Под ред. Уварова В.К. СПб.: СПбГУКиТ, 2004.102 с.

28. Г ахов Ф.Д. Краевые задачи./Изд. 2-е. М.: Издательство Физико-Математической литературы, 1963. - 640 с.

29. Трикоми Ф. Интегральные уравнения./Пер. с англ. Под ред. И.Н. Ве-куа. М.: Иностранная литература, 1960. - 300 с.

30. Брычков Ю.А., Прудников А.П. Интегральные преобразования обобщённых функций. М.: Наука, 1977. - 288 с.

31. Владимиров B.C. Обобщённые функции в математической физике. -М.: Наука, 1976.-280 с.

32. Коржик В.И. Расширенное преобразование Гильберта и его применение в теории сигналов. Проблемы передачи информации, Том 5, Вып. 4, 1969. С. 3-18.

33. Трахтман A.M. Гильбертовы колебания и Гильбертовы спектры. Радиотехника, Том 24, № 7, июль 1969. С. 1 - 9.

34. Трахтман A.M., Трахтман В.А. Таблица преобразований Гильберта. -Радиотехника, Том 25, № 3, март 1970. С. 85 89.

35. Rihaczek A. W. Hilbert transform and the complex representation of real signals. Proceedings of the Institute of Electrical and Electronic Engineers, vol. 54, № 3, March 1966. pp. 434 - 435.

36. Hilbert D. Grundziige einer allgemeinen Theorie der linearen Integralglei-chungen. Leipzig, 1912.

37. Tricomi F.G. On the finite Hilbert transformation. Quart. J. Math. Oxford (2),№ 2, 1951. pp. 199-211.

38. Hahn S.L. Hilbert Transforms in Signal Processing. Boston, MA: Artech1. House, 1996.

39. Stark H. An extention of the Hilbert transform product theorem. Proceedings of the Institute of Electrical and Electronic Engineers, vol. 59, 1971. pp. 1359- 1360.

40. Мышкис А.Д. Лекции по высшей математике. М.: Наука, 1969. -640 с.

41. Корэюик В.И. Огибающая сигнала и некоторые её свойства. Радиотехника, № 4, Том. 23, апрель 1968. С. 1 - 6.

42. Трахтман A.M. Введение в обобщённую спектральную теорию сигналов. М.: Советское радио, 1972. - 352 с.

43. Куриное Б.М. Рекурсивный модуляционный анализ функций. Сб. трудов Вычислительные системы, Вып. 44. Новосибирск: Наука, Сибирское отделение, 1971. С. 49 - 59.

44. Ишуткин Ю.М. Перспективы обработки звуковых сигналов по их модулирующим функциям./В сб.: Проблемы звукотехники//Труды ЛИКИ, Вып. XXXI. Л.: ЛЖИ, 1977. С. 102 - 115.

45. Bedrosian Е. A product theorem for Hilbert transforms. Proceedings of the Institute of Electrical and Electronics Engineers, vol. 51, № 5, May 1963. pp. 868-869.

46. Уваров B.K. Речь и слух: Описание некоторых процессов с позиций модуляционной теории звуковых сигналов. СПб.: СПбГУКиТ, 2005. -115с.

47. Фипк Л.М. Сигналы, помехи, ошибки. (Заметки о некоторых неожиданностях, парадоксах и заблуждениях в теории связи). М.: Связь, 1978.-272 с.

48. ГОСТ Р 50840 95 Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. - М.: Издательство стандартов, 1995.

49. Voelcker Н.В. Toward a Unified Theory of Modulation Part II: Zero Manipulation. - Proceedings of the Institution of Electrical and Electronic En- 181 gineers, vol. 54, № 5, May 1966, pp. 735 - 755.

50. Соколов A.B., Андрианов В.И. Альтернатива сотовой связи: транкинго-вые системы. СПб.: БХВ - Петербург; Арлит, 2002. - 448 с.

51. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. - 176 с.

52. Харкевич А.А. О возможности сжатия спектра. Электросвязь, № 11, ноябрь 1958. С. 3 - 8.

53. Dudley Я. W. Synthesizing speech. Bell Laboratories Record, vol. 15, December 1936. pp. 98- 102.

54. Харкевич А.А. Спектры и анализ.//А.А. Харкевич. Избранные труды: В 3 т. М.: Наука, 1973. Т. 2. Линейные и нелинейные системы. - С. 87 -252.

55. Dudley H.W. The carrier nature of speech. The Bell System Technical Journal, vol. 19, № 4, October 1940. pp. 495 - 515.

56. Верзунов M.B. Однополосная модуляция в радиосвязи. М.: Воениз-дат, 1972.-296 с.

57. Kock W.E. Speech bandwidth compression. Bell Laboratory Record, vol. 34, № 3, March 1956. pp. 81 - 85.

58. Schroeder M.R. Vocoders: Analysis and Synthesis of Speech (A review of 30 years of applied speech research). Proceedings of the Institute of Electrical and Electronic Engineers, vol. 54, № 5, May 1966. pp. 720 - 733.

59. Dudley H.W. The Vocoder. Bell Laboratories Record, vol. 18, December 1939. pp. 122- 126.

60. Campanella S.J. A survey of speech bandwidth compression techniques. -IRE Transactions on Audio, vol. 6, September-October 1958. pp. 104 -116.

61. Miller R.L. Signalling System. U.S. Patent 2 117 739, issued May 17, 1938.

62. Flanagan J.L., Golden R.M. Phase vocoder. Bell System Technical Journal, vol. 45, 1966. pp. 1493 - 1509.

63. Marcou P., Daguet J. New methods for speech transmission, 3-rd symposium on information theory. London, 1955. Information theory. Ed. by C. Cherry. London: Butterworth, 1956. pp. 231 - 244. Ann. Telecommunication, vol.11, 1956. pp. 118-126.

64. Marcou P., Daguet J. Systeme de transmission telephonique a bande tres etroite, французский патент № PV 670107 (1954).

65. Гольдштейн B.C., Пинчук A.B., Суховицкий A.JJ. IP-Телефония. M.: Радио и связь, 2001. - 336 с.

66. Licklider J.C.R. Effects of amplitude distortion upon the intelligibility of speech. The Journal of the Acoustical Society of America, vol. 18, № 2, 1946. pp. 429-434.

67. Licklider J.C.R. The intelligibility of amplitude-dichotomized, time-quantized speech waves. The Journal of the Acoustical Society of America, vol. 22, № 6, 1950. pp. 820 - 823.

68. Шелухии О.И., Лукъяпцев Н.Ф. Цифровая обработка и передача ре-чи./Под ред. О.И. Шелухина. М.: Радио и связь, 2000. - 456 с.

69. Сифоров В.PL Третья международная конференция по теории передачи сообщений. Электросвязь, № 1, январь 1956. С. 72-77.

70. Сапожков М.А. Речевой сигнал в кибернетике и связи. Преобразование речи применительно к задачам техники связи и кибернетики. М.: Связьиздат, 1963. - 452 с.

71. Сапожков M.A. О методах «компрессии» спектров речи. Электросвязь, № 8, август 1958. С. 36 - 47.

72. Seki Н. A new method of speech transmission by frequency division and multiplication. The Journal of the Acoustical Society of Japan, vol. 14, 1958. pp. 138- 142.

73. Mayer H.F., Holzler E. Verfahren und Einrichtung zur Elektrischen Nach-richtenubertragung, Pat. DBR № 878381, 1953.

74. Meyer-Eppler W., e.a. Raise of intelligibility of speech in narrow diapason. URSF. № 65-VI-54, 1954.

75. Кандинов A.B., Цемелъ Г.И. О возможности сужения спектра телефонного канала передачей мгновенной частоты речи или применением делителей частоты. Электросвязь, № 8, 1958. С. 3 - 8.

76. Турбович И.Т. Об умножении и делении частоты смодулированных и модулированных колебаний. Радиотехника, Т. 11, № 8, 2956. С. 3 -13.

77. Цемелъ Г.И. Системы сокращения спектра телефонного сигнала.- 184

78. Электросвязь, № 5, 1957. С. 65 70.

79. Цемелъ Г.И. Опознавание речевых сигналов. М.: Наука, 1971. -148 с.

80. Ишуткин Ю.М. Модуляционный анализ-синтез звуковых сигналов. Деп. рук. № 9кт-Д82, ОНТИ НИКФИ, 1982. 125 с.

81. Ишуткин Ю.М. Разработка теории модуляционного анализа-синтеза звуковых сигналов и её практическое применение в технике записи звука кинофильмов: Автореф. дис. на соискание уч. ст. д. т. н. М.: НИКФИ, 1985.-48 с.

82. Волков А.А. Синтетический метод цифровой передачи речевых сигналов. Электросвязь, № 7, 2004. С. 36 - 38.

83. Аладин И.М., Дежурный И.И., Козленко Н.И. Аналоговый вокодер интегрального типа. Электросвязь, № 12, 2001. С. 20 - 24.

84. Кузнецов С.Н. Компандирование спектра речевого сигнала на основе его огибающей и фазы: Автореф. дис. на соискание уч. ст. канд. тех. наук. М.: ВНИИАС МПС России, 2006. - 23 с.

85. F. dejager, Greefkes J.A. "Frena", A system of speech transmission at high noise levels. Philips Technical Review, vol. 19, № 3, October 1957. pp. 73 - 83.

86. Ростовцев Ю.Г. О возможности применения в системах связи предельного амплитудного ограничения речевых сигналов. Электросвязь, № 6, 1958. С. 49-52.

87. Уваров В.К. О возможности преобразования (умножения-деления) мгновенной частоты любого звукового сигнала без выделения этоймодулирующей функции. Деп. рук. № 152 кт-Д99, ОНТИ НИКОИ, 1999.- 10 с.

88. Ashwin R., Kumaresan R. On decomposing speech into modulated components. IEEE Transactions on Speech and Audio Processing, vol. 8, № 3, May 2000. pp. 240-254.

89. Kumaresan R., Ashwin R. Model-based approach to envelope and positive instantaneous frequency estimation of signals with speech applications. -The Journal of the Acoustical Society of America, vol. 105, № 3, March 1999. pp. 1912 1924.

90. Gang Li, Lunji Oiu, Ling Kong Ng Signal representation based on instantaneous amplitude models with application to speech synthesis. IEEE Transactions on Speech and Signal Processing, vol. 8, № 3, May 2000, pp. 353 -357.

91. McAulay R.J., Ouatieri T.F. Speech analysis/synthesis based on sinusoidal representation. IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 34, № 4, August 1986. pp. 744 - 754.

92. Atal B.S., Hanauer S.L. Speech analysis and synthesis by linear prediction of the speech wave. The Journal of the Acoustical Society of America, vol. 50, 1971. pp. 637-655.

93. Makhoul J.I. Linear prediction: A tutorial review. Proceedings of the Institute of Electrical and Electronic Engineers, vol. 63, № 4, April 1975. pp. 561 -580.

94. Маркел Дж.Д., Грэй A.X. Линейное предсказание речи: Пер. с англ./Под ред. Ю.Н. Прохорова, B.C. Звездина. М.: Связь, 1980. -308 с.

95. Уваров В.К. Способ и устройство точного аналогового деления мгновенной частоты сигналов. Патент РФ № 2130651//Б.И. 1999. - № 14.

96. Уваров В.К, Плющёв В.М., Чесиоков М.А. Применение модуляционных преобразований звуковых сигналов ./Под ред. В.К. Уварова. -СПб.: СПбГУКиТ, 2004. 131 с.

97. Нейман В.И. Тенденции развития телетрафика (к итогам MKT-18). -Электросвязь, № 6, июнь 2004. С. 32-35.

98. Flanagan J.L. Speech analysis, synthesis and perception. New York: Springer-Verlag and Academic, 1965.

99. Уваров B.K. Некоторые вопросы модуляционной теории звуковых сигналов: Уч. пос. СПб.: СПбГУКиТ, 2005. - 68 с.

100. Смирнов В.И. Курс высшей математики. В пяти томах/Изд. 23-е, сте-реотипное./Т. I. М.: «Наука», 1974. - 480 с.

101. Звуковое вещание./А.В. Выходец, П.М. Жмурин, И.Ф. Зорин и др.; Под ред. Ю.А. Ковалгина: Справочник. М.: Радио и связь, 1993. -464 с.

102. Управление радиочастотным спектром и электромагнитная совместимость радиосистем./Уч. пос. под ред. М.А. Быховского. М.: Эко-Трендз, 2006. - 376 с.

103. Fant G. Acoustic theory of speech production. 's-Gravenhage: Mouton & Co., 1960.

104. Муравьев B.E. О современном состоянии и проблемах вокодерной техники.//Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества, посвященной 90-летию М.А. Сапожкова. -М.: ГЕОС, 1999. 166 с.

105. Харкевич А.А. Очерки общей теории связи.//А.А. Харкевич. Избранные труды: В 3 т. М.: «Наука», 1973. Т. 3. Теория информации. Опознавание образов. С. 11 - 195.

106. Харкевич А.А. Теоретические основы радиосвязи. М.: Издательство Технико-Теоретической литературы, 1957. - 348 с.

107. А. Кушнир Ф.В., Савенко В.Г., В ерник С.М. Измерения в технике связи. Учебник для вузов. Изд. 2-е доп. и перераб. М.: Связь, 1976. - 432 с.

108. Чугунов А.А. Оценка спектра мощности огибающей и мгновенной частоты случайного звукового сигнала цифровыми методами./Сборник научных трудов ЛИКИ. Л.: ЛИКИ, 1985. С. 53 - 54.

109. Цвикер Э., Фельдкеллер Р. Ухо как приёмник информации. Пер. с нем. Под ред. Б.Г. Белкина-М.: Связь, 1971. 255 с.

110. Зуев П.Ю. Разработка метода и технических средств частотного компрессирования речевых сигналов для повышения разборчивости на фоне помех. Автореферат диссертации на соискание учёной степени к.т.н. СПб.: СПбГУКиТ, 2007. - 22 с.

111. Справочник по расчету и проектированию ARC схем./Под ред. А.А. Ланнэ. - М.: Радио и связь, 1984. - 368 с.

112. Операционные усилители и компараторы. М.: Издательский дом «Додэка-ХХ1», 2002. - 560 с.

113. Гитлиц М.В., Лев А.Ю. Теоретические основы многоканальной связи. М.: Радио и связь, 1985. - 248 с.

114. Сапожков М.А., Михайлов В.Г. Вокодерная связь. М.: Радио и связь, 1983.-248 с.

115. Уваров В.К., Маркин Д.Н. Результаты новых исследований на основе модуляционной теории звуковых сигналов.//В сб.: Факультету аудиовизуальной техники 75 лет. - СПб.: СПбГУКиТ, 2005. С. 36 - 41.

116. Покровский Н.Б. Расчёт и измерение разборчивости речи. М.: Связь-издат, 1962. - 391 с.

117. Речь, слух и качество речевых трактов. Уч. пос. Пенза: Пензенский- 188 политехнический институт, 1974. -46 с.

118. Моишц Г., Хорн П. Проектирование активных фильтров. М.: Мир, 1984.-320 с.

119. Уваров В.К. Измерение основных характеристик мгновенной частоты сигналов. Деп. рук. №119кт-Д88, ОНТИ НИКФИ, 1988. 15 с.

120. ГОСТ 16600 72 Передача речи по трактам радиотелефонной связи. Требования к разборчивости и методы артикуляционных измерений. -М.: Издательство стандартов, 1973.

121. ГОСТ 11515 91 Каналы и тракты звукового вещания. Основные параметры качества. Методы измерений. - М.: Издательство стандартов, 1991.-22 с.

122. Цифровая обработка сигналов/А.Б. Сергиенко. СПб.: Питер, 2003. -608 с.

123. Маркин Д.Н., Уваров В.К. Результаты практических исследований соотношений между спектрами сигнала, его огибающей, косинуса фазы и мгновенной частоты. Деп. рук. № 181кт-Д07, ОНТИ НИКФИ, 2007. -32 с.

124. Маркин Д.Н., Осташевский Е.Н., Уваров В.К. Время-частотный анализ сигналов. Деп. рук. № 184кт-Д07, ОНТИ НИКФИ, 2007. 38 с.

125. Пшеничников А.П. Проблемы информатизации общества и развитие средств электросвязи. Электросвязь, № 2, 1991. С. 7 - 9.