автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка и исследование методов оценивания качества передачи вьетнамской речи при статистическом уплотнении стандартной цифровой системы передачи

кандидата технических наук
Чан Куок Тхинь
город
Москва
год
1995
специальность ВАК РФ
05.13.17
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка и исследование методов оценивания качества передачи вьетнамской речи при статистическом уплотнении стандартной цифровой системы передачи»

Автореферат диссертации по теме "Разработка и исследование методов оценивания качества передачи вьетнамской речи при статистическом уплотнении стандартной цифровой системы передачи"

МИНИСТЕРСТВО ПУТЕЙ СООБЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

иг

Р Г 5 веский государственный университет путей сообщения

О О •

(МИИТ)

На правах рукописи

ЧАН КУОКТХИНЬ

УДК 621. 391 (024)

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ ОЦЕНИВАНИЯ КАЧЕСТВА ПЕРЕДАЧИ ВЬЕТНАМСКОЙ РЕЧИ ПРИ СТАТИСТИЧЕСКОМ УПЛОТНЕНИИ СТАНДАРТНОЙ ЦИФРОВОЙ СИСТЕМЫ ПЕРЕДАЧИ

05.13.17-Теоретические основы информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

.Москва-1935

Работа выполнена а Московг -.ом государственном университете

путей сообщений (МИИТ)

Научный руководитель: Действительный член Академии

транспорта Российской Федерации, доктор технических наук, профессор Г. В. ГОРЕЛОи

Официальные оппоненты -доктор технических наук, профессор

Р. А. КОСИЛОВ кандидат технических наук В. А. ДОКУЧАЕВ

Ведущее предприятие:-ГВЦ МПС

Защита диссертации состоится "и." 1996 п. в "//"часов на заседании диссертационного совета К114.05.10 при Московском государственном университете путей сообщения (МИИТ) по.адресу:

103055, г. Москва, А-55, ГТС, ул. Образцова, 15, ауд. с диссертацией можно ознакомиться в библиотеке МИИТа. Автореферат разослан "..." 1995 года.

Ученый секретарь диссертационного

совета К 114.05.10, д.т.н., профессор

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Результаты исследования статистических свойств речевого сигнала приводят к выводу, что можно повысить эффективное использование цифровых трактов методом статистического уплотнения, цифрового речевого сигнала, применение ЦСП со статистическим уплотнением (ЦСП-СУ) в телефонной связи позволит повысить эффективное использование пропускной способности цифровых трактоз, сократить затраты для построения системы связи, удовлетворять потребностям населения и народного хозяйства. В настоящее время применение ЦСП-СУ является одним из важнейших направлений развития отрасли связи.

Применение ЦСП-СУ повышает эффективность цифровых трактов , но при статистическом уплотнении возникают искажения речевого сигнала, в результате отбраковки отсчетов речевого сигнала. При построении ЦСП-СУ использованы разные способы обеспечения качества передачи речевого сигнала. Необходимо создать и развивать теорию исследования процесса преобразования речевого сигнала в ЦСП-СУ. До сих пор было не так много работ по исследованию ЦСП-СУ, вопросы исследования , проектирования и совершенствования ЦСП-СУ продолжают развиваться, причем практика создания и эксплуатации этих систем в развитых зарубежных странах показала эффективность использования пропускной способности цифровых трактов з ЦСП-СУ. Недостаточная изученность объективных закономерностей процесса передачи и восстановления речевого сигнала: в ЦСП-СУ, отсутствие математического аппарата и

строгой методики аналитической оценки, качества передачи по критерию разборчивости приводят к не рациональному проектированию ноаых систем и препятствуют решению в полной мере задачи их совершенствования. Задача создания такого математического аппарата и разработки методики, решаемая в данной диссертационной работе представляют собой часть комплекса проблем исследования, проектирования, совершенствования ЦСП-СУ и является актуальной проблемой.

Для решения поставленной задачи необходимо выполнять следующие основные этапы

1 -Анализ методов цифровой передачи речи при статистическом уплотнении и исследование методов оценивания ее качества

2-Моделирование статистических вероятностных свойств речевого сигнала на вьетнамском языке

3-Разработка модели потоков отсчетов речевого сигнала в ЦСП-СУ в применении для вьетнамской речи

4- Проведение оценки качества передачи вьетнамского речевого сигнала в ЦСП-СУ.

Исходная основа диссертации

Для решения поставленной задачи используем:

-результаты фундаментальных работ теории информации Н. Винера, В.А. Котельникова, К,- Шаннона и др •

-результаты теоретических и прикладных исследований по цифровой обработке и передачи речи Дж.Балами, А.И. Величкина, М.Д. Венедиктора, Г.В, Вемяна, В.Н. Гордиенко, Г.В. Горелова, А.Г. Зюко, М.В. Назарова, В.И. Неймана, Ю.Н. Прохорова, А.Ф. Фомина и др

-результаты исследований цифровых систем передачи информации Л.А. Баранова, А.П. Биленко, В.А. Докучаева, P.A. Косилова, И.А, Лозового, А.Р. Лившица, В.А. Новикова и др.

Цель работы

Выполненная диссертационная работа преследует цель решения комплекса проблем теории восстановления речевого сообщения в ЦСП в частности ЦСГ1-СУ ,эти решения позволят оценивать качество передачи речевого сигнала в ЦСП-СУ по критерию разборчивости , анализировать преимущества и недостатки различных алгоритмов функционирования ЦСП-СУ.

На защиту выносятся следующие основные положения и результаты исследования

1- Алгоритм оценки качества передачи вьетнамской речи в ЦСП-СУ по критерию разборчивости

2-Аналитические модели потока отсчетов на входе восстанавливающего устройства оконечного пункта ЦСП-СУ при фиксированном и чередующемся приоритетах..

3- Аналитическое выражение для оценки влияния шумов квантования на качество передачи вьетнамской речи в ЦСП-СУ при ^-характеристике и А -характеристике компандирования.

4-Аналитическое выражение для оценки влияния шумов „дискретизации и восстановления на качество передачи вьетнамской речи

в ЦСПгСУ

5-Результаты оценки качеств"» передачи сигнала вьетнамской речи в ЦСП-СУ при фиксированном и чередующемся приоритетах.

Методика исследования

Теоретический анализ процессов обработки и передачи речевой информации в ЦСП-СУ выполнен с использованием теории вероятностей, теории массового обслуживания ( в частности теории совпадения хаотических импульсных потоков со случайной длительностью), математического программирования. Экспериментальные исследования выполнены с применением обработки данных эксперимента на ЭВМ

Научная новизна

Диссертации развивает теорию дискретизации и восстановления речевых сообщений в направлении совершенствования методики и математического аппарата аналитической оценки качества передачи и восстановления вьетнамской речи в ЦСП-СУ,

Практическое значение работы

Практическая ценность диссертации: разработанные в диссертации решения дают возможность оценивать качество передачи в ЦСП речевого сигнала по критерию разборчивости, . позволяют сравнивать методы статистического уплотнения в ЦСП-СУ (в частности сделан важный для практики вывод о целесообразности применения ЦСП-СУ при чередующемся приоритете для передачи Еьэтнамской речи) , выбирать

рациональные решения при анализе и проектировании конкретных цифровых систем передачи.

Апробация

Материалы "диссертации докладывались на заседаниях кафедры "Радиотехника и электросвязь" МИИТа , а также на четвертой межрегиональной конференции МНТО РЭС им. А. С. Попова "Обработка сигналов в системах двусторонней телефонной связи" (Москва, 1995 г.)

Публикации

Основные результаты диссертации изложены в четырех опубликованных'работах. Перечень их представлен в конце автореферата.

Структура и объем работы

Диссертация состоит из введения, четырех разделов, заключения, содержит 20 рисунков, 4 таблицы, список литературы из 60

у

наименований. Основная часть диссертации изложена на 101 странице машинописного текста,

Основное содержание работы

Во введении обоснована актуальность темы диссертационной работы, определено современное состояние исследуемых вопросов, формируются цель и задачи исследования, изложены алгоритм их решения и основные положения диссертации.

Первый раздел представляет обзор и анализ методов передачи речи, методов статистического уплотнения цифрового сигнала и методов оценки качества передачи речи в телефонной связи. Представлены возможные причины отбраковки отсчетов речевого сигнала. Из обзора и анализа методов цифровой передачи при статистическом уплотнении, методов оценки ее качества можно сделать следующие выводы: '

1. Применение ЦСП-СУ ведет к повышению эффективности использования пропускной способности цифровых трактов при построении системы связи и является одним из важнейших направлений развития отрасли связи

2. При реализации ЦСП-СУ необходимо исследовать и использовать различные варианты приоритета, при объединении комплектов стандартной ЦСП с целью минимизации числа отбракованных отсчетов речевого сигнала.

3.При определении качества передачи речи по критерию разборчивости в ЦСП-СУ необходимо учитывать отношения сигнал/ шум квантования, дискретизации и восстановления, а .следовательно, определять распределения вероятностей числа отбракованных подряд отсчетов речевого сигнала.

Второй раздел посвящен аналитическому моделированию статистических вероятностных свойств сигнала вьетнамской речи.

Для плотности распределения мгновенных значений речевого сигнала используется гиперэкспоненциальное распределение вероятностей, которое представлено в виде:

1К(х)=4<:"'и' + е-Л'1] , (1)

где А, а, р - коэффициенты,определяемые из условий:

.) №'(*)<&= I и ] л'Щх)<Ы = <т? . (2)

Таким образом:

• I.

.1

(3)

-Экспериментальные результаты при построении гистограммы одномерного распределения вероятностей мгновенных значений речевого сигнала на вьетнамском языке были получены с использованием АЦП К572П31. Определено отношение р/а=4.5

Экспериментальная одномерная плотность распределения вероятностей речевого сигнала на вьетнамском языке (кривая1) и ее аппроксимация (3) при р/а=4.5 (кривая 2) представлены на рис 1. Кривая 3 представляет аппроксимацию (3) для русскоязычного речевого сигнала при р/а=-Л00.

Модель усредненного энергетического спектра речевого сигнала определена аппроксимацией в виде:

-Г-^т I, -0< «¿О , (4) авю+аЧя2 г

. 1

1

со1-2 + + со1

4-У

где

. Д^-Эффективная ширина спйктра сигнала;

• ю •

Рис. 1 Графики плотностей распределения вероятностей мгновенных знамений речевого сигнала и их аппроксимаций (кривые 1,2 для вьетнамской речи; кривая 3 длг. русской-речи)

0=2лРср, Рср -частота среза ФНЧ, используемого для предварительного ограничения спектра ;

^...коэффициенты; • ,,

с^-дисперсия речевого сообщения.

Отметим, что формула (4) удовлетворяет условию нормировки:

*

ч

,)£,(£»)<&> = 2*. (5)

о

Проведенные исследования свойств речевого сигнала позволяют сделать следующие выводы:

1. Гиперэкспоненциальное распределение хорошо описывает экпериментальное распределение вероятностей мгновенных .значений речевого сигнапа на вьетнамском языке и может достаточно эффективно использоваться при решении поставленных в диссертации задач.

2. Достаточно хорошо согласуется с данными эксперимента и используемая аппроксимация энергетического спектра. Максимум спектральной плотности вьетнамской речи достигается на частоте 700Гц (для русской речи 400Гц).

Третий раздел посвящен моделированию потоков отсчетов речевого сигнала на входе восстанавливающего устройства ЦСП-СУ.

Необходимо отыскать математическую формулу для описания плотности распределения вероятностей интервала в потоке отсчетов после статистического уплотнения, в результате которого часть отсчетов отбраковывается.

Плотность распределения вероятностей интервала Тп между соседними'отсчетами в потоке определяется по формуле:

Л;<«>=2>(*Ж«-'f) ,х=0,1.2.....(6)

где Р(х)- распределение вероятностей числа X отбракованных подряд отсчетов ;

f частота дискретизации в первичной ЦСП.

Речевой сигнал может быть представлен в виде последовательности "речевых импульсов", распределение вероятностей длительности которых представляем гиперэкспоненциальной плотностью:

О)

i

где Bi , Ci -коэффициенты. Используем также интегральную функцию

(8)

й математическое ожидание длительности речевого импульса

(9)

Используя собственные записи речевого сигнала вьетнамской речи, представленные в цифровой форме, получили экспериментальную функцию Аэ, представленную на рис 2, и ее аппроксимацию в виде:

А(Х)=0,7 ехр(-4441) + 0,3 ехр(-27001) (10)

(табл.1), которой соответствует плотность ( 7 ) при:

В1=310,3 Гц; С1=444 Гц; Вг=810Гц; Сг=2700Гц.

Таблица 1

Значения экспериментальной функции и ее аппроксимации при значениях, 1, мкс

V мкс 0 125 375 1375 2375 2875

Аэ(1) 1 1 0,695 0,394 0,244 .0,193

А(1) 1 0,874 0,702 0,387 0,244 0,195

Очевидно, что конфликтные ситуации занятия канального интервала двумя комплектами при их статистическом объединении возникают при совпадении импульсов в потоках речевых импульсов этих комплектов, поэтому возникает необходимость использовать положения теории совпадения импульсных потоков. Плотность распределения длительности сопадения тс двух одинаковых потоков речевых импульсов с

распределениями вероятностей (8)

Лг(0

{

Рис. 2.Экспериментальная функция распределения вероятностей длительности речевых импульсов и ее

аппроксимация

При фиксированном приоритете одного (основного) из двух статистически объединяемых комплектов первичной ЦСП можно предгтавить число отбракованных подряд отсчетов дополнительного комплекта в виде Х^г, , а распределение вероятностей X в виде:

Р(х) =

, В, "Г В, fvfl, -sV. -т

, х-0,1,2...; (12)

Для ЦСП-СУ при чередующемся приоритете: (когда с частотой f основной и дополнительный комплекты меняются ролями)

при х=0 при Х = 1

(13)

Для полученных выше значений В|=310.8Гц, С1==444Гц, Вг=810 Гц,С2=2700Гц. рассчитаны при f=8000ru распределения Р(х) при фиксированном и чередующемся приоритетах по формулам (12) и (13) соответственно, а также значения M[xJ ( табл. 2 )

Таблица 2

значения значения распределения Р(х) при значении х

М[х]___ 0 1 2 10 - 50

фиксиро 6,75 0,214 0,158 - 0,120 0,0264 0,00028

ванный

чередую 0,786 0,214 0,786 0 С 0

щийся

Исследование вероятностных свойств потоков отсчетов речевого сигнала в ЦСП-СУ позволило прийти к выводам:

исходными данными для получения оценки качества передачи речевого сигнала в ЦСП-СУ. При моделировании использованы результаты теории совпадения хаотических импульсных потоков со случайными длительностями импульсов.

2. Эти модели позволяют сопоставлять методы статистического уплотнения ЦСП (в частности свидетельствуют о безусловной целесообразности применения . варианта статистического уплотнения с чередующимся приоритетом ).

В четвертом разделе проведена оценка качества передачи речевого сигнала вьетнамской речи в ЦСП-СУ по критерию разборчивости.

Определены отношения сигнал/шум квантования (ОСШК) в ЦСП-СУ дли разных типов характеристики компандирования.

1. Разработанные аналитические модели потоков отсчетов являются

Для ц-характеристики

У =

0<М<;1

ОСШК определяется формулой:

ОС1Ш.

! дЧми_£)Т Л 1&Н И ]

где Д-средний шаг квантования. Для А-характеристики

А\А

1+1пЛ

1 + 1п(Л|х|) 1

1+1пЛ А ОСШК определяется формулой:

<хй\

ОСШК = 10 Ц—

-^Г1 28 281 1 -&[ 1

1Г ' Л

Р

1-е

281 1

; я а}к сх3кг\ 1 26 2б1

28

р к р к

.>3-11 ргкА А'к1.

1

28 281

а1 А2 а2кА а'к1

(15)

Результаты расчета представлены на рис. 3

Зависимость ОСШК от мощности сигнала Рс представлена на рис 4 для стандартной ЦСП (кривая 1), для ЦСП-СУ, в которой последний разряд кодового слова используется для синдрома комплекта (кривая2), для ЦСП-СУ, когда последний разряд кодового слова, который определяет синдром, используется в приемной части АЦО и для определения величины отсцзта (кривая 3), В последнем случае:

ОСШ =10 = 1/128) + (1- р)уг(А= 1/64)]

(16)

где ф-вероятностъ совпадения значения последнего разряда со значением синдрома. При ф=0.5

ОСШ =ОСШ(Д=1/128)-3.98 . (17)

50 * ОСШК. дБ

Рис.3. Зависимость от мощности сигнала отношения сигнал/шум квантования и(30,100,255) для вьетнамской речи (крнв;вая 1,2, ,3) в стандартной [ДСП (. (Л-1/128),(кривая 4,5,6) в ЦСП-С.У (Л-=1/64)

Рис. 4. Отношение сигчал/шум квантования-А в ЦСП-СУ с использованием восьмого элемента кодового слова для синдрома комплекта

На рис 4 кривая 4 соответствует шаблону рекомендации в.712 МККТТ Исследовано влияние отношения сигнал/шум дискретизации и восстановления (ОСШД) на оценку качества передачи речевого сигнала в ЦСП-СУ . ОСШД определено в виде:

ОСЩЦ =10 181^1

2лсг>

2 *<° ^

¿=-00 Т

(18)

Рг(а)Лг| ;

осшд=ю

п-с а+й

вгсЦ{——) + агс 1§(—-—) -

Я

к

2як/1 (х-+ 1)-П-С 2пВс I (х- +1) - О-ь О 1

\ -)- 0К15(--)|

(19)

где

(ОУП)(гП)

-частота среза интерполирующего фильтра ;

Используя распределения Р(х),<12) и (13) для определения ОСШД, по формуле (19) при. значениях /=8000 Гц, 3700. Гц, ^ = 3400 Гц,

получаем для. рассмотренной выше ЦСП-СУ ОСШД=24.7дБ . (при чередующемся, .приоритете), ОСШД= ,"12.6дБ. (при 'фиксированном, приоритете). • •..,..

Используем известную зависимость результирующего отношения сигнал/шум от ОСШК и ОСШД в виде:

ОСШ =ОСЩЦ 11-ехг

, /осшк

-(0.16 осщд

(20)

На основании результатов проведенных во Вьетнаме исследований предложена аналитическая зависимость слоговой разборчивости от результирующего отношения ОСШ :

3=23+81[1-ехр(-0,050СШ)], при ОСЦкбО дБ. (21)

С использованием этой зависимости получаем для ЦСП-СУ при чередующемся приоритете 3>79,6% (ОС11Ж=26дБ, ОСШД=24,7дБ, ОСШ=24,02дБ) для ЦСП-СУ при фиксированном приоритете Эй 60,7% (ОСШК=26дБ, ОСШД=12,6дБ, ОСШ=12,55дБ) Из сравнения разборчивости двух методов передачи в ЦСП-СУ отметем, что качество передачи речевого сигнала в ЦСП-СУ при чередующемся приоритете существенно лучше. В стандартной ЦСП ОСШ=ОСШК и для ОСШК=26дБ 5=81,9% . Результаты и основные выводы данного раздела

1. Использована формула плотности распределения мгновенных значений речевого сигнала- для определения отношения сигнап/шум квантования при характеристике А, ц(30,100,255) в ЦСП-СУ при различных способах передачи синдрома комплекта.

2. Использована формула энергетического спектра речевого сигнала и распределение числа отбракованных подряд отсчетов речевого сигнала

для определения отношения сигнал/ шум дискретизации и восстановления в ЦСП-СУ.

3. Применены результаты исследования результирующего отношения сигнал/шум и зависимости разборчивости от отношения сигнал/шум для расчета разборчивости в ЦСП-СУ. Количественно (по показателю разборчивости) показано преимущество ЦСП-СУ с чередующимся приоритетом.

- -.4

ЗАКЛЮЧЕНИЕ

Полученные в диссертационной работе результаты позволили сделать следующие выводы:

1. Анализ методов статистического уплотнения речевого сигнала в цифровой форма и практического применения ЦСП-СУ позволяют сделать вывод о перспективности развития ЦСП-СУ во всем мире и, в частности, во Вьетнаме, поскольку эти системы позволяют повысить эффективность использования пропускной способности цифровых трактов, сократить затраты для построения системы связи

2. Моделирование потока отсчетов речевого сигнала в ЦСП-СУ с использованием положений теории совпадения импульсов и гиперэкспоненциального распределения вероятностей длительности импульсов речевого сигнала , позволяет' описывать процесс статистического уплотнения потоков отсчетов в ЦСП-СУ , оценивать влияние шума дискретизации и восстановления на качество передачи речи, позволяет сопоставлять варианты приоритета в ЦСП-СУ.

: 3. С . исполосованием моделей статистических свойств речевого сигнала и "моделей потоков отсчетов речевого сигнала в, ЦСП-СУ

определены отношения сигнал/шум квантования, дискретизации восстановления, которые сопоставлены с шаблоном МККТТ 0712. Повышению качества передачи в ЦСП-СУ способствует способ введения синдрома,когда последний разряд кодового слова, который определяет синдром, используется в приемной части и для определение величины отсчетов. Для сообщения на вьетнамском языке ОСШК при (1=100,255 и А-87.6 удовлетворяют нормам соответствующих рекомендации МККТТ

4. Применение в комплексе результатов исследования зависимости ОСШ от ОСШК и ОСШД , зависимости разборчивости от ОСШ (полученной в СРВ) , выражений для распределения отбракованных подряд отсчетов речевого сигнала, для отношения сигнал/шум квантования и дискретизации (восстановления), позволяет аналитически определять разборчивость в ЦСП-СУ.

. 5. На основании полученных результатов можно сделать вывод, что для вьетнамской речи целесообразно использовать ЦСП-СУ при чередующемся приоритете. В этом случае при двукратном увеличении числа каналов качество связи остается приемлемым, приближающемся к качеству связи в ' стандартной первичной ЦСП.

Основные положения диссертации опубликованы в следующих работах

1, Горелоз Г. Р , Лукова О.Н., Чан Куок Тхииь. Влияние порога задержек на качество передачи в пакетных сетях АЯРМЕТ.М.: Обработка сигналов в системах двусторонней телефонной связи . 1994 .с 139-141

2. Горелов Г. В., Лукова О. Н., Чан Куок Тхинь. Влияние изменений аппроксимации плотности распределения вероятностей речевого сигнала на оценку шумов квантования в первичной цифровой системе передачи. Сб. "Деп. Научн. раб. " ВИНИТИ,1993,N1

3. Горелов Г. В.,Чан Куок Тхинь. Вероятностные характеристики — алгоритма отбраковки отсчетов при статистическом уплотнении первичной

цифровой системы передачи. М.: Сб. ЦСИО .Труды МИИТа. 1996 с.81-84 (в печати)

4. Чан Туан Ан, Чан Куок Тхинь. Свойства энергетического спектра и плотности распределения вероятностей вьетнамского речевого сообщения • М.: Сб. ЦСИО. Труды МИИТа. 1S96 с. 85-88. (в печати)

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ ОЦЕНИВАНИЯ КАЧЕСТВА

ПЕРЕДАЧИ ВЬЕТНАМСКОЙ РЕЧИ ПРИ СТАТИСТИЧЕСКОМ УПЛОТНЕНИИ СТАНДАРТНОЙ ЦИФРОВОЙ СИСТЕМЫ ПЕРЕДАЧИ (05.13.17-Теоретические основы информатики)

Чан Куок Тхинь

Сдано в набор.<££. /¿.95, .Подписано к печати. •

Формат бумаги 60x90 1/160бъем 1.5 п. л. Заказ /ЛОЗ. Тираж 100

Типография МИИТа, Москва, ул. Образцова, 15