автореферат диссертации по радиотехнике и связи, 05.12.02, диссертация на тему:Исследование и разработка кодека для низкоскоростной цифровой передачи речи в системах подвижной радиосвязи

кандидата технических наук
Русев, Любомир Христов
город
Москва
год
1993
специальность ВАК РФ
05.12.02
Автореферат по радиотехнике и связи на тему «Исследование и разработка кодека для низкоскоростной цифровой передачи речи в системах подвижной радиосвязи»

Автореферат диссертации по теме "Исследование и разработка кодека для низкоскоростной цифровой передачи речи в системах подвижной радиосвязи"

Г 6 сд

; ...... МИНИСТЕРСТВО СВЯЗИ РОССИЙСКОЙ ФЕДЕРАЦИЙ

йосковский ордена Трддового Красного Знамени Технический Университет Связи и Инфориатики

На правах рдкописи

Р9СЕВ Либоиир Христов

ЗЛК 621.391.27:621.396.93

ИССЛЕДОВАНИЕ И РАЗРАБОТКА- КОДЕКА ДМ НИЗКОСКОРОСТНОЙ ЦИФРОВОЙ ПЕРЕДАЧИ РЕЧИ В СИСТЕМАХ ПОДВИНОИ РАДИОСВЯЗИ

Специальность 05.12.02 - Систены и дстройства передачи

информации по канала» свази

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 1395

Работа выполнена на кафедре Теории электрической связи Московского ордена Трудового Красного Знамени Технического Нниверснтета Связи и Информатики.

Надчннй руководитель: доктор технических наук, профессор

Е.Н.ПРОХОРОВ

Официальные оппоненты: доктор физико-математических наук

B.Н.СОРОКИН

кандидат технических наук

C.П.БАРОНИН

Ведудее предприятие: Центральный Научно-исследовательский

Институт Связи (ЦНИИС)

Защита состоится _______" 1993 г. в _^?~часов

на заседании Специализированного Совета К 118.06.03 по присуждение ученой степени кандидата технических наук в Московской ордена Трудового Красного Знамени Технической Вкиверситете Свази и Информатики по адресу: Ш024. Москва, уд.Авиамоторная, д.8а.

автореферат разослан ____" 1993 г.

ЗченнЛ секретарь Специализированного Совета

К 118.00.ОЗ., к.т.н. У Матвеева О.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

В настоящее время наблюдается устойчивая тенденция роста потребностей индивидуальных и коллективных пользователей в предоставлении каналов связи для передачи речевой информации. Следовательно. необходимо постоянно увеличивать число каналов передачи и эффективность их использования, сохраняя высокую достоверность (точность) передаваемых сообщений.

Разрабочики устройств и систем переда-,и сталкиваются с дефицитом отведенных для этой цели частотных диапазонов. Поэтому актуальной является задача низкоскоростной и достоверной передачи речевой информации меяду подвинными абонентами. На сегоднявний день в области цифровой передачи речи достигнуты значительные результаты на базе развития общего направления "кодирование с предсказанием". Такими результатами является серийный выпуск однокристальных кодеков для передачи речи со скоростью 32 кбит/с в соответствии с Рекомендацией 5.721 СС1ТТ, принятые стандарты меа-дународных организаций для передачи речи со скоростью 18 кбит/с, а такяе Федеральный стандарт США для систем подвияной радиосвязи, работающих со скоростью 4,8 кбит/с.

Ведущие научные лаборатории и исследовательские подразделения ряда фирм проводят интенсивные исследования по разработке многоскоростных перестраиваемых кодеков и стандартов для скоростей 2,4 - 9,6 кбит/с в локальных сетях и сетях обчего пользования.

Поэтому задача разработки и исследования кодека для передачи речи в системах подэиишй радиосвязи со скоростями 4.8 - 9,6 кбит/с актуальна и имеет большое практическое значение.

Цель работы и задачи исследований,

Цельэ диссертационной работы является разработка эффективного кодека речи для скоростей 4.8 - 9,8 кбит/с на оснсев алгоритмов линейного предсказаний и зксперииенг«ьного иссладовакиа ин-форчакконких свойств сигнала овибки предсяаггнпя ССОП). Дзя достижения этой цели э диссертации рввеняся занеси:

- срззявййе аягодетиоз -эффзктиого квяврогжя рт* "> ско-

г<.\

ростьв 16 кбит/с для выбора перспективного направления разработки;

- исследование информационных свойств СОП в кодеках речи и разработка ее модели, допускающей дополнительное сокращение избыточности речи;.

- разработка метода квантования СОП на основе модели;

- разработка алгоритмов нелинейного предсказания речевого сигнала, позволявших формировать ошибку предсказания с благоприятными для кодирования свойствами:

- экспериментальное исследование характеристик разработанного алгоритма кодирования речи;

- анализ возыоитстей технической реализации нового кодека.

Состояние вопроса.

В настоящее время алгоритмы эффективного кодирования речи в подавляющем большинстве основаны на линейном предсказании и методах дополнительной обработки СОП. В существующих методах воплощены различные методы квантования параметров предсказания и СОП. Общепризнанным объективным критерием качества передачи речи,, как и других непрерывных сообщений, является критерий минимума сред-неквадратической овибки (СКО). Вместе с тем, при разработке кодеков, работающих на скоростях ни*е 9,6 кбит/с, исследователи сталкиваются с резким сюшениен качества восстановленного сигнала по критерию СКО, что обусловлено, во-первых, небольиим количеством уровней квантования, а во-вторых, несовервенством используемых математических моделей речевого сигнала. Следует отметить такяе, что критерий СКО не отракает свойства слухового восприятия и, следовательно, такое снижение показателя допустимо. Одновременно используется ряд объективных критериев качества, основанных на количественной мере близости спектров и кепстров исходного и восстановленного сигналов, а такке на взаимной корреляции между сигналами. Однако синтез устройств кодирования-декодирования, основанный на таких критериях весьма затруднителен. Поэтому на основании критерия минимума СКО разрабатывавтся практически все кодеки, предназначенные для передачи речи со скоростьв 4,8 - 9,6 кбит/с.

Основными факторами, затрудй'яящимк эффективное кодирование речи простыми средствами, являются существенная нестационарность речевого сигнала и отличие его функции распределения вероятностей (<ЕПВ) от Гауссовской. Влияние первого Фактора учитывают обычно

принятием допущения локального постоянства статистических характеристик речевого сигнала на коротких временных интервалах в 20 -30 as. Второй фактор заставляет разработчиков идти по следувцену пути: поскольку оптимального ревения для негауссовской ФПВ нет и получить довольно трудно, разработка новых алгоритмов идет по направление] изучения информационных характеристик оиибки линейного предсказания и поиска новых ее моделей и алгоритмов кодирования.

Существует несколько главных направлений такого пути:

- векторное квантование СОП;

- фильтрация и квантование прорванной оиибки предсказания:

- создание кодовых книг для СОП с выбором кода по цепи обратной связи.

Во всех направлениях кодирования не учитывавтея информационные характеристики СОП. В настоящей работе выполнено изучение этих характеристик и предлагается нови.^. алгоритм кодирования СОП.

Методы исследования.

Исследования, проведенные в настоящей диссертационной работе выполнены методами теории вероятностей и математической статистики. функционального анализа, теории выбора и принятия рекний, теории информации и статистической радиотехники. В работе виро-чайшим образом применен ыетод моделирования на ЗВН и методы цифровой обработки сигналов. Навинные экспериментальные исследования проводились на ЗВН типа IBM PC AT на основе программного обеспечения, разработанного и отла«енного автором.

Научная новизна.

1. Выполнено экспериментальное сравнение различных алгоритмов кодирования речи со скоростьп 16 кбит/с для выбора перспективного направления исследований.

2. Экспериментально установлено, что СОП представляет собой последовательность некоррелированных блоков отсчетов различной длины, дспускааадх различнув точность квантования.

3. Предложена новая модель источника СОП, учитывавшая его блоковую структуру. Оценена избыточность нового источника.

4. Разработаны нелинейные алгоритмы предсказания речи, цчя-тиЕЗЕзяз усредквчяае ОПВ.

5. Разработан иозйЛ аеторатк вергвжягздногз ¿кжмюго ire&n-Рбэания £0П.

ггА

Основные полокения, представленные к защите:

1. Результаты экспериментального сравнительного исследования кодеков для передачи речи со скоростью 16 кбит/с.

2. Модель источника сигнала ошибки предсказания, представляющую последовательность некоррелированных блоков отсчетов различной длины.

3. Оценка избыточности сигнала ошибки предсказания.

4. Нелинейные алгоритмы предсказания речи, учитывающие условные ФПВ.

5. Алгоритм неравномерного блокового кодирования СОП.

6. Результаты исследования кодека речи со скоростью 4,8-9,6 кбит/с.

Личный вклад.

Все результаты, представленные в работе, получены автором лично.

Практическая ценность.

1. Показано, что при скорости передачи 16 кбит/с кодеки стандартов ШМАЙНАТ-В и СШ обеспечивают БЫИ в среднем на 3 йВ выше, чем кодеки ДМ и ЙДИКМ.

2. Остановлено, что избыточность сигнала ошибки предсказания в кодеке еБИ СШ составляет 0,67.

3. Экспериментально показано, что разработанный алгоритм векторного квантования СОП обеспечивает ЯИК 12 (1В при слабой зависимости от начальных условий обучения кодовых книг.

4. При акустической помехе на входе кодека в диапазоне ЗНЙак от 20 до 8 <1В на выходе изменяется в пределах 12...5 ёВ.

5. В отсутствии акустических помех кодек обеспечивает 1 класс качества по ГОСТ 16600-72.

Апробация работы.

Результаты исследований докладывались ежегодно на конференциях болгарских аспирантов в СССР "Актуальные проблемы современной науки" с мевдуиародным^частиеи и конференциях профессорско-преподавательского состава ИТУСЙ, а также на И Научно-технической конференции молодых ученых, специалистов и студентов "Формирование и обработка радиотехнических сигналов" в Черноголовке -1989г. Вколы-сеиинара РТИ ЙН СССР им.Минца в Новороссийске б

1991г, 1? сенинаре "Автоматическое распознавание слуховых образов" (flPCO - 17) Ивевск, 1992, международной симпозиуме в Терно-поле, Украина, 1992.

Публикации.

По тепе диссертационной работа опубликовано б печатных работ и депонировано 2 доклада в ЦИНТИ - г.София. Болгария.

Структура диссертации.

Диссертация состоит из введения, трех глав, заключения, списка использованной литературы и приловений.

Краткое содержание работы.

Во ВВЕДЕНИИ обоснована актуальность работе. Сформулированы цели и задачи исследований, приведены основные научные результаты. выносимые на зациту, дано краткое описание содернания диссертации.

ПЕРВАЯ ГЛАВА содержит аналитический обзор низкоскоростннх кодеков для цифровой передачи речи в СПР. Дано определение СВР» приведены диапазоны рабочих частот, специфика распространенна радиоволн, указаны характерные помехи, действувцие в СПР, приведена основные принципы организации зтих систем. Сформдлированн основные требования к кодекам для передачи речи в СПР:

- высокая стабильность работы при вероятностях окнбви на символ Роа = 0,001. обеспечение высокой разборчивости (по I классу ГОСТ 16000-72):

- при Pos = 0,0000001 - 0,000001 качество передачи ннзкоско-ростннх кодеков долано быть близким к качеству передачи речг. в системе иипульсно-кодовой модуляции (ИНН) при скорости 64 кбнт/с (Рекомендация 6.711 CCITT):

- кодек доляен сохранять высокое качество саззк при акзстк-ческих помехах на входе с отногеиием SRRaK 10...8 d3;

Современная технология производства компонентов полупрсаоа-киковой микросхемотехники, а такве последние достижения в о-*£ае?й акусто-'лрктроиннх и оптнка-злекгрошшх пр??оров, позвсшшт реализовать больвннстЕО накоплеиних идей я шздзгавт ковке задали m создания ^довтизянх методов цифровой обрабэт рачвёых Среди известных методов аффективного кодирования $ечя uusa-; заилить трк оскоже r^naa: аетодн с 5е4ьта-к8*«?езщп^ ?«¥)» s-r<ua с ак$<5«г.5аш;авьзз6 янпрьсно-нмовой мегяд'пьзй д ws: ;з с

¿гл

- 8 -

предсказанием и анализом через синтез.

В первой главе рассмотрены: метод ДМ, ДИК11, обцие алгоритмы кодеков с ортогональным преобразованием, с обработкой сигнала в выделенных частотных диапазонах. Подробно рассмотрены методы адаптивного предикативного кодирования: RELP, RELP-UQ, GSH, IHHARSAT-8. Среди методов передачи речи с анализом через синтез выделены CELP и SELP (Ш1КВ). Аналитический обзор методов кодирования включает описание структурной схемы, передаваемой в канал информации, скорость передачи в канале.

Изучение приведенных методов позволило сделать вывод о том, что в настоящее время существует две основных рекоммендации по современным средствам эффективного кодирования речи в цифровых СПР: Рекоммендация группы 6SH CCIR на скорость 16 кбит/с, включая помехоустойчивое канальное кодирование и федеральный стандарт CIA на скорость 4,8 кбит/с с повшенной сложностью технической реализации. Из этого следует актуальность научных исследований, направленных на разработку алгоритмов и устройств эффективного кодирования в диапазоне скоростей менее 16 кбит/с, для которого пока отсутствуют мевдународные нормативы. Одним из наиболее перспективных подходов является развитие ыетодов линейного адаптивного предсказания, применение которых позволило создать ряд кодеков для указанных скоростей с обнадевиваюцими результатами. На основе этих выводов в первой главе сформулирована постановка задачи диссертации: Разработка нового алгоритма эффективного кодирования, отличающегося повышенным качеством передачи и умеренной (по сравнению в алгоритмами CELP) слояностью технической реализации.

ВТОРАЯ ГЛАВА посвявена разработке метода сокращения избыточности речевого сигнала. Для этой цели автором проведено сравнительное исследование алгоритмов эффективного кодирования речи со скоростью 16 кбит/с, которое представляет суцественный интерес для разработчиков устройств эффективного кодирования речи. Критериями сравнения являются интегральное качество и разборчивость слогов, контролируемые в условиях наличия ошибок в канале и акустических помех на входе микрофона. Исследовались кодеки ДН с мгновенным компандированием по алгоритму Сонга, АДИКН с адаптивным трансверсальныы фильтром в качестве кратковременного предсказателя и с предсказанием-по основному тону. АДИКМ без предсказания по основному тону. АДИКМ с рекуррентным предсказателем 8 порядка. ЙДИКИ с рекуррентным предсказанием и маскированием, кодек стандарта 6SH. Исследования проводились на реальных речевых сиг-

налах в соответствии с ГОСТ 16600-72 на коыплексе, состоящем из устройства ввода-вквода и ПЭВМ класса IBM PC ИТ 286. Все алгоритмы кодеков программно эмулировались в среде Turbo Pascal 6.0 под управлением MS DOS 5.0. Исходные фонограммы, содержащие фразы, произнесенные мужским и женскими голосами, подвергались фильтрации с полосой 0,3 - 3,4 kHz, соответствующей полосе частот телефонного канала. Нстройство ввода-вывода содержит 10-разрядный АЦП и ЦйП, с поможьв которого речевой сигнал преобразовывался в циф-ровув форму в виде ИКИ с частотой дискретизации f5 = 8 kHz. В целях оперативной обработки, цифровые фонограммы записывались на жесткий диск в виде файлов данных.

Исследования показали наилучшие показатели у кодека 6SH. Среди кодеков АДИКИ наилучжее качества обеспечивал кодек с адаптивным трансверсальным фильтром н предсказателем по основному тону при отсутствии ошибок э канале. При входных акустических помехах кодек АДИКЫ с маскирувим фильтром показал существенный выигрыш.

Результаты сравнения по отношение сигнал/шум (SHR) и баллу качества во многом подтвердились результатами парных сравнений. В таблице I приведена их результаты. В ней обозначены: К1 - кодек ДМ с мгновенным компандированием по алгоритму Сонга, К2 - кодек АДНКМ с адаптивным трансверсальный фильтром 16 порядка и предсказанием по основному тону, КЗ - кодек АДИКМ с адаптивным фильтром 16 порядка без предсказателя по основному тону, К4 - кодек АДИКМ с рекуррентным предсказателем 8 порядка, К5 - кодек АДИКИ с рекуррентным предсказанием и маскированием, Кб - кодек SSM.

В качестве перспективного направления для разработки кодека для передачи речи со скоростьв в диапазоне 4,8 - 9,6 кбит/с бнл выделен алгоритм GSH. Для этого было проведено экспериментальное исследование свойств ООП. сформированного по алгоритму SSM. В качестве осковн исследования была предложена гипотеза о том, что С0П содержит компоненты, финитные во времени, которые моьчо кодировать с разной точностьв. Применялись различные методы выделения этих компонент, основанные на нелинейном преобразований СОИ. Прослувиваниэ синтезированных по обработанном СОИ речевых сигналов подтвердил выдвинутую гипотезу. Наиенсшеа качество скнтезк-рованного сигнала по критерии минимума СКО «гй лвдзяось прк pas Жжении С0П на гоупн отсчетов методом "скодьзялзгэ ^оеаекного омга" длительность:! в. ? отсчета к вндеяення mäkcbs«»»»* по «вергск iwp отсчетов. В ^реетносгся атак пар шрегогда «¿¿сдзй сьхтазлгнме

213

границы групп отсчетов СОИ. Блоки квантовались с разной точностью, установленной ло качеству восстановления речевого сигнала. Был сделан вывод о целесообразности векторного квантования выделенных групп отсчетов неравной длины. Далее в главе представлены общие принципы векторного квантования и оценен выигрыа от его применения по сравнения со скалярным квантованием СОИ. Предложена модификация методов векторного квантования, ослаблявшая влияние начальных условий при построении кодовых книг в процессе обдчения. Предложена также следующая модель источника СОП, фор-мирувщего блоки отсчетов разной длины. Обозначим через 1 тип блока (слова). 1 - 1.Н. Каждое слово принадлежит алфавиту объемом М1. Обозначим через СИ 1-ое кодовое слово типа 1. Пусть вероятность появления группы отсчетов СОП длиной 1.1 отсчетов равна Р1, а ве-

Таблица 1.

Процент предпочтений кодеков

нение Ром = 0 Ро«.= 0,001

Без ак.жума SHR = 5 dB Без ак.вума SNR = 5 dB

К2/К1 81 65 0 0

КЗ/К1 71 67 78 78

КЗ/К2 33 31 100 100

К4/К1 82 67 87 79

К4/К2 35 59 100 100

К4/КЗ 47 37 46 43

К5/К1 73 70 86 80

К5/К2 39 64 400 100

К5/КЗ 44 40 56 53

К5/К4 67 76 62 60

К6/К1 S9 98 99 92

К6/К2 62 68 - -

КО/КЗ 78 57 87 53

KS/K4 90 65 94 42

КВ/К5 86 83 96 85

роятность слова СИ равна Р1/Ь Тогда совместная вероятность этих событий равна

Plj = pl.pl/j ( 1 ) '

и можно рассчитать энтропии источника СОП по формуле

n hi

Н = PiJ.loe(PiJ). ( 2 )

Путем несложных преобразований (2) с учетом (1) получаем и Mi

fi ^РИ.ПойСН) + log(Mi)] =

i*l j*i г—

= log Н + 2_ РМовСНП. С 3 )

И

Средняя длина группы, выражаемая в числе отсчетов равна

= ^Г L1.P1

Li = 2_ Li-Pi < * )

Ы

Тогда число бит на отсчет в среднем равно

Rot = -4r- . Н ( 5 )

Li

Расчетное значение выигрыша в скорости кодирования при использовании этой модели источника СОП по сравнении со скалярным квантованием составляет в среднем 1,5.

Алгоритмы нелинейного предсказания речевого сигнала призваны уменьиить величину выбросов в СОП, обусловленных основным тоном и формантными колебаниями. Рассмотрим модель авторегрессии, в которой дисперсия порождающего процесса зависит от сигнала. Ограничимся для простоты первым порядком:

xt = а.хн+ Ь(хм).5; С б )

Физически наличие зависимости b(xt моано обосновать тем, что оценка xtHa выходе предсказателя не содержит в себе информации о долговременной коррелированности речевого сигнала, которая обусловлена наличием на участках звучания гласных импульсов основного тона. Таким образом, в процессах xt и (xfe - xt ) присутствуют синфазные выбросы, снияавние эффективность линейного предсказания. В (б) за счет коэффициента Ь(хи) эти выбросы в СОП

- 12 -

будут уиеньиены. Функция Ь(х, ,) найдена из условий:

b Cxi4 )

при ограничении

—> ain , b

b Схи)

( 8 )

С поноцьв аппарата вариационного исчисления найдены ревения (7) для различных условных ФПВ. Подтвершден факт линейности модели (6) (b = const) для гауссовских условных ФПВ.

Вторая глава завервается общим алгоритмом неравномерного блокового кодирования СОП. состоящего в выделении блоков овибки, кодировании их по кодовым книгам в цепи обратной связи' кодера. Дано такве описание алгоритма декодирования.

В ТРЕТЬЕЙ ГЛАВЕ приведены результаты экспериментального исследования разработанного алгоритма низкоскоростного кодирования речи. Дано описание алгоритма формирования кодовых книг, проведен анализ скорости его сходимости. Подробно описаны критерии оценки качества восстановления сигнала.

Цифровой поток, формируемый кодеком речи для передачи по каналам связи, состоит из двух частей: потока параметров предсказания и потока СОП. Поток параметров предсказания формируется на кадре обработки речя (20 is) из следующих групп данных:

Группа 1: - параметры кратковременного предсказания R1....R8 - R1 и R2 - по 6 бит, R3 и R4 - по 5 бит. R5 и RS - по 4 бит, R7 и R8 - по 3 бит каздкй.

Группа 2: - параметра долговременного предсказания Р и b (период основного тока Р - 7 бит, козффицие^ предсказания по основному тону Ь - ? бита).

Группа 3: - акала квактш&кш овибки предсказаний 5 - б бит,.

Группе 4: - фаза прсдотгной последоеаг^яькоеги Кс 2 бита.

Группа даашж 3 и 4 ©ap-aspysrec кз кс;- >'f: г.зЗ и передается че?врв разе, г« кат; 'itfp&^&tias рэч?. В&йсаешя* ?acnpag«-ление бит по догвегс^гф,« cs^astw? es адог&зм».

2

используемому при экспериментальных исследованиях кодека. Сушар-ная скорость, необходимая для передачи первой части цифрового потока кодека, составляет 5.2 кбит/с. Анализ корреляционных свойств и ряд исследований векторного квантования коэффициентов кратковременного и долговременного предсказаний речя позволят сделать вывод о том, что цифровой поток со скоростьн 5,2 кбит/с является избыточным. Экспериментальные исследования показали, что переход к векторному квантование параметров Группы 1 (распределение бит: И,112 - 5 бит, R3.R4.R5 - В бит. R6.R7.R8 - 5 бит) приводит не более чем к 10£ сниаении точности описания параметров кратковременного предсказания. Для периода основного тона и фаз прореченной последовательности (Группы 2 и 4) целесообразно применение ДИКИ. При этом для передачи основного тона на кадре требуется 6 бит (4 бита на период и 2 бита на коэффициент), а фазы прорепен-ной последовательности-(Группа 3) - 4 бита. Нхуднение качества на выходе кодека составляет примерно 0.2 ¿В. Применение методов ДНК)! оказывается полезным и для третьей группы данных. При этом для передачи изменения 1калы квантования СОП достаточны 8 бит на кадр. Суммарная скорость передачи первой части информации на выходе кодека составляет 1,7 кбит/с.

Вторая часть цифрового потока на выходе кодека состоит из последовательности типов групп и номеров квантов, полученных в процессе выполнения процедуры векторного квантования СОП.

При использовании равномерного кода для описания каадого кванта расчетная скорость передачи потока оаибки предсказания составляет приблизительно 3,4 кбит/с. Дополнительно требуется порядка 1,6 кбит/с для передачи типа группы. Сказанные цифры рассчитаны по данным второй главы. Для определения возмоаностей уненызения этой скорости рассмотрим информационные характеристики двумерного источника групп онибки предсказания.

Источник вырабатывает в момент времени Ь пару символов

(1,к), где 1 = 1.....N - тип (длина) группы, к = 1,...,Н1 - номер

кодового слова из кодовой книги объемом Н1, соответствувей группам длиной I. Вероятность появления кодового слова (1)

Р = Р1.Р(к/1),

где Р1 - вероятность появления группы длиной 1.

Р(к/1) - условная вероятность появления кодового слова с номером к при условии, что источник вырабатывает группу длиной 1.

ггз

Рассмотрим случай, когда символы двумерного источника, появлявшиеся в различные моменты времени, независимы. Тогда энтропия источника определяется соотношением:

N Н М1

Н4= -^~Р1.1овР1 -V уРи1ов РСк/П 1--1 Ы Ш

( 3 )

- i

Ваксимуиа энтропия достигает, когда Р1 = —— , а Р(к/1) =

м N I 1 г = —. При этом Ншах = 1одН + —) 1оцК1.

Избыточность источника определяется соотновениен

1 _ Л_ . ( ю )

Ншах

Рассмотрим теперь случай зависимого двумерного источника. Пусть вероятность появления группы длиной 1 в момент времени I зависит от длины группы, появившейся в предыдущий момент времени. Пары символов, появляющихся в моменты времени I и (-1 обозначены (1,к) и и,г) соответственно. Совместная вероятность двух последовательных пар

г) = Р(к/1).РС1/]).РСЛ.РСг/]) ( И )

при следующих условиях:

С1,к)/(],г)

= Р

а,к>/]

( 12 )

к/С],!)

РСк/1).

С 13 )

Эзтропия. прмхошааел на о^.;:: сшм, пяререла-

етсй соотноЕеаййк

Ее' и К; К;

Й1- Г \ \ ; » . * • ; ; 4 > 2 « . • - ' \

^- - — ) } / >.;<.*;> 1У

ки

X 1ов Р(к/] ).Р(1/1 ).РС1 ).РСг/})

С 14 )

Упрощая вырааение с использованием свойств распределения вероятностей, получаем ^

М1

+ _

Тн км.

( 15 )

Расчеты, выполненные по приведенным выше формулам для кодовых таблиц, составленных для реальных речевых сигналов, показывают , что энтропия Н1 принимает значения в диапазоне 1,9 - 2,1. Среднее значение энтропии на один отсчет входного сигнала составляет 0,66. Нчет зависимости символов двумерного источника в соседние моменты времени практически не изменяет расчетное значение энтропии (отличие Н2 от Н1 составляет менее 1%).

Таким образом, приведенные расчеты показывают, что минимально достижимая (без потери в качестве звучания) скорость цифрового потока на выходе кодера составляет 3,5 кбит/с (1.7 кбит/с - скорость передачи параметров предсказания и 1,8 кбит/с - скорость передачи ошибки предсказания, расчитанная по энтропии источника с учетом прореживания СОП с фактором 3).

Исследование влияния входных акустических помех на качество синтезированного сигнала показало, что в диапазоне Я^ак 20..8 <1В кодек обеспечивает I класс качества по ГОСТ 16600 - 72. Допустимую вероятность ошибки в канале передачи, при которой сохраняется высокое качество без помехоустойчивого канального кодирования составляет Рои доп = 0,0001.

Для согласования асинхронного потока на выходе кодера с синхронным каналом предлояено использовать стандартное буферное запоминающее устройстве.

Оценена сложность технической реализации разработанного алгоритма кодирования и декодирования. Кодек моано реализовать на одном сигнальном процессоре типа ТМЗ 320 С 25.

В ЗАКЛЮЧЕНИИ сформулированы основные научные результаты, по-

-16 -

лученные в диссертационной работе:

1. Проведен аналитический обзор современных методов низкоскоростного кодирования речи.

2. Установлено, что с доверительной вероятностьв 0,95 сигнал овибки предсказания состоит из некоррелированных блоков отсчетов неравной длины, допускавших различную точность квантования.

3. Разработана модификация алгоритма построения кодовых книг векторного квантования, сшившего влияние выбора начальных условий на относеннв сигнал/вам на выходе.

4. Избыточность сигнала овибки предсказания в кодеке 6БН составляет 0,6?.

5. Разработан метод неравномерного блокового кодирования сигнала овибки предсказания.

6. Синтезирована с помощью вариационных исчислений модель нелинейного предсказания речевых сигналов.

7. Выполнено экспериментальное, исследование разработанного кодека. Показано, что при атновении входного сигнала к акустической помехе в диапазоне 20...8 <1В на выходе кодека отновение скгнал/вум изменяется в диапазоне 12...5 ¿В. Установлено, что при вероятности овибки в канале, не превывавцей 0,0001, кодек обеспечивает I класс качества по ГОСТ 16600-72. Для согласования асинхронного выхода кодера с синхронным каналом мовет быть использовано стандартное буферное запоминавшее устройство.

По теме диссертации опубликованы следцвщие работы:

1. Л.X.Русев. Моделирование на ЭВМ кодека ИЕЬР для низкоскоростной цифровой передачи речи. - Доклад на II Научно-техни--ческой конференции молодых ученых, специалистов и студентов "Формирование и обработка радиотехнических сигналов". К., Черноголовка, XI 1889 г,

2. Л.X.Русев. Моделирование на ЭВМ низкоскоростного кодека едя цифровой передачи речевые сообщений. - Даклад на XI Научной конференции болгарских аспирантов в СССР с махяународним участием "Актуальные проблемы современной науки - 89". М.. кш> 1989г.. Прнлогение к газете "Друвба", 8о.25/1989» .. дэиоодован в ЦИНГИ -г. Сосда, Богхарка.

3. Й.К.Рйсзл. Взджрйакме ка Ж ».едока (1Е1Р-СС кая кн-коскоростной цкфройой соргядо - Двкхзд а« XII йагалнгех-нкческоа воШФвнцвв геящшш т

гчаегкзк *й8тд&£Ш0 «¿¿йт- - 8., >

1990г., Деп. в ЦИНТИ - г.София, Н.Р.Болгария.

4. С.И.Алябьев, Л.Х.Русев. Исследование низкоскоростннх кодеков с адаптивной дельта-модуляцией и адаптивной дифференциальной импульсно-кодовой модуляцией для систем спутниковой связи. -Статистические методы обработки сигналов и изобраяений. Тезисы докладов яколн - семинара. Новороссийск. 1991г.

5. Л.Х.Русев. Новий алгоритм цифрово! передач! мови, який базуеться на л!н1йному означенн! 1 зфективному кодуванн1 сигнал1в к1нцевого передбачення. - Доклад на меядународном . симпозиуме "1мов1рн1ст1 модел! та обробка випадкових сигнал1в 1 пол!в 1И0ВСП - 92", Терноп1ль - 1992р.

6. Л.Х.Русев. Новый алгоритм цифровой передачи речи со скоростью 9,6 кбит/с. - Доклад на 17 семинаре "Автоматическое распознавание слуховых образов" (АРСО-17). Ииевск, 1992г.

Подписано в печать 30.04.93. Формат 60; х34/16. Печать офсетная. Объем^.О усл.п.л. Тираж 100 зкз. Заказ 223. Бесплатно.

ОП11 ;»ГГУСИ. Москва, ул. Авиамоторная, 8.