автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Методы и средства автоматизированного проектирования систем кодирования речи
Автореферат диссертации по теме "Методы и средства автоматизированного проектирования систем кодирования речи"
На правах рукописи
КОЛОМИЕЦ ИРИНА АЛЕКСАНДРОВНА
МЕТОДЫ И СРЕДСТВА АВТОМАТИЗИРОВАН! ЮГО 11РОЕК ГИРОВАНИЯ СИС1 ЕМ КОДИРОВАНИЯ РЕЧИ
Специальность: 05.13.12 - Системы автоматизации проектирования (промышлен ность)
Ав гореферат диссертации на соискание ученой степени кандидат 1ехпических наук
Владимир 2005
Работа выполнена на кафедре «Вычислительной техники» Владимирски! о государе i вешим о универси re i а
Научный руководитель - доктор технических наук,
профессор Ланцов Владимир Николаевич
Официальные оппоненш: -доктор ¡ехнических наук,
профессор Паянзин Наум [ урьевич
Защи!а состой i ся « б » июля 2005 i в i 4.00 на заседании диссертационно!о совета Д212 025.01 в ауд. 211 корп. 1 Владимирскою юсударовенного университет но адресу: 600000, i. Владимир, ул Горького, д.87.
С диссершцией можно ошакомшься в библиогеке Владимирскою государствен ног о у i ш версит е ¡ а
Автореферат разослан «_» июня 2005i.
Отзывы на авторсфера! в двуч экземплярах, заверенные нечапло, просьба направляхь но адресу: 600000, г. Владимир, ул. Горького, 87, ученом) секрет apio сове i а.
Ученый секретарь диссертационно!о сон*""«
доктор технических наук, профессор Макаров 1'Н
- кандидат!ехнических наук,
Долинин Александр Геннадьевич
Ведущая организация - КБ Радиосвяш, г. Владимир
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
В настоящее время наблюдается активное развитие и внедрение новых цифровых систем передачи знаковой информации Поскшшо вофаоающее число нользоватепеп cncieM связи требует повышения пропускной способное 1и каналов связи Одним из путей увеличения пропускной способноеш каналов связи является сжатие передаваемой информации. В современных системах связи значительную часть передаваемых данных составляю! речевые сообщения Блок кодирования речевых сш налов (кодек) являегся неот ьемлемой частью систем связи
Исходные данные для проектирования кодеков представляю! собой набор параметров, часть из коюрых являегся независимыми, а дру!ая взаимосвязанными Cienein» соошекпвия харатаериешк разрабатываемого кодека указанным параметрам можно оценшь, только имея законченную реализацию системы кодирования речи.
Процесс проектирования кодека включает следующие шаги выбор алгоритма кодирования речи, формирование начальной cipyiaypi.i кодека, варьирование структуры системы, связанное с выбором алгоритма реализации отдельною блока, и варьирование параметров бтоков Для каждою варианта кодека производится анализ на соотве|ствие заданным параметрам. Проектирование кодека представляет собой mhoiоигерационный процесс, причем значительная часть итераций носи г вложенный характер
При таком подходе основным недостатком является высокая трудоемкость процесса проецирования систем кодирования речи
Кроме пою, на сегодняшний день для реализации большииива блоков кодеков известно множество альтернативных вариантов реал и тации, основанных на различных алгоритмах, зю множество постоянно растет за счет интенсивного развшия области речевою кодирования В зависимости от квалификации и опыта разработчика от ею внимания может ускользай. значительное чисно возможных проектных решении и, следовательно, разработанный кодек может иметь более низкое качество, относительно потенциально возможною
Устранение указанных недостатков возможно путем использования в процессе проектирования речевых кодеков систем автоматизированного проектирования (САПР), предос^вл^ющих пользователю множество альтернативных реализации различных блоков систем кодирования речи
Анализ современных ('АИР показал, что па сегодняшний день не существует специализированных citcicm автоматизировать)! о проектирования, ориентированных на разработку речевых кодеков Возможности проектирования систем кодирования речи с помощью универсальных САПР определяются составом библиотек цифровой обработки сш налов Однако универсальность САПР для решения специализированной задачи разрабоп<и речевых кодеков является недостатком в том понимании, что по-прежнему неоправданно велико время разработки Универсальные САПР позволяют формировать модели для noto—числа блоков речевых кодеков, что гакже снижает их систем кодирования речи. Пекоюрые САПР^с
^Jhscbl....... "' ■ •• ■ "-'-V
возмо
помощью пакетов расширения, ориешированных на ироскшрование смоем (елекоммуннкацпй, предооавляин гоювыс модели речевых кодеков современных оандарюв связи, однако возможности их модификации о[раничены оруюурным уровнем, алюршмы их элеменюв не дос1унны иользова1елю
Из выше сказанною следует, чю в насюящее время задача автомаппации процесса проектирования систем кодирования речи является ак1уальной
Целью работы являйся разработка меюдов автома! пзпровашюю проектирования сиоем кодирования речи и создание на их основе пакета прикладных пренрамм, предназначенною для решения данной задачи
Для достижения указанной цели в работе оавягся и решаются следующие основные задачи.
I. Исследование и анализ алгоритмов кодирования речи
2 Исследование существующих споем кодирования речи
3 Исследование современных подходов к проектированию речевых кодеков, возможнооей современных САПР для решения данной задачи
4. Разработка обобщенной модели сиосмы кодирования речи, включающей множеово алыернашвиыч алюришов функциональных блоков на разных уровнях детализации, н способов се предоавлепия в базе знаний.
5. Разработка меюдики ав1 ома (тированного нроектрования сиоем кодирования речи, направленной на формирование орук(урной и функциональной моделей кодека с использованием ба !Ы знаний и библиотеки блоков.
6. Разработка математического, информационною и нро1раммною обеспечения подсистемы СА1II', позволяющей формирован, ор>кгурн>ю и функциональную модели кодека и оценивав характеристики полученною решения.
Методы исследования. Для решения иооавленных задач в рабоге использовались методы- 1еории САПР, 1еории трафов, 1еории мкожсон, 1еорин цифровой обрабо1ки ей! налов, кюрии обрабо1ки речевых сигналов
Научная повита работы. Новые научные резулыамл, полученные в работе соооя! в следующем'
1 Разрабо[ана обобщенная модель сиосмы кодирования речи, предложен способ ее представления в базе знаний в виде совокупное!и двух И-ИЛИ-деревьев.
2 Предложена методика ароматизированною нроектрования сиоем кодирования речи, направленная на формирование струк1урной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
Практическая ценность. Разработанные меюды авюмашзированною проск1ироваш1Я речевых кодеков применимы для создания как самосюя1етыюи еиоемы, так и нодсиоемы любой из сюроннич сред нроектрования (САПР
или среды проектирования на языках высокою уровня), позволяющих разрабатывать н подключать пол:.ювательские библиотеки.
На основе предложенных методов автомашзированною проеюирования систем кодирования речи была разработана специализированная подсистема САПР, позволяющая сокрагшь временные затраты на разрабожу речевых кодеков и повыешь качество проектируемою ус i роист па кодирования речи Библиотека блоков кодеков иодсис!емы САПР выполнена по 1ехноло1ии динамически подключаемых библиотек (DLL) и может бьпь использована в сторонних САПР, позволяющих проектировать функциональные модели устройся и поддерживающих подключение пользовательских модулей. Открытость архитектуры подсистемы и возможность се взаимодействия с другими САПР позволяют включай, новые модули. Разрабо1анпая подсистема САПР позволяет моделирован, и исследовать сущес1вующис системы кодирования речи, исследовать oí дельные функциональные блоки кодеков, создавав модели новых сие i ем кодирования речи. Возможность замены блоков существующею кодека блоками с друтон реализацией той же функции п настройка каждою параметра блока позволяю i с малыми временными затратами наГпи эффективное техническое решение
Реализация и внедрение результатов работы. Работа по теме диссертации проводилась на кафедре ВТ Вл! У. в Центре мпкро электронною проектирования и обучения, в рамках тосзаказа но контрактам ПИОКР N» 2852/03, № 2879/03. № 2992/03 Полученные резулыатм исследовании в виде меюдик, про1раммпою обеспечения и моделей устройств внедрены в виде ма1ериалов отчетов по НИР и ОКР, выполненных в рамках госзаказа, и в учебный процесс кафедры ВТ ВлГУ.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались lid следующих семинарах и конференциях
Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies)) (Владимир, 2002 i );
Всероссийская Н1К «Реконфпгурируемые электронные средства в ciicicMax обработки информации» (Владимир, 2002 т.). Международная научно-техническая Конференция «Новые методолотии проек/ирования изделий микроэлектроники» «New design methodologies» (Владимир, 2003 i );
Fast-West Design and 1 esling Symposium (Crimea, Ukraine, 2004 т.); Международная научно-техническая Конференция «Новые методолотии проектирования изделий микроэлектроники» «New design methodologies» (Владимир. 2004 г.),
Vil международная научно-техническая конференция «Перспективные технологии в средствах передачи информации» (Владимир, 2005 i.);
6-я ежеюдная выставка «Информационные технологии' 2005». экспонат «Модифицированным АДИКМ-кодек» (Владимир, 2005 г )
НТК профессорско-преподавательскою состава ВлГУ (2002-20051) Научно-практические семинары Центра микрот тектроннот проектирования и обучения ВлГУ (2002 2005 I). На защиту выносятся:
1 Обобщенная модель системы кодирования речи, способ ее представления в базе шаний в виде совокупности двух И-ИЛИ-деревьев
2. Методика автоматизированною проектирования систем кодирования речи, направленная на формирование структурной и функциональной моделей кодека с использованием баш знаний и библиотеки блоков
3 Библиотека блоков систем кодирования речи
4 Математическое, информационное и программное обеспечение подсистемы САШ', позволяющей формировать структурную и функциональную модель кодека и оценивать характеристики полученною решения.
5 Результаты применения подсистемы САПР для исследования и модификации кодека 0.726 (АДИКМ)
Публикации по работе. По теме диссертации опубликовано 13 печатных работ, из них одна статья в сборнике научных трудов, одно свидетельство об официальной ретисфации программы для Г)ВМ и одиннадцать тезисов докладов на Международных и Российских научно-технических конференциях
Структура работы. Диссер1ацпонная работа состоит из введения, |рех тлав, заключения, списка литературы и приложений Общий обьем диссертации 161 страница, в том числе 142 страницы основною текста, 1! страниц списка литературы (105 наименований), 8 страниц приложения Диссертация содержит 62 рисунка и 20 таблиц
СОДЕРЖАНИЕ РАБОТЫ Во введении обосновывается актуальность работы, формулируется научная новизна и практическая ценность полученных результатов, дается структура диссертации и основные положения, выносимые на защиту
В первой главе приводится исследование объекта проектирования ал! орит мов кодирования речи и основанных на них речевых кодеков Исследуется процесс проектирования сис!ем кодирования речи и возможности современных САПР для решения данной задачи Анализируется маршрут проектирования кодеков, и определяются недостатки современною подхода к проектированию кодеков. Выделяются характеристики систем кодирования речи и способы их оценки Рассмотрена постановка задач исследования
Показано, что основой любою речевою кодека является алюритч кодирования речи В насюятдее время выделяют три основных класса алгоритмов кодирования речи, различающиеся принципами обработки речевых сит налов кодирование формы еж пала, кодирование параметров стпнала, кодирование на основе метла «анализ-через-синтез» Подавляющее большинство существующих систем кодирования речи строится на основе алюритма АДИКМ и алгоритмов полувокодеров.
Анализ алюршмов кодирования речи позволяет выделить макроблоки различных классов систем кодирования речи Среди них можно выделшь общие макроблоки, применяющиеся во всех речевых кодекам, п специфические - для кодеков, основанных на оыельных алгоритмах. Совокупность тгих макроблоков и их составных частей составляет множество функциональных блоков систем кодирования речи
Выделяются основные характеристики систем кодирования речи, качество восприятия восстановленного сигнала; коэффициент сжатия сит нала (скорость передачи цифровою потока), задержки кодирования и декодирования; вычислительная сложность алюршмов, • устойчивость к сбоям (время восстановления после сбоя). Дополни тельными характеристиками, относящимися к аппаратной реализации кодека являются энергопотребление и физические размеры устройства
Проектирование кодека представляет собой мноюитерационный процесс. Исследование речевых кодеков показало, что на сегодняшний день подавляющее большинство алгоритмов предметной области представлено в виде математических моделей H спянт с ним маршрут проектирования систем кодирования речи включает в себя разработку и отладку математических моделей на алгоритмических языках высокою уровня, проведение ряда мероприятий для адаптации используемых данных, кодовых книг и таблиц квантования к аппаратной реализации и затем аппаратную реализацию, которая чаше всего связана с созданием описания кодека на языке описания аппаратуры Специфика данною маршрута требует участия в процессе проектирования специалистов в области систем кодирования речи, специалистов в области течнолотий нротраммироваштя, специалистов в области схемотехническою проектирования. При ном межд\ специалистами необходима тесная связь на каждой итерации процесса проектирования, и подготовка документов для работы следующею звена, все это вносиi дополнительные временные затраты.
Таким образом, недостатками современного маршрута проектирования речевых кодеков являются большие временные затраты на разработку it более низкое качество разработанною кодека относительно потенциально возможною. Устранение этих недостатков возможно путем применения средств автоматизированною проектирования.
Приведен обзор систем автоматизированною проектирования, позволяющих проектирован, и моделировать системы кодирования речи
15 ходе проведенною исследования коммерческих САПР было выявлено, что ни одна из них в полной мере не содержит необходимого набора блоков для создания речевых кодеков lice представленные модели кодеков ограничиваются структурным уровнем, а возможности их модификаций изменением параметров бчоков
Наибольшее число блоков кодеков, включая их составные части, предоставляю! пакеты расширения системы Matlab - Communication Toolbox и
Communication Blockset Ото ipu полных кодека (ИКМ, ДИКМ, П LP) и около 10 блоков оIдельных элементов Очевидно, чю данных возможности не достаточно для эффективною автоматизированною проектирования chcicm кодирования речи
На основе проведенною анализа формулируема направление исследовании, заключающееся в разработке меюдов и среде i в автоматизированною проектирования систем кодирования речи. С'1авя1ся задачи работы
Вторая глава посвящена рассмотрению ирсдлатаемых методов авюма1изировапно1 о проектрования ciicieM кодирования речи
Основываясь на том, что в различных кодеках блок, выполняющий по смыслу одну и ту же функцию, может быть реализован с использованием разных алюритмов и методов цифровом обработки сигналов, формируются множества альтернативных реализации функциональных блоков на разных уровнях детализации
Речевой кодек можно рассматривать в виде систем и с иерархической структурой На каждом уровне иерархии отдельны» влечет системы имеет несколько вариантов реализации Иерархическая структура кодека в совокупноеjи с альтернативными вариантами реализации каждою блока представляет собой обобщенную модель речевого кодека. Ота обобщенная модель представляется в виде И-ИЛИ-дерева
Па рис I представлен верхний уровень И-ИЛИ-дерева обобщенной модели системы кодирования речи, соответствующий множеству макроблоков, и И-ИЛИ-поддсрево для бтока предсказания.
В терминах теории множеств и теории графов обобщенную модель системы кодирования речи можно представить следующим образом
7>=(Г, Е, Т)) (1)
ите У~ множество вершин дерева 7У, V - У' иК" V' пГ1 пИ1 =0,
У1 множество вершин тина «И», V2 - множество вершин типа «ИЛИ», К' множество листьев дерева Тг, Е множество ребер дерева Тг
£= {(v„vj)\vl,vJeV}
Т- множество типов вершин
Î0, вершина типа "И" 1,еТ < I, вершина mima " ИНН" (2, шет
Представленная структура дерева основана на ipjтитровании .элементов но функциональному признаку и не отражает в явном виде запрещенных сочетании элементов.
В связи со спецификой обьекта проектирования процесс определения запрещенных сочетаний связан с отслеживанием выбираемых элементов, просмотром оставшихся элементов множества V и установкой им соответствующих флагов каждый раз при включении новою элемента в модель кодека
^ предобрабо
(ка си) нала
подавление пауз определение уровня он нала Оперши) ^ опрел«, ленис филмронои функции ^ >ч ^^определение ошибки предсказания
^^ ^^^оиреле 1спие ш«сраюрной функции ц. ^определение параметром основной) юна кна», юисшие уровня им нала киапкшанпе иарамсфоа сигнала
нр( лскашимс
Фил( Iрация
\ 1(роЩСИН1)1И I р.иисншый шиортм
Решсччагый
1рсоПраз ко->ф |1 параметр 1.1 / ' о ЛКМЛ-филыр раш.перса н>иыи
^Кваптна^л!.
^даинтныи
и» выходу
\1,авио'мер|и.|1
\>
! Кранпомермыи .
' г Л;ыпг по ичод)
14 к\ рсия
III)
Рек)рсия ДлрПниа
* - И
О - ИЛИ
Рис. 1 И-ИЛИ-поддерено обобщенной модели систем кодирования речи
Для сокращения времени обработки запрещенных сочетаний блоков целесообразно вынолншь два следующих условия.
1 Модель кодека алюритмпчсски представляет собой линейную структуру, в которой зафиксирован порядок выполнения множества операций цифровой обработки сигналов, поэтому можно носIроить дерево Тг таким образом, чтобы
V1 € V' г
для каждой вершины ' соблюдалось правило в левом поддереве находятся вершины, соответствующие операциям, выполняющимся во времени раньше, чем операции соответствующих вершин правого поддерева Подобная структура дерева при рассмотрении сто слева направо даст возможность соблюдения порядка прохождения данных по блокам системы
2 Для определения групп блоков, совместное использование которых для реатизации блока верхнею уровня иерархии потенциально возможно, на
верхних уровнях иерархии вводи[ся еще один признак трупппровки дерево преобразуется к виду, предегавленному на рис 2.
Предсказание (Э
ho mc!од),
AUMA
Грансверсалькый
Расчет ко Mfi Расчет козф
Кил|) Г)
автокоппеляпиу
Разложение (J) Холеикого
Рекурсия О Дарбина
Квантование ^
I рансверс
фнлыр ^у ^пКиг
Расчет коэф
V
у> Адаптивный Равномерный Неравномерный^ \
* -И
О - ИЛИ
Peuiei4uri.ui
Решетч фитьгр ■Кван юванме 1реобраз в 1 AK -Ко.>ф отражения 'екурспя Ш>ра Кшф
авшкоорелянни Ipeoiipai
В КО}ф
отражения ARMA-фильтр
Квантование
Упрошенный радпенгныН алгоршм
Козф
авторегрессии Коэф скользяще! и срелнею
Рис. 2 Модифицированное И-ИЛИ-поддерево для блока предсказания
I, <=Т' =
Данная структура описывается следующими соотношениями
/>'=(К\ £', Г)> (2)
где V', Е'- множества вершин и ребер дерева Тг' соответственно, анало! ичные V и Е выражения (I), Т' - множество типов вершин
0, чиршииа miiiui "//"
1, вершина типа " ИЛИ" - б Юк
2, вершина типа " ПЛИ" - мепим)
3, лит
Для }чета возмол<ных и запрещенных сочетаний необходимо в выражение (1) ввести jjieMein W- множество весов вершин дерева
|(), j цемент мпрещен
|1, элемент разрешен,
и выражение П) преобразуется к следующему виду
Г) = (У, Е, /', W) ^ (3)
соответственно, между эпеметиамп множеств V и W существует отношение RH, = !(v ,w )| v, cV,w elV]
Отношение И»' изменяеня каждый раз при добавлении новою блока к модели разрабатываемого кодека.
На основе теории множеств п теории графов разработан математический апнараг обработки деревьев Тг и Тг' Син1ез структуры кодека происходит по принципу выделения частной структуры устройства из обобщенной модели, испотьзуя структуру дерева Тг (3), а процедура изменения отношения Л» использует структуру дерева Тг' (2)
!аким обратом, обобщенная модель речевою кодека представляется в базе танин в виде совокупности двух И-ИЛИ-деревьев- основное дерево отражает множество альтернативных решений базовых блоков и используется в процессе выделения частной структуры устройства из обобщенной модели; дополнительное дерево используется для определения запрещенных сочетаний блоков
Показано, чю при проектировании кодека, как иерархической системы, на каждом уровне иерархии необходимо решать задачу структурной оптимизации всей системы и задачу параметрической оптимизации отдельных блоков. Представлены критерии оптимизации, которые миуг быть использованы при различных требованиях к разрабатываемому кодеку. Для поддержки принятия решений каждая вершина основною дерева содержи! набор характеристик- -признаков, соответствующих предметной облает и полученных ну1ем экспертной оценки. Ьсли характеристики некоторою блока зависят о! ею внутренних параметров, то они определяются но соответствующим функциям расчета или таблицам соответствия.
На основе обобщенной модели кодека разработана библиотека блоков кодеков Представлены требования к библиотеке, состав и структура библиотеки Библиотека состоит из библиотеки макроблоков, библио1еки базовых блоков, сгруппированных по выполняемой функции, библиотеки кодовых книг и таблиц квантования Макроблоки соответавукп вершинам дерева типа «И», базовые блоки соответствую! листьям дерева Необходимость в макроблоках определяется тем, чю анализ характера тик шетемы кодирования речтт возможен только при наличии юювой законченной модели, а нетто 1ьзование на ранних стадиях проектирования ютовых блоков верхнею уровня позволяет повысить эффекшвпосгытроекшровання кодеков.
Отдельный блок библиотеки представляет собой фрейм (рис 3), декларашвная часть которого отражает структуру входных и выходных данных блока параметры настройки и параметры состояния блока Процедурная часть содержи! процедуры, реализующие математические модели, процедуры, реализующие модели, адаш ированные к аннарашой реализации с соо!ветсгвуютцим форматом и разрядностью данных, и процедуры, Iенерпрующие код на языке высокою уровня и языке описания апнара!уры
Предлагаемая методика автоматизированною проектирования систем кодирования речи описывает процесс нисходящего проектирования, в котором еинтет структуры и формирование функциональной модели кодека ироисхо цп па основе библиотеки блоков кодеков, оптимизация на основе поиска
оптимального решения, иснольз\я И-ИЛИ-дерево обобщенной модели, и на основе настраиваемых иарамефов блоков
I (араметры настройки (алт оритма и реали зации)
Параметры состояния
Входные данные Выходные данные
Процедуры настройки
Процедуры реализации шпоригма с фиксированной точкой
Процедуры реализации алгоритма с плавающей точкой
Процед)ры формирования протраммното кода
>
Декларативная
<
7-
Процедурная
J
Рис 3 Структура блока библиотеки
Меюдика иредполатаст рассмотрение процесса проектирования на трех уровнях: системном, функциональном и компонентом
Па системном уровне (рис. 4) на основании предъявляемых требований происходит выбор алюритма кодирования речи, алтортпмов дополнителт.ной обработки сит нала и формирование набора необходимых базовых блоков
Опреде leime требований к разраба.ыиаемому кодеку I) среда передачи
3) скорость цифровою потока
4) качество восстан сигнала
5) задержка кодирования
6) сложность алгоритма
8) требования к реализации
X
Исследование и анаши сш налов и среды ф>икиионирования
Выбор алгори I ма кодирования речи
PajpaöoiKi С1рук1)рнин схемы кодека (п.мор чакроб нжов)
Дскомжнш ия струк ¡урпоп схсмы (формирование набора базовые б iokob)
Принятие решении о дальнейших дейстияч
Рис. 4 Системный уровень
Функциональный уровень (рис разделен па два подуровня на верхнем подуровне формируется и оптимизируется функциональная модель кодека без учета особенностей базиса реализации Па нижнем подуровне происходит адаптация полученной модели к выбранному базису реализации
Третья глава посвящена разработке на основе предложенных методов специализированной подсистемы автоматизированною проектирования речевых кодеков. Подсистема САПР речевых кодеков интегрирована в систем) функционал!,пою моделирования System Vue (рис 7) и состоит из базы знаний, хранящей И-ИЛИ-деревья обобщенной модели кодека, модуля редактирования базы знаний, библиотеки блоков кодеков, анализатора, выполняющего анализ блоков, используемых при проектировании кодека, на предмет возможности их совместною использования в проектном решении, а также формирующею синеок блоков, потенциально возможных для использования в данной модели; и генератора кода, формирующею программный код на языках С и VIII)! Алюритм работы анализа юра соответствует разработанному математическому аппарату обработки обобщенной модели кодека и поддержки принятия решений Математическое обеспечение подсистемы САПР кодеков представлено разработанным математическим аппаратом обработки обобщенной модели системы кодирования речи, математическими моделями блоков речевых кодеков и методикой автоматизированною проектирования систем кодирования речи
Информационное обеспечение подсистемы САПР кодеков состоит из базы знаний, поддерживающей структуру разработанной обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьсв и обеспечивающей поддержку принятия проектных решений, библиотеки базовых блоков и макроблоков и описания методики проектирования систем кодирования речи. Структура данных базы знании, представлена на рис 6.
Дерево Тг _ __Дерево 1г_
Идентификатор J-J Идентификаюр
1 ип вершины Гни вершины
Массив илентификаюров Массив идентификаторов
потомков потомков
Название
Информация
Характеристики
Рис. 6. Структура данных базы знаний
Программное обеспечение (рис. 7) подсистемы САПР кодеков состоит из двух модулей динамически подключаемых библиотек (ФЗ. Ф4). представляющих собой библиотеку блоков кодеков, базы знании в виде файлов XML-форма г а (Ф1, Ф2) и модуля редактирования базы знаний, обеспечивающею удобный пользовательский интерфейс
Па рис 8 представлена стр)ктура элемента библиотеки блоков, соответствующая предложенной структуре блока библиотеки в виде фрейма. Для тою, чюбы разработанная библиотека блоков не была зависима от специфических особенностей S\stcm Vue, интерфейсная часть, обеспечивающая подключение библиотеки блоков к ной системе, выделена в отдельный молить
(ФЗ). г)тот модуль взаимодействует со средой System Vue, принимает входные данные, обрабатывает настройки параметров, выполняет преобразование форматов данных, передает управление соответствующей процедуре (функциональной части) блока, размещенной в друтом модуле (Ф4), и затем формируем выходные данные H ном случае обеспечивается переносимоегь библиотеки в любую CAI IP
Рис. 7 Структура подсистемы САПР кодеков, интегрированная в System Vue
Разработанная подсистема САПР кодеков использовалась для модификации кодека () 726 (АДИКМ) с целью получения аппаратной модели кодека для реализации в ПЛИС с более высоким качеством восстановленною сигнала, чем обеспечивает стандартный кодек
Для решения поставленной задачи с помощью разработанной подсистемы САПР была составлена модель стандартною кодека Ci.726, адаптированная к аппаратной реализации На полученной модели был проведен ряд исследовании и тестовых испытаний, которые выявили проблемные блоки, требующие изменений, и пути повышения качества восстановленною сит нала Полученный в результате модификации кодек превосходит стандартный по качеству восстановленною сит нала и обладает более высоким динамическим диапазоном (табл 1)
1акже была выполнена оптимизация стеттерированното подсистемой САПР V11D1 -кода ноч ПЛИС серии Spartan и Virlex-2 и ииотвлек рабочий макет аппаратной) кодека Испытания подтвердили соответствие характеристик и параметров макета требованиям техническою задания
и
Вход 1
Вход I
Вход N
Параметры настройки
"'. '1 . . \ " -Функция преобразования -данных
Преобрт 1 )реобрач
ВЧОЖ'Н выходов
Выход !
Выход 1
Выход N
Рис 8. Структура элемеп га библиотеки блоков подсистемы САШ»
1аблица I
Характеристики кодеков, стандартною 0.726 (А) и модифицированного (В)
Характеристики
Разрядность входных/выходных даттных____
Динамический диапазон (дЬ)______
Ухудшение отношения сигнал/шум (дЬ) *
Величина частотных искажеттий (дЬ) _
Величина нелинейных искажении (%) _
Время восстановления после сбоя
Задержка кодирования____ _
Оцсв кап о шкале МОв (РЫ5 0)___
13 бит
78
< 6 < 1,5
1 -5
< 27 мс
< 1 мс
4,1
В
16 бит
96
< 0,5 < 1
" 30 мс_ ^ 1 мс
4,4
*) при отношсшш сигнал/шум исходною сигнала не менее 86 дЬ
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РА КОТЫ
1 Исследованы алюртпмы кодирования речи и проанализированы основанные па них системы кодирования речи современных стандартов связи Определены основные >гапы проектирования речевых кодеков, определены характеристики кодеков, которые ложатся в основу критериев качества систем кодирования речи Выделены оГнцие и специфические функциональные блоки различных классов систем кодирования речи
2 Проведенный анализ алторнтмов и методов цифровой обработки ин налив для выделенных блоков привел к формированию набора базовых блоков и набора макроблоков систем кодирования речи, из которых можно построить функционалы!} ю модель кодека и получить оценку ею характеристик.
3 Сформированы множества альтернативных вариашов реализаций функциональных блоков па разных уровнях детализации
4 Разрабо1ана обобщенная модель системы кодирования речи, предетавлнющая собой иерархическую структуру кодека в совокупности с альтернативными вариантами реализаций каждого бчока Предложено ее представление в базе знаний в виде совокупности двух И-ИЛИ-деревьев' основное дерево отражает множество альтернативных решений функциональных блоков, дополнительное дерево используется для определения запрещенных сочетаний блоков Для поддержки принятия решения каждая вершина основною дерева содержит набор характеристик-нри таков, определяемых методом экспертной оценки
5 Предложен математический аппарат обработки двух видов представления обобщенной модели кодека на основе теории множен в и теории I рафов.
6 Разработана методика автоматизированною проектирования систем кодирования речи, направленная на синтез структуры и формирование функциональной модели кодека с использованием библиотеки блоков Синтез модели кодека происходи! путем выделения частой структуры из обобщенной модечи системы кодирования речи, оптимизация на основе поиска оптимально!о решения, нсполыуя И-ИЛИ-дерево обобщенной модели, и на основе настраиваемых параметров блоков Методика предполагает рассмотрение процесса проектирования на трех уровнях' системном, функциональном и компонентном
7 Предложены состав н структура библиотеки блоков речевых кодеков Состав библиотеки соответствует множеству вершин тина И и множеству лнегьев основною дерева обобщенной модели кодека Бпблио1Ска сосюит из библиотеки макроблоков, библиотеки базовых блоков, сгруппированных но выполняемой функции, библнотот кодовых книг и таблиц квантования
8 Предложена структура блока библиотеки, обеспечивающая по^щержку предложенной методики проектирования кодеков. Ьлок библиотеки представляет собой фрейм, обьединяющни декларативную и процедурную час ш
9. Разработано математическое, информационное и программное обеспечение, реализованное в подснс(еме САПР речевых кодеков, позволяющей формировать функциональную модель системы кодирования речи и получать оценку ее характеристик. Подсистема САПР кодеков итпетрироватта в систему функциональною моделирования System Vue.
10 Предложена структура базы знаний, соответствующая способу представления обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьев н обеспечивающая поддержку принятия решений.
11. Проведено исследование предложенных решений при выполнении ряда заказных НИОКР, в том числе при модификации кодека G.726 с целью повышения его технических характеристик Модифицированный кодек превосходит стандартный но качеству восстановленною сшпала и обладает более высоким динамическим диапазоном.
ПУБЛИКАЦИИ ПО РАБОТЕ
1 Коломиеп И А Постановка задачи оптимизации при проектировании систем кодирования речи // 7-я международная научно-техническая конференция ПТСПИ'2005 «Перспективные технолотни в средствах передачи информации», Владимир, 2005 г
2 Коломиеп И А. Проектирование систем кодирования речи на основе библиотеки макроблоков и базовых блоков // 7-я международная научно-техническая конференция ПГСПИ'2005 «Перспективные технолотпи и средствах передачи информации)), Владимир, 2005 т
3. Свидетельство об официальной регистрации протраммы дня Г)ВМ № 2004610928 Авторы Г.фимов В Г, I уесв F В , Коломиец И А Заретистрировано в Реестре протрамм для ЭВМ 16 апреля 2004 г
4 Басаргин АС, Коломиец И А Программные модели прямою каната CDMA // Материалы международной 11 ГК «Новые мегодоло'ии проектирования изделий микроэлектроники», Владимир, 2004 г -С 81 -83
5 Басартин АС, Коломиеп НА Учебная подсистема САПР функп1тоналыю-ло1 ического проектирования // Материалы международной IIГК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г.-С 21-23
6 Коломиеп НА Библиотека алторитмов кодирования речевых анналов для системы автоматизированного проектирования // Методы и системы обработки информации. Сборник научных статей в 2-х частях ч 2 / Под ред С С.Садыкова, Д.F Андрианова - М. Горячая линия -Телеком, 2004 - с 40 46
7 Коблов F В., Коломиец ПА, Заболотько MA, Басаргин А.С Оценка эффективности алторитмов линейного предсказания в кодеках сетей 3G // Материалы международной П1К «Новые методолотии проектирования изделий микроэлектроники», Владимир, 2004 1 с 172 174
8 Коломиец НА, Ьасартин АС Состав библиотеки моделей алторитмов построения систем кодирования речи // Материалы международной НТК «Новые
четдо.Ю! пп проектирования изделий микроглек тропики», Владимир, 2004 i с 168 171
9 Коломиец И.Л , Коблом £• К., Куликов К.В Research of Ihe speech signal prediction // Fast-West Design and Testing Symposium Crimea, Ukraine, September. 2004
10 Коломиец С Л , Коломисн И Л , Лапцов li.ll Design of ADPCM-codcc on I PGA basis // I ast-West Design and Jesting Symposium Crimea, Ukraine, September. 2004 p 152-156
11 Коломиец И А 1'азншис алгоршмов кодирования речи // Международная научно-техническая конференция «Новые меюдологии проецирования изделий микроэлектроники» «New design methodologies», Владимир, 2003 т.
12 Коломиец И А Методика проектирования систем кодирования речи // Международная научно-техническая конференция «Новые методологии нроекшрования изделий микроэлектроники» «New design methodologies», Владимир, 2002 т
И.Ланцов ВН. Коломиец И.Л Реализация подсистем кодирования -декодирования речи в базисе ПЛИС // Всероссийская НГК «Реконфитурируемыс электронные средства в системах обработки информации», Владимир, 2002 т., с 38 - 40.
ЛР № 020275 Подписано в печать 03 06 05 Формат 60x84/16. Ьумага для множш техники. I арнигура 1аймс Печать офсетная Уел нем л 0.93 Уч-изд л 0,97 Тираж 100 жз
Заказ /П'ЛМб'г Редакционно-издагельскни комплекс Владимирского государственною университета
600000, Владимир, у л 1 орькою, 87
0 5-1 38 2 5
РНБ Русский фонд
2006-4 9309
Оглавление автор диссертации — кандидата технических наук Коломиец, Ирина Александровна
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ.
ВВЕДЕНИЕ.
1. СОСТОЯНИЕ В ОБЛАСТИ ПРОЕКТИРОВАНИЯ СИСТЕМ КОДИРОВАНИЯ РЕЧИ.
1.1. Классификация алгоритмов кодирования речи.
1.2. Основные алгоритмы кодирования речи.
1.2.1. Кодирование формы сигнала.
1.2.2. Кодирование параметров сигнала (вокодеры).
1.2.3. Кодирование на основе метода «анализ-через-синтез».
1.3. Структуры систем кодирования речи.
1.3.1. G. 726 (АДИКМ).
1.3.2. GSM06.60 (ACELP).
1.3.3. GSM06.10 (RPE-LTP).
1.3.4. CDMA QCELP 8 (CELP).
1.3.5. G.723 (MP-MLQ).
1.4. Направления развития в области систем кодирования речи.
1.5. Характеристики систем кодирования речи.
1.6. Процесс проектирования систем кодирования речи.
1.7. Возможности систем автоматизированного проектирования.
1.7.1. Mathworks Matlab u Simulink.
1.7.2. Eagleware-Elanix System Vue.
1.7.3. National Instruments LabVIEW.
1.7.4. Agilent Advanced Design System.
1.8. Цель и постановка задач исследования.
1.9. Выводы.
2. РАЗРАБОТКА МЕТОДОВ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ СИСТЕМ КОДИРОВАНИЯ РЕЧИ.
2.1. Обобщенная модель системы кодирования речи.
2.2. Методика проектирования систем кодирования речи.
2.2.1. Системный уровень.
2.2.2. Функциональный уровень.
2.2.3. Компонентный уровень.
2.2.4. Поддержка принятия решений.
2.3. Библиотека блоков систем кодирования речи.
2.3.1. Определение требований к библиотеке.
2.3.2. Структура и состав библиотеки.
2.3.3. Структура блока библиотеки.
2.4. Выводы.
3. ИССЛЕДОВАНИЕ И ПРАКТИЧЕСКОЕ ВНЕДРЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ.
3.1. Структура подсистемы САПР (математическое, информационное и программное обеспечение).
3.2. Структура библиотеки.
3.3. Примеры блоков.
3.4. Модификация кодека G.726.
3.5. Выводы.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Коломиец, Ирина Александровна
В настоящее время наблюдается активное развитие и внедрение новых цифровых систем передачи звуковой информации (далее системы связи). Постоянно возрастающее число пользователей систем связи приводит к тому, что пропускная способность большинства каналов связи является недостаточной. Одним из путей увеличения пропускной способности каналов связи является сжатие передаваемой информации. Кроме этого следует отметить, что сокращение объемов передаваемых данных позволит увеличить количество пользователей канала связи и, следовательно, сократить стоимость услуг связи.
В современных системах передачи звуковой информации значительную часть передаваемых данных составляют речевые сообщения, для решения задачи увеличения пропускной способности каналов связи необходимо использовать в составе таких систем блок кодирования (сжатия) речевой информации, или кодек. При этом достигается еще один положительный эффект — обеспечение определенной степени защиты информации от несанкционированного доступа.
Таким образом, в настоящее время системы кодирования речи (речевые кодеки) являются неотъемлемой частью систем связи.
Использование в составе некоторой системы дополнительного сложного блока цифровой обработки данных приводит к появлению ряда проблем. Первая из них определяется спецификой блока кодирования речи и связана с тем, что сжатие информации в общем случае приводит к некоторым потерям данных, и следовательно, к снижению качества восстановленного сигнала. Решение этой проблемы приводит к использованию в качестве основы кодеков более сложных алгоритмов кодирования речи. Однако, чем сложнее алгоритм и, следовательно, система кодирования речи, тем большие вычислительные ресурсы требуются для ее реализации. Хотя острота указанной проблемы в последнее время сглаживается за счет интенсивного развития элементной (технической) базы, со сложностью алгоритма связана еще одна проблема обработка информации в дополнительном блоке приводит, соответственно, к дополнительным задержкам в передаче данных. Для простых алгоритмов задержка невелика - единицы миллисекунд, однако для сложных алгоритмов, обеспечивающих значительное сжатие и хорошее качество восстановленного сигнала, продолжительность задержки может составлять сотни, и даже тысячи миллисекунд, что вполне ощутимо при разговоре [33]. Следует отметить, что для обеспечения должного качества обслуживания современные стандарты связи строго ограничивают допустимую задержку кодирования и декодирования речевых данных.
Из вышесказанного следует, что основными требованиями, предъявляемыми к системам кодирования речи, являются требования к таким характеристикам, как качество восприятия восстановленной информации, коэффициент сжатия, задержки кодирования/декодирования и вычислительная сложность алгоритмов. Дополнительные требования, предъявляемые к аппаратной реализации кодеков, связаны со снижением энергопотребления и массо-габаритных размеров устройства, в состав которого они входят.
Таким образом, при проектировании системы кодирования речи решается задача обеспечения как взаимосвязанных, так и независимых требований. Степень выполнения этих требований можно оценить только имея законченную реализацию кодека.
Современный подход к проектированию систем кодирования речи обеспечивает достижение требований к кодеку путем последовательного выполнения следующих шагов: выбор соответствующего алгоритма кодирования речи, варьирование структуры системы, связанное с выбором алгоритма реализации отдельного блока, и варьирование параметров блоков. В случае неудовлетворительного результата возможен возврат на любой из указанных шагов. Следовательно, проектирование кодека представляет собой многоитерационный процесс, причем значительная часть итераций носит вложенный характер.
При таком подходе основным недостатком является высокая трудоемкость процесса проектирования кодека и связанные с этим большие временные затраты на разработку. В худшем случае для достижения указанных в требованиях на проектирование системы кодирования речи характеристик требуется перебор всех приемлемых вариантов структуры. Порядок следования вариантов и ограничения их применения в каждом конкретном случае определяются разработчиком на основе его опыта и квалификации, при этом используются эвристические методы. Различные реализации каждого блока объективно имеют различную структуру выходных данных, которая влияет на структуру, а зачастую и на принципы функционирования одного или нескольких других блоков. Так, например, эффективность предсказания сигнала определяет статистические характеристики сигнала погрешности предсказания, от которых зависит структура (количество уровней и интервалы, принципы адаптации и др.) квантователя уровня сигнала; в то же время порядок предсказания (количество коэффициентов предсказания, точность их представления и др.) влияют на структуру квантователя параметров сигнала. Неотъемлемыми частями блоков квантования уровня сигнала и параметров сигнала являются кодовые книги и таблицы квантования. Формирование и расчет кодовых книг и таблиц квантования представляют собой один из самых трудоемких этапов проектирования речевого кодека: необходимо набрать статистическую информацию по типовым сигналам, с которыми они будут работать, выделить наборы характерных признаков, разработать эталонные векторы признаков типовых сигналов и т.п. Следовательно, при любом изменении характеристик входных для данных блоков сигналов необходимо заново проектировать кодовые книги и таблицы квантования.
На сегодняшний день маршрут проектирования систем кодирования речи включает в себя разработку и отладку математических моделей на алгоритмических языках высокого уровня, проведение ряда мероприятий для адаптации используемых данных, кодовых книг и таблиц квантования к аппаратной реализации и затем создание описания кодека на языке описания аппаратуры. Это связано в первую очередь с тем, что большинство алгоритмов предметной области представлено в виде математических моделей. Необходимость перехода от математического описания к программной модели и тем более к аппаратной модели требует от разработчиков опыта, значительной квалификации и глубоких знаний не только в области речевых кодеков, но и принципов, технологий программирования на языках высокого уровня и языках описания аппаратуры. Подобное сочетание требований не всегда является обеспечиваемым и эффективным, поэтому в процессе проектирования систем кодирования речи участвуют как минимум специалист по обработке речевых сигналов и программист, между которыми необходима тесная связь на каждой итерации процесса проектирования. Подготовка документации, согласование работы между различными специалистами приводит к дополнительным временным затратам. Поскольку, как было показано выше, процесс проектирования кодеков носит многоитерационный характер и немалая часть итераций связана с изменением параметров блоков, подобные временные затраты становятся неоправданными и снижают эффективность разработки.
Кроме этого, на сегодняшний день для реализации большинства отдельных блоков кодеков известно множество альтернативных реализаций, основанных на различных алгоритмах и подходах, и это множество постоянно растет за счет интенсивного развития области речевого кодирования. В зависимости от квалификации и опыта разработчика от его внимания может ускользать значительное число возможных проектных решений и, следовательно, разработанный кодек может иметь более низкое качество, относительно потенциально возможного.
Повысить качество проектного решения и снизить время разработки можно путем использования в процессе проектирования речевых кодеков систем автоматизированного проектирования (САПР), предоставляющих пользователю множество альтернативных реализаций различных блоков систем кодирования речи. Анализ современных средств автоматизированного проектирования цифровых систем передачи звуковой информации позволил выделить САПР, содержащие в своем составе библиотеки блоков речевых кодеков. Однако множество предлагаемых блоков исключительно мало и ограничивается блоками, реализующими стандарты современных систем связи. Более того, большинство из этих блоков — закрытые готовые реализации стандартных кодеков (в виде «черного ящика»). Исследование и возможность модификации оставшейся части блоков ограничиваются структурным уровнем, алгоритмы отдельных элементов не доступны пользователю, что не позволяет вносить в них какие-либо изменения, и тем более разработать новый кодек. Из выше сказанного следует, что в настоящее время является актуальным решение задачи автоматизации процесса проектирования систем кодирования речи с использованием библиотеки отдельных функциональных блоков открытых по отношению к модернизации и расширению. Цель работы и задачи исследований.
Целью работы является разработка методов автоматизированного проектирования систем кодирования речи и создание на их основе пакета прикладных программ, предназначенного для решения данной задачи. Для достижения данной цели в работе ставятся и решаются следующие основные задачи:
1. Исследование и анализ алгоритмов кодирования речи.
2. Исследование существующих систем кодирования речи.
3. Исследование существующих подходов к проектированию систем кодирования речи, возможностей современных САПР для решения данной задачи.
4. Разработка обобщенной модели системы кодирования речи, включающей множество альтернативных алгоритмов функциональных блоков на разных уровнях детализации, и способов ее представления в базе знаний.
5. Разработка методики автоматизированного проектирования систем кодирования речи, направленной на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
6. Разработка математического, информационного и программного обеспечения подсистемы САПР, позволяющей формировать структурную и функциональную модели кодека и оценивать характеристики полученного решения.
Научная новизна работы. Новые научные результаты, полученные в работе, состоят в следующем:
1. Разработана обобщенная модель системы кодирования речи, предложен способ ее представления в базе знаний в виде совокупности двух И-ИЛИ-деревьев.
2. Предложена методика автоматизированного проектирования систем кодирования речи, направленная на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
Практическая ценность работы. На основе предложенных методов автоматизированного проектирования систем кодирования речи была разработана специализированная подсистема САПР, позволяющая сократить временные затраты на разработку речевых кодеков и повысить качество проектируемого устройства кодирования речи. Библиотека базовых блоков подсистемы САПР выполнена по технологии динамически подключаемых библиотек (DLL) и может быть использована в сторонних САПР, позволяющих проектировать функциональные модели устройств и поддерживающих подключение пользовательских модулей. Открытость архитектуры подсистемы и возможность ее взаимодействия с другими САПР позволяют включать новые модули. Разработанная подсистема САПР позволяет моделировать и исследовать существующие системы кодирования речи, исследовать отдельные структурные блоки кодеков, создавать модели новых систем кодирования речи. Возможность замены блоков существующего кодека блоками с другой реализацией той же функции и настройка каждого параметра блока позволяют с малыми временными затратами найти эффективное техническое решение.
Реализация и внедрение результатов работы.
Работа по теме диссертации проводилась на кафедре ВТ ВлГУ в Центре микроэлектронного проектирования и обучения в рамках госзаказа по контрактам НИОКР № 2852/03, № 2879/03, 2992/03. Полученные результаты исследований в виде методик, программного обеспечения и моделей устройств внедрены в виде материалов отчетов по НИР и ОКР, выполненных в рамках госзаказа, и в учебный процесс кафедры ВТ ВлГУ. На защиту выносятся.
1. Обобщенная модель системы кодирования речи, способ ее представления в базе знаний в виде совокупности двух И-ИЛИ-деревьев.
2. Методика автоматизированного проектирования систем кодирования речи, направленная на формирование структурной и функциональной моделей кодека с использованием базы знаний и библиотеки блоков.
3. Библиотека блоков систем кодирования речи.
4. Математическое, информационное и программное обеспечение подсистемы САПР, позволяющей формировать структурную и функциональную модели кодека и оценивать характеристики полученного решения.
5. Результаты применения подсистемы САПР для исследования и модификации кодека G.726 (АДИКМ).
Апробация работы.
Основные положения и результаты работы докладывались и обсуждались на следующих семинарах и конференциях:
Международная научно-техническая конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2002 г.); Всероссийская НТК «Реконфигурируемые электронные средства в системах обработки информации» (Владимир, 2002 г.);
Международная научно-техническая Конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2003 г.); East-West Design and Testing Symposium (Crimea, Ukraine, 2004 г.); Международная научно-техническая Конференция
Новые методологии проектирования изделий микроэлектроники» «New design methodologies» (Владимир, 2004 г.); VII международная научно-техническая конференция «Перспективные технологии в средствах передачи информации» (Владимир, 2005 г.);
6-я ежегодная выставка «Информационные технологии' 2005», экспонат «Модифицированный АДИКМ-кодек» (Владимир, 2005 г.) НТК профессорско-преподавательского состава ВлГУ (2002-2005г); Научно-практические семинары Центра микроэлектронного проектирования и обучения ВлГУ (2002 - 2005 г).
Публикации по работе. По теме диссертации опубликовано 13 печатных работ, из них одна статья в сборнике научных трудов, одно свидетельство об официальной регистрации программы для ЭВМ и одиннадцать тезисов докладов на Международных и Российских научно-технических конференциях.
Структура работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы и приложений. Общий объем диссертации 161 страница, в том числе 142 страницы основного текста, 11 страниц списка литературы (105 наименований), 8 страниц - приложения. Диссертация содержит 62 рисунка и 20 таблиц.
Заключение диссертация на тему "Методы и средства автоматизированного проектирования систем кодирования речи"
3.5. Выводы
1. Разработана подсистема САПР речевых кодеков, позволяющая формировать функциональную модель системы кодирования речи и получать оценку ее характеристик. Подсистема САПР кодеков интегрирована в систему функционального моделирования System Vue.
2. Математическое обеспечение подсистемы САПР кодеков соответствует разработанным и описанным в главе 2 математической модели обобщенной модели кодеков и методике автоматизированного проектирования систем кодирования речи, а также математическим моделям блоков систем кодирования речи, и реализовано в виде библиотеки блоков, подключаемой к системе System Vue.
3. Информационное обеспечение подсистемы САПР кодеков состоит из базы знаний, описывающей структуры И-ИЛИ-деревьев обобщенной модели системы кодирования речи, библиотеки базовых блоков и макроблоков и описания методики автоматизированного проектирования систем кодирования речи.
4. Предложена структура данных базы знаний, соответствующая способу представления обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьев и обеспечивающая поддержку принятия решений.
5. Предложен способ подключения разработанной библиотеки блоков кодеков к системе System Vue, не требующий изменений блоков. Соответствие интерфейсов обеспечивается отдельным модулем (интерфейсная часть), поддерживающим стандарт System Vue. Функции данного модуля принимают входные данные, обрабатывают настройки параметров, выполняют преобразование форматов данных и передают управление соответствующей процедуре блока, размещенной непосредственно в модуле разработанной библиотеки (функциональная часть), затем формируют выходные данные в формате System Vue. Таким образом, обеспечивается переносимость библиотеки кодеков в любую САПР, для этого требуется только изменить интерфейсный модуль под стандарт новой системы и не затрагивать функциональную часть.
6. Предложена структура элемента библиотеки блоков кодеков для использования в системе System Vue, соответствующая разработанной структуре блока библиотеки в виде фрейма (п.2.3.3) и принципам разделения интерфейсной и функциональной частей. Приведены примеры блоков, использующихся в структуре кодека G.726 (АДИКМ).
7. Программное обеспечение подсистемы САПР кодеков состоит из двух модулей динамически подключаемых библиотек, представляющих собой интерфейсную и функциональную части библиотеки блоков кодеков, двух файлов XML-формата базы знаний и модуля редактирования базы знаний, обеспечивающего удобный пользовательский интерфейс.
8. С помощью разработанной подсистемы САПР выполнена модификация кодека G.726 с целью улучшения его технических характеристик. Модифицированный кодек превосходит стандартный по качеству восстановленного сигнала и обладает более высоким динамическим диапазоном. Приведены результаты экспериментов с использованием сигналов с различными характеристиками. Была выполнена оптимизация сгенерированного подсистемой САПР VHDL-кода под ПЛИС серии Spartan, который использовался для изготовления рабочего макета аппаратного кодека. Испытания подтвердили заявленные характеристик и параметры макета.
ЗАКЛЮЧЕНИЕ
Анализ алгоритмов кодирования речи и соответствующих им систем кодирования речи показал, что в общем случае речевой кодек имеет сложно подчиненную структуру, в которой структура одного блока сильно влияет на структуру, а иногда и на принципы функционирования одного или нескольких других блоков. Для достижения желаемых характеристик кодека необходимо при проектировании выполнить не одну итерацию, связанную со структурной или параметрической оптимизацией системы кодирования речи. Таким образом, процесс проектирования систем кодирования речи носит многоитерационный характер и отличается высокими временными затратами. Использование САПР или подсистем САПР, специально ориентированных на проектирование данного класса систем, позволит значительно повысить эффективность разработки речевых кодеков: сократить время разработки за счет использования настраиваемых моделей блоков кодеков и повысить качество готового проектного решения за счет использования базы знаний, предоставляющей разработчику множество альтернативных алгоритмов реализаций каждого блока. Анализ современных САПР показал, что на сегодняшний день не существует специализированных систем автоматизированного проектирования, ориентированных на разработку речевых кодеков.
Возможности проектирования систем кодирования речи с помощью универсальных САПР определяются предоставляемыми ими блоками цифровой обработки сигналов, однако время, затрачиваемое на разработку, по-прежнему неоправданно велико. Кроме этого, данные САПР предоставляют далеко не все возможные модели блоков, использующихся в составе систем кодирования речи. Некоторые САПР с помощью пакетов расширения, ориентированных на проектирование систем телекоммуникаций, предоставляют готовые модели речевых кодеков современных стандартов связи, однако возможности их модификации ограничены структурным уровнем и алгоритмы их элементов не доступны пользователю. Все это снижает эффективность разработки систем кодирования речи и ограничивает ее качество.
В диссертационной работе поставлены и решены задачи, направленные на создание методов и средств автоматизированного проектирования систем кодирования речи.
В работе были получены следующие основные результаты.
1. Исследованы алгоритмы кодирования речи и проанализированы основанные на них системы кодирования речи современных стандартов связи. Определены основные этапы проектирования речевых кодеков; определены характеристики кодеков, являющиеся основой критериев качества систем кодирования речи. Выделены общие и специфические функциональные блоки различных классов систем кодирования речи.
2. Проведенный анализ алгоритмов и методов цифровой обработки сигналов для выделенных блоков привел к формированию набора базовых блоков и набора макроблоков систем кодирования речи, из которых можно построить функциональную модель кодека и получить оценку его характеристик.
3. Сформированы множества альтернативных алгоритмов реализаций функциональных блоков на разных уровнях детализации, основываясь на том, что в различных кодеках блок, выполняющий одну и ту же функцию, может реализовывать разные алгоритмы цифровой обработки сигналов.
4. Разработана обобщенная модель системы кодирования речи, представляющая собой иерархическую структуру кодека в совокупности с альтернативными вариантами реализации каждого блока.
5. Предложено представление обобщенной модели кодека в базе знаний в виде совокупности двух И-ИЛИ-деревьев: основное дерево отражает множество альтернативных решений функциональных блоков; дополнительное дерево используется при определении запрещенных сочетаний блоков. Для поддержки принятия решения при выборе одного из альтернативных решений каждая вершина основного дерева содержит набор характеристик-признаков, определяемых методом экспертной оценки.
6. Предложен математический аппарат обработки двух видов представления обобщенной модели кодека на основе теории множеств и теории графов.
7. Разработана методика автоматизированного проектирования систем кодирования речи, направленная на синтез структуры и формирование функциональной модели кодека с использованием библиотеки блоков. Синтез модели кодека происходит путем выделения частной структуры из обобщенной модели системы кодирования речи; оптимизация - на основе поиска оптимального решения, используя И-ИЛИ-дерево обобщенной модели, и на основе настраиваемых параметров блоков. Методика предполагает рассмотрение процесса проектирования на трех уровнях: системном, функциональном и компонентном.
8. Предложены состав и структура библиотеки блоков систем кодирования речи. Состав библиотеки соответствует множеству вершин типа И и множеству листьев основного дерева обобщенной модели системы кодирования речи. Библиотека состоит из библиотеки макроблоков, библиотеки базовых блоков, сгруппированных по выполняемой функции, библиотеки кодовых книг и таблиц квантования.
9. Предложена структура блока библиотеки, обеспечивающая поддержку предложенной методики проектирования кодеков. Блок библиотеки представляет собой фрейм, объединяющий декларативную и процедурную части.
10. Разработано математическое, информационное и программное обеспечение, реализованное в подсистеме САПР речевых кодеков, позволяющей формировать функциональную модель системы кодирования речи и получать оценку ее характеристик. Подсистема САПР кодеков интегрирована в систему функционального моделирования System Vue.
11. Предложена структура базы знаний, соответствующая способу представления обобщенной модели кодека в виде совокупности двух И-ИЛИ-деревьев и обеспечивающая поддержку принятия решений.
12. Проведено исследование предложенных решений при выполнении ряда заказных НИОКР, в том числе при модификации кодека G.726 с целью повышения его технических характеристик. Модифицированный кодек превосходит стандартный по качеству восстановленного сигнала и обладает более высоким динамическим диапазоном.
Разработанные методы автоматизированного проектирования речевых кодеков применимы для создания как самостоятельной системы, так и подсистемы любой из сторонних сред проектирования (САПР или среды проектирования на языках высокого уровня), позволяющих разрабатывать и подключать пользовательские библиотеки.
Библиография Коломиец, Ирина Александровна, диссертация по теме Системы автоматизации проектирования (по отраслям)
1. Автоматизация проектирования цифровых устройств/ Баранов С.И., Майоров С.А., Сахаров Ю.П. Селютин В.А. JL: Судостроение, 1979, 261 с.
2. Автоматизация схемотехнического проектирования: Учеб. пособие для вузов / Ильин В.Н., Фролкин В.Т., Бутко А.И. и др.; Под ред. Ильина В.Н. М.: Радио и связь, 1987. - 368 с.
3. Адаптивные фильтры: пер. с англ. /Под ред. К.Ф.Н. Коуэна и П.М. Гранта. М.: Мир, 1988.
4. Афанасьев А.А. Адаптивный кодек речевых сигналов на основе систем с переменной структурой // Материалы 4-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2002. Москва, 2002 г.
5. Афанасьев А.А., Пищальников А.В. Система адаптивного кодирования речевых сигналов // Материалы 5-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2003. Москва, 2003 г.
6. Барков И. Некоторые аспекты технологии 1Р-телефонии. http://www.ixbt.com/comrri/ip-aspects.html.
7. Басаргин А.С., Коломиец И.А. Программные модели прямого канала CDMA // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 81 -83.
8. Басаргин А.С., Коломиец И.А. Учебная подсистема САПР функционально-логического проектирования // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 21- 23.
9. Бернюков А.К. Дискретная и цифровая обработка информации. Введение в теорию и некоторые приложения: Уч. пособие/ ВлГУ. -Владимир, 1990.
10. Борзенко А. Системы на одном кристалле. // "PC Week" №44, 1999, , с. 24-30.
11. Варламова О. Помехоустойчивые кодеки будущее цифровой телефонии. // "Сети и системы связи" - №10, 1997, с. 26-32 .
12. Владимирова Н.В., Коломиец И.А. Основные особенности турбо-кодов // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2003 г.
13. Вокодерная телефония. Методы и проблемы. /Под ред. А.А. Пирогова. -М: Связь, 1974.
14. Ворсано Давид. Кодирование речи в цифровой телефонии. // "Сети и системы связи" №8, 1996, с.24-27.
15. Гемитерн В.И., Каган Б.М. Методы оптимального проектирования. -М.: Энергия, 1984 г.
16. Гольденберг JL М. и др. Цифровая обработка сигналов: Учеб. пособие для вузов. -2 изд., перераб. и доп. М.: Радио и связь, 1990.
17. Гофман В.Э., Хомоненко А.Д. Delphi 5. СПб.: БХВ - Санкт-Петербург, 1999.-800 с.
18. Губанов Д.А., Стешенко В.Б., Храпов В.Ю., Шипулин С.Н. Перспективы реализации алгоритмов цифровой фильтрации на основе ПЛИС фирмы ALTERA. // "Chip News" № 9,10, 1997, с. 26-33.
19. Губанов ДА., Стешенко В.Б., Шипулин С.Н. Современные алгоритмы ЦОС: перспективы реализации. // "Электроника: наука, технология, бизнес" №1, 1999, с.54-57.
20. Кириллов С.А., Лоцманов А.А. Дифференциальная импульсно-кодовая модуляция с нелинейным адаптивным фильтром-предсказателем // Материалы 5-ой международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2003. Москва, 2003 г.
21. Кобелев В.Ю. Адаптивное вейвлет-преобразование сигналов // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
22. Кодирование речи, http://www.protei.ru/teor/iptel/ipspeak/kodek.html.
23. Коломиец И.А. Владимирова Н.В. Развитие кодов, корректирующих ошибки // 5-я международная научно-техническая конференция ПТСПИ'2003 «Перспективные технологии в средствах передачи информации», Владимир, 1-4 июля 2003г, с. 223-225
24. Коломиец И.А. Методика проектирования систем кодирования речи // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2002 г.
25. Коломиец И.А. Постановка задачи оптимизации при проектировании систем кодирования речи // 7-я международная научно-техническая конференция ПТСПИ'2005 «Перспективные технологии в средствах передачи информации», Владимир, 22 апреля 2005г.
26. Коломиец И.А. Проектирование систем кодирования речи на основе библиотеки макроблоков и базовых блоков // 7-я международная научно-техническая конференция ПТСПИ'2005 «Перспективныетехнологии в средствах передачи информации», Владимир, 22 апреля 2005г.
27. Коломиец И.А. Развитие алгоритмов кодирования речи // Международная научно-техническая конференция «Новые методологии проектирования изделий микроэлектроники» «New design methodologies», Владимир, 2003 г.
28. Коломиец И.А., Басаргин А.С. Состав библиотеки моделей алгоритмов построения систем кодирования речи // Материалы международной НТК «Новые методологии проектирования изделий микроэлектроники», Владимир, 2004 г. С. 168 —171.
29. Коломиец И.А., Коблов Е.Б., Куликов К.В. Research of the speech signal prediction // East-West Design and Testing Symposium. Crimea, Ukraine, September, 2004.
30. Коломиец C.A., Коломиец И.А., Ланцов B.H. Design of ADPCM-codec on FPGA basis // East-West Design and Testing Symposium. Crimea, Ukraine, September, 2004. - P. 152 - 156.
31. Крейнес А. Как налить море в наперсток? Технологии компрессии голоса. // "Сети и системы связи" №9,10, 1996, с. 119-121.
32. Ланнэ А.А. Новая теория линейных спектральных корней // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
33. Ланцов В.Н., Коломиец И.А. Реализация подсистем кодирования -декодирования речи в базисе ПЛИС // Всероссийская НТК «Реконфигурируемые электронные средства в системах обработки информации», Владимир, 2002 г., с. 38 40.
34. Маркел Дж., Грэй А. Линейное предсказание речи. М.: Связь, 1980. -308 с.
35. НИР № 2879/03. Исследование путей совершенствования тактико-технических характеристик аппаратуры цифровой регистрации речевой информации.
36. НИР № 2852/03. Разработка программно-аппаратных средств обработки речевого сигнала с применением адаптивной дифференциальной импульсно-кодовой модуляции.
37. Новосельский А. И звукам не тесно, и мыслям просторно. http://softlab.od.ua/algo/dsp/spech-compress.htm
38. Норенков И.П. Разработка систем автоматизированного проектирования. Учебник для вузов. М.: Изд-во МГТУ им. Н.Э. Баумана, 1994.-207 с.
39. Норенков И.П., Маничев В.Б. Системы автоматизированного проектирования электронной и вычислительной аппаратуры: Учеб. пособие для вузов. М.: Высш. школа, 1983. — 272 с.
40. ОКР № 2992/03. Разработка и изготовление специализированного кодека для аппаратуры регистрации цифровым методом.
41. Рабинер JL, Гоулд Б. Теория и применение цифровой обработки сигналов. М: Мир, 1978.
42. Рабинер J1.P., Шафер Р.В. Цифровая обработка речевых сигналов. М: Радио и связь, 1981.
43. Разработка программы распознавания русской речи для процессора SuperH RISK http://leader.cs.msu.su/~luk/ContinuousSpeechrus.html.
44. Разработка САПР. В 10 кн. Кн. 2. Системотехнические задачи создания САПР: Практ. пособие/ А.Н. Данчул, Л.Я. Полуян; Под ред. А.В. Петрова М.: Высш. шк., 1990 - 144 с.
45. Ратыжский М.В. Основы сотовой связи./ Под ред. Зимина Д.Б. М.: Радио и связь, 2000, 248 с.
46. Свидетельство об официальной регистрации программы для ЭВМ № 2004610928. Система воспроизведения речевых сигналов. Авторы Ефимов В.Г., Гусев Е.В., Коломиец И.А. Зарегистрировано в Реестре программ для ЭВМ 16 апреля 2004 г. (г. Москва).
47. Справочник по математике для научных работников и инженеров. Корн Г., Корн Т. М.: Наука, 1984.
48. Стукалов Д.Н. Кластеризация параметров речевого сигнала с учетом их динамических характеристик // Материалы 3-ей международной конференции-выставки «Цифровая обработка сигналов и ее применение» DSPA'2000. Москва, 2000 г.
49. Теоретические основы САПР: Учебник для вузов / Корячко В.П., Курейчик В.М., Норенков И.П. М.: Энергоатомиздат, 1987. - 400 с.
50. Уидроу Б., Стирнз С. Адаптивная обработка сигналов: Пер. с англ. — М.: Радио и связь, 1989. 440 с.
51. Хартов В.Я. Автоматизация функционально-логического проектирования цифровых приборов и устройств. — М.: Машиностроение, 1978. 52 с.
52. Цифровая обработка сигналов / А.Б. Сергиенко СПб.: Питер, 2002. -608 с.
53. Яблонский С.В. Введение в дискретную математику: Учебн. Пособие для вузов. -М.: Наука. Гл. ред. физ.-мат. лит., 1986. 384 с.
54. A. Chandrakasan, S.Sheng, R. Brodersen. Low-power CMOS digital design. // IEEE J.Solid-State Circ., vol. 27, No. 4, pp. 473-484, Apr. 1992.
55. A.Spanias. Speech coding. Proc. IEEE, vol. 82, pp. 1541-1582, Oct. 1994.
56. Akira Takahashi, Hideaki Yoshino. Perceptual QoS Assessment Technologies for VoIP // IEEE VOICE OVER IP AND QUALITY OF SERVICE, Vol.42, № 7, July 2004, pp. 28-34.
57. Alan V. Oppenheim, Roland W. Schafer, John R. Buck. Discrete-time signal processing. Prentice-Hall International, 1999.
58. Allen Gersho, Erdal Paksoy. An overview of Variable Rate Speech Coding for cellular network. Proc. of the Int. Conf. On Selected Topics in Wireless Communications, 1992, Vancouver, B.C., Canada.
59. Chandrakasan, R. Brodersen. Minimizing power consuption in digital CMOS circuits. Proc. IEEE, vol. 83, pp. 498-523, Apr. 1995.
60. Ciaran McElroy. Introduction to many types of speech coding. http://www.dsp.ucd.ie/speech/tutorial/speechcoding/ speechtut.html
61. D. Massaloux, S. Proust. Special shaping in the proposed ITU-T 8kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1995, pp. 9-10.
62. DSP Cores for Mobile Communications: Where are we going?, Gerhard Fettweis, Mobile Communications Systems, Dresden University of Technology, D-01062 Dresden.
63. E. Paskoy, K. Srinivasan, A. Gersho. Variable Rate CELP Coding of Speech with Phonetic Classification. European Transactions on Telecommunications, September, 1984.
64. E. Yuen, P. Но, V. Cuperman. Varible Rate Speech and Channel Coding for Mobile Communications. Proc. 43rd IEEE/VTS Vehicular Technology Conference, 1994.
65. F.Weller. Программные средства проектирования устройств цифровой обработки сигналов. // "Electronic Engineering Times" N32, 1995, с.40-41.
66. GSM 06.10 (ETS 300 580-2). Digital cellular telecommunications system (Phase 2); Full rate speech. European Telecommunications Standards Institute, 2000.
67. GSM 06.20 (ETS 300 581-2). Digital cellular telecommunications system (Phase 2); Half rate speech. European Telecommunications Standards Institute, 1998.
68. GSM 06.60 (ETSI EN 301 245). Digital cellular telecommunications system (Phase 2); Enhanced Full Rate (EFR) speech transcoding. European Telecommunications Standards Institute, 2000.
69. I. Gerson, M. Jasiuk. Vector sum excited linear prediction (VSELP) speech coding at 8 kbits/s. Proc. ICASSP-90, Apr. 1990, pp. 461-464.
70. I.A. Greson, M.A.Jasiuk. Vector Sum Excited Linear Prediction (VSELP) speech coding at 8 kb/s. Proc. ICASSP '90, Albuquerque, pp. 461-464.
71. ITU Coding Standards. http://www.itu.ch/itudoc/itu-t/rec/g/g700-799.html
72. ITU-T Recommendation G.711. General aspects of digital transmission systems; terminal equipments. Pulse Code Modulation (PCM) of voice frequencies. International Telecommunication Union, Telecommunication Standardization Sector, 1988, 1993.
73. ITU-T Recommendation G.723.1. Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbits/s. International Telecommunication union, Telecommunications Standardization Sector, 1996.
74. ITU-T Recommendation G.729. Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic Code-Excited Linear-Prediction (CS-ACELP). International Telecommunication union, Telecommunications Standardization Sector, 1995.
75. ITU-T Recommendation P.800. Mean Opinion Score (MOS). International Telecommunication union, Telecommunications Standardization Sector, 1996.
76. ITU-T Recommendation P.861. Perceptual Speech Quality Measurement (PSQM). International Telecommunication union, Telecommunications Standardization Sector, 1996.
77. ITU-T Recommendation P.862. Perceptual Evaluation of Speech Quality (PESQ). International Telecommunication union, Telecommunications Standardization Sector, 1996.
78. J. H. James, Bing Chen, Laurie Garrison. Implementing VoIP: A Voice Transmission Performance Progress Report // IEEE VOICE OVER IP AND QUALITY OF SERVICE, Vol.42, № 7, July 2004, pp. 36-41.
79. J. Hennesy, D. Patterson. Computer Architecture: A Quantitative Approach. San Francisco, С A: MorganKaufmann, 1996.
80. J.D. Markel, A.H. Gray, Jr. Linear prediction of speech. Springer-Verlag, New York, NY, 1976.
81. J.J. Dubnowski, R.E.Crochier. Variable Rate Coding of Speech. // "Bell systems Technical Journal", March, 1979, vol. 58, pp. 557-600.
82. Jason Woodard. Introduction to speech coding plus information on a series of speech coding standards. http://www-mobile.ecs.soton.ac.uk/ speechcodecs/index.html
83. K. Jarvinen, J. Vainio, P. Kapanen, T. Honkanen, P. Haavisto, R. Salami, C. Laflamme, J-P. Adoul. GSM Enhanced Full Rate Speech Codec. Proceedings of the 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '97).
84. Kataoka et al. LSP and gain quantization for the proposed ITU-T 8 kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1995, pp.7-8.
85. L.R. Rabiner, R.W. Shafer. Digital processing of speech signals. Prentice-Hall, Englewood Cliffs, NJ, 1978.
86. Lei Zhang, Tian Wang, Vladimir Cuperman. A CELP Variable Rate Speech Codec with low average rate. Proceedings of the 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '97).
87. M. Rajesh. Low Power Architectures for the IS-54 VSELP Algorithm, MS thisis, Arizona State University, Tempe, Arizona, 1995.
88. Makhoul J., Roucos S., Gish H. Vector Quantization in Speech Coding // IEEE v.73, № 11, 1985.
89. N. Weste, K.Eshragian. Principles of CMOS VLSI Design: A Systems Perspective. Reading, MA: Addison-Wesley, 1988.
90. P. Jacobs, W. Gardner. "QCELP": A Variable Rate Speech Coder for CDMA Digital Cellular Systems. // Speech and Audio Coding for Wireless and Network Applications, edited by B.S. Atal, V. Cuperman and A. Gersho, Kluwer Academic Publishers, 1993.
91. R. Salami et al. Description of the proposed ITU-T 8 kb/s speech coding standart. // IEEE Speech Coding Workshop, Annapolis, Sept. 1999, pp. 3-4.
92. Russell E. Henning, Chaitali Chakrabarti. High-Level Design Synthesis of a Low Power, VLIW Processor for the IS-54 VSELP Speech Encoder. Proceedings of the 1997 International Conference on Computer Design (ICCD '97).
93. The Programmable Logic Data Book. Xilinx, Inc., 1999
94. TIA/EIA/IS-127. Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital Systems. Interim Standart.
95. Telecommunications Industry Association, Electronic Industries Alliance, 1997.
96. TIA/EIA/IS-96-B. Speech Service Option Standart for Wideband Spread Spectrum Systems. Interim Standart. Telecommunications Industry Association, Electronic Industries Alliance, 1996.
97. V. Cuperman, P. Lupini. Variable Rate Speech Coding. // "Modern methods of speech processing '1995", pp. 101-120.
98. V. Madisetti. VLSI Signal Processors: An Introduction to Rapid Prototyping and Design Synthesis. Boston, MA: Butterworth-Heinemann, 1995.
99. Y. Yatsuzuka, S. Lizuka, T. Yamazaki. A Variable Rate Coding by APC with Maximum Likelihood Quantization from 4.8 kbit/s to 16 kbit/s. Proc. IEEE ICASSP, 1986, pp. 3071-3074.
100. МЕТОДИКА ПРОЕКТИРОВАНИЯ РЕЧЕВОГО КОДЕКА1. Начало1. Алгоритмыкодир. речи1. Библиотека макроблоков1. Ai
101. Библиотека л эазовых блоков.1. Библиотека кодовых книг1. Расчет кодовых книги таблиц квантования1. Оптимизациятаблиц квантования
102. Определение требований к разрабатываемому кодеку: 1) среда передачи, виды сигналов3. скорость цифрового потока4. качество восстан.сигнала5. задержка кодирования6. сложность алгоритма8. требования к реализации
103. Исследование и анализ сигналов и среды функционирования
104. Выбор алгоритма кодирования речи
105. Разработка структурной схемы кодека(набор макроблоков)
106. Декомпозиция структурной схемы (формирование набора базовыхблоков)
107. Выбор реализаций отдельных базовых блоков
108. Принятие решений о дальнейших действиях
109. Модификация существующих или составление и новых кодовых книг и таблиц квантования
110. Составление функциональноймодели кодека *
111. Моделирование и анализ характеристик кодека
112. Принятие решений о дальнейших действиях
-
Похожие работы
- Разработка эволюционных методов и алгоритмов кодирования-декодирования данных в компьютерных системах
- Автоматизация проектирования программно-аппаратных средств адаптивного помехоустойчивого кодирования данных
- Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств
- Алгоритмы и устройства для кодирования эталонной информации в системах автоматизированного обучения
- Повышение эффективности проектирования маршрута технологического процесса механической обработки на основе формализации этапа подготовки и кодирования конструкторско-технологической информации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность