Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса

Якушев, Дмитрий Владимирович

Математическое моделирование, численные методы и комплексы программ

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса

кандидата технических наук: Якушев, Дмитрий Владимирович
город: Ставрополь
год: 2008
специальность ВАК РФ: 05.13.18

Диссертация по информатике, вычислительной технике и управлению на тему «Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса»

Автореферат диссертации по теме "Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса"

0034504Т2

На правах рукописи ¿0.

Якушев Дмитрий Владимирович

ИССЛЕДОВАНИЕ ОБРАТНОЙ ЗАДАЧИ ДЛЯ ГОЛОСОВОГО ИСТОЧНИКА С ПОМОЩЬЮ ПРОЦЕДУРЫ РЕКОНСТРУКЦИИ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РЕЧЕВОГО ПРОЦЕССА

05.13.18 - Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

я О О-ЛТ 2008

Ставрополь - 2008

003450472

Работа выполнена В ГОУ ВПО «Ставропольский государственный университет»

Научный руководитель: доктор технических наук, профессор

Копытов Владимир Вячеславович

Официальные оппоненты: доктор технических наук, профессор

Бабенко Людмила Клементьевна

(Технологический институт Южного федерального университета);

. , доктор технических наук, профессор

Мочалов Валерий Петрович ' ' (Северо-Кавказский технический

;1 "' , - университет)

Ведущая организация: Учреждение Российской академии наук

Научно-исследовательский институт прикладной математики и автоматизации Кабардино-Балкарского научного центра РАН (г.Нальчик)

Защита состоится 27 ноября 2008 года в 14.30 на заседании совета по защите докторских и кандидатских диссертаций Д 212.256.08 при Ставропольском государственном университете по адресу: 355009, Ставропольский край, г.Ставрополь, ул. Пушкина, 1, ауд. 214

С диссертацией можно ознакомиться в научной библиотеке Ставропольского государственного университета.

Автореферат разослан « 24» октября 2008 года

Ученый секретарь

совета по защите докторских

и кандидатских диссертаций

Копыткова Л.Б.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. К числу основных,задач речевых технологий относятся задачи распознавания речи, идентификации и верификации диктора по голосовым данным. Решения этих задач находят широкое применение в комплексных системах защиты информации при биометрической идентификации человека. Большой вклад в развитие анализа речевых сигналов внесли специалисты: Фант, Фланаган, Маркел, Грей, Рабинер, Шафер. Среди отечественных специалистов можно выделить: В.Р. Женило, В.Я. Чучупал, А.Н. Собакин, и т.д. Исследованием условий решения речевых обратных задач для речевых технологий занимается речевая группа: В.Н. Сорокин, И.С. Макаров - лаборатории Информационных технологий передачи, анализа и защиты информации на базе Института проблем передачи информации им. А.А. Харкевича

Решением обратной задачи для голосового источника является определение формы импульсов голосового возбуждения в речевом тракте, определяемой колебаниями голосовых связок. Параметры колебаний голосовых связок являются индивидуальными и используются для практических приложений речевых технологий. Определение колебаний голосовых связок связано с реализацией технологии обратной фильтрации, которая основана на подавлении резонансов речевого тракта, в результате которого остаются импульсы голосового возбуждения.

Для реализации технологии обратной фильтрации используется модель линейного предсказания с рекурсивной структурой. Рекурсивная структура модели линейного предсказания в условиях реальной среды распространения речевого сигнала создает эффект накапливания ошибок во времени и может привести к значительному смещению полученных оценок параметров голосового источника. Другим существенным недостатком статистического подхода к обработке экспериментальных данных является предположение о прямой зависимости между точностью полученных оценок параметров исследуемой системы и объемом выборки стационарного сигнала, так как речевой сигнал является нестационарным. Существующее деление системы речеобра-зования на две компоненты - голосовой источник и речевой тракт искусственно, так как на физиологическом уровне система речеобразования является неделимым целым. Следовательно, существующий математический аппарат анализа речевых сигналов неадекватен его природе.

Выявленные недостатки статистического подхода к анализу речевых сигналов позволяют сделать вывод о недостаточной изученности проблемы речеобразования. Альтернативным подходом к анализу речевых сигналов и изучению нелинейных динамических систем - голосовой источник и процесс речеобразования является использование динамического подхода, основанного на реконструкции математической модели динамической системы по порождаемому временному ряду в рамках теории детерминированного хаоса.

Реализация технологии обратной фильтрации с помощью процедуры реконструкции математической модели речевого процесса на зашумленных участках речевого сигнала позволяет существенно снизить неблагоприятное внешнее воздействие, так как уравнения движения, используемые в качестве реконструированной модели речевого процесса, нерекурсивны и исключается возможность проявления эффекта накапливания ошибок.

Цель исследования: разработка методов решения обратной задачи для голосового источника с помощью процедуры реконструкции математической модели динамической системы по порождаемому временному ряду.

' Для достижения поставленной цели решались следующие задачи исследования:

1. Разработать метод решения обратной задачи для голосового источника на основе процедуры реконструкции математической мо-■ дели речевого процесса.

- 2. Оценить форму импульсов голосового возбуждения в речевом тракте с помощью процедуры реконструкции математической модели аэродинамического потока через голосовую щель.

3. Разработать метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическим параметрам речевого сигнала.

4. Снизить ошибки реконструкции формы импульсов голосового возбуждения в речевом тракте.

Объект исследования: динамические системы - процесс речеобра-зования и голосовой источник.

Предмет исследования: временной ряд, являющийся реализацией процесса речеобразования - речевой сигнал, либо сигналом из голосового источника — импульсы голосового возбуждения в речевом тракте.

Методы исследования. Для решения сформулированных частных научных задач использовались методы: моделирования динамических систем, анализа временных рядов и речевых сигналов, теории цифровой обработки сигналов, идентификации систем, оптимизации, математической статистики.

Достоверность полученных результатов основывается на непротиворечии с известными в литературе результатами, проведением вычислительных экспериментов, проверкой полученных моделей на адекватность исследуемому объекту.

Научная новизна результатов, полученных в работе, состоит в следующем:

1. Разработан новый метод и алгоритм обратной фильтрации на основе процедуры реконструкции математической модели речевого процесса, позволяющий снизить неблагоприятное воздействие реальной среды распространения речевых сигналов.

2. Получена оценка параметров модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов.

3. Разработан новый метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическому сигналу, расширяющий возможности исследования обратной задачи для голосового источника.

4. Продемонстрирована возможность снижения ошибки реконструкции голосового источника с помощью дробно-рационального интерполирования.

Практическая значимость заключается в следующем. Разработанные методы могут быть использованы:

1. Для идентификации и верификации диктора по голосу, распознавании пола диктора и отнесения его к определенной возрастной группе в комплексных системах с разграничением доступа к информации.

2. В решении обратной задачи для голосового источника с помощью динамического подхода на материале зашумленных речевых сигналов.

3. В создании программного обеспечения для детального исследования речевых сигналов в условиях реальной среды распространения, синтезе речи, корректировке медицинских диагнозов.

Положения, выносимые на защиту:

1. Метод и алгоритм анализа речевых сигналов с помощью процедуры реконструкции математической модели речевого процесса по акустическому сигналу.

2. Метод реконструкции математической модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов.

3. Метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическим параметрам речевого сигнала.

4. Снижение величины ошибки реконструкции математической модели голосового источника с помощью дробно - рационального интерполирования.

Апробация работы. Результаты исследований по теме диссертационной работы отражены в 18 публикациях. Из них 2 в журналах, рекомендованных ВАК.

Основные результаты диссертационного исследования были использованы в разработках систем контроля и управления доступа ЗАО «Стилсофт», внедрены в учебный процесс Ставропольского государственного университета. Работа поддержана грантом РФФИ № 06-01-00020 — «Структурирование выявления несоответствий и прогнозирования эволюционных дискретных процессов и систем при наличии долговременных корреляций».

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений.

ОСНОВНЫЕ ПОЛОЖЕНИЯ РАБОТЫ

Во введении обоснованы актуальность и новизна исследования. Определена цель исследования и частные научные задачи исследования, объект и предмет исследования. Представлены результаты диссертационного исследования и их практическая значимость.

- В первой главе проведен анализ методов решения обратной задачи для голосового источника на основе обратной фильтрации с помощью модели линейного предсказания.

Представлены основные определения и постановка обратной задачи для голосового источника, анатомические и физические детали образования вокализованной речи. Рассмотрены параметрические модели объемной скорости воздушного потока через голосовую щель, импульсов голосового возбуждения в речевом тракте, площади голосовой щели, а так же модель аэродинамического потока через голосовую щель. Проанализированы существующие алгоритмы обратной фильтрации и анализ методов оценки параметров голосового источника с помощью модели линейного предсказания. ' На рисунке 1 представлена схема процесса речеобразования.

Генератор возбуждения (голосовой источник)

импульсы

Линейная система с переменными параметрами (речевой тракт)

речь

Среда распространения речевого сигнала

речь + шум

приемник речевого сигнала

Рисунок 1 - Схема процесса речеобразования

В практике анализа речевых сигналов на корректность решения обратной задачи для голосового источника с помощью модели линейного предсказания оказывают влияние:

1. Реверберация помещения.

2. Тип звукоснимающего устройства, модель и количество микрофонов, их расстояние от диктора.

3. Внешние шумы.

4. Алгоритмы оценивания коэффициентов модели линейного предсказания.

Обоснована постановка задачи диссертационного исследования — разработка методов решения обратной задачи для голосового источника с помощью процедуры реконструкции математической модели динамической системы по порождаемому временному ряду.

Во второй главе проведен анализ этапов процедуры реконструкции математической модели динамической системы по порождаемому временному ряду.

На рисунке 2 представлена схема моделирования по временным рядам.

Рисунок 2 — Схема моделирования по временным рядам

Для реконструкции математической модели динамической системы по порождаемому временному ряду рассмотрена следующая структура реконструируемой модели

кп ю о *о':?*^'в{х1,Х2,...,Х1г),с}= ^ ср.Ц.и...../„ГК'.УЛ -^П-

/„/2,..,/д=0 " /с=1 к=1

Для оценки коэффициентов реконструируемой модели применен линейный метод наименьших квадратов. Для проверки реконструированной модели на адекватность использовано следующее представление

I ] ^ : 7

Ь-' (2)

у /V - от -1 ^

/и - потери точек при реализации метода последовательного дифференцирования.

Исследована возможность снижения ошибки аппроксимации е с помощью дробно - рационального интерполирования. На рисунке 3 представлен результат вычисления ошибок реконструкции для различных временных окон реконструкции.

помощью алгебраического многочлена - линия, дробно - рационального интерполирования - штриховая линия

Исследование динамического подхода к анализу нестационарных временных рядов позволило определить методы для реализации этапов процедуры реконструкции математической модели динамической системы по порождаемому временному ряду применительно к речевым сигналам.

В третьей главе представлены результаты разработки подходов к решению обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса по двум направлениям:

реализация ситуации «черного ящика» — структура модели не определена, и «прозрачного ящика» — структура модели определена и необходимо оценить параметры модели. В рамках исследования проведено моделирование речевого процесса, оценка параметров модели аэродинамического потока через голосовую щель, моделирование голосового источника.

Проведенное моделирование показало, что метод последовательного дифференцирования в практике анализа экспериментальных данных дает большие ошибки реконструкции и это отражается на адекватности реконструированной модели исследуемой динамической системе, поэтому в дальнейшем использовался метод последовательно интегрирования. Реконструируемая модель речевого процесса имеет вид

I I I

|х£Й = *,, = х,, |х2сй = х3,

ООО

х=/(х[,хг,х2) = с0+с1х1 + с2хг + е3х3 + с^х2 + с^х, + с(х2х1 + с^х^х3 + с^ +

2 2 2 2 2 2 2 2 (3)

+СдХ2 + 'чЛ Х2 С\2Х\. Х3 СИ*1 Х2Х1 С\АХ\Х2 С\5Х\Х2Х3 С\ЬХ2Х3

2 2 2 2 2 2 2 22

Здесь х - речевой сигнал, зависящий от времени X], Хг, дг3 - возбуждение в голосовой щели (входной процесс), С0,...,С26 ~ коэффициенты входного процесса возбуждения в речевом тракте. Размерность и порядок модели (3) подбираются из соображений адекватности модели.

Алгоритм обратной фильтрации с помощью процедуры реконструкции математической модели речевого процесса по акустическим параметрам речевого сигнала состоит из следующих этапов:

1. Предварительно речевой сигнал предыскажается с помощью нерекурсивного высокочастотного фильтра первого порядка.

2. Речевой сигнал разбивается на сегменты длиной 20 — 25 тс.

3.По предыскаженному речевому сигналу оцениваются коэффициенты модели речевого процесса (3).

4.Непредыскаженный речевой сигнал пропускается через обратный фильтр с передаточной функцией

к=I

где Л (г) - аппроксимация передаточной функции речевого тракта, в качестве оценок а^ используются коэффициенты модели речевого процесса (3).

Таким образом, используя технологию обратной фильтрации с помощью реконструированной модели речевого процесса можно получить

значения объемной скорости воздушного потока через голосовую щель, интегрируя сигнал - остаток обратного фильтра.

Доя реализации «прозрачного ящика» использован следующий подход. Значение первой производной объемной скорости воздушного потока через голосовую щель может бьггь вычислено с помощью модели аэродинамического потока через голосовую щель (модель голосового источника)

w(t) 4ps(0 сУ(<) 12^('М'). (5)

1 } p0h 2hS(t) р0

где w— объемная скорость воздушного потока через голосовую щель, S — площадь голосовой щели.

Для оценки Ар, сх и ц использован линейный метод наименьших квадратов. Для оценки параметров pa, hub, входящих нелинейно в модель (5) использован нелинейный метод наименьших квадратов. Реконструируемая модель голосового источника имеет вид

г г t

Jxai =xv fxldt=x2, jx2dt =дг3, 0 0 0

x=f{xl,x2,xi)=cii+clx] +c2x, +c3x, +c4x,2 + с5х% + C6x\ + C7Jt?+cfxl +

+4*} С](Л*2 + C1 \X2X3 + С[2ХЛ + C\3XlX2X3 + ¿14*2*1 С15*Г*2 <-]6">Уч

A-*2 + ^20-^2 ^21X2X3 + ^

I ~f C^JCj —f C^jXJ ij I I Cjipt^Jlj H" Cjq^^JCj I J^Xj 4"

^^XjX^J^ i -f- CViX^XjX^ +C44J^X2X3 +c45xl^x3 +C46X1X2X3 +

+ Cjj^JCJ^ + + Cjgxfx^x^ + C5ix^x2xj + С^Л^Л^Х} + C5yXj XpC^ +

-fC^JE^X^Xj + C55xfx^ -f +C}7xfx^ +C5sxlx2 +C59X%Xj +c6ax1x3 + c6¡xtx£x£ +

"^д-'уХХ^.

Здесь x - оценки импульсов голосового возбуждения в речевом тракте зависящие от времени t; х, —оценки объемной скорости воздушного потока через голосовую щель; х2, х3 — проинтегрированные оценки объемной скорости воздушного потока через голосовую щель один и два раза соответственно, с0,...,с62~параметры колебаний голосовых связок, определяющие форму импульсов голосового возбуждения в речевом тракте. Таким образом, реализована процедура реконструкции модели голосового источника, случай «черного ящика». Представленный подход к решению обратной задачи для голосового источника позволяет избежать проблем моделирования по речевым сигналам заменой моделирования речевого процесса на моделирование голосового источника.

(6)

В четвертой главе представлены результаты вычислительного эксперимента по следующим направлениям:

1. Экспериментальное подтверждение индивидуальности речевой акустики на основе коэффициентов реконструированной модели речевого процесса.

2. Экспериментальное подтверждение точности оценивания объемной скорости воздушного потока через голосовую щель на основе технологии обратной фильтрации по коэффициентам реконструированной модели речевого процесса.

3. Экспериментальное подтверждение восстановления формы импульсов голосового возбуждения в речевом тракте по оцененным значениям параметров модели аэродинамического потока через голосовую щель.

4. Экспериментальное подтверждение снижения ошибки реконструкции голосового источника с помощью дробно — рационального интерполирования.

Для экспериментального подтверждения индивидуальности речевой акустики при произношении дикторами одного и того же звука использована процедура реконструкции математической модели речевого процесса по усредненному речевому сигналу, полученному в результате произношения диктором фонемы /э/ несколько раз. Результаты эксперимента подтвердили индивидуальность речевой акустики по оцененным коэффициентам модели (3).

Для экспериментального подтверждения точности оценивания объемной скорости воздушного потока через голосовую щель, на основе технологии обратной фильтрации, по коэффициентам реконструированной модели речевого процесса использован материал синтезированных гласных на первом периоде основного тона. Так как д ля этого материала известен тип голоса.

Вычисленная объемная скорость получена с помощью модели аэродинамического потока через голосовую щель (5). Площадь голосовой щели получена с помощью модели

7Г<

2 /,Г0

2 -0Г» О,

о <I< 'Л

'Л < / < /2г0

12Т0<1<Т0

(7)

со значениями параметров /,=0.46 и 12 =0.77 для придыхательного типа голоса и /,=0.3 и /2=0.5 для скрипучего типа голоса, сс=2, /3=1. Экспери-

ментальная объемная скорость получена с помощью технологии обратной фильтрации по коэффициентам модели линейного предсказания и модели реконструкции. Для сравнения вычисленной и экспериментальной объемных скоростей использована величина абсолютной среднеквадратической погрешности. Результаты отражены в таблице 1 и таблице 2.

Таблица 1 - Линейное предсказание

гласные /а/ /и/ /у/

придыхательный голос 0,0364 0,0239 0,1186

скрипучий голос 0,0550 0,0428 0,0482

Таблица 2 - Модель реконструкции

гласные /а/ /и/ /у/ '

придыхательный голос 0,0280 0,0583 0,0280

скрипучий голос 0,0430 0,0352 0,0291

При реализации технологии обратной фильтрации с помощью коэффициентов модели речевого процесса средняя ошибка меньше на 3% в отличие от использования коэффициентов модели линейного предсказания.

На рисунке 4 представлены результаты вычисления площадей голосовой щели для реального звука /э/ с помощью параметрической модели площади голосовой щели (7) по оценкам ее параметров. Параметры модели (7) оценены, методом среднеквадратической минимизации, в результате подгонки значений этой модели к значениям площади голосовой щели, вычисленным с помощью модели голосового источника (5). Объемная скорость воздушного потока в модели (5) получена с помощью технологии обратной фильтрации по коэффициентам модели линейного предсказания и коэффициентам реконструированной модели речевого процесса (3).

0.2 о ia

О 18 О 14 О 12

4= 01

ооа 0.06 004

0 02

О О 001 О 002 О 003 О 004 О 005 О 006 О 007 0.0Q8 О 009 О 01 sec

а)

02 О 13 О 16 О 14 О 12

ооа DOS О 04 0 02

°0 О 001 0002 О 003 0 004 D 005 0 006 0 007 О ОСИ 0 009 0.01 sec

б)

Рисунок 4 — Площади голосовой щели, полученные с помощью различных моделей: модели линейного предсказания а) и модели реконструкции б) - сплошная линия, площадь скрипучего типа голоса (для сравнения) - пунктирная линия

Из рисунка 4 следует, что для реального гласного корректное решение обратной задачи для голосового источника получено с помощью коэффициентов реконструированной модели речевого процесса, так как длительность фазы открытия голосовой щели не превышает фазу открытой голосовой щели, что отражается на форме площади

/ А

/ ^

/ / i,

/ / 1 / \

! / > / *

1 /

/ /

/ / »

1 / \

/ / / / 1

/ / ^

1 / ' '/ \ (

) _1_1_1_-1_1_

голосовой щели. Такой результат соответствует физиологии образования речевого сигнала.

Для экспериментального подтверждения восстановления формы импульсов голосового возбуждения в речевом тракте по оцененным значениям параметров модели аэродинамического потока через голосовую щель (5) использованы линейный и нелинейный методы наименьших квадратов. Экспериментально подтверждена возможность применения методов оптимизации к оценке параметров модели (5).

Экспериментальное подтверждение адекватности реконструированной модели голосового источника (6) получено по формулам средних квадратических отклонений. В таблицах представлены ошибки реконструкции, окно 250 мс (2000 - 5000 отсчетов, при частоте дискретизации 8000 - 22050 Гц) и 500 мс (10000 отсчетов) для дробно-рационального интерполирования. Таблица 3 и таблица 4 отражает результат вычисления ошибок реконструкции для алгебраического многочлена, таблица 5 - результат вычисления ошибок реконструкции с помощью дробно - рационального интерполирования.

Таблица 3 - Величины ошибок реконструкции е0/. в зависимости от параметров реконструкции - размерности И и порядка Р алгебраического многочлена для реальной синтезированной /а/

И-2 1>=3

Р=1 Р= 3 Р= 4 Р= 5 2 Р=3

0.1738 0.1731 0.1724 0.1719 0.0972 0.0739

Таблица 4 — Величины ошибок реконструкции £ор в зависимости от параметров реконструкции — размерности В и порядка Р алгебраического многочлена для реальной /а/

£>=2 £)=3

Р=2 . Р= з рщ Р= 5 Р= 2 Р= 3

0.0240 0.0240 0.0240 0.0239 0.0212 0.0206

Таблица 5 — Величины ошибок реконструкции Езр в зависимости от порядка Р алгебраического многочлена

синтезированная Ы реальная /а/

Р=2 Р= 3 Р=2 Р=Ъ

2.9894е-009 2.1586е-009 1.4121е-004 3.5067е-008 !

Таким образом, получено экспериментальное подтверждение адекватности реконструированной модели голосового источника.

Заключение содержит результаты диссертационной работы и направления дальнейших исследований:

]. Разработан метод и алгоритм обратной фильтрации речевого сигнала на основе процедуры реконструкции математической модели речевого процесса.

2. Оценка параметров модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов.

3. Разработан метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическому сигналу.

4. Снижение ошибки реконструкции математической модели голосового источника по порождаемому временному ряду с помощью дробно-рационального интерполирования.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОГО ИССЛЕДОВАНИЯ

1. Якушев, Д. В. Идентификация временных рядов методом определения размерности модели [Текст] / Д; В. Якушев // Физико-математические науки на современном этапе развития Ставропольского государственного университета : Материалы 51-й научно-методической конференции преподавателей и студентов Ставропольского государственного университета «Университетская наука — региону». — Ставрополь: Изд-во СГУ, 2006. - С. 363 - 366.

2. Якушев, Д. В. Фильтрация данных при моделировании автоколебательных систем [Текст] / Д. В. Якушев П Наука на рубеже тысячелетий «Progressive technologies of Development» 3-я Международная научно — практическая конференция: 24-25 ноября 2006 г. — Тамбов: ОАО «Там-бовполиграфиздат», 2006. - С. 64 — 66.

3.Якушев, Д. В. Фильтрация данных методом скользящей средней на промежуточных этапах моделирования автоколебательных систем [Текст] / Д. В. Якушев // Современные проблемы информатизации в моделировании и анализе сложных систем : Сб. трудов. - Воронеж: «Научная книга», 2007. - Вып. 12: сборник трудов по итогам 12-й Международной открытой научной конференции, Воронеж, ноябрь 2006 - январь 2007 гг.-С. 210-213.

4. Якушев, Д. В. Методы восстановления фазового портрета по данным ЭКГ человека [Текст] / Д. В. Якушев // Современная техника и технологии в медицине, биологии и экологии: Материалы 7-й Международной научно-практической конференции, г. Новочеркасск, 17 ноября 2006 г. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск: ООО НПО «Темп», 2006.-С. 14-15.

5. Якушев, Д. В. Вычисление показателя Ляпунова Применительно к оценке вариабельности сердечного ритма [Текст] / Д. В. Якушев // Методы и алгоритмы прикладной математики в технике, медицине и экономике : Материалы 7-й Междунар. научн.-практ. конф., г. Новочеркасск, 2 фев. 2007 г.: В 2 ч. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск: ЮРГТУ, 2007. - Ч. 2. - С. 64 - 66.

6. Якушев, Д. В. Методы аппроксимации при реконструкции математической модели динамической системы [Текст] / Д. В. Якушев // Информационно — вычислительные технологии и их приложения: сборник статей 5-й Международной таучно — технической конференции. — Пенза: РИО ПГСХА, 2006. - С. 337 - 339.

7. Якушев, Д. В. Оценка параметра дискретного отображения и реконструкция уравнений движения по хаотическим временным рядам [Текст] / Д. В. Якушев // Материалы и технологии XXI века: сборник статей 5-й международной научно - технической конференции. - Пенза: АНОО «Приволжский Дом знаний», 2007. - С. 146 -148.

8. Якушев, Д. В. Моделирование динамических систем с помощью алгоритмов нелйнейной динамики [Текст] / Д. В. Якушев // Теоретические и прикладные вопросы современных информационных технологий: Материалы 8-й Всероссийской научно - технической конференций. -Улан-Удэ: Изд-во ВСГТУ, 2007. - С. 41 - 44.

9. Якушев, Д. В. Методы прогнозирования дискретных отображений по хаотическим временным рядам [Текст] / Д. В. Якушев, О. М. Лепеш-кин // Нйучно-инновационные достижения ФМФ в области физико-математических и технических дисциплин: Материалы 52-й научно-методической конференции преподавателей и студентов Ставропольского государственного университета «Университетская наука — региону». -Ставрополь: Ставропольское книжное издательство, 2007. - С. 336 — 339.

10. Якушев, Д. В. Определение дальности прогноза автоколебательных систем на примере осциллятора Ван дер Поля [Текст] / Д. В. Якушев, О. М. Лепешкин // Научно-инновационные достижения ФМФ в области физико-математических и технических дисциплин: Материалы 52-й научно-методической конференции преподавателей и студентов Ставропольского государственного университета «Университетская наука — региону». - Ставрополь: Ставропольское книжное издательство, 2007. -С. 339-341.

11. Якушев, Д. В. Решение обратной задачи речевой акустики методом реконструкции математической модели динамической системы по порождаемому временному ряду [Текст] / Д. В. Якушев // Современные проблемы информатизации в анализе и синтезе технологических и программно-телекоммуникационных систем: сб. науч. тр. — Воронеж: Научная книга, 2008. - Вып. 13: сборник трудов по итогам 13-й Международной открытой научной конференции, Воронеж, ноябрь 2007 — январь 2008 гг. - С. 326-328.

12. Якушев, Д. В. Оценка параметров модели голосового источника [Текст] / Д. В. Якушев // Современные проблемы информатизации в моделировании и социальных технологиях: сб. науч. тр. - Воронеж: Научная книга, 2008. - Вып. 13: сборник трудов по итогам 13-й Международной открытой научной конференции, Воронеж, ноябрь 2007 - январь 2008 гг.-С. 262-264.

13. Якушев, Д. В. Обратная фильтрация речевого сигнала с помощью процедуры реконструкции математической модели речевого процесса [Текст] / Д. В. Якушев // Теоретические и прикладные вопросы современных информационных технологий: Материалы 9-й Всероссийской научно - технической конференции: в 2 ч. - Улан-Удэ: Изд-во ВСГТУ, 2008.-Ч. 1,-С. 45-48.

14. Якушев, Д. В. Реконструкция математической модели хаотической динамической системы дробно — рациональным интерполированием [Текст] / Д. В. Якушев // Теоретические и прикладные вопросы современных информационных технологий: Материалы 9-й Всероссийской научно - технической конференции: в 2 ч. - Улан-Удэ: Изд-во ВСГТУ, 2008,-Ч. 1,-С. 50-54.

15. Якушев, Д. В. Верификация диктора по результатам моделирования импульсов голосового возбуждения в речевом тракте [Текст] / Д. В. Якушев // Моделирование. Теория, методы и средства: Материалы 8-й Международной научно-практической конференции: в 2 ч. / Юж.-Рос. гос. техн. ун-т (НПИ). - Новочеркасск: Лик, 2008. - Ч. 1. - С. 86 - 89.

16. Якушев, Д. В. Реконструкция речевого сигнала с помощью моделирования голосового источника по акустическим параметрам речевого сигна-

ла [Текст] / Д. В. Якушев И Современные методы и средства обработки пространственно - временных сигналов: Сборник статей 6-й Всероссийской научно — технической конференции. — Пенза, 2008. — С. 54 — 56.

В рецензируемых научных журналах из перечня ВАК опубликованы следующие работы:

1. Якушев, Д. В. Оценка импульсной характеристики речевого тракта методом реконструкции математической модели динамической системы по порождаемому временному ряду [Текст] / Д. В. Якушев, В. В. Копытов // Инфокоммуникационные технологии. - 2008. - Т.6, №2. - С. 26 - 29.

2. Якушев, Д. В. Анализ речевого сигнала с помощью процедуры реконструкции математической модели речевого процесса по порождаемому речевому сигналу [Текст] / Д. В. Якушев // Инфокоммуникационные технологии. - 2008. - Т.6, №2. - С. 32 - 34.

Подписано в печать 17.10.2008 Формат 60x84 1/16 Усл.печ.л. 1,1 Уч.-изд.л. 0,93 Бумага офсетная_Тираж 100 экз._Заказ 189

Отпечатано в Издательско-полиграфическом комплексе Ставропольского государственного университета. 355009, Ставрополь, ул Пушкина, 1.

Оглавление автор диссертации — кандидата технических наук Якушев, Дмитрий Владимирович

Введение.

1 Анализ методов решения обратной задачи относительно формы голосового источника на основе обратной фильтрации с помощью модели линейного предсказания.

1.1 Основные определения и постановка обратной задачи для голосового источника.

1.1.1 Анатомические и физические детали образования вокализованной речи.

1.1.2 Постановка обратной задачи для голосового источника.

1.2 Обзор параметрических моделей голосового источника.

1.2.1 Модели объемной скорости воздушного потока через голосовую щель и ее первой производной.:.

1.3 Аэродинамическая модель голосовой щели.

1.3.1 Математическая модель площади голосовой щели.

1.4 Анализ технологии обратной фильтрации в исследовании голосового источника с помощью модели линейного предсказания.

1.4.1 Процедура обратной фильтрации.

1.4.2 Анализ речевых сигналов с помощью модели линейного предсказания.

1.4.3 Методы оценивания коэффициентов модели линейного предсказания.'.

1.4.4 Сопоставление различных алгоритмов обратной фильтрации.

1.5 Анализ методов оценки параметров голосового источника на основе обратной фильтрации с помощью модели линейного предсказания.

1.5.1 Результаты оценивания параметров голосовой щели с помощью вариационного метода, основные недостатки.

1.5.2 Результаты оценивания параметров голосовой щели с помощью метода среднеквадратической аппроксимации, основные недостатки.

1.6 Достоинства и недостатки статистического моделирования в решении обратной задачи для голосового источника. Постановка задачи исследования.

1.7 Выводы.

2 Анализ этапов процедуры реконструкции математической модели динамической системы по порождаемому временному ряду.

2.1 Процедура реконструкции математической модели динамической системы по порождаемому временному ряду.

2.1.1 Схема моделирования по временным рядам. Постановка задачи и этапы реконструкции.

2.1.2 Восстановление компонент векторов состояния модели исследуемой динамической системы.

2.1.3 Реконструкция математической модели исследуемой динамической системы - синтез моделей.

2.1.4 Проверка реконструированной модели на адекватность исследуемому объекту.

2.2 Пример оценки параметра дискретного отображения по хаотическим временным рядам с шумом.

2.2.1 Оценка параметров дискретного отображения с кубической нелинейностью в условиях отсутствия шума.

2.2.2 Оценка параметров дискретного отображения с кубической нелинейностью в условиях динамического шума.

2.3 Увеличение временного окна реконструкции математической модели хаотической динамической системы с помощью дробно — рационального интерполирования.

2.3.1 Реконструкция эталонной хаотической системы с помощью алгебраического многочлена.

2.3.2 Реконструкция эталонной хаотической системы с помощью дробно -рационального интерполирования.

2.4 Примеры прогнозирования хаотических систем.

2.4.1 Методы прогнозирования дискретных отображений по хаотическим временным рядам.

2.4.2 Методы прогнозирования автоколебательных систем.

2.5 Выводы.

3 Исследование решения обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса.

3.1 Разработка процедуры реконструкции математической модели речевого процесса по акустическим параметрам речевого сигнала.

3.1.1 Постановка обратной задачи речевой акустики.

3.1.2 Оценка коэффициентов реконструированной модели речевого процесса.

3.2 Реализация технологии обратной фильтрации с помощью процедуры реконструкции математической модели речевого процесса по акустическим параметрам речевых сигналов.

3.2.1 Разработка метода и алгоритма обратной фильтрации с помощью процедуры реконструкции математической модели речевого процесса по акустическим параметрам речевого сигнала.

3.2.2 Приемы решения обратной задачи для голосового источника.

3.3 Оценка параметров модели аэродинамического потока через голосовую щель с помощью метода наименьших квадратов.

3.4 Разработка процедуры реконструкции математической модели голосового источника.

3.5 Выводы.

4 Вычислительный эксперимент с использованием реконструированных моделей речевого процесса.

4.1 Результаты вычислительного эксперимента по оценке коэффициентов реконструированной модели речевого процесса.

4.1.1 Результаты оценивания коэффициентов реконструированной модели речевого процесса, отражающих индивидуальные особенности речевой акустики на фиксированном интервале времени.

4.1.2 Пример практического приложения траекторий коэффициентов реконструированной модели речевого процесса.

4.2 Результаты вычислительного эксперимента по оценке точности восстановления объемной скорости воздушного потока через голосовую щель с помощью модели реконструкции речевого процесса по акустическим параметрам речевого сигнала.

4.2.1 Результаты оценки точности восстановления объемной скорости воздушного потока через голосовую щель по коэффициентам модели линейного предсказания и модели реконструкции речевого процесса на материале синтезированных гласных.

4.2.2 Пример оценки параметров голосового источника с помощью процедуры реконструкции математической модели речевого процесса на материале реальных гласных.

4.3 Результаты численного эксперимента определения формы импульсов голосового возбуждения в речевом тракте с помощью исследования модели аэродинамического потока через голосовую щель.

4.3.1 Результаты оценки параметров модели аэродинамического потока через голосовую щель с помощью линейного метода наименьших квадратов.

4.3.2 Результаты оценки параметров модели аэродинамического потока через голосовую щель с помощью нелинейного метода наименьших квадратов.

4.3.3 Пример восстановления нелинейных характеристик модели аэродинамического потока через голосовую щель на материале реальной гласной.

4.4 Анализ величин ошибок реконструированной модели голосового источника при разной размерности пространства вложения и порядка алгебраического многочлена.

4.4.1 Результаты вычислительного эксперимента по определению ошибок реконструированной модели голосового источника с модифицированными алгоритмами определения параметров реконструкции.

4.4.2 Результаты применения дробно-рационального интерполирования для снижения ошибки реконструкции математической модели голосового источника.

4.5 Пример реконструкции речевого сигнала.

4.6 Разработка схемы анализа речевых сигналов.■.

4.7 Выводы.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Якушев, Дмитрий Владимирович

Актуальность работы. К числу центральных задач цифровой обработки речевых сигналов относится задача идентификации и верификации диктора по голосовым данным. Решение этой задачи необходимо в комплексных системах защиты информации по биометрическим данным человека и в криминалистике. Другими, не менее важными задачами анализа речевых сигналов являются синтез речи и медицинская диагностика заболеваний органов речеобразования.

Большой вклад в развитие анализа речевых сигналов внесли специалисты: Гуннар Фант - классик акустической теории речеобразования, Джеймс Фланаган - анализ и синтез речи, Маркел, Грей, Рабинер, Шафер - анализ речевых сигналов и т.д. Среди отечественных специалистов по анализу речевых сигналов можно выделить: В.Р. Женило (Академия МВД), В.Я. Чучупал (вычислительный Центр РАН), А.Н. Собакин (МГЛУ) и т.д. Исследованием условий решения речевых обратных задач занимается речевая группа: В.Н. Сорокин, И.С. Макаров - лаборатории Информационных технологий передачи, анализа и защиты информации на базе Института проблем передачи информации им. А.А. Харкевича.

К основному направлению анализа речевых сигналов относится решение обратных задач для речевых технологий. Это задачи определения формы речевого тракта, анатомических и артикуляторных параметров, команд управления артикуляцией, а также формы импульсов голосового возбуждения по параметрам, измеренным на речевом сигнале. Такие задачи в практике научных исследований относятся к некорректным, поскольку допускают неоднозначные, а часто и неустойчивые решения. Основой этих решений являются математические модели речеобразования, к которым можно отнести модели речевого тракта и голосового источника.

Основной в решении обратной задачи для голосового источника является задача определения формы импульсов голосового возбуждения в речевом тракте, определяемой колебаниями голосовых связок. Решение этой задачи основывается на технологии обратной фильтрации. Технология обратной фильтрация основана на подавлении резонансов речевого тракта, в результате которого остаются импульсы голосового возбуждения.

На практике в качестве единственного доступного объекта получения информации являются акустические параметры речевого сигнала. Другие результаты измерения параметров процесса речеобразования в целом ряде прикладных областей в силу объективных причин не могут быть использованы.

Основой для реализации технологии обратной фильтрации и модели речеобразования является модель линейного предсказания с рекурсивной структурой. Рекурсивная структура модели линейного предсказания в условиях реальной среды распространения речевого сигнала создает эффект накапливания ошибок во времени и может привести к значительному смещению полученных оценок параметров голосового источника для речевых сигналов в условиях реальной среды распространения.

Другим существенным недостатком существующих моделей являются особенности статистического подхода к обработке экспериментальных данных. Предположение о прямой зависимости между точностью полученных оценок параметров исследуемой системы и объемом выборки является постулатом математической статистики для стационарных сигналов. Характерной же особенностью речевого сигнала является его нестационарность. Следовательно, существующий математический аппарат анализа речевых сигналов неадекватен его природе.

Еще одним из недостатков существующих методов анализа речевых сигналов, основанных на технологии обратной фильтрации, является противоречие между теоретическими предположениями и данными, полученными в экспериментальных исследованиях. Существующее деление системы речеобразования на две компоненты — голосовой источник и речевой тракт искусственно, так как на физиологическом уровне система речеобразования является неделимым целым. Предположение о линейности системы «голосовой источник - речевой тракт» спорно. Сложность процесса речеобразования и нестационарность речевых сигналов, позволяет сделать предположение о нелинейной связи системы «голосовой источник - речевой тракт».

Представленные недостатки существующих методов анализа речевых сигналов и противоречие между теоретическими предположениями и новыми данными исследований процесса речеобразования позволяют сделать вывод о недостаточной изученности проблемы речеобразования, объективно возникшей в ходе развития теории речеобразования. Альтернативным подходом к анализу речевых сигналов и изучению нелинейных динамических систем - голосовой источник и процесс речеобразования является использование динамического подхода основанного на реконструкции математической модели динамической системы по порождаемому временному ряду в рамках теории детерминированного хаоса.

Применение динамического подхода к анализу речевых сигналов позволяет разрешить существующие недостатки в изучении процесса речеобразования. Динамический подход к анализу речевых сигналов адекватен его природе, так как ориентирован на анализ нестационарных систем и для своей реализации требует временное окно малой длительности при корректности полученных результатов. Проведение технологии обратной фильтрации с помощью • процедуры реконструкции математической модели речевого процесса на проблемных участках речевого сигнала позволяет существенно снизить неблагоприятное внешнее воздействие, так как уравнения движения," используемые в качестве реконструированной модели речевого процесса, нерекурсивны и исключается возможность проявления эффекта накапливания ошибок, связанных с шумами и возможностями звукоснимающей аппаратуры. Использование реконструированных моделей речевого процесса и голосового источника позволяет расширить возможности исследования решений обратной задачи для голосового источника.

Таким образом, исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса и голосового источника по акустическому сигналу является актуальной.

Цель исследования - разработка методики решения обратной задачи для голосового источника с помощью процедуры реконструкции математической модели динамической системы по порождаемому временному ряду.

Для достижения поставленной цели решались следующие задачи:

1) разработать метод решения обратной задачи для голосового источника на основе процедуры реконструкции математической модели речевого процесса;

2) оценить форму импульсов голосового возбуждения в речевом тракте с помощью процедуры реконструкции математической модели аэродинамического потока через голосовую щель;

3) разработать метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическим параметрам речевого сигнала;'

4) снизить ошибки реконструкции формы импульсов голосового возбуждения в речевом тракте.

В качестве объекта исследования рассматриваются динамические системы - процесс речеобразования и голосовой источник. В качестве предмета исследования рассматривается временной ряд, являющийся реализацией процесса речеобразования — речевой сигнал, либо сигналом из голосового источника — импульсы голосового возбуждения в речевом тракте.

Методы исследования. Для решения сформулированных частных научных задач использовались, методы: моделирования динамических систем, анализа временных рядов, теории цифровой обработки сигналов, идентификации систем, оптимизации, математической статистики и анализа речевых сигналов.

Научная новизна результатов, полученных в работе, состоит в следующем:

1) разработан новый метод и алгоритм обратной фильтрации на основе процедуры реконструкции математической модели речевого процесса, позволяющий снизить, неблагоприятное воздействие реальной среды распространения речевых сигналов;

2) получена оценка параметров модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов;

3) разработан новый метод анализа речевых сигналов с помощью процедуры реконструкции математической модели . голосового источника по акустическому сигналу, расширяющий возможности исследования обратной задачи для голосового источника;

4) продемонстрирована возможность снижения ошибки реконструкции голосового источника с помощью дробно-рационального интерполирования.

Практическая значимость заключается в следующем. Разработанные методики могут быть использованы:

1) для идентификации и верификации диктора по голосу, распознавании пола диктора и отнесения его к определенной возрастной группе в комплексных системах с разграничением доступа к информации;

2) в решении обратной задачи для голосового источника с помощью динамического подхода на материале зашуМленных речевых сигналов;

3) в создании программного обеспечения для детального исследования речевых сигналов в условиях реальной среды распространения, синтезе речи, корректировке медицинских диагнозов.

Положения, выносимые на защиту:

1) метод и алгоритм анализа речевых сигналов с помощью процедуры реконструкции математической модели речевого процесса по акустическому сигналу;

2) метод реконструкции математической модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов;

3) метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическим параметрам речевого сигнала;

4) снижение величины ошибки реконструкции математической модели голосового источника с помощью дробно - рационального интерполирования.

Апробация работы и публикации. Результаты исследований по теме диссертационной работы отражены в 18 публикациях. Из них 2 в журналах, рекомендованных ВАК.

Основные результаты диссертационного исследования были использованы в разработках систем контроля и управления доступа ЗАО «Стилсофт». Так же внедрены в учебный процесс Ставропольского государственного университета. Работа поддержана грантом РФФИ № 06-0100020. Название проекта: Структурирование выявления несоответствий и прогнозирования эволюционных дискретных процессов и систем при наличии долговременных корреляций.

В рецензируемых научных журналах из перечня ВАК опубликованы следующие работы:

Заключение диссертация на тему "Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса"

4.7 Выводы

Результаты вычислительного эксперимента подтвердили:

1) индивидуальность речевой акустики при произношении дикторами одного и того же звука на основе коэффициентов реконструированной модели речевого процесса;

2) точность оценивания объемной скорости воздушного потока через голосовую щель на основе технологии обратной фильтрации по коэффициентам реконструированной модели речевого процесса;

3) точность восстановления формы импульсов голосового возбуждения в речевом тракте с помощью линейного и нелинейного метода наименьших квадратов;

4) адекватность реконструированной модели голосового источника;

Таким образом, с помощью реконструированной модели речевого процесса возможно решение обратной задачи для голосового источника на сегментах речевого сигнала в условиях реальной среды распространения. Первая производная объемной скорости воздушного потока через голосовую щель, интерпретируемая, как импульсы голосового возбуждения в речевом тракте, может быть получена с помощью модели аэродинамического потока через голосовую щель по оцененным значениям параметров модели. Решение обратной задачи для голосового источника может быть получено с помощью реконструированной модели голосового источника. Все вычисления могут быть проведены в соответствии с представленной схемой анализа речевых сигналов.

ЗАКЛЮЧЕНИЕ

В диссертационном исследовании были получены следующие результаты:

1) разработан метод и алгоритм обратной фильтрации речевого сигнала на основе процедуры реконструкции математической модели речевого процесса;

2) оценка параметров модели аэродинамического потока через голосовую щель по речевому сигналу с помощью метода наименьших квадратов;

3) разработан метод анализа речевых сигналов с помощью процедуры реконструкции математической модели голосового источника по акустическому сигналу;

4) снижение ошибки реконструкции математической модели голосового источника по порождаемому временному ряду с помощью дробно-рационального интерполирования.

Таким образом, применение динамического подхода к анализу речевых сигналов позволяет использовать математический аппарат, адекватный природе речевого сигнала. Реконструированная модель речевого процесса расширяет возможности решения обратной задачи для голосового источника на речевых сигналах в условиях реальной среды распространения. Параметры реконструированной модели голосового источника расширяют возможности анализа сигнала из голосового источника.

Разработанные методы позволяют провести детальный анализ речевого сигнала. Результаты анализа могут быть использованы в идентификации диктора по голосовым данным, распознавании пола и возрастной группы диктора, в корректировке медицинских диагнозов. Поэтому, требуются дополнительные исследования, определяющие границы идентификации диктора или заболеваний гортани по оцененным параметрам голосового источника в различных условиях внешней среды.

Библиография Якушев, Дмитрий Владимирович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов: Пер. с англ./Под ред. М.В. Назарова и Ю.Н. Прохорова. - М.: Радио и связь, 1981.- 496 с.

2. Сорокин B.C. Теория речеобразования. М.: Радио и связь. 1985. - 312 с.

3. Сорокин В.Н. Синтез речи. М.: Наука. 1992. - 392 с.

4. Сорокин В.Н., Макаров И.С. Обратная задача для голосового источника // Информационные процессы. 2006. Том 6, № 4.- С. 375 — 395. .

5. Маркел Д., Грей А. Линейное предсказание речи.— М: Связь, 1980.-308 с.

6. Vijay Parsa, Donald G. Jamieson, Identification of Pathological Voices Using Glottal Noise Measures // Journal of Speech, Language, and Hearing Research, vol 43, pp. 469 485, 2000.

7. Carlson R., Granstrom В., Karlsson I., Experiments with voice modeling in speech synthesis // STL-QPSR, No 2-3, pp. 53 61, 1990.

8. Rothenberg M., An interactive model for the voice source // STL-QPSR, No 4, pp. 1-17, 1981.

9. Сергиенко В.И., Петросян Э.А., Кулаков А.А., Петросян М.Э. Топографическая анатомия и оперативная хирургия челюстно — лицевой области и шеи. М.: ГЭОТАР - МЕД, Майкоп «Качество», 2006. - 862 с.

10. Ananthapadmanabha Т., Acoustic Analysis of Voice Source Dynamics // STL-QPSR, No. 2-3, pp. 1-24, 1984.

11. Childers D. G., Paige A., Moore A., Laryngeal vibration patterns // Archives of Otolaryngology, vol. 102, pp. 407 410, 1976.

12. Lin Q., Nonlinear Interaction in Voice Production // STL-QPSR, No. 1, pp. 1 12, 1987.

13. Titze I., Mapes S., Story В., Acoustics of the Tenor High Voice // J, Acoust. Soc. Amer., vol. 95, pp. 1133 1142, 1994.

14. Lisker L., et. al. Transillumination of the larynx in running speech // JASA, vol. 45, pp. 1544 1547, 1969.

15. Childers D.G., Naik J., Larar J.N., et. al. Electroglottography, speech, and ultrahigh speed cinematography // Vocal fold Physiology, pp. 202 220, 1983.

16. Левин JI.C., Плоткин M.A. Цифровые системы передачи информации. -М.: Радио и связь. 1982. 216 с.

17. Bostik М., Sigmund М., Methods for Estimation of Glottal Pulses . Waveform Exciting Voiced Speech // EUROSPEECH 2003 GENEVA, pp. 2389-2392.

18. Arroabarren I., Carlosena A., Unified Analysis of Glottal Source Spectrum // EUROSPEECH 2003 GENEVA, pp.1761 - 1763.

19. Arroabarren I., Carlosena A., Glottal Spectrum Based Inverse Filtering // EUROSPEECH 2003 GENEVA, pp. 57 - 60.

20. Alku P., Airas M., Backstrom Т., Pulakka H., Group Delay Function as a Means to Assess Quality of Glottal Inverse Filtering // INTERSPEECH 2005, pp. 1053-1056.

21. Lindqvist-Gauffin J., Inverse filtering. Instrumentation and techniques // STL-QPSR, pp. 1-4, 1964.

22. Lindqvist-Gauffin J., Studies of the voice source by means of inverse filtering // STL-QPSR, pp. 8 13, 1965.

23. Mathews M. V., Miller J. E., David E.E., Pitch Synchronous Analysis of Voiced Sounds // The journal of the acoustical society of America, vol. 33, pp. 179-186, 1961.

24. Lindqvist-Gauffin J., The voice source studied by means of inverse filtering // STL-QPSR, No. 1, pp. 3 9, 1970.

25. Price P.J. Male and female voice source characteristics: inverse filtering results // Speech Communication, vol. 8, pp. 261 277, 1989.

26. Alku P., Vilkman E., Amplitude domain quotient for characterization of the glottal volume velocity waveform estimated by inverse filtering // Speech Communication, vol. 18, pp. 131- 138, 1996.

27. Alku P., Vilkman E., Effects of bandwidth on glottal airflow waveforms estimated by inverse filtering // J. Acoust. Soc.Am.; vol. 98, No 2, pp. 763 -767, 1995.

28. Drioli C., A flow waveform-matched low-dimensional glottal model based on physical knowledge // J. Acoust. Soc.Am., vol. 117, No 5, pp. 3184 — 3195,2005.

29. Tokihiko Kaburagi, Koji Kawai, Analysis of voice source characteristics using a constrained polynomial model // EUROSPEECH 2003 GENEVA, pp.461 -464.

30. Deng H., Beddoes M., Ward R., Hodgson M., Estimating the Vocal-Tract Area Function and the Derivative of the Glottal Wave from a Speech Signal // EUROSPEECH 2003 GENEVA, pp. 2437 - 2440.

31. Cranen В., Boves L., Pressure measurements during speech production using semiconductor, miniature pressure transducers: Impact on models for speech production // J. Acoust. Soc.Am., vol. 77, No 4, pp. 1543 1551, 1985.

32. Childers D.G., Hicks D.M., Moore G.P., Alsaka Y.A., A model for vocal foldvibratory motion, contact area, and the electroglottogram // J. Acoust. Soc.Am., vol. 80, No 5, pp. 1309 1320, 1986.

33. Alku P., Backstrom Т., Vilkman E., Normalized amplitude quotient for Parametrization of the glottal flow // J. Acoust. Soc-.Am., vol. 112, No 2, pp. 701-710, 2002.

34. Titze I., Parameterization of the glottal area, glottal flow, and vocal fold contact area // J. Acoust. Soc.Am., vol. 75, No 2, pp. 570 580, 1984.

35. Liljencrants J., Analysis by synthesis of glottal airflow in a physical model 11 TMH QPSR, No. 2, pp. 139 - 142, 1996.

36. Karlsson I., Dynamic voice source parameters in a female voice // STL -QPSR, No. 1, pp. 75 77, 1989.

37. Karlsson I., Glottal waveform parameters for different speaker types // STL -QPSR, No. 2-3, pp. 61 67, 1988.

38. Karlsson I., Glottal wave forms for normal female speakers // STL QPSR, No. l,pp.31 -36, 1985.

39. Cranen В., Schroeter J., Physiologically motivated modelling of the voice source in articulatory analysis/synthesis // Speech Communication, vol. 19, pp. 1-19, 1996.

40. Childers D.G., Glottal source modeling for voice conversion // Speech Communication, vol. 16, pp. 127 138, 1995.

41. Drioli C., A flow waveform adaptive mechanical glottal model // TMH -QPSR, vol. 43, pp. 69 79, 2002.

42. Cranen В., Boves L., On the measurement of glottal flow // J. Acoust. Soc.Am., vol. 84, No 3, pp. 888 900, 1988.

43. Fant G., Lin Q., Glottal source vocal tract acoustic interaction // STL -QPSR, No. 1, pp. 13-27, 1987.

44. Childers D., Ahn Ch., Modeling the Glottal Volume Velocity Waveform for Three Voice Types // J. Acoust. Soc. Amer., vol. 97, No. 1, pp. 505 519, 1995.

45. Childers D., Lee C., Vocal Quality Factors: Analysis, Synthesis, and Perception // J. Acoust. Soc. Amer., vol. 90, No. 5, pp. 2394 2410, 1991.

46. Fu Q., Murphy P., Robust Glottal Source Estimation Based on Joint Source-Filter Model Optimization // IEEE Trans. Audio, Speech, Language Process., vol. 14, No. 2, pp. 492 501, 2006.

47. Froelich M., Michaelis D., Strube H. W., SIM Simultaneous Inverse Filtering and Matching of a Glottal Flow Model for Acoustic Speech Signals // J. Acoust. Soc. Amer., vol. 110, No. 1, pp. 479-488, 2001.

48. Strik H., Boves L., On the Relation between Voice Source Parameters and Prosodic Features in Connected Speech // Speech Commun., No. 11, pp. 167-174, 1992.

49. Fant G., Some Problems in Voice Source Analysis // Speech Commun., No. 13, pp. 7-22, 1993.

50. Karlsson I., Liljencrants J., Diverse Voice Qualities: Models and Data // TMH-QPSR, No. 2, pp. 143-146, 1996.

51. Fant G., The Voice Source in Connected Speech // Speech Commun., No. 22, pp. 125 139, 1997.

52. Strik H., Automatic Parametrization of Differentiated Glottal Flow: Comparing Methods by Means of Syn-thetic Flow Pulses// J. Acoust. Soc. Amer., vol. 103, No. 5, Pt. 1, pp. 2659-2669, 1998.

53. Fant G., Liljencrants J., Lin Q., A Four Parameter Model of Glottal Flow // STL-QPSR, vol. 4, pp. 1-13, 1985.

54. Fant G., Gustafson K., LF-frequency domain analysis // TMH-QPSR, No. 2, pp. 135-138, 1996.

55. Milenkovic P., Glottal Inverse Filtering by Joint Estimation of an AR System with a Linear Input Model // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-34, No. 1, pp. 28-42, 1986.

56. Milenkovic P., Voice Source Model for Continuous Control of Pitch Period // J. Acoust. Soc. Amer., vol. 93, No. 2, pp. 1087-1096, 1993.

57. Childers D., Ни H., Speech Synthesis by Glottal Excited Linear Prediction // J. Acoust. Soc. Amer., vol. 96, No. 4, pp. 2026-2036, 1994.

58. Schoentgen J., Glottal Waveform Synthesis with Volterra Shaping Functions // Speech Commun., vol. 11, pp. 499-512, 1992.

59. Schoentgen J., Shaping Function Models of the Phonatory Excitation Signal// J. Acoust. Soc. Amer., vol. 114, No. 5, pp. 2906-2912, 2003.

60. Narasimhan K., Principe J., Childers D., Nonlinear Dynamic Modeling of the Voiced Excitation for Im-proved Speech Synthesis // Proc. Int. Conf. Acoust., Speech, Signal Process., AZ, pp. 389-392, 1999.

61. Rank E., Kubin G., An Oscillator Plus - Noise Model for Speech Synthesis // Speech Commun., vol. 48, pp. 775-801, 2006.

62. Pinto N., Childers D., Lalwani A., Formant Speech Synthesis: Improving Production Quality // IEEE Trans. Acoust., Speech, Signal Process., vol. 37, No. 12, pp. 1870-1887, 1989.

63. Gupta S., Schroeter J., Pitch-Synchronous Frame-by-Frame and Segment-Based Articulatory Analysis by Synthesis // J. Acoust. Soc. Amer., vol. 94, No. 5, pp. 2517-2530, 1993.

64. Titze I., Wong D., Story В., Long R., Considerations in Voice Transformation with Physiologic Scaling Principles", Speech Commun., vol. 22, pp. 113-123, 1997.

65. Tom K., Titze I., Vocal Intensity in Falsetto Phonation of a Countertenor: An Analysis by Synthesis Ap-proach // J. Acoust. Soc. Amer., vol. 110, No. 3, pp. 1667-1676, 2001.

66. Plumpe M., Quatieri Т., Reynolds D., Modeling the Glottal Flow Derivative with Application to Speaker Identification // IEEE Trans. Speech, Audio Process., vol. 7, No. 5, pp. 569-585, 1999.

67. Akande O., Murphy P., Estimation of the Vocal Tract Transfer Function with Application to Glottal Wave Analysis // Speech Commun., vol. 46, No. 1, pp. 15-36, 2005.

68. Backstrom Т., Alku P., Vilkman E., Time-Domain Parametrization of the Closing Phase of Glottal Air-flow Waveform from Voices over a Large Intensity Range // IEEE Trans. Speech, Audio Process., vol. 10, No. 3, pp. 186-192,2002.

69. Alkhairy A., An Algorithm for Glottal Volume Velocity Estimation // Proc. Int. Conf. Acoust., Speech, Signal Process., 1999. .

70. Shapira Y., Gath I., A Geometrical Fuzzy Clustering-Based Solution to Glottal Wave Estimation // J. Acoust. Soc. Amer., vol. 104, No. 5, pp. 30703079, 1998.

71. Wong D., Markel J., Gray A., Least Squares Glottal Inverse Filtering fromthe Acoustic Speech Wave-form // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-27, No 4, pp. 350-355, 1979.

72. Larar J., Alsaka Y., Childers D., Variability in Closed Phase Analysis in Speech // Int. Conf. Acoust., Speech, Signal Process., pp. 1089 1092, 1985.

73. Леонов A.C., Макаров И.С., Сорокин B.H., Цыплихин А.И., Кодовая книга для речевых обратных задач // Информационные процессы, Т. 5, No. 2, стр. 101-119, 2005.

74. Veeneman D., BeMent S., Automatic Glottal Inverse Filtering from Speech and Electroglottographic Study // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-33, No. 2, pp. 369-377, 1985.

75. Малинецкий Г.Г., Потапов А.Б. Современные проблемы нелинейной динамики. Издание 2-е, исправл. и доп. М.: Едиториал УРСС, 2002. -360 с.

76. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В.Э. Фигурнова. 3-е изд., перераб. и доп. - М.: ИНФРА- М, 2003.-544 с.

77. Лайонс Р. Цифровая обработка сигналов: Второе издание. Пер. с англ. -М.: ООО «Бином Пресс», 2007. - 656 с.

78. Сергиенко А.Б. Цифровая обработка сигналов: Учебник для вузов. 2-е изд. СПб.: Питер, 2007. - 751 с.

79. Малинецкий Г.Г., Потапов А.Б. Современные проблемы нелинейной динамики. Издание 2-е, исправл. и доп. М.: Едиториал УРСС, 2002. 360 с.

80. Hegger R., Kantz Н., Schmuser F. et al. // Chaos. 1998. V. 8. P. 727 754.

81. Swameye I., Muller T.G., Timmer J. et al. // Proc. Natl. Acad. Sci. USA. 2003. V. 100. P. 1028-1033.

82. Безручко Б.П., Смирнов Д.А. Математическое моделирование и хаотические временные ряды. Саратов: ГосУНЦ «Колледж», 2005. 320 с.

83. Анищенко B.C., Астахов В.В., Вадивасова Т.Е., Нейман А.Б., Стрелкова Г.И., Шиманский-Гайер Л. Нелинейные эффекты вхаотических и стохастических системах. Москва-Ижевск: Институт компьютерных исследований, 2003. 544 с.

84. Кузнецов С.П. Динамический Хаос. М.: Физматлит, 2001. 296 с.

85. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991.432 с.

86. Анищенко B.C., Астахов В.В., Вадивасова Т.Е. Нелинейная динамика хаотических и стохастических систем. Саратов: Изд-во Саратовского университета, 1999. 368 с.

87. Casdagli М. Nonlinear prediction of chaotic time series // Physica D. 1989. V. 35. P. 335-356.

88. Farmer J.D., Sidorowich J J. Predicting chaotic time series // Phys. Rev. Lett. 1987. V. 59. P. 845-848.

89. Калиткин H.H. Численные методы. M.: Наука, 1978.

90. Самарский А.А. Введение в численные методы. М.: Наука, 1982.

91. Турчак Л.И., Плотников П.В. Основы численных методов:учебное пособие. 2-е изд., перераб. и доп. - М.: ФИЗМАТЛИТ, 2003. 304 с.

92. Анищенко B.C. Знакомство с нелинейной динамикой. Лекции соровского профессора: Учеб. пособие. Москва Ижевск: Институт компьютерных исследований, 2002.-144 с.

93. Crutchfield J.P., McNamara B.S. Equations of motion from a data series //

94. Complex Systems. 1987. Vol. 1. P. 417-452.

95. Timmer J., Rust H., Horbelt W., Voss H.U. Parametric, nonparametric and parametric modeling of chaotic circuit time series // In proceedings of International Sumposium NOLTA, 2000. Dresden. Vol. 2. P.713.

96. Пределы предсказуемости / Ред. Ю.А. Кравцов. М.: ЦентрКом, 1997. 256 с.

97. Modeling and Forecasting Financial Data: Techniques of Nonlinear Dynamics / Eds. A.S. Soofi, L. Cao. Kluwer, 2002.

98. Nonlinear Modeling and Forecasting / Eds. M. Casdagli, S. Eubank. SFI Studies in the Sciences of Complexity. V. XII. Addison-Wesley, 1992.

99. Time Series Prediction: Forecasting the Future and Understanding the Past /175

100. Eds. N.A. Gerschenfeld, A.S. Weigend. SFI Studies in the Science of Complexity, Proc. V. XV. Adisson-Wesley, 1993.

101. Breeden J.L., Hubler A. Reconstructing equations of motion from experimental data with unobserved variables // Phys. Rev. A. 1990. Vol. 42. P. 5817.

102. Kadtke J., Kremliovsky M. Estimating statistics for detecting determinism using global dynamical models // Phys. Lett. A. 1997. Vol. 229. P. 97.

103. Anishchenko V.S., Pavlov A.N. Global reconstruction in application to multichannel communication // Phys. Rev. E. 1998. Vol. 57. P. 2455.

104. Cremers J., Hubler A. Construction of differential equations from experimental data // Z. Naturforschung A. 1987. Vol. 42. P. 797-802.

105. Takens F., Detecting Strange Attractors in Turbulence, in Dynamical Systems and Turbulence, ed. by D. Rang and L.S. Young. Lecture Notes in Mathematics, Vol. 898 (Springer, Berlin, Heidelberg 1980) p. 366.

106. Безручко Б.П., Смирнов Д.А., Сысоев И.В. Оценка параметров динамических систем по хаотическим временным рядам при наличии скрытых переменных // Изв. вузов. Прикладная нелинейная динамика. 2004. Т. 12, №6. С.93 -104.

107. Безручко Б.П., Диканев Т.В., Смирнов Д.А. Глобальная реконструкция модельных уравнений по временной реализации переходного процесса // Изв. вузов. Прикладная нелинейная динамика. 2001. Т. 9, № 3. С. 3-12.

108. Безручко Б.П., Диканев Т.В., Смирнов Д.А. Тестирование на однозначность и непрерывность при глобальной реконструкции модельных уравнений по временным рядам // Изв. вузов. Прикладная нелинейная динамика. 2002. Т. 10, № 4. С. 69-81.

109. Безручко Б.П., Левин Ю.И., Смирнов Д.А. Моделирование неавтономных систем по временным рядам (учебно-методическое пособие), Саратов: «Колледж», 2001. 44 с.

110. Безручко Б.П., Смирнов Д.А. Построение модельных отображений по хаотическим временным рядам (учебно-методическое пособие).

111. Саратов: «Колледж», 2000. 38 с.

112. Безручко Б.П., Смирнов Д.А. Реконструкция обыкновенных дифференциальных уравнений по временным рядам (учебно-методическое пособие). Саратов: «Колледж», 2000. 46 с.

113. Noack B.R., Ohle F., Eckelmann H. Construction and analysis of differential equations from experimental time series of oscillatory systems // Physica D. 1992. Vol. 56. P. 389.

114. Packard N.H., Crutchfield J.P., Farmer J.D., Shaw R.S. Geometry from a time series // Phys. Rev. Lett. 1980. Vol. 45. № 9. P. 712-716.

115. Mane R. On the dimension of the compact invariant sets of certain nonlinear maps, in Dynamical Systems and turbulence, ed. by D. Rang and L.S. Young. Lecture Notes in Mathematics, Vol. 898 (Springer, Berlin, Heidelberg 1980) p. 366.

116. Grassberger P. Generalized dimensions of strange attractors // Phys. Lett. A 97. 227-231 (1983).

117. Grassberger P., Procaccia I. Characterization of strange attractors // Phys. Rev. Lett. 50. 346-349 (1983).

118. Grassberger P., Procaccia I. Measuring the strangeness of strange attractors // Physica D. 9. 189-208 (1983).

119. Янсон Н.Б., Анищенко B.C. Моделирование динамических систем по экспериментальным данным // Изв. вузов. Прикладная нелинейная динамика. 1995. Т. 3, № 3. С. 112 121.

120. Brown R., Rulkov N.F., Tracy E.R. Modeling and synchronizing chaotic systems from time-series data // Phys. Rev. E.1994. Vol.49. №5. P. 37843800.

121. Грибков Д.А., Грибкова B.B., Кравцов Ю.А., Кузнецов Ю.И., Ржанов

122. А.Г. Восстановление структуры динамической системы по временным рядам // Радиотехника и электроника. 1994. Т39. В. 2. с. 269-277.

123. Бохан К.А. Курс математического анализа. T.I. Учеб. пособие для студентов-заочников физ.-мат. фак-тов пед. ин-тов. Под ред. Проф. Б.З. Вулиха. Изд. 2-е. М.: Просвещение, 1972. 511 с.

124. Смирнов Д.А., Власкин B.C., Пономаренко В.И. Метод оценки параметров одномерных отображений по хаотическим временным рядам // Письма в ЖТФ. 2005. Т. 31, вып. 3. С. 18-26.

125. Дэннис Дж., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. М.: Мир, 1988. 440 с.

126. Pisarenko V.F., Sornette D. Statistical methods of parameter estimation for deterministically chaotic time series // Phys. Rev. E.2004. V. 69. 036122

127. Smirnov D.A., Vlaskin V.S., Ponomarenco V.I. Estimation of parameters in one dimensional maps from noisy chaotic time series // Phys. Lett. A, 2005.V. 336. P. 448-458.

128. Вентцель E.C. Теория вероятностей: Учебник для студентов вузов. 9-е изд., стер. - М.: Издательский центр «Академия», 2003. - 576 с.

129. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. 2-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА. 2004. -573 с.

130. Половко A.M., Бутусов П.Н. Интерполяция. Методы и компьютерные технологии их реализации. СПб.: БХВ-Петербург, 2004. - 320с.

131. Сизиков B.C. Устойчивые методы обработки результатов измерений. Учебное пособие. СПб.: СпецЛит, 1999. - 240 с.

132. Якушев, Д. В. Фильтрация данных методом скользящей средней на промежуточных этапах моделирования автоколебательных систем /

133. Международной открытой научной конференции, Воронеж, ноябрь 2007- январь 2008 гг. С. 326-328.

134. Якушев, Д. В. Оценка параметров модели голосового источника /

135. Д. В. Якушев // Современные проблемы информатизации в моделировании и социальных технологиях : сб. науч. тр. Воронеж : Научная книга, 2008.

136. Вып. 13 : сборник трудов по итогам 13-й Международной открытой научной конференции, Воронеж, ноябрь 2007 — январь 2008 гг. С. 262— 264.

137. Якушев, Д. В. Реконструкция речевого сигнала с помощью моделирования голосового источника по акустическим параметрам речевого сигнала

138. Д. В. Якушев // Современные методы и средства обработки пространственно-временных сигналов: Сборник статей 6-й Всероссийской научно технической конференции. - Пенза,2008. — С. 54 —

139. Якушев, Д. В. Анализ речевого сигнала с помощью процедуры реконструкции математической модели речевого процесса по порождаемому речевому сигналу / Д. В. Якушев // Инфокоммуникационные технологии. 2008. — Т.6, №2. - С. 32 - 34.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00