автореферат диссертации по радиотехнике и связи, 05.12.13, диссертация на тему:Применение кластеризации в детекторах речи для телекоммуникационных приложений

кандидата технических наук
Мартынович, Павел Владиславович
город
Москва
год
2004
специальность ВАК РФ
05.12.13
Автореферат по радиотехнике и связи на тему «Применение кластеризации в детекторах речи для телекоммуникационных приложений»

Автореферат диссертации по теме "Применение кластеризации в детекторах речи для телекоммуникационных приложений"

Московский Государственный Технический Университет Гражданской Авиации

На правах рукописи

Мартынович Павел Владиславович

Применение кластеризации в детекторах речи для телекоммуникационных приложений

05.12.13-Системы, сети и устройства телекоммуникаций Автореферат

диссертации на соискание ученой степени кандидата технических

наук

Москва - 2004

Работа выполнена в Московском государственном техническом университете гражданской авиации. Научный руководитель:

кандидат технических наук, доцент Вайнейкис Л.А. Официальные оппоненты:

доктор технических наук, профессор Прохоров А.В. кандидат технических наук, профессор Санников В.Г.

Ведущая организация: ООО "Спирит".

Защита состоится "_"_200_г. в_на заседании

диссертационного совета Д 223.011.02 в зале заседаний МГТУГА по адресу: Москва, Кронштадтский бульвар, 20.

С диссертацией можно ознакомиться в библиотеке университета

Автореферат разослан "_"_200_г.

Ученый секретарь диссертационного совета

_кандидат технических наук, доцент Попов А.С.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время речевые технологии занимают ключевое место среди других отраслей телекоммуникаций и цифровой обработки сигналов. Большинство систем обработки речи: вокодеры, распознавание речи и диктора, шумоподавление - это устройства, имеющие в своем составе детектор речи, который выполняет важную задачу в каждом из них. Диссертационная работа посвящена исследованию таких детекторов. Проблема построения детекторов речи широко обсуждается в мировой научной литературе. Но и по сей день, задача далека от решения: алгоритмы либо потребляют большие вычислительные ресурсы и, значит, не представляют практический интерес, либо используют слишком простые решающие правила и способы установки порогов, что вызывает неудовлетворительную работу детектора в разных акустических условиях.

Выбранная тема представляет научный и практический интерес по следующим причинам:

• Быстрое развитие телекоммуникационных технологий приводит к повышению требований для приложений обработки речи А детектор речи является одним из основных элементов большинства систем речевых технологий.

• Повышение интереса в мире к системам безопасности дало новый толчок к применению в системах телекоммуникации биометрических систем, среди которых особое место принадлежит голосовой верификации. Одним из самых важных элементов последней является детектор речи.

• Развитие телеконференций и переговоров через сеть Интернет с использованием различного рода вокодеров вызывает необходимость в экономном использовании пропускной способности сети и уменьшении битовой скорости систем сжатия во время пауз. Эффективное опознавание пауз в речевом сигнале - это задача детектора речи.

• Существующие детекторы речи устанавливают пороги на основе только уровня шума или используют максимальный уровень речи, внося большую

задержку в процесс принятия решения. Это вызывает привязку на определенное соотношение сигнала к шуму, либо к его определенному типу, что затрудняет использование детектора в разных акустических условиях и разных задачах без ручной перенастройки.

Таким образом, разработка детектора речи, использующего и оценивающего минимальный уровень речи и шума и обладающего минимальной задержкой принятия решения, является, по мнению автора, актуальной научной задачей, а ее решение - востребованным для телекоммуникационных приложений.

Цели, задачи и объект исследований. Объектом исследования являются детекторы речи, применяемые в системах распознавания и сжатия речи. Предметом исследования является декомпозиция сигнала остатка применительно к классификации речь-шум. Целью работы является повышение эффективности алгоритмов детектора речи в разных акустических условиях, уменьшения ошибок классификации речь-шум, тем самым, повышение потребительского качества данного класса устройств. Основными научными и практическими задачами диссертации являются анализ методов детектирования речи, разработка улучшенных алгоритмов и методов для детектора речи, снижающих зависимость от акустических условий, и реализация указанных алгоритмов в виде модулей на ПЭВМ для использования в системах сжатия речи и распознавания диктора. Для решения основных задач в диссертации ставятся следующие частные задачи:

1) Проведение аналитического обзора методик построения детекторов речи. Формулировка основных недостатков существующих решений и выделение среди них тех, которые планируется ослабить или устранить в диссертационном исследовании.

2) Разработка программных средств для оценки точности работы детекторов речи и исследования их поведения в различных приложениях и шумовых обстановках.

3) Разработка метода получения сигнала остатка, позволяющего повысить эффективность устранения предсказуемой на соседних отсчетах компоненты из речевого сигнала.

4) Сравнение метода получения остатка с линейным предсказанием.

5) Разработка алгоритма детектора речи, использующего сигнал остатка для ослабления зависимости от отношения сигнала к шуму.

6) Формулировка специфики и разработка алгоритма детектора речи для системы верификации диктора.

7) Сравнение разработанной модели детектора речи с существующими аналогами.

8) Реализация алгоритма детектора речи в виде программного модуля на ПЭВМ для работы в составе системы сжатия речи и распознавания диктора. Методы исследования. Для решения поставленной задачи использовались

методы цифровой обработки сигналов, численного моделирования алгоритмов, кластерный анализ, распознавания образов, линейной алгебры, математической статистики.

Научная новизна определяется тем, что в процессе исследования была разработана совокупность методов и алгоритмов для снижения зависимости детектора речи от уровня квазистационарных шумов.

Практическая ценность. Разработанные алгоритмы позволяют повысить качество речи в системах сжатия с переменной битовой скоростью, а также надежность систем распознавания и верификации. Разработанный алгоритм детектора был реализован в виде программного модуля для ПЭВМ и используется в составе систем верификации, сжатия и распознавания.

Апробация и публикации. Результаты выполненных исследований докладывались и обсуждались на Международной научно-технической конференции "Гражданская авиация на современном этапе развития науки, техники и общества" (Москва, МГТУГА, 2003 г.), Второй биометрической конференции "Biometrics 2003 AIA RUII" (Москва, ВВЦ), Международной конференции "Информационно-правоохранительные системы 2001" (Москва,

МВД). По тематике диссертации было опубликовано 7 работ, включая 2 публикации в виде тезисов и 5 статей.

Личный вклад. Изложенные в работе результаты получены автором самостоятельно. В публикациях с соавторами вклад соискателя определяется рамками полученных в диссертации результатов.

Основные положения днссертацин, выносимые на защиту:

1) Метод получения сигнала остатка на основе интерполяции.

2) Метод детектирования речи, использующего кластерный анализ и сигнал остатка для выбора порогов.

Структура и объем диссертации. Диссертация состоит из введения, 3-х глав с выводами по каждой из них, заключения и списка литературы. Она содержит 140 страниц с 40 рисунками и списком литературы, включающим 80 наименований.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы диссертации, ее научная новизна и практическая ценность. Сформулированы задачи и цели исследования, а также защищаемые положения. Приведена структура диссертации.

В Главе 1 сказано об основных областях применения детекторов речи: распознавание речевых команд, распознавание фонем и анимация, распознавание диктора, подавление шумов для речевых сигналов, кодирование речи. Глава содержит аналитический обзор существующих методов построения и признаков детектора речи. Рассмотрено выделение признаков для детектирования речи: энергетические, меры вокализации (корреляция, кепстральный анализ высокого порядка), различные оценки огибающей спектра (на основе банков фильтров в частотной области, линейного предсказания, кепстральных коэффициентов, формантного анализа), энтропия, наличие пиков в огибающей спектра, стационарность спектральной огибающей. А также применяемые методы классификации: простые статистические методы, Марковские модели, динамическое программирование, нейронные сети,

векторное квантование, гистограммы распределений, простая пороговая схема классификации, дополнительный детектор стационарности. Приводятся основные недостатки существующих решений:

• Зависимость от конкретных акустических условий и вида шума. Значение многих признаков зависит от степени зашумленности речевого сигнала, что вызывает проблемы при попытке использовать его при разных отношениях сигнал-шум.

• Предположение о квазистационарности шума.

• Использование алгоритмов, которые включают настройку только на уровень шума

• Требуется специальный детектор стационарных участков сигнала, на которых следует обновлять параметры модели шума.

• Использование априорных предположений о положении и распределении шумовых или речевых участков, которые не всегда справедливы. Например, первые несколько секунд сигнала считаются шумовыми.

• Необходимость компромисса между задержкой принятия решения и точностью детектирования речи.

Таким образом, очевидна необходимость в разработке модели детектора речи, который:

• Строит не только модель шума, но и модель речи, и использует информацию одновременно об уровне речи и шума для выбора порога принятия решения. За счет этого предполагается снизить зависимость от такого параметра акустических условий как отношение сигнала к шуму.

• Предполагает стационарность шума только по энергии.

• Обновляет параметры моделей речи и шума без использования детекторов стационарности.

• Может быть использован для обработки как с большой, так и с маленькой задержкой принятия решения.

В Главе 2 изложен разработанный метод детектирования речи. Предлагаемый алгоритм детектора речи берет в качестве прототипа метод

классификации на основе гистограмм с использованием энергии. В данном случае распределение признака представляется многомодальным и на первый план выходит проблема оценки пиков распределения, соответствующих речи и шуму. Если наблюдать распределение энергии на достаточно продолжительном речевом сигнале, то можно заметить, что энергия концентрируется вокруг нескольких кластеров, каждый из которых соответствует своему классу звуков. Очевидно, что таких кластеров как минимум два или даже три. Первый кластер включает высокоэнергетические вокализованные звуки, второй -низкоэнергетические невокализованные, в том числе и взрывные. Последний кластер соответствует фоновому шуму. Для выделения отдельных кластеров предлагается использовать модифицированный алгоритм Ллойда. Близость уровня шума и низкоэнергетических звуков не позволяет использовать указанный алгоритм непосредственно для определения минимальных речевых уровней на основе только энергии. Для этих целей в диссертации предложено использовать сигнал остатка (возбуждения) и его декомпозицию. В главе рассмотрено место источника шума в модели речеобразования. Сам сигнал остатка представлен как сумма импульсов от трех источников: тонального, турбулентного и фонового шума. Был сделан ряд предположений:

• каждый источник независим от остальных,

• импульсы от каждого источника могут быть представлены как реализации случайной величины с нулевым математическим ожиданием,

• дисперсия тонального источника строго больше, чем дисперсия турбулентного источника; дисперсии всех источников строго больше нуля,

• плотность следования импульсов (расстояние между соседними импульсами) различна для каждого источника: самую большую разреженность имеют импульсы тонального источника, меньшую — турбулентного, импульсы шумового источника следуют друг за другом. Таким образом, для каждого отсчета сигнала возбуждения справедливо одно

из следующих утверждений:

• отсчет образован суммой импульсов от шумового, тонального и турбулентного источников, обозначен через ЫиУ,

• отсчет образован суммой импульсов от шумового и тонального источников, обозначен через ЫУ,

• отсчет образован суммой импульсов от шумового и турбулентного источников, обозначен через N0,

• отсчет образован только шумовым источником, обозначен через N.

Это справедливо в силу разреженности компонент возбуждения во времени. Таким образом, сигнал возбуждения состоит из сменяющих друг друга реализаций четырех случайных величин, каждая из которых соответствует одному из перечисленных выше четырех случаев. Заметим, что в силу независимости источников, дисперсия каждой из четырех случайных величин образуется суммой дисперсий всех источников, импульсы от которых участвуют в формировании данной случайной величины (1)-(2).

где Б(Ы) - дисперсия источника шума, В(П) - дисперсия турбулентного источника, Б(У) - дисперсия тонального источника, Б(КиУ) - дисперсия отсчетов, образованных тремя источниками, Л(МУ) - дисперсия отсчетов, образованных шумом и тональным источником, Л(Ми) - дисперсия отсчетов, образованных шумом и турбулентным источником.

Таким образом, сигнал возбуждения состоит из отсчетов, амплитуды которых имеется возможность условно классифицировать на четыре кластера Это можно показать рисунком 1. Распределение амплитуд сигнала остатка предполагается четырех модальным, а сам сигнал можно считать выходом скрытой Марковской модели с четырьмя состояниями (ЫиУ, ЫУ, N0, Ы). Вероятность перехода между состояниями в такой модели зависит от частоты появления отдельных компонент в сигнале. Поэтому можно ожидать (3): Р(МиУ)<Р(ЫУ)<Р(т)<Р(М) (3)

В(МиУ)>В(МУ)>В(Ми)>В(М) В(М)+В(и)+В(У)>В(М) +Б(У) >В(М)+В(и) >В№)

(1)

(2)

где Р(КиУ) - вероятность появления импульса от тонального, турбулентного и шумового источника одновременно (в данном случае это вероятность перехода в состояние NUV эргодической Марковской модели), Р(ЫУ) - вероятность появления импульса от тонального и шумового источника одновременно (вероятность перехода в состояние №У), Р(МИ) - вероятность появления импульса от турбулентного и шумового источника одновременно (вероятность перехода в состояние NU), Р(№) - вероятность появления импульса только от шумового источника (вероятность перехода в состояние

Рисунок 1-Сигнал остатка с отсчетами N NU, NUV

В качестве метода декомпозиции сигнала остатка используется алгоритм кластеризации Ллойда Таким образом, проведя процедуру кластеризации, мы получим разделение исходного множества всех отсчетов сигнала возбуждения на четыре кластера по значению амплитуды. Но поставить в соответствие значения амплитуд кластеров и случайных величин N NU, NUV можно только при условии высокого отношения сигнала к шуму, а именно, когда Б(И)<< Щи). Если же отношение сигнал-шум низкое, то результаты алгоритма кластеризации нуждаются в коррекции. Учитывая, что для установки порогов необходимо знать только оценки значений амплитуд для N NU, NUV, то результаты кластеризации подвергаются следующей модификации:

- Шумовая компонента присутствует в каждом отсчете сигнала, а вероятность появления турбулентного и тонального источников много меньше вероятности шумового, что позволяет оценить амплитуду шума как центральное значение (4) амплитуд, входящих во все 4 кластера:

где - абсолютные значения амплитуд отсчетов сигнала остатка, Ь - количество отсчетов сигнала остатка,

- средняя амплитуда шумовой компоненты при низком отношении сигнала к шуму.

- Для случая величины N0 находим центральное значение (5) амплитуд, входящих во все кластеры, кроме 1-го:

где - средняя амплитуда турбулентной компоненты, К1 - множество амплитуд, отнесенных к кластеру 1 по алгоритму Ллойда (1=1..4), кластер 1 - соответствует низкоэнергетическому кластеру N а кластер 4 - соответствует высокоэнергетическому кластеру NUV,

\К2\ - количество амплитуд, отнесенных к кластеру 1 (1=1..4). - Для NV оцениваем как центроид (6) амплитуд, входящих во все кластеры, кроме 1 и 2:

где - средняя амплитуда тональной компоненты. - И, наконец, для NUV берется центроид (7) кластера 4 без изменения:

(4)

(5)

(6)

где - средняя амплитуда смешанной компоненты.

Для формирования модели шума и речи достаточно средних значений от кластеров N и NU, т е. кластеров шума Ам и низкоэнергетических звуков Ат. Такие значения вычисляются для каждого кадра. Среднее значение кластера N представляет собой аналог энергии, в то время как центроид кластера NU можно использовать как дополнительный признак для учета уровня низкоэнергетических звуков. Гистограммный подход, идея которого была положена в основу предлагаемого метода, предлагается использовать для последовательности центроидов от кластеров N и NU. Обычное применение гистограммного метода для классификации возможно после ввода всего сигнала, что сопряжено с внесением дополнительных задержек в процесс принятия решения. Но в разработанном алгоритме вносится задержка в процесс установки порогов, а не в принятие решения. Обозначим длину буфера для оценки по гистограммному методу через Кж В обычном применении метода - это длительность всего сигнала, но в разработанном детекторе это число определяет количество предыдущих кадров, для которых была проведена декомпозиция сигнала остатка, и на основе которых будут устанавливаться пороговые значения. Буфер гистограммного метода содержит значений центроидов А„ И Ат, вычисленных на предыдущих кадрах. Окончательная оценка уровня речи и уровня шума может быть проведена путем поиска минимальных уровней среди значений буфера для Здесь опять

воспользуемся алгоритмом Ллойда, аналогично тому, как это было сделано при декомпозиции сигнала остатка. Только в данном случае достаточно 2-х уровней для максимума и минимума. Марковскую модель классификации речь-шум имеет два состояния: для речи и шума. В соответствии с общепринятой статистикой пауза и речь в сигнале распределены примерно в равных

пропорциях, поэтому вероятности переходов: Плотность

распределения вероятности для каждого состояния запишем в виде (8)-(9):

МЯ)-

bSL(E)'

V2 xD(NL) 1

JEdsL

2D(M>

.feil 2D(SL)

(8) (9)

где Е - среднее значение амплитуды в кадре, для которого выносится решение, Б(ЫЬ) - дисперсия шума, Б(8Ь) - дисперсия речи.

Для упрощения вычисления положим Б(ЫЬ) = Б(8Ь) > 0 и запишем по условие классификации кадра с амплитудой Е как речь:

РрЕЧь{Е)> РрВЧь{Щ^ + > ЯЯ)■*«№) +

Последнее выражение можно упростить до -£)? < (ИЬ-Е^ ,т.е. для принятия решения можно воспользоваться выражением (10): Е> Р-Ж+{\~Р)-М (10)

где Р - значение от 0 до 1, для обозначенного случая это 0,5.

Изменяя значения 0 можно регулировать соотношение ошибок детектора. Разработанный детектор способен определять те шумовые сигналы, которые являются квазистационарными на участке длинной Кш кадров, или если их энергия не претерпевает изменение на участке Кш на величину более

Для получения сигнала остатка в работе предлагается использовать интерполяцию (11) вида:

где х - речевой сигнал, а-коэффициенты интерполяции, Ы-количество таких коэффициентов, е - сигнал остатка.

Для получения коэффициентов а используется система (12):

R(2)+R{0)

ад+ед

Л(3) + Л(1) К(4) + Л(0)

Я(^+1)+й(ЛГ-1) R{N+2) + R(N-2)

R{N+l)+R(N-\) Ä(<V+2) + Ä(iV-2)

R(2-N)+R(0)

V 'ад"

a2 II R( 2)

ß{N\

где К - автокорреляция сигнала х.

С целью повышения устойчивости детектора речи в шумовой обстановке была использована предварительная фильтрация речевого сигнала усредненными на шуме коэффициентами интерполяции, подобная той, которая проводится с коэффициентами линейного предсказания. Также стоит заметить, что перед декомпозицией (разделением на амплитудные кластеры) энергия сигнала остатка приводится к энергии исходного сигнала.

На основе изложенных методов был разработан детектор речи с малой задержкой для применения в системах сжатия речи. Он может быть использован с любым вокодером, в том числе и взамен или совместно с уже существующим классификатором речь-пауза Помимо этого был разработан детектор речи с большой задержкой для применения в системах верификации диктора. Особенностью детектора является то, что помимо указанных признаков, добавляются еще стационарность по огибающей спектра мощности, импульсный детектор, мера вокализации на основе анализа спектра мощности, наличие пиков в нем. Порядок классификации по каждому из дополнительных признаков аналогичен описанному выше для энергии. Основная особенность детектирования речи в данном случае - выделения отдельных вокализованных сегментов речевого сигнала, в не определение начала и конца парольных фраз.

В главе 3 приведены результаты сравнительных экспериментов для изложенных методов.

Цель первого эксперимента - сравнить эффективность методов устранения избыточности между соседними отсчетами сигнала на основе линейного предсказания и с использованием интерполяции. В качестве критерия оценки эффективности было выбрано значение энергии остаточного сигнала. По результатам испытаний на речевом материале предложенный в диссертации метод дает остаточный сигнал по мощности в 40 раз меньший, чем аналогичный сигнал линейного предсказания. Результат говорит о целесообразности использования описанной методики для устранения

избыточности между соседними отсчетами в речевом сигнале для разработанного детектора речи.

Цель другого эксперимента - сравнить эффективность системы верификации до и после внедрения разработанного детектора Система верификации диктора по голосу выносит бинарное решение о пользователе: либо признает его "законным", либо считает его "чужаком". При такой схеме возможны два типа ошибок:

• "свой" диктор был отвергнут системой как "чужой" (в английской литературе такая ошибка обозначается FRR);

• "чужой" диктор был принят системой как "свой" (в английской литературе такая ошибка обозначается FAR).

Процесс тестирования систем верификации сводится к оценке надежности, характеризуемой величиной указанных двух ошибок. Речевой материал для тестирования представляет собой записи парольных фраз разных дикторов. Использованы высказывания 4 видов, их средняя продолжительность 1.2 сек. Каждый диктор произносит один вид парольной фразы 4 раза (отдельно для регистрации и верификации). Результат тестирования детектора речи с обычным выделением начала и конца высказывания: ошибки FAR = 3% и FRR = 4%. Результат тестирования разработанного детектора речи с кластерным анализом: ошибки FAR - 0.9% и FRR = 1.5%. Результаты тестирования показывают преимущество разработанного детектора.

Цель последнего эксперимента - сравнить разработанный детектор с наиболее широко используемыми алгоритмами, отражающими различные подходы к проблеме выделения речи с малой задержкой. Из заранее подготовленной речевой базы данных последовательно выбираются файлы с речевыми записями. Каждый такой файл имеет соответствующий ему файл разметки. Последний создается до проведения эксперимента и содержит отметки о наличии или отсутствии речи в сигнале. Звуковой файл смешивается с шумом в разных пропорциях и подается на тестируемый детектор речи, который выносит бинарное решение для каждого из них. Далее, решение

детектора сравнивается с ручной разметкой и, если они не совпадают, то соответствующая ошибка увеличивается. Как уже было отмечено ранее, детектор речи проверяет две гипотезы: принятый кадр содержит "речь", или принятый кадр содержит "шум".

В соответствии с этим, возможны два типа ошибок:

• ошибка первого рода: "речь" классифицируется как "шум";

• ошибка второго рода: "шум" классифицируется как "речь".

Цель данного эксперимента сравнить ошибки первого и второго родов для всех реализаций детекторов в одинаковых условиях (на одинаковом речевом материале) В качестве альтернативы сравнения были выбраны 3 наиболее распространенных детектора: G.723.1, G 729 и GSM (рисунок 2)

Рисунок 2 - Графики сравнительных испытаний детекторов. На рисунках символом "X" обозначен разработанный детектор. Для облегчения сравнения на графиках показана максимальная из двух ошибок.

Графики разработанного детектора имеют более "пологий" характер, т.е. с

изменением отношения сигнала к шуму ошибка меняется более плавно, чем у

стандартных алгоритмов, что говорит о более слабой зависимости от

указанного параметра акустических условий для квазистационарных шумов.

ЗАКЛЮЧЕНИЕ Основные результаты диссертационной работы:

1) Проведен аналитический обзор и классификация методик построения детекторов речи и признаков, которые используются в этих устройствах. Выделены недостатки существующих решений.

2) Разработаны программные средства для оценки точности работы детекторов речи, исследования их поведения в различных акустических условиях и сравнительных испытаний.

3) Разработан метод устранения избыточности между соседними отсчетами речевого сигнала и получения сигнала остатка на основе интерполяции.

4) Проведено сравнительное испытание метода получения остатка на основе интерполяции с линейным предсказанием, которое показало преимущество первого метода Первый метод позволил снизить уровень сигнала остатка в 40 раз.

5) Разработан алгоритм детектора речи, использующего сигнал остатка для определения минимального уровня речевого сигнала и устанавливающего порог принятия решения в зависимости от уровня речи и шума.

6) Разработан алгоритм детектора речи для системы верификации диктора, позволивший в 2 раза снизить количество ошибок указанной системы в случае использования коротких (около 1 секунды) парольных фраз.

7) Проведено сравнительное испытание разработанного алгоритма детектора с существующими аналогами, использующимися в системах сжатия речи. Результаты показали меньшую зависимость предлагаемого детектора от такого параметра акустических условий как отношение сигнал-шум, а также

его превосходство над аналогами в квазистационарных шумах при некоторых отношениях сигнала к шуму.

8) Разработанный алгоритм детектора был реализован в виде программного модуля для ПЭВМ и используется в составе систем верификации, сжатия и анимации.

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ

1. Мартынович П.В. и др. Система верификации диктора, ориентированная на надежное опознавание через телефонную линию. -М.: ИПС, 2001.

2. Мартынович П.В., Вайнейкис Л .А. Использование когорты для тексто -независимого режима верификации, —М.: МНТК "Гражданская авиация на современном этапе развития науки, техники и общества", 2003.

3. Мартынович П. В., Свириденко В. А. Системы верификации и идентификации диктора от SPIRIT Corp. -M.: Вторая Биометрическая Конференция "Biometrics 2003 AIA RUII, 2003.

4. Мартынович П.В., Абкаиров Н.Н., Каюмов В.П. Система верификации диктора через телефонную линию - новое решение. -М.: МНТК "Гражданская Авиация на рубеже веков", 2001.

5. Мартынович П.В., Вайнейкис Л.А. Детектор речи и его особенность применительно к системам верификации диктора по голосу. —М.: Вестник МГТУГА, 2002

6. Мартынович П.В., Вайнейкис Л.А. Выбор сегментов сигнала для повышения устойчивости системы верификации диктора по голосу. -М.: Вестник МГТУГА, 2002.

7. Мартынович П.В., Вайнейкис Л.А. Итерационный подход для анализа и синтеза речи. -М.: Вестник МГТУГА, 2004.

Подписано в печать 24.11.04 г. Печать офсетная Формат 60x84/16 0,82 уч.-изд. л.

1,0 усл.печ.л. Заказ № 1325/ £208 Тираж 70 экз.

Московский государственный техническийуниверситет ГА 125933 Москва, Кронштадтский бульвар, д. 20 Редакционно-издательский отдел 125493 Москва, ул. Пулковская, д.6а

© Московский государственный технический университет ГА, 2004

»2432«