автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Модели речевых сигналов для аутентификации личности по голосу

доктора технических наук
Голубинский, Андрей Николаевич
город
Воронеж
год
2010
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Модели речевых сигналов для аутентификации личности по голосу»

Автореферат диссертации по теме "Модели речевых сигналов для аутентификации личности по голосу"

004615923

На правах рукописи

ГОЛУБИНСКИЙ АНДРЕЙ НИКОЛАЕВИЧ

МОДЕЛИ РЕЧЕВЫХ СИГНАЛОВ ДЛЯ АУТЕНТИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ

Специальности: 05.13.18 - Математическое моделирование, численные методы и комплексы программ; 05.13.19 - Методы и системы защиты информации, информационная безопасность.

АВТОРЕФЕРАТ

диссертации на соискание учёной степени доктора технических наук

- ОМ

Воронеж-2010

004615923

Работа выполнена на кафедре радиотехники Воронежского института МВД России.

Научный консультант: доктор технических наук, доцент

Булгаков Олег Митрофанович

Официальные оппоненты: доктор технических наук, доцент

Тарасов Александр Алексеевич

доктор технических наук, профессор Алексеев Владимир Витальевич

доктор технических наук, профессор Дурденко Владимир Андреевич

Ведущая организация: Московский инженерно-физический институт

(Национальный исследовательский ядерный университет)

Защита диссертации состоится « 21 » декабря 2010 года в 13 часов, в ауд. № 215 / 1 корп. на заседании диссертационного совета Д 203.004.01 в Воронежском институте МВД России по адресу: 394065, г. Воронеж, пр. Патриотов, 53.

С диссертацией можно ознакомится в библиотеке Воронежского института МВД России.

Автореферат разослан « 19 » ноября 2010 г.

Ученый секретарь диссертационного совета

С.В. Белокуров

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время аутентификация личности по голосу широко применяется в системах контроля доступа к информационным или материальным ресурсам на основе биометрических параметров. Системы аутентификации личности по голосу обладают рядом преимуществ относительно других биометрических систем, основными из которых являются сравнительно небольшая стоимость и относительная простота практической реализации.

Развитие систем аутентификации личности по голосу лимитируется уровнем их надежности. Точность идентификации (установление) и верификации (подтверждение) личности по голосу в существенной мере определяется адекватностью математической модели, описывающей речевой сигнал. Увеличение точности в рамках существующих методов описания речевых сигналов, если и возможно, то приводит, как правило, к значительному увеличению количества параметров модели, что влечет за собой увеличение систематической ошибки и времени обработки поступивших данных, а также снижение значимости таких параметров для характеристики индивидуальных особенностей голоса человека. Высокий уровень ошибок систем аутентификации по голосу обуславливается также трансформацией голоса, вследствие болезней, особых эмоциональных состояний, возрастных изменений и т. д.

Используемые в диссертации теоретико-методологические посылки основываются на трудах отечественных и зарубежных исследователей в области акустической теории речеобразования и обработки речевых сигналов, таких как: Г. Фант, М.А. Сапожков, Дж. Фланаган, A.A. Пирогов, Б. Атал, Дж. Додингтон, JI.P. Рабинер, Б, Гоулд, Р.В. Шафер, Д.Д. Маркел, А.Х. Грей, С. Левинсон, Б.М. Лобанов, Л.А. Чистович, Н.Г. Загоруйко, Г.С. Рамишвили, Ю.Н. Прохоров, В.Н. Сорокин, В.Г. Михайлов, Т.К. Винцюк, В.И. Галунов, В.Р. Женило, Р.К. Потапова, A.B. Аграновский, C.B. Дворянкин, A.A. Петровский, В. Чу, Р.Г. Голд-берг, СЛ. Коваль и др.

Обоснованию подходов к разработке математических моделей речевых сигналов посвящено сравнительно немного научных публикаций. Это объясняется, прежде всего, сложной полиинформативной и полимодуляционной структурой речевого сигнала, а также большим количеством информации, используемой при анализе и синтезе математических моделей речевых сигналов. Однако, сегодня прогресс микроэлектроники наряду с применением цифровых технологий преобразования речевых сигналов дает возможность оперировать большими объёмами информации, обрабатывая её с приемлемой скоростью. При этом зачастую цифровые речевые технологии опережают речевую науку.

Наибольшую точность описания имеют математические модели, соответствующие физике процессов, поэтому при разработке математической модели речевого сигнала необходима её адекватность акустической теории речеобразования. Таким образом, повышение надежности проектируемых систем аутентификации возможно за счет разработки и использования новых методов построения адекватных математических моделей речевых сигналов.

В последнее время проявляется интерес к созданию математических моделей речевых сигналов, основывающихся на теории модуляции в рамках де-

терминированного подхода и характеризующихся небольшим количеством существенных параметров речевых сигналов и высокой точностью их описания. Однако общие свойства параметров речевых сигналов, описанных такими моделями, практически не исследованы.

Таким образом, повышение надежности систем верификации и идентификации личности по голосу и развитие голосовых систем разграничения доступа требуют решения крупной актуальной научной проблемы — разработки теоретических основ анализа и синтеза высокоточных адаптивных математических моделей речевых сигналов с минимальным количеством высокоинформативных физически интерпретируемых существенных параметров применительно к задачам голосовой аутентификации.

Работа выполнена в рамках госбюджетных НИР кафедры радиотехники Воронежского инсттуга МВД России.

Цель и задачи исследования. Целью работы является разработка методов построения математических моделей речевых сигналов для верификации и идентификации личности по голосу.

Для достижения данной цели в работе решены следующие задачи:

1. Разработка концепции построения математических моделей речевых сигналов для задач голосовой аутентификации на основе акустической теории ре-чеобразования.

2. Разработка методов синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием детерминированного и стохастического подходов.

3. Разработка обобщённого метода аналитического расчета амплитуд несущих гармоник полигармонических математических моделей речевого сигнала.

4. Разработка высокоточных методов оценки частоты основного тона и фор-мантных частот речевого сигнала.

5. Разработка способа проверки адекватности математической модели речевого сигнала экспериментальным данным.

6. Разработка мер различимости для верификации и идентификации личности по голосу и методов аналитического расчета их весовых коэффициентов.

7. Создание и реализация алгоритмов функционирования систем верификации и идентификации личности по голосу.

Методы исследования. При решении поставленных задач использовались современные аналитические и вычислительные методы теории вероятностей и математической статистики, теории случайных процессов, теории рече-образования, математического анализа, цифровой обработки сигналов, теории оптимального приёма, кластерного анализа, численные методы, методы программирования и моделирования на ЭВМ.

Научная новизна работы заключается в том, что в ней впервые:

1. Дана систематизация математических моделей речевых сигналов для задач аутентификации по голосу и сформулирована концепция их построения в явном виде, включающая в себя систему признаков модели и требований к ее структуре, существенным параметрам и методам их определения и оценки точности их расчетов, методам проверки модели на адекватность и мерам различимости.

2. Для задач аутентификации по голосу на основе теории модуляции разработаны и апробированы методы синтеза и анализа детерминированных и стохастических импульсных полигармонических математических моделей речевого сигнала с получением аналитических выражений для характеристик моделей.

3. Разработаны методы выделения модулирующего колебания и аналитического расчета амплитуд несущих колебаний полигармонических математических моделей речевого сигнала, построенных на основе теории модуляции, с оценкой точности расчетных параметров в аналитическом виде.

4. Разработана математическая модель речевого сигнала в виде суммы ква-зидетерминированной компоненты с полигармоническими модулирующим и несущим колебаниями и процесса авторегрессии.

5. Разработаны методы и алгоритмы и получены выражения для оценки точности вычисления частоты основного тона речевого сигнала на основе полигармонической математической модели: по минимуму невязки коэффициентов корреляции, а также по формированию оптимальной оценки при известных и неизвестных амплитудах и начальных фазах несущих гармоник.

6. Разработан метод оценки формантных частот вокализованных участков речи на основе полигармонической математической модели.

7. Получен способ проверки адекватности математической модели речевого сигнала экспериментальным данным по коэффициентам корреляции при использовании критерия соответствия на базе коэффициента множественной корреляции.

8. Для задач аутентификации личности по голосу разработаны новые эффективные меры различимости речевых сигналов для математической модели в виде импульса АМ-колебания с несколькими несущими частотами, методика вычисления начального значения порога меры различимости для критерия принятия решения.

9. Разработаны алгоритмы и синтезированы структурные схемы устройств аутентификации диктора по голосу, обеспечивающие повышение точности систем разграничения доступа.

Практическая значимость исследования заключается в перспективах расширенного применения разработанных методов синтеза и анализа математических моделей речевых сигналов в практических системах аутентификации по голосу. Разработанные структурные схемы устройств и алгоритмы реализации систем верификации и идентификации личности по голосу, могут быть положены в основу реальных технических устройств, работающих в составе систем разграничения доступа. Полученные в работе методы высокоточных оценок существенных параметров моделей речевых сигналов призваны повысить надёжность систем голосовой идентификации и верификации самого широкого спектра их практического приложения.

Внедрение научных результатов. Полученные в диссертации результаты использовались при выполнении научно-исследовательских работ в Воронежском институте МВД России, внедрены в научно-исследовательский процесс в ОАО «Концерн «Созвездие» (г. Воронеж), в ОАО «ВНИИ «Вега» (г. Воронеж), в ФГНИИЦ РЭБ ОЭСЗ Министерства обороны России (г. Воронеж), в Военной

академии связи (г. Санкт-Петербург), в ЗАО «Учебно-методический центр при Санкт-Петербургском государственном университете телекоммуникаций им. проф. М.А. Бонч-Бруевича» (г. Санкт-Петербург). Кроме того, результаты внедрены в учебный процесс в Воронежском институте МВД России и в практическую деятельность ЗАО «ВТБ 24».

На защиту выносятся:

1. Метод синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием детерминированного подхода.

2. Метод синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием стохастического подхода.

3. Обобщенный метод аналитического расчета и выражения для оценки точности амплитудных параметров математических моделей речевого сигнала, построенных на основе теории модуляции.

4. Метод и характеристики оценки частоты основного тона речевого сигнала на основе полигармонической математической модели по минимуму невязки коэффициентов корреляции.

5. Метод и характеристики оценки частоты основного тона речевого сигнала при неизвестных амплитудах и начальных фазах несущих гармоник, основывающийся на полигармонической математической модели.

6. Метод оценки формантных частот вокализованных участков речи на основе полигармонической математической модели.

7. Меры различимости речевых сигналов для аутентификации личности по голосу на основе математической модели в виде импульса АМ-колебания с несколькими несущими частотами.

8. Алгоритмы функционирования и структурные схемы устройств аутентификации диктора по голосу в системах разграничения доступа.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях, таких как: VII, X, XI, XVI международная научно-техническая конференция "Радиолокация, навигация, связь" (Воронеж, 2001, 2004; 2005, 2010); XV международная научная конференция "Информатизация и информационная безопасность правоохранительных органов" (Москва, 2006); Международная научно-практическая конференция "Современные проблемы борьбы с преступностью" (Воронеж, 2006); Международная научно-практическая конференция "Обеспечение общественной безопасности в Центральном федеральном округе Российской Федерации" (Воронеж, 2007); Международная научно-практическая конференция "Преступность в России: состояние, проблемы предупреждения и раскрытия преступлений" (Воронеж, 2008); Международная научно-практическая конференция "Обеспечение законности и правопорядка в странах СНР' (Воронеж, 2009); Международная научно-практическая конференция "Общественная безопасность, законность и правопорядок в III тысячелетии" (Воронеж, 2010); XXIII международная научная конференция "Математические методы в технике и технологиях" (Саратов, 2010); XVI международная научно-техническая конференция "Информационные системы и технологии" (Нижний Новгород, 2010); VII международная научно-практическая

конференция "Аетуальные вопросы современной науки" (Таганрог, 2010); Международная научно-техническая конференция "Наука и образование - 2010" (Мурманск, 2010); I международная научно-практическая конференция "Наука и современность" (Новосибирск, 2010); VI международная открытая научная конференция "Современные проблемы информатизации в технике и технологиях" (Воронеж, 2001); XV международная открытая научная конференция "Современные проблемы информатизации в экономике и обеспечении безопасности" (Воронеж, 2010); Всероссийская конференция "Интеллектуальные информационные системы" (Воронеж, 1999); Всероссийская научно-практическая конференция "Современные проблемы борьбы с преступностью" (Воронеж, 2003, 2005); V, VII всероссийская научно-практическая конференция "Охрана, безопасность и связь" (Воронеж, 2005, 2009); Общероссийская научная конференция "Актуальные вопросы современной науки и образования" (Красноярск, 2010); XXII сессия "Российского акустического общества" (Москва, 2010).

Публикации. По теме диссертации опубликовано 66 научных работ: 1 монография, 1 учебное пособие, 18 статей в ведущих рецензируемых научных журналах, которые входят в утвержденный ВАК Минобрнауки РФ «Перечень периодических научных и научно-технических изданий, выпускаемых в Российской Федерации, в которых рекомендуется публикация основных результатов диссертаций на соискание ученой степени доктора наук», 1 патент на изобретение, 1 депонированная рукопись, 1 регистрация программы в ФАП, 4 заключительных отчета о НИР, 11 научных статей и материалы 28 докладов на международных и всероссийских научно-технических и научно-практических конференциях.

Личный вклад автора. Основные научные результаты получены автором лично. Из 66 работ по теме диссертации 34 написаны без соавторов. В приведенном списке научных работ из опубликованных в соавторстве лично соискателем предложено: в [13, 14, 16, 17, 19, 39, 49-55, 57] - разработка основных концептуальных положений, постановки задач, выбор методов их решения; в [31-34] - основные идеи по методам построения и расчета параметров математических моделей речевых сигналов; в [1, 20, 23, 35-38] - постановка экспериментов, анализ и интерпретация, полученных результатов и выводы; в [47, 56] -алгоритмы и структурные схемы устройств аутентификации.

Структура и объём работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы, включающего 400 наименований. Общий объём диссертации составляет 403 страницы машинописного текста, включая 53 рисунка и 19 таблиц.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, определена цель работы, изложены научная новизна и практическая ценность полученных результатов, сформулированы основные положения, выносимые на защиту.

В первой главе приведен анализ современного состояния и проблем развития систем биометрической аутентификации личности по голосу. Проанализированы проблемы консолидации речевой науки, речевых технологии и практики применения систем биометрической аутентификации по голосу.

Рассмотрены следующие основные подходы к параметрическому описанию речевых сигналов и построению их математических моделей в задачах верификации и идентификации по голосу: приближенное описание речевого тракта (решение волнового уравнения совместно с граничными и начальными условиями, передаточная функция и др.); мгновенные или усреднённые приближенные численные характеристики речевых сигналов (спектральные, корреляционные, кепстральные, вейвлет, фрактальные, статистические характеристики частоты основного тона, описание на основе скрьггых марковских моделей и др.); математические модели речевых сигналов (на основе линейного или нелинейного предсказания, полигармонические (в т.ч. с шумовой составляющей), на основе модуляционной теории и др.).

Проанализированы особенности и недостатки известных методов описания уникальности голоса, например: большое количество малозначимых численных параметров; громоздкость математического аппарата; отсутствие четкой физической интерпретации моделей, несогласование их с теорией речеоб-разования и механизмами речевого поведения человека; экспериментальный подбор весовых коэффициентов; приближение статистической некоррелированности последовательности векторов наблюдений и др. Отмечены достоинства математических моделей, заданных в явном виде: ясность физической интерпретации, принципиальная возможность получения характеристик модели в аналитическом виде, реализация конструктивных подходов к оптимизации и адаптации модели и др.

Показано, что перспективным направлением повышения надёжности систем разграничения доступа к информационным и материальным ресурсам на основе аутентификации личности по голосу, является разработка эффективных подходов к построению математических моделей, обладающих высокой точностью описания и простотой реализации алгоритмов и устройств на их основе за счет оперирования компактным набором существенных параметров речевого сигнала и адекватности акустической теории речеобразования.

Согласно предложенной концепции построения математических моделей, аутентификация по голосу должна осуществляться на основе сравнения наиболее значимых существенных параметров речевых сигналов, характеризующих индивидуальные особенности голоса человека. Наиболее информативными в этом плане являются параметры, характеризующие вокализованные сегменты речи. Разработка в явном виде математических моделей рассматриваемого класса должна включать в себя:

1) математическую формализацию речевого сигнала на основе акустической теории речеобразования;

2) выявление значимой характеристики речевого сигнала для расчёта существенных параметров математической модели речевого сигнала;

3) невязку (между характеристиками речевого сигнала и модели) и критерий для расчёта существенных параметров модели;

4) методы расчёта существенных параметров модели;

5) характеристики оценки точности рассчитанных существенных параметров.

Наиболее эффективно проблема разработки математических моделей ре-

чевых сигналов может решаться на основе комплексного подхода, оптимально объединяющего в себе полигармоническое, модуляционное и импульсное описания, а также использовании соответствующих данным моделям мер различимости для критерия принятия решения о результате аутентификации.

Во второй главе рассмотрены вопросы синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием детерминированного подхода. Согласно физическим представлениям о формировании речевого сигнала, его вокализованные сегменты можно представить как результат прохождения квазипериодического сигнала возбуждения, генерируемого голосовыми связками посредством нагнетания потока воздуха из лёгких, через резонатор сложной формы, состоящий из бронхов, легких, диафрагмы, трахеи, гортани, глотки, небной занавески, языка, ротовой и носовой полостей. Изменения конфигурации голосового тракта и колебания голосовых связок взаимосвязаны, т.е. вся речеобразующая система функционирует как единый сложный объект, и артикуляционный аппарат является нелинейной параметрической системой с распределенными параметрами. Вследствие этого сформированный речевой сигнал оказывается сложным по своей структуре, и его математическое описание в явном аналитическом виде затруднительно. Информация, заключённая в речевом сигнале, может быть разделена на основную, заключающуюся в передаче смыслового содержания речи, и дополнительную, передающую индивидуальные особенности говорящего, его физическое и эмоциональное состояние, а также характеристики передающей среды. Особенностями речевого сигнала, вытекающими из такого рассмотрения, являются его полиинформативность и полимодуляционность. Сепарация речевого сигнала на смысловую и индивидуальную составляющие вызывает большие трудности. Однако для описания индивидуальных особенностей голоса возможно упрощение математической модели речевого сигнала, при условии, что она будет адекватно отражать отвечающие за уникальность существенные параметры.

В качестве существенных параметров, характеризующих уникальность голоса человека, предлагается использовать усреднённое на сегменте вокализации значение частоты основного тона (ЧОТ), характеризующей индивидуальный генератор, а также амплитуды гармоник несущего колебания, характеризующие спектральные компоненты индивидуального генератора и селективные свойства индивидуального резонатора. Изменение во времени амплитуды речевого сигнала на участке вокализованного сегмента соответствуют сигналу, модулирующему квазипериодическое несущее колебание. Таким образом, вокализованный речевой сегмент можно описать математической моделью в виде импульса АМ-колебания с несколькими несущими частотами при модуляции суммой гармоник:

К £

"(0 = £Л4со5(2*^ + Ф^£С//С05(2;г//о/ + ?>;), /е[0;ги], (1)

*=0 1=1 где ^ - наименьшая частота модулирующего колебания; Мь и Ф* - глубина модуляции и начальная фаза к-й гармоники модулирующего колебания;/0 - ЧОТ; С// и ф; - амплитуда и начальная фаза 1-й гармоники несущего колебания; (АТ+1) и Ь — количество модулирующих и несущих гармоник (низкочастотная состав-

ляющая несущего колебания, как правило, не учитывается, из-за затухания в резонаторе речевого тракта, а также сильного ослабления и искажения микрофоном и звуковой платой ЭВМ); ги - длительность вокализованного сегмента.

Математическая модель (1) с полигармоническими модулирующим и несущим колебаниями, характеризует индивидуальные особенности голоса: тембр (форму спектра) посредством амплитуд несущих гармоник, и тон посредством усреднённого значения ЧОТ.

В критерии для аналитического расчета оценок амплитуд несущих гармоник 11/ при детерминированном подходе использована нижняя граница среднеквадратичной ошибки (невязки):

еь=£{Ь?-ЬГ)2-+Ы, (2)

7=1

где Ь" и - соответственно нормированные автокорреляционные функции

(НАКФ) математической модели (1) и центрированного речевого сигнала; 3 -количество учитываемых отсчётов НАКФ;

ву О) ву и) ^ . —

—; вуи)= 2>, ум, 7=0,/; (3)

л - ^

вл 0)

;=0

у,=х1-х, / = 0,^-1;

| N -1

" ;=0

(4)

где х, - начальные отсчеты речевого сигнала; N - число отсчетов. НАКФ модели (1):

6"=6мО'Д); (5)

у £и(0) Еи

здесь Д = 1 / — интервал дискретизации; /а — частота дискретизации; АКФ и энергия модели сигнала (1) для т> 0 определяются выражениями:

II ¿л^чда«*

к=0 л=0 /=1

х[х¥(1 + т,к + п,<р, + <рт,Фк+Ф„,1-т,к-п,<р1-(рт,Фк-Ф„) + +Ч>{1-т,к-п,<р1-<рт,Фк-Фл,1 + т,к + п,<р1 + <рт,Фк + Ф„) + +х¥(1 + т,к-п,(р1+<рт,Фк-Фп,1-т,к + п,<р,-<рт,Фк + Фл) + +Ч'(!-т,к + п,<Р1-<рт,Фк + Фп,1 + т,к-п,<р1 + <рт,Фк-Ф„) +

+ХУ(1 + т~к + п,<Р! + <рт,-Фк + Ф„,/ -т-к-п,<р,-<рт,-Фк -Ф„) + +Ч>(/- т-к-п,<р, -<рт,-Фк -Ф„,/+ т-к + щщ + (рт-Фк + Ф„) + +Ч>(/ + т-к - п,<р, + <рт,~Фк - Ф „,1-т-к + п,<р1-(рт,-Фк + Ф„) + +Ч>(/ - т-к + п,<р,- <рт,-Фк + Ф „,/ + т-к -п,щ + <рт,-Фк - Ф„)], (6)

где функция

г —г

Ч^д, Ь, с, (1, е, х, у, г)=Б 'пс Еи=Ви(0).

с <1

ХСОБ

Для расчета оценок существенных параметров £/, модели (1), на основе имеющейся оценки ЧОТ /0, согласно критерию (2) можно воспользоваться методом наименьших квадратов (МНК), приравняв производную еь по каждому из [// к нулю. В результате получается система из £ нелинейных уравнений в виде полиномов 4-й степени, не имеющая однозначного решения. Для решения полученной системы относительно £/;, делались следующие допущения:

1) среди компонент АКФ, соответствующих модулирующему и несущему колебаниям, учитывались только наиболее существенные по значению (т.е. не перекрёстные компоненты при к = п и I = т);

2) энергия одинаковых речевых сегментов (например, одинаковых парольных фраз) полагалась постоянной (£„=сопз1).

В итоге система нелинейных уравнений сводится к линейной: А V = В, • (8)

где V - матрица-столбец размером Ь х 1, с элементами: К;={/,2; (9)

В - матрица-столбец £х1, с элементами:

вр=Ъг^.Р > о°)

у=1

А - квадратная матрица I х Ь, с элементами:

(п)

¿и /=1

а элементы матрицы в вычисляются следующим образом:

= ^Чг^ £ Л/* М/с + Ы-о )(т. - 7А) + (?>,+Ф*)]+

8 к=о

+ 8шс[2*(//о -*Р0Хгн + -Ф*)]+

+ 2$тс\2л1/0(тК - у А) + <Р/)]соз[2я-1Р0у'Д + Ф*]+ + 2ътс\1пкР0 (ги - у'Д) + Ф* ]соз [2я7/0уД + <р,]+

+соз[2,т(//0 + ^ )уА + (д + Ф,)]+соз[2^(//0 - ^0)уД+- ф4)]}. (12)

Таким образом, решение системы (8) относительно С/;, имеет вид:

(13)

V = А_1В. (14)

Максимальное количество гармоник несущего колебания Ьтах, которые можно учесть в полосе частот [0;/в], где/в - верхняя частота в спектре речевого сигнала будет равно:

Аг.ах

Л

/о. |_2/о ]

(15)

где I. _| - означает отбрасывание дробной части; /в = // / 2 - при дискретизации по теореме Котельникова.

Для определения учитываемого количества отсчётов НАКФ J следует воспользоваться одним из критериев, основанных на заданном: уровне ослаб-

ления значения НАКФ по модулю на J -м отсчете относительно максимального значения; уровне отношения энергии сигнала при отбрасывании отсчётов НАКФ выше ./-го к энергии сигнала; уровне отношения энергии ошибки НАКФ при отбрасывании отсчётов НАКФ выше У-го к энергии сигнала и др. При этом для значения^ = 6000 Гц целесообразно принять для расчётов ./«200, что, как правило, соответствует | и < 0,4. Если использовать частоту дискретизации /¡¡г, то значение J1 вычисляется:

Jг=~J■ (16)

Расчёт показывает, что для речевого материала в виде парольной фразы "он" при заданных параметрах: fd =6000 Гц; ги=0,3 с; /г0= 10 Гц; М0= 1; Фо=0; М\=\\ Ф1=7с; Ь=6; <р/ =0; Еи =1; /=200; следующие семь коэффициентов модели, отражают индивидуальные особенности голоса: ^=155,2 Гц; (7]=0,819; £/2=0,784; иъ= 1,457; (У4=0,315; С/5=0,327; [76=0,142, при этом ошибка модели составила £6=0,994. На рис. 1 для данного речевого материала, приведены зависимости НАКФ центрированного речевого сигнала — сплошной линией, и НАКФ Ь" математической модели (1) при указанных выше значениях параметров - пунктирной линией. Из графиков видно, что НАКФ модели достаточно хорошо аппроксимирует НАКФ речевого сигнала, что подтверждает пригодность предложенной модели к описанию вокализованных сегментов речи.

На рис. 2 сплошной линией приведён график нормированной спектральной плотности энергии (НСПЭ) речевого сигнала:

=-к = 0,М/2-1, (17)

та х[1Ук]

где \Ук = \ск — квадрат модуля коэффициентов дискретного преобразования

Фурье (ДПФ). Штриховой линией изображён график НСПЭ математи-

ческой модели:

Рис. 1. НАКФ речевого сигнала и математической модели

0 200 400 600 800 1000 /,Гц Рис. 2. НСПЭ речевого сигнала и математической модели

lSuif? • (18) max[Su2(/)]

Спектральная плотность S„(f) модели (1) рассчитывается:

su(f) = ^¿м, ¿t/Hsinc Mf + lfo + kF0)r„]-c,(«"+ф'>+ 4 A=0 /=1

+ Sinc [*(/-(//o + kF0))rJ• с>+ sine [*(/ + / /0 - *F0 ) r„ ]• e >+ + sinc [^(/-(//o -^o^rj-e"^^)}. (19)

Как видно из рис. 2, график Wu{f) содержит максимумы, соответствующие наличию гармоник, кратных ЧОТ (основной тон и обертона речевого сигнала). На шестом обертоне значение НСМЭ соответствует величине -20,2 дБ, а начиная с частоты 970 Гц, значения спектральных компонент НСПЭ не превышают -35 дБ. Из графиков, представленных на рис. 2, видно, что НСПЭ речевого сигнала удовлетворительно сходится с НСПЭ модели (1), однозначно характеризуя такие существенные параметры, как ЧОТ, частоты обертонов, а также значения НСПЭ в областях максимумов на данных частотах.

Предложена математическая модель речевого сигнала, основанная на аппроксимации спектра набором постоянных составляющих в окрестностях ЧОТ и обертонов:

L

u(t) = sine (2 л- F0 /)£ и I cos(2;r//(,/). (20)

1=0

Для расчёта амплитуд несущих гармоник согласно (13) элементы матрицы S, входящие в (10), (11), вычисляются:

^ = SÍnC(2f°-/A)¿cos(2W/0yA). (21)

Математическую модель речевого сигнала (20) целесообразно применять в тех случаях, когда затруднена или нецелесообразна оценка длительности произнесения контрольного речевого материала, т.е. затухающая огибающая модулирующего колебания дает возможность без оценки длительности речевого сигнала осуществлять адекватное описание вокализованных участков речи. Предложенная математическая модель речевого сигнала адекватно описывает вокализованные участки речи, сравнительно проста в анализе и расчете её существенных параметров, прозрачно физически интерпретируема. Однако точность описания вокализованных участков речи математической моделью (20) несколько меньше относительно модели в виде импульса АМ-колебания с несколькими несущими частотами (1). Для рассмотренного выше речевого материала ошибка Еъ увеличилась примерно в 2 раза. Для другого вокализованного речевого материала еь возрастает, как правило, от 1,5 до 3 раз.

Рассмотрены вопросы, связанные с обобщенной математической моделью речевого сигнала в виде импульса колебания с амплитудно-частотной модуляцией:

К L С Р ^

«(0=5; Mk cos( 2 ж kF01 + Ф* ) ¿£/, cos 2 я //„ í + / - ¿ тр sin(Q^ * + Ф J? ) ■+ q>, k=Q /=1 V. P=1 y

fe[0;r„], (22)

где тр, и - соответственно индекс модуляции, круговая частота и начальная фаза р-н гармоники разложения в ряд Фурье ЧОТ. Отмечено, что модель вида (22) является потенциально более точной, вследствие непосредственного учёта осцилляций основного тона. С помощью аппарата функций Бесселя в аналитическом виде получены такие характеристики модели, как АКФ и спектральная плотность энергии. Данная модель обладает несколько большей точностью, однако принципиально более сложна для анализа, что накладывает определённые ограничения для её практического использования.

Разработан метод выделения модулирующего колебания ммод(0 из огибающей речевого сигнала U(t) с целью оценки параметров F0, A4 и Ф^. Для этого U(t), полученную на основе свойств преобразования Гильберта, необходимо пропустить через фильтр нижних частот (ФНЧ). Для получения имод(?) из экспериментального речевого материала на основе модели (1) необходимо вычислить U(t). Спектральную плотность речевого сигнала рассчитывают на основе коэффициентов ДПФ, например, с помощью одного из алгоритмов быстрого преобразования Фурье (БПФ). Графики огибающей U/ для речевого материала в виде фонем "о", "э", "и" представлены тонкими сплошными линиями соответственно на рис. 3, 4, 5.

Для анализа качества выделения модулирующего колебания из огибающей от различных частот среза при фильтрации ФНЧ (в данном случае цифровым фильтром (ЦФ), синтезированным на основе фильтра Баттерворта 3-го порядка с затуханием Л = -18 дБ на октаву), на рис. 3-5 приведены графики отсчетов огибающей на выходе ФНЧ w:, для значений: /ср=30 Гц (жирные сплошные линии); /ср=25 Гц (штриховые линии); /ср=20 Гц (пунктирные линии); j^p=15 Гц (штрих-пунктирные линии).

да ол~ ¡й ' ¡ас

Рис. 3. Огибающая фонемы "о" до и после фильтрации ФНЧ

Из графиков, приведенных на рис. 3-5, видно, что модулирующее колебание представляет собой низкочастотную составляющую огибающей речевого сигнала.

Из анализа сигнала огибающей на выходе ФНЧ установлено, что, начиная с частоты среза фильтра/^25 Гц и менее,

0*002 С! 02 ТАс

Рис. 4. Огибающая фонемы "э" до и после фильтрации ФНЧ

' {ЛСТйГ <5л ' ' ' (3V2 ГЗГс

Рис. 5. Огибающая фонемы "и" до и после фильтрации ФНЧ

высокочастотные осцилляции в модулирующем колебании практически отсутствуют, при одновременном сохранении существенных особенностей поведения низкочастотной составляющей огибающей речевого сигнала до/«10 Гц (что соответствует при Г0=1/ти значению К&3). При этом сигнал на выходе ФНЧ смещен на интервал времени, примерно равный среднему групповому времени задержки в полосе пропускания ЦФ.

Таким образом, для ФНЧ с равномерной АЧХ в полосе пропускания и резким ослаблением в полосе задерживания частоту среза следует выбирать из условия К /ч,</ср<</0. При анализе качества выделения модулирующего колебания было установлено, что следует выбирать ЦФ с затуханием Л>-12 дБ/окт. Это обусловлено с одной стороны необходимостью подавления высокочастотных осцилляций несущего колебания в полосе задерживания, а с другой - сохранением существенных гармоник модулирующего колебания в полосе пропускания.

Предлагаемый подход позволяет относительно просто получить модулирующее колебание мМ0д(<) в численной форме, которое затем можно аппроксимировать или использовать для определения параметров Р0, Мк и Ф* при разложении данного колебания в ряд Фурье.

В третьей главе приводится метод синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием стохастического подхода. Рассмотрены физическое обоснование и сущность метода синтеза и анализа стохастической модуляционной математической модели речевого сигнала. Фазовые соотношения (фазочастотную характеристику речевого тракта, а в конечном итоге и фазовый спектр выходного колебания в виде речевого сигнала) такой сложной акустической резонансной системы, как речевой тракт человека, при детерминированном подходе зачастую весьма затруднительно описать с высокой точностью. Таким образом, целесообразна разработка и исследование математических моделей речевого сигнала для аутентификации по голосу, при использовании стохастического подхода, позволяющего адекватно описать случайные составляющие начальных фаз гармоник в речевом сигнале. Данный подход в ряде случаев позволяет повысить точность математической модели.

Математическая модель речевого сигнала в ввде импульса АМ-колебания с несколькими несущими частотами и случайными начальными фазами при модуляции суммой гармоник имеет вид (1), при этом начальные фазы Ф* и являются случайными величинами, не коррелированными между собой и равномерно распределёнными в интервале [0;2я], с плотностями вероятностей:

р**=Ъ (23)

Показано, что модель (1) с полигармоническими модулирующим и несущим колебаниями при выполнении (23) является реализацией стационарного в широком смысле, эргодического случайного процесса, и соответствует квазиде-терминированному процессу.

В критерии для аналитического расчета оценок амплитуд несущих гармоник (7/ при стохастическом подходе использовалась нижняя граница невязки:

7=1

где г" и Гу ц- - соответственно коэффициенты корреляции (КК) математической модели (1) при выполнении (23) и центрированного речевого сигнала; J -количество учитываемых отсчётов КК. При этом:

г

' Яу(0) а;

г; = гм(уД); г" (г) = = ' (26)

' ~*„«>г ^ • у=0'7; (25)

= «»Р^ВДХ^сов^/ог], /€[0;ги), (27)

4 *=0 /=1 где сг^и Сц - соответственно дисперсии центрированного речевого сигнала и модели; г=|/2-?1|.

Число учитываемых отсчетов КК У, определим как номер отсчёта КК, начиная с которого все значения КК находятся в доверительных границах нулевых значений ±3 ап полученных по методу Бартлетга для КК (показаны на рис. 6 штриховыми линиями):

N14 ^

1 + 2 ]>>Г)2 (28)

- стандартная ошибка для коэффициентов корреляции. Анализ речевых сигналов различных дикторов показал, что, как правило, все значения КК заходят в границы Бартлетга ±3 аг до 200 отсчета при // = 6000 Гц (при этом для случая, показанного на рис. 6 все значения КК заходили в границы Бартлетга, начиная со 156 отсчёта), таким образом, целесообразно выбрать значение /»200.

Вычисление амплитуд несущих гармоник на основе (13), для квазидетер-минированной полигармонической модели, основано на элементах матрицы Б, которые рассчитываются как:

= ^Мксо%{2лкР0]А)со%{2л1/0]А). (29)

4*=о

В качестве примера для речевого материала в виде парольной фразы "он" при заданных параметрах: £ =6000 Гц; г„=0,3 с; М0=1,414; Ф0=0; М\=\\ Ф1=я; Ь=6; (р! =0; /г0=15 Гц; =23,218; /=200; были получены следующие семь коэффициентов модели, отражающих индивидуальные особенности голоса: /о= 155,2 Гц; «71=2,249; £/2=2,173; (/З=3,994; {/,=0,900; С/5=0,937; С/6=0,433. Абсолютная ошибка модели составила £>=1,154. На рис. 6 для данного речевого материала, приведен сплошной линией график г?а, а пунктирной линией зависимость г".

Для анализа спектральных компонент речевого сигнала от частоты приведём рис. 7, на котором изображены графики нормированной на максимум спек-

тральной плотности мощности (НМСПМ) речевого сигнала (сплошной

линией) и модели IV"(/) (пунктирной линией):

тглп

тах[^(/)]'

К(Л = 2А

1 +

г=1

где С? - точка отсечения спектрального окна Тьюки МяУ-

1 + СОБ

тах[Г„(/)]'

(30)

(31)

(32)

= Т 1и' {зтс[2Лг(/+(//0 + ВДги] + зтс[2ж(/ - (//0 + *^))ги] +

4=0

м

+ зтс[2*(/ + (//о - кЬо ))ги ] + з!пс[2ж(/ - (//0 - ))ги ]}. (33)

Из графиков, представленных на рис. 6,7, а также значений вычисленных ошибок ег видно, что КК и НМСПМ полигармонической модуляционной квази-детерминированной модели (1), (23) достаточно хорошо аппроксимируют соответствующие характеристики вокализованных речевых сегментов.

--»"МЛ, дБ

0 |

50 ¡00 150 200 250 Рис. 6. КК речевого сигнала и математической модели

200 400 600 800 1000/, Гц Рис. 7. НМСПМ речевого сигнала и математической модели

Представлена математическая модель речевого сигнала в виде суммы квазидетерминированного случайного процесса и{() и белого шума п(1) с ограниченным верхней частотой /8 спектром и односторонней спектральной плотностью мощности М,:

#(0=«(0 + "(0- (34)

Рассмотрены вопросы оценки степени вокализации речевого сегмента на основе экспериментального КК. Вычислены характеристики модели (34) - математическое ожидание, функция корреляции (ФК), дисперсия, КК, СПМ. Приведена оценка параметра шумовой компоненты Л'о на основе соотношения:

где дисперсия шумовой компоненты о-2 рассчитывается по формуле: <х2=^2-«)2, (36)

здесь сг| и (Сц1)2 - соответственно оценки дисперсии сигнала £(г) и апостериорной дисперсии периодической компоненты модели.

Разработана математическая модель речевого сигнала в виде суммы ква-зидетерминированного случайного процесса «(/) и процесса авторегрессии (АР) «(/). Смешанная модель задаётся своими отсчётами:

= и,+л„ (37)

где = £(0|,=/Д = £(/Д); и, ==м(')|,_/д =«('А) - отсчёты периодической компоненты. Шумовая компонента модели (37) описывается процессом АР:

р

= Х^/А-р+Ч' (38)

Р=\

где а/ - сигнал возбуждения в виде реализации белого гауссовского шума; Р -порядок модели АР; фр - коэффициенты линейного предсказания (КЛП); 6 -

коэффициент усиления. Для расчета оценок параметров фр, Ь модели АР (38)

необходимо определить КК г„( у'Д) шумовой компоненты п, смешанной модели (37). В этой связи, полагая, что периодическая и шумовая компоненты некоррелированны между собой, соотношение для отсчётов КК принимает вид: гяО'Л) = (г2 +1)^0'Д)-22 г„0'Д), (39)

где отношение сигнал-шум (ОСШ) определяется как:

(40)

На основе ОСШ можно привести условные границы, позволяющие определить степень вокализации речевого сигнала, а также вклад периодической или шумовой компонент в смешанную стохастическую модель.

Изложены вопросы построения модели АР с постоянными коэффициентами для вокализованного речевого сегмента после предварительной фильтрации с целью выравнивания спектра. Исследованы вопросы выбора параметров и характеристик ЦФ для обеспечения достаточного уровня ослабления периодических составляющих кратных частоте основного тона. Установлено, что при фильтрации вокализованного речевого сегмента с помощью режекторного фильтра Чебышева 2-го рода 8-го порядка на ЧОТ и частоте первого обертона (в ряде случаев дополнительно на частотах второго и третьего обертонов), построенная на полученный сигнал модель АР 12-го-15-го порядка адекватна на основе остаточных ошибок по критерию у? с вероятностью 99,9%.

В четвертой главе представлены методы расчета параметров математических моделей речевого сигнала, построенных на основе теории модуляции.

Приведён обобщенный метод и характеристики аналитического расчета амплитудных параметров математических моделей речевого сигнала, построенных на основе теории модуляции и заданных в виде явной функции времени. НАКФ (или КК) йг(г) математической модели речевого сигнала, может быть записана в виде:

Лг(г) = -1-£и,2Ыг), (41)

Лао /=о

где Ка0 — энергия (или дисперсия) модели; 5Хг) - некоторая функция, зависящая от номера несущей гармоники /, интервала времени г и параметров математической модели (например, ЧОТ, частота модулирующего колебания, длительность сегмента и др.); НАКФ (или КК) задана J экспериментальными отсчетами. Выражение (41) в матричной форме:

Ка0 • На = Б V, (42)

где Г1а = Ка / Ка0 - матрица-столбец размером Ух 1 с элементами Ка] = Ла(уД); в - прямоугольная матрица Jx(L +1), с элементами

Б- С/А); V - матрица-столбец (I + 1)х 1 с элементами К, = и}.

Оценки амплитуд несущих гармоник рассчитывались при использовании МНК, при этом минимизировалась невязка:

е(У)=(Ка - К)т (Иа - И) =

И——вУ

. Ка0 .

И——БУ

. Као .

(43)

по вектору вычисляемых параметров

Згг(У)/оУ = 0, (44)

где II = К / /Г0 - матрица-столбец размером Jxl с элементами т - знак транспонирования. При допущении Као^сопИ система нелинейных уравнений, состоящая из полиномов четвертой степени, сводится к линейной. Отсюда вектор оценок параметров К/ (при Ка0= К0):

у^о^зу^я. (45)

Таким образом, решение системы (44) относительно параметров И\ математической модели:

= (46)

При расчете амплитудных параметров по выражению (45) в зависимости от вида модели будут изменяться функциональная зависимость НАКФ или КК, т.е. будут меняться параметры и Ка0. Таким образом, применение общих соотношений для расчета параметров математических моделей речевых сигналов возможно как в рамках стохастического, так и в рамках детерминированного подходов без потери общности рассуждений.

С учётом линейной зависимости матрицы наблюдений К и матрицы параметров V, несмещённые и эффективные оценки V/ (на основе матрицы рассеяния оценок МНК П(У)) имеют дисперсию:

4, = {П (V)},,, = У){(вт в)"1},,. (47)

Относительные ошибки существенных параметров 0, модели для доверительных интервалов ±3а^ (при доверительной вероятности Р = 99,7%):

Ал

(48)

5 = 3-100%; А0 У)!^)"1},,.

и, ^ /о> и, 2ц/ \j-i_, ' >'■'

Для рассмотренного примера в главе 3, применительно к квазидетерми-нированной модели, относительные ошибки соответствующих гармоник: Зц^ =±0,433%; 50г =±0,464%; =±0,137%; =±2,707%; =±2,495%;

<^(76=±11,662%. Таким образом, оценки амплитуд гармоник (/, удовлетворительно группируются относительно их значений для широких доверительных интервалов.

Приведены метод, алгоритм и характеристики оценки ЧОТ речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели. Оценка ЧОТ вычисляется: ?о=^Ы[ег(Л], (49)

где невязка при стохастическом подходе:

(50)

7=1

здесь /о - истинное значение ЧОТ; / - текущее значение варьируемой частоты при сканировании диапазона наиболее вероятного нахождения ЧОТ, как правило, /е[70; 330] Гц; г"чот — КК математической модели для оценки ЧОТ, упрощенный вид которого для //-гармонической оценочной модели: г«чот(/)= 1 ¿соз(2^//оУд). (51)

н м

В качестве примера на рис. 8 приведёна зависимость оценочной ошибки от частоты сканирования в оценочной модели для вокализованного сегмента речи в виде слова "он".

70 100 150 200 250 300/, Гц о 5 10 15 Я

Рис. 8. Оценочная ошибка ЧОТ речевого сигнала Рис. 9. Усредненное СКО ЧОТ

при использовании оценочной полигармонической в зависимости от количества

математической модели гармоник оценочной модели

На рис. 8 изображены зависимости для разного количества гармоник оценочной модели: Я=3 - пунктирной линией; Н=4 - сплошной линией; Н= 5 -штриховой линией. Для данного случая глобальный минимум (оценка ЧОТ речевого сигнала) наблюдался на частоте: /0 = 155,2 Гц, при шаге изменения частоты А/=0,1 Гц. Для анализа качества работы предложенного метода оценки ЧОТ генерировались различные эталонные полигармонические сигналы. Модуль относительной погрешности оценки ЧОТ б/й = (/0 -/о*)//"-100%, как правило, не превышает 0,3%, при шаге Д/=0,1 Гц.

В качестве статистической характеристики точности вычисленной оценки ЧОТ использовалось усреднённое среднеквадратическое отклонение (СКО):

- сГ(/01 /0) = 1/о) + Я~(Л1/о)). (52)

^(7о I /о) = |е[оЭЦ -¿£со5[2я/(/0 ±--^Есо5[2^//0уД]| |х

Х|Х -¿гЕ(2,тО-Д)Бт[27г//0;Д^ | . (53)

График зависимости усреднённого СКО ¿т от количества гармоник в оценочной модели Я (для речевого материала "он") приведён на рис. 9. Наибольшая точность оценки при А/-=0,1 Гц (¿7 =0,021 Гц) наблюдается для оценочной модели, содержащей 19 гармоник (все гармоники, укладывающиеся до верхней частоты в спектре речевого сигнала).

Установлено, что для практического использования в большинстве случаев можно рекомендовать трёхгармоническую оценочную модель (Ь = 3) для частотного шага Д/=0,1 Гц, при этом ст» 0,082 Гц обеспечивает вполне достаточную точность оценки (вероятность попадания оценки /0 в доверительный интервал /0 ±ст равна Р «68,3%). Доверительный интервал для Р ~ 99,7%: Зет« 0,245 Гц.

Поведена оценка ЧОТ и исследованы её характеристики на основе метода максимального правдоподобия при известных амплитудах и начальных фазах несущих гармоник. Оценка ЧОТ базируется на математической модели речевого сигнала:

£(/,/о) = и(*,/о) + л(0, (54)

где и(/,/0) - детерминированный сигнал в виде модуляционной полигармонической модели (1); и(/) — шумовая компонента в виде модели гауссовского случайного процесса с нулевым средним значением и функцией корреляции вида Л(?1,/2)= (Л^0/2)-£(/, -/2), где 8 (■) - (5-функция Дирака.

Оценка максимального правдоподобия (ОМП) ЧОТ определяется как:

где логарифм функционала отношения правдоподобия (ЛФОП):

= ((,/0)и(1,/)¡и2(1,/)<11, (56)

где Т — время наблюдения; и((,/) - опорный сигнал:

и{!,/) = ^и,с^(2л1/1 + (р1). (57)

¡=1

На основе блок-схемы данного алгоритма измерения оценки ЧОТ речевого сигнала были вычислены значения оценки ЧОТ для различных вокализованных речевых сегментов. Результаты экспериментальных измерений оценки ЧОТ соответствуют точности оценки, которую можно определить на основе полученного выражения для дисперсии:

Д/о1/о)<

я

2 2^2"2^0/

2 ,2

Ж//

.1=1

-1

(58)

4л г Т й

где и0, - истинные значения амплитуд несущих гармоник.

При оценке ЧОТ распределение амплитуд и начальных фаз <г> несущих гармоник, образующих сложный полигармонический сигнал, как правило, является трудно получаемой информацией. В этой связи разработан метод оценки ЧОТ при неизвестных £// и <ри рассчитаны характеристики точности полученной оценки. Максимизация ЛФОП (56) по неизвестным несущественным параметрам XI и у/( х1 = и1 сое(01); У1= 1/1 51п(<9; ); в1 = -эд) приводит к выражению: " я я

(59)

\!> 2Т

_/=1 /=1

где соответствующие синфазные и квадратурные компоненты:

*,Ш = гМ£(/,/0)со8(2;Г//0<1/; У/(/)~ . (60)

д 0 о к0 о

Как видно из (59), (60) оптимальная обработка полигармонического сигнала для оценки его параметров, сводится к получению билинейной формы из квадратурных компонент корреляционного интеграла. Данная обработка справедлива для случая разрешения гармоник, что обеспечивается при /о Т> 2,7.

Разработанная на основе (59), (60) блок-схема алгоритма расчёта оценки ЧОТ при оптимальной временной обработке сигнала в случае отсутствия априорной информации о распределении амплитуд и начальных фаз гармоник входного сигнала позволяет получить высокоточную оценку, дисперсия которой:

Д/о1/о) =

я

.2 2Г2"1У0/

Я

1и01 м

-1

2 ¡2

(61)

Л 2 1 /=1

Представлен метод и получены характеристики оценки формантных частот (ФЧ) речевого сигнала на основе его полигармонической математической модели. Сущность метода заключается в следующем. Положим, что известны значения оценок /0 и О/, при этом количество амплитуд гармоник принимают равным 1тах (15). По известным значениям {// определяют их глобальный мак-

симум С/тах 1, и за оценку ФЧ принимают его аргумент: Р\ =/тах1 ■ /0, т.е. оценка соответствует резонансно усиленной /таХ1-й гармонике основного тона, или же (/тах1-1)-му обертону. Далее находят первый минимум £//тшЬ после значения аргумента которого /тшь определяют следующий первый максимум £// тюа; оценка второй ФЧ: Рг =/тах2 • /о- При необходимости можно сузить интервал поиска максимумов, используя диапазоны наиболее вероятного нахождения соответствующих ФЧ. Далее находят следующий первый минимум £7/ тШ2, после значения аргумента которого ищут первый максимум С//тахз; оценка третьей ФЧ: Ръ =/юахз -/0, и т.д. Разработанный метод даёт конструктивный подход к вычислению оценок ФЧ в рамках математической модели, записанной в явном виде, обладает удовлетворительной точностью, а также лишён ряда недостатков, которые присущи, например, методу моментов и его модификациям. Полученные оценки ФЧ могут быть использованы в качестве параметров для аутентификации личности по голосу.

В пятой главе изложены вопросы, связанные с проверкой адекватности математической модели речевого сигнала на основе экспериментальных данных. Проанализированы основные меры близости, входящие совместно с решающим правилом в критерий соответствия математической модели речевому сигналу. Приведена методика проверки математической модели речевого сигнала на адекватность экспериментальным данным при использовании статистического критерия на базе коэффициента множественной корреляции, где в качестве существенной характеристики речевого сигнала выступает КК. Установлено, что между коэффициентами корреляции речевого сигнала рассчитанными по экспериментальным данным г;э и математической модели г" существует тесная корреляционная связь. При этом модуляционная полигармоническая математическая модель вокализованного речевого сегмента соответствует экспериментальным данным с вероятностью принятия правильной гипотезы Р>99,9%(при/<г6000 Гц; У =200).

Изложены теоретические основы методов аналитического расчета весовых коэффициентов дня меры различимости в виде взвешенной суммы квадратов ошибок, наиболее часто используемой для аутентификации по голосу:

(62)

1=1

где Л" и ^ - значения 1-го параметра математической модели речевого сигнала эталонного и аутентифицируемого дикторов соответственно; ¿У/ - весовые коэффициенты. Приведены три метода, основанные на: 1) критерии минимизации расстояния между "своими" и эталоном; 2) критерии максимизации расстояния между "чужими" и эталоном; 3) критерии минимаксного расстояния между "своими", "чужими" и эталоном соответственно. Последний, обобщённый метод основан на нахождении минимума обобщенной результирующей меры:

о¥ = ЯГ+иг = ¿к")2 + Е^Г , (63)

Р=1 Я!=1

а критерии для аналитического расчета a>i представлен в виде:

min[Df]= min t№ + , (64)

aI a> Lp=I

где Df и - результирующие меры априори "своих" и "чужих" относительно эталона (для определённой парольной фразы); Р и М - соответственно количество реализаций парольной фразы для "своих" и "чужих" дикторов; ¿+1 L+1 ¿+1

/=1 /=1 м

У\,р = (/о" ~ /<Г )2 : %т ~ (/о^Г ~ /о* Г* 5 (Ol = Ct)f \

Г£+1., - VZp-и?)2-, Пш,т - {UZÍ-U?)-2, ФЫ s

где /оМ/Г,...да и /oT'^iT'-'^ - параметры ма-

тематической модели парольной фразы соответственно для эталонной реализации эталонного диктора, />-й реализации эталонного диктора и /я-й реализации неэталонных дикторов.

Приравняв к нулю первые производные по a>¡, получим систему из L линейных уравнений, которую необходимо решить относительно весов a¡ с учётом их нормировки на единицу. Точка экстремума, определяемая вторыми производными - это минимум. Элементы матриц А и В, входящих в Асо = В, (66)

где о - матрица-столбец размером Lx 1с элементами <o¡, 1 = 2,L + \; А -

квадратная матрица L х L, с элементами

и

АУ.'=Х(У1р-Уьр^\.р - У1,р"> + - П,,т)(П\,т -11,т); Л/ = 2,1 + 1; (67)

р=1 т=1

В - матрица-столбец Ь х 1, с элементами

я м

В1 = ^т.т^.т-п^), (68)

/7=1 т=1

определяют решение линейной системы относительно й>/, которое в матричной форме имеет вид:

(о = А_,В. (69)

При использовании критерия (64), необходимо иметь, как минимум, три реализации - две произнесенные эталонным диктором на этапе обучения системы и одну реализацию аугентифицируемого диктора. Однако, для набора статистики, достаточной для объективного отражения свойств когорты, отвечающей за формирование адекватных оценок весов а/, необходимо иметь, как правило, не три исходные реализации, а гораздо больше.

С целью устранения вышеуказанного недостатка были предложены несколько новых мер различимости для задач аутентификации (верификации и идентификации) личности по голосу применительно к полигармонической математической модели речевого сигнала. Одной из мер различимости, показавшей свою высокую эффективность в практических расчётах, является мера между аутентифицируемыми и эталонными существенными параметрами:

£> =

/7

¿К-иг? + +(*/7? №-иг?, (70)

V /о

/= 1

где 5/7 = Д/0ЭТ//7 ~ относительный интервал вариации ЧОТ; ДС//Т - абсолютный интервал вариации амплитуд несущих гармоник.

Разработанная методика оценки начального значения порога А для критерия принятия решения о результате аутентификации базируется на учёте вариаций существенных параметров и определяется точностью метода, на основе которого вычислен тот или иной параметр. Даны рекомендации по использованию значений Д> в конкретных случаях.

На основе новых методов разработаны и проанализированы алгоритмы функционирования систем аутентификации личности по голосу, включающие в себя способ, устройство и блок-схемы алгоритмов работы систем верификации и идентификации по голосу на основе математической модели с полигармоническими модулирующим и несущим колебаниями. Отдельно рассмотрены вопросы оценки качества работы систем аутентификации личности по голосу.

При аутентификации по голосу на основе полигармонической математической модели с существенными параметрами^, иь..., 1/10, с применением меры различимости (70) для 100 различных дикторов средняя вероятность равных ошибок (для различного вокализованного речевого материала) при верификации составила 0,2-0,8%, а при идентификации - 0,5-1,5%. Время аутентификации оказалось равным примерно 1 с.

Таким образом, ключевым положением работы, обеспечивающим предметное решение задач аутентификации, является представление сегментов речевого сигнала с помощью математических моделей, заданных в явном виде.

Разработанная методология построения математических моделей речевых сигналов применительно к аутентификации по голосу позволяет конструктивно разработать модель в рамках детерминированного или стохастического подхода, а также рассчитать существенные параметры речевых сигналов, на основе которых принимается решение об аутентификации.

В заключении подведены итоги диссертационной работы в целом, сформулированы следующие основные результаты и выводы.

1. Требованиям к математическим моделям речевых сигналов с точки зрения обеспечения высокой надёжности систем аутентификации по голосу: высокой точности, минимальному количеству относительно просто рассчитываемых существенных параметров, в наибольшей мере удовлетворяют модели, основанные на физических принципах акустической теории речеобразования и описывающие вокализованные сегменты речи.

2. Разработанная на основе данного подхода модуляционная импульсная полигармоническая математическая модель речевого сигнала позволяет компактно описать вокализованные сегменты речи, учитывая временную вариацию спектра речевого сигнала соответствующей модуляцией амплитуд и частот модели. Существенными параметрами математической модели речевого сигнала, характеризующими уникальность голоса, являются усреднённая частота основного тона и амплитуды несущих гармоник.

3. Характеристикой речевого сигнала для расчёта существенных параметров его детерминированной математической модели служит автокорреляционная функция, а для стохастической модели - функция корреляции, число значимых отсчетов которых следует выбирать исходя из уровня ослабления автокорреляционной функции относительно её наибольшего значения и из условия захождения функции корреляции в доверительные границы нулевых значений, полученных по методу Бартлеггта. По номеру отсчёта функции корреляции, начиная с которого она заходит в границы Бартлетга, можно также проводить разграничение речевых сегментов на вокализованные и невокализованные.

4. Выделение модулирующего колебания полигармонической математической модели речевого сигнала осуществляется путём пропускания огибающей речевого сигнала через фильтр нижних частот.

5. Получены аналитические выражения характеристик модуляционной импульсной полигармонической математической модели: автокорреляционной функции и спектральной плотности энергии (при детерминированном подходе), функции корреляции и спектральной плотности мощности (при стохастическом подходе), которые могут эффективно применяться для аутентификации по голосу на основе вокализованных участков речи.

6. Случайная компонента вокализованных сегментов речевого сигнала корректно описывается случайными начальными фазами модулирующего и несущего колебаний модуляционной полигармонической математической модели. Введение в данную модель аддитивной компоненты в виде ограниченного по полосе частот белого шума обеспечивает приемлемую точность учета шумовой составляющей речевого сигнала, а использование в качестве аддитивной компоненты процесса авторегрессии дает высокую точность описания речевых сегментов с различной степенью вокализации, определяемой отношением "сигнал-шум".

7. Разработан обобщённый метод аналитического расчета амплитуд несущих гармоник модуляционных полигармонических математических моделей речевого сигнала. В явном виде выражена зависимость точности оценки амплитуд несущих гармоник от математической модели и ее ошибки.

8. Разработанный метод оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели обеспечивает относительную погрешность оценки частоты основного тона менее 0,3%, при шаге частотной сетки А/1-0,1 Гц, причем для большинства практических случаев в оценочной модели достаточно трёх гармоник несущего колебания. Снижение относительной погрешности измерения частоты основного тона в два раза и более может быть

достигнуто предварительной фильтрацией речевого сигнала цифровым полосовым фильтром с нижней и верхней частотами среза/с^гас= 60 Гц и /с^рх =340 Гц.

9. На основе метода максимального правдоподобия разработаны способы получения оптимальной оценки частоты основного тона для известных и неизвестных амплитуд и начальных фаз несущих гармоник. Дисперсия оценки определяется отношением "сигнал-шум", длительностью вокализованного сегмента, количеством и значениями амплитуд несущих гармоник в оценочной модели.

10. Оценки частоты основного тона и амплитуд несущих гармоник используются в методе оценки формантных частот, синтезированном на основе полигармонической модели речевого сигнала.

11. Для проверки адекватности математической модели речевого сигнала по сопоставлению коэффициентов корреляции математической модели и речевого сигнала разработана методика, использующая критерий соответствия на основе коэффициента множественной корреляции.

12. Для задач аутентификации личности по голосу разработаны методы аналитического расчёта весовых коэффициентов меры различимости между существенными параметрами математической модели эталонного и аутентифици-руемого диктора в виде взвешенной суммы квадратов ошибок, две новые эффективные меры различимости речевых сигналов для математической модели в виде импульса АМ-колебания с несколькими несущими частотами, методика вычисления начального значения порога меры различимости для критерия принятия решения, учитывающая значения доверительных интервалов вариаций существенных параметров.

13. Разработанные алгоритмы аутентификации диктора по голосу в системах разграничения доступа обеспечивают среднюю вероятность равных ошибок верификации и идентификации соответственно 0,2-0,8% и 0,5-1,5%, что позволяет повысить надёжность и эффективность работы синтезированных на их основе систем обеспечения информационной безопасности.

Основное содержание диссертации изложено в следующих работах: Публикации в журналах из перечня ВАК:

1. Ролдугин C.B. Модели речевых сигналов для идентификации личности по голосу / C.B. Ролдугин, А.Н. Голубинский, Т.А. Вольская // Радиотехника. -2002. - № 11.-С. 79-81.

2. Голубинский А.Н. Модель речевого сигнала в виде импульса АМ-колебания с несколькими несущими для верификации личности по голосу / А.Н. Голубинский // Системы управления и информационные технологии. - 2007. -№4.-С. 86-91.

3. Голубинский А.Н. К вопросу о разработке математической модели речевого сигнала на основе особенностей его характеристик / А.Н. Голубинский // Системы управления и информационные технологии. - 2008. - № 2. - С. 80-85.

4. Голубинский А.Н. Физическая интерпретация математической модели речевого сигнала, в виде импульса АМ-колебания с несколькими несущими частотами, на основе принципов речеобразования / А.Н. Голубинский // Системы управления и информационные технологии. - 2008. - № 3. - С. 78-82.

5. Голубинский А.Н. Обработка речевого сигнала на основе модели в виде импульса АМ-колебания с несколькими несущими частотами / А.Н. Голубинский И Телекоммуникации. - 2008. - № 12. - С. 13-17.

6. Голубинский А.Н. Методика расчета параметров модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами, для случая модуляции суммой гармоник / А.Н. Голубинский // Системы управления и информационные технологии. - 2008. - № 4.1. - С. 156-161.

7. Голубинский А.Н. Общий случай модели речевого сигнала в виде суммы квазидетерминированного случайного процесса и белого шума с ограниченным по полосе частот спектром / А.Н. Голубинский И Системы управления и информационные технологии. - 2009. -№ 1. - С. 95-100.

8. Голубинский А.Н. Метод аналитического расчета параметров математических моделей речевого сигнала, построенных на основе теории модуляции / А.Н. Голубинский // Системы управления и информационные технологии. -

2009. -№ 1.3.-С. 332-336.

9. Голубинский А.Н. Критерии соответствия математической модели речевого сигнала экспериментальным данным / А.Н. Голубинский // Системы управ-ленияи информационные технологии.-2009.-№2.1.-С. 113-118.

Ю.Голубинский А.Н. Метод оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции / А.Н. Голубинский // Телекоммуникации. - 2009. -№ 8. - С. 16-21.

11 .Голубинский А.Н. Математическая модель речевого сигнала, основанная на аппроксимации спектра набором постоянных составляющих в соответствующих полосах частот / А.Н. Голубинский // Безопасность информационных технологий. - 2009. - № 2. - С. 12-18.

12.Голубинский А.Н. Стохастические модели речевого сигнала, и их частные случаи в виде квазидетерминированных и детерминированных моделей / А.Н. Голубинский // Телекоммуникации. - 2009. -№ 9. - С. 15-20.

13.Голубинский А.Н. Выделение модулирующего колебания из огибающей речевого сигнала / А.Н. Голубинский, О.М. Булгаков // Системы управления и информационные технологии. - 2009. - № 4.1. - С. 130-134.

14.Голубинский А.Н. Аутентификация личности по вокализованным участкам речи на основе частоты основного тона и амплитуд кратных гармоник в области первых двух формант / А.Н. Голубинский, О.М. Булгаков // Системы управления и информационные технологии. - 2009. - № 4.1. - С. 134-139.

15.Голубинский А.Н. Методика проверки на адекватность математической модели речевого сигнала экспериментальным данным / А.Н. Голубинский // Информационные технологии. - 2009. - № 12. - С. 54-59.

16.Голубинский А.Н. Метод расчета весовых коэффициентов меры различимости речевого сигнала, моделируемого импульсом АМ-колебания с несколькими несущими / А.Н. Голубинский, О.М. Булгаков // Телекоммуникации. —

2010.-№ 1.-С. 10-15.

17.Булгаков О.М. Оценка частоты основного тона речевого сигнала методом максимального правдоподобия при известном распределении амплитуд и начальных фаз гармоник сложного несущего колебания / О.М. Булгаков, А.Н. Голубинский // Вестник ВИ МВД России. - 2010. - № 2. - С. 154-162.

18.Голубинский А.Н. Оценка частоты основного тона речевого сигнала при априори неизвестных амплитудах и начальных фазах полигармонического несущего колебания / А.Н. Голубинский // Вестник ВИ МВД России. - 2010. -№3.-С. 110-117.

Монография:

19.Голубинский А.Н. Математические модели речевых сигналов для верификации и идентификации личности по голосу / А.Н. Голубинский, О.М. Булгаков. - Воронеж: Воронежский государственный университет, 2010. - 364 с.

Учебное пособие:

20.Голубинский А.Н. Теория цифровой обработки сигналов: Учеб. пособие / А.Н. Голубинский, C.B. Ролдугин, И.В. Лазарев. - Воронеж: ВИ МВД России, 2009. -132 с.

Патент на изобретение:

21.Патент на изобретение № 2399102 РФ, 8 G 10 L 17/00. Способ и устройство автоматической верификации личности по голосу / А.Н. Голубинский -№ 2008143852/09; Заявл. 05.11.2008; Опубл. 10.09.2010; Бюл. № 25.

Регистрация программы:

22.Голубинский А.Н. Расчет существенных параметров математической модели речевого сигнала, построенной на основе модуляционной теории, применительно к задачам аутентификации личности по голосу / Государственный фонд алгоритмов и программ (Москва), регистрационный номер 50200901049 от 16.11.09г.

Статьи в научных периодических изданиях:

23.Ролдугин C.B. Расчет параметров авторегрессионной модели речевого сигнала / C.B. Ролдугин, А.Н. Голубинский // Вестник ВИ МВД России. - 2001.

- С. 28-33.

24.Голубинский А.Н. К вопросу о модели речевого сигнала для верификации личности по голосу / А.Н. Голубинский // Вестник ВИ МВД России. - 2005. -С. 29-34.

25.Голубинский А.Н. Алгоритмы оценки частоты основного тона и обертонов речевого сигнала / А.Н. Голубинский // Вестник ВИ МВД России. - 2006. -С. 15-19.

26.Голубинский А.Н. Расчет параметров модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими / А.Н. Голубинский // Вестник ВИ МВД России. - 2006. - С. 20-24.

27.Голубинский А.Н. Спектральный анализ речевого сигнала и его модели в виде импульса АМ-колебания с несколькими несущими / А.Н. Голубинский // Вестник ВИ МВД России. - 2006. - С. 25-29.

28.Голубинский А.Н. Методы аппроксимации экспериментальных данных и построения моделей / А.Н. Голубинский // Вестник ВИ МВД России. - 2007.

- № 2. - С. 138-143.

29.Голубинский А.Н. Расчет частоты основного тона речевого сигнала на основе полигармонической математической модели / А.Н. Голубинский II Вестник ВИ МВД России. - 2009. - № 1. - С. 81-89.

Депонированная рукопись:

ЗО.Голубннский А.Н. Разработка математической модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами, применительно к задаче верификации личности по голосу / А.Н. Голубинский; Воронежский институт МВД России. - Воронеж, 2008. - 29 с. - Деп. в ВИНИТИ 09.07.08, №591-В2008.

Отчеты о НИР:

31.0рганизация радиосвязи в подразделениях ОВД и Внутренних войск МВД России в условиях проведения спецопераций: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: А.Н. Лукин. — № ГР 01032904. - Воронеж, 2003. - 253 с. - А.Н. Голубинский: раздел 4 -С. 224-245.

32. Синтез алгоритмов различения звуковых и оптических сигналов: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: А.Н. Лукин. - № ГР 01021801. - Воронеж, 2004. - 91 с. - А.Н. Голубинский: раздел 1 - С. 10-39.

33.Обработка звуковых и оптических сигналов: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: А.Н. Лукин. - № ГР 01068673. - Воронеж, 2008. - 50 с. - А.Н. Голубинский: разделы 1-8 - С. 5-50.

34.Совершенствование средств низовой УКВ радиосвязи: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: Ю.К. Ро-гачев. - № ГР 03095963. - Воронеж, 2009. - 140 с. - А.Н. Голубинский: разделы 1,2-С. 12-79.

Материалы международных и всероссийских конференций:

35.Сумин В.И. Анализ основных параметров функционирования охранных систем / В.И. Сумин, А.Н. Голубинский // Всероссийская конференция "Интеллектуальные информационные системы": Сборник трудов. - Воронеж: ВГТУ, 1999.-С. 193-194.

36.Ролдугин C.B. Расчет параметров стохастической модели речевого сигнала / C.B. Ролдугин, А.Н. Голубинский // VI Международная открытая научная конференция "Современные проблемы информатизации в технике и технологиях": Сборник трудов. - Воронеж: ВЭПИ, 2001. - С. 25.

37.Маршаков В.К. Идентификация речевого сигнала на основе его авторегрессионной модели / В.К. Маршаков, C.B. Ролдугин, А.Н. Голубинский // VII Международная научно-техническая конференция "Радиолокация, навигация, связь". - Т. 1. - Воронеж: ВНИИС, 2001. - С. 266-272.

38.Голубинский А.Н. Формирование тестового речевого сигнала, используемого для исследования блоков ЦСЧ / А.Н. Голубинский, C.B. Ролдугин // Всероссийская научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. - Воронеж: ВИ МВД России, 2003. - С. 35-36.

39.Голубинский А.Н. К вопросу об одной модели речевого сигнала для верификации личности по голосу / А.Н. Голубинский, C.B. Ролдугин // Всероссийская научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. - Воронеж: ВИ МВД России, 2005. - С. 26-27.

40.Голубинский А.Н. Анализ результатов идентификации личности по голосу "на слух" 1 А.Н. Голубинский // V Всероссийская научно-практическая конференция "Охрана, безопасность и связь": Сборник материалов. - Воронеж: ВИ МВД России, 2005. - С. 65-66.

41. Голубинский А.Н. Алгоритм оценки частоты основного тона речевого сигнала корреляционным методом / А.Н. Голубинский II Международная научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. - Воронеж: ВИ МВД России, 2006. - С. 39-40.

42. Голубинский А.Н. Алгоритм оценки частоты основного тона и обертонов речевого сигнала спестральным методом / А.Н. Голубинский // Международная научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. - Воронеж: ВИ МВД России, 2006. - С. 41^2.

43.Голубинский А.Н. О расчете параметров модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими / А.Н. Голубинский // Международная научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. - Воронеж: ВИ МВД России, 2006.-С. 43-44.

44.Голубинский А.Н. О модели речевого сигнала для верификации личности по голосу / А.Н. Голубинский // XV Международная научная конференция "Информатизация и информационная безопасность правоохранительных органов": Сборник трудов. - М.: Академия управления МВД России, 2006. - С. 341-346.

45.Голубинский А.Н. О методах аппроксимации экспериментальных данных и построения моделей / А.Н. Голубинский // Международная научно-практическая конференция "Обеспечение общественной безопасности в Центральном федеральном округе Российской Федерации": Сборник материалов. - Ч. 4. - Воронеж: ВИ МВД России, 2007. - С. 74-77.

46.Голубинский А.Н. Об интерпретации модели речевого сигнала, в виде импульса АМ-колебания с несколькими несущими частотами, на основе физических принципов речеобразования / А.Н. Голубинский // Международная научно-практическая конференция "Преступность в России: состояние, проблемы предупреждения и раскрытия преступлений": Сборник материалов. -Ч. 2. - Воронеж: ВИ МВД России, 2008. - С. 75-80.

47.Голубинский А.Н. Разработка алгоритма верификации личности по голосу на основе математической модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами / А.Н. Голубинский, Ю.А. Лазукин // Международная научно-практическая конференция "Обеспечение законности и правопорядка в странах CHF': Сборник материалов. - Ч. 2. -Воронеж: ВИ МВД России, 2009. - С. 56-62.

48.Голубинский А.Н. Перспективы разработок математических моделей речевых сигналов / А.Н. Голубинский И XV Международная открытая научная конференция "Современные проблемы информатизации в экономике и обеспечении безопасности": Сборник трудов. - Воронеж: "Научная книга", 2010.-С. 68-71.

49.Голубинский А.Н. Точность метода оценки частоты основного тона речевого сигнала при использовании полигармонической математической модели /

А.Н. Голубинский, О.М. Булгаков // VII Международная научно-практическая конференция "Актуальные вопросы современной науки": Сборник научных трудов. - Таганрог, 2010. - С. 219-224.

50.Голубинский А.Н. Оценка вокализации речевого сигнала на основе его коэффициента корреляции / А.Н. Голубинский, О.М. Булгаков //1 Международная научно-практическая конференция "Наука и современность": Сборник материалов. - Ч. 2. - Новосибирск, 2010. - С. 83-88.

51.Голубинский А.Н. К расчету параметров математических моделей речевых сигналов, построенных на основе модуляционной теории / А.Н. Голубинский, О.М. Булгаков // XVI Международная научно-техническая конференция "Радиолокация, навигация, связь". - Т. 1. - Воронеж: НПФ "Саквоее", 2010.-С. 69-77.

52.Голубинский А.Н. Модифицированный метод оценки частоты основного тона речевого сигнала на основе полигармонической модели при использовании предварительной фильтрации / А.Н. Голубинский, О.М. Булгаков // XVI Международная научно-техническая конференция "Информационные системы и технологии": Сборник материалов. - Нижний Новгород, 2010. - С. 14-15.

53.Голубинский А.Н. Обобщенная математическая модель речевого сигнала в виде импульса колебания с амплитудно-частотной модуляцией / А.Н. Голубинский, О.М. Булгаков // Общероссийская научная конференция "Актуальные вопросы современной науки и образования": Сборник материалов в научном журнале "В мире научных открытий". -№3. - Красноярск, 2010. - С. 62-65.

54.Голубинский А.Н. Мера различимости для верификации личности по голосу на основе модуляционной полигармонической математической модели / А.Н. Голубинский, О.М. Булгаков // Международная научно-техническая конференция "Наука и образование - 2010": Сборник материалов. - Мурманск, 2010.-С. 168-171.

55.Голубинский А.Н. К вопросу о потенциальной точности оценки частоты основного тона речевого сигнала при оптимальной временной обработке / А.Н. Голубинский, О.М. Булгаков II Международная научно-практическая конференция "Общественная безопасность, законность и правопорядок в III тысячелетии": Сборник материалов. - Ч. 3. - Воронеж: ВИ МВД России, 2010.-С. 19-24.

56.Голубинский А.Н. Система аутентификации личности по голосу на основе математической модели речевого сигнала / А.Н. Голубинский, О.М. Булгаков // XXIII Международная научная конференция "Математические методы в технике и технологиях": Сборник трудов. - Т. 6. - Саратов, 2010. - С. 19-22.

57.Голубинский А.Н. Метод оценки формантных частот, основанный на полигармонической математической модели речевого сигнала / А.Н. Голубинский, О.М. Булгаков И XXII сессия Российского акустического общества: Сборник трудов XXII сессии РАО. -Т. 3. - М.: ГЕОС, 2010. - С. 32-35.

Подписано в печать 15.11.2010. Формат 60x84 '/к,. Усл.-печ. л. 1,86. Тираж 100 экз. Заказ Ks 261.

Типография Воронежского института МВД России. 394065, г. Воронеж, пр. Патриотов, 53.

Оглавление автор диссертации — доктора технических наук Голубинский, Андрей Николаевич

ВВЕДЕНИЕ

ГЛАВА 1. МЕТОДЫ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ В ЗАДАЧАХ АУТЕНТИФИКАЦИИ ЛИЧНОСТИ

1.1. Системы биометрической аутентификации, особенности идентификации и верификации личности по голосу.

1.2. Речевая наука, речевые технологии и системы биометрической аутентификации по голосу.

1.3. Подходы к построению математических моделей речевых сигналов в задачах аутентификации личности по голосу.

Выводы к главе

ГЛАВА 2. МЕТОД СИНТЕЗА И АНАЛИЗА МАТЕМАТИЧЕСКИХ

МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ ТЕОРИИ

МОДУЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ ДЕТЕРМИНИРОВАННОГО ПОДХОДА

2.1. Детерминированная математическая модель речевого сигнала, сущность метода синтеза и анализа на основе модуляционной теории.

2.2. Математическая модель речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами.

2.3. Математическая модель речевого сигнала в виде амплитудно-модулированного импульса с полигармоническими несущим и модулирующим колебаниями.

2.4. Математическая модель речевого сигнала, основанная на аппроксимации спектра набором постоянных составляющих в соответствующих полосах частот.

2.5. Обобщенная математическая модель речевого сигнала в виде импульса колебания с амплитудно-частотной модуляцией.

2.6. Метод выделения модулирующего колебания из огибающей речевого сигнала.

Выводы к главе 2.

ГЛАВА 3. МЕТОД СИНТЕЗА И АНАЛИЗА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ ТЕОРИИ

МОДУЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ СТОХАСТИЧЕСКОГО ПОДХОДА

3.1. Обоснование и сущность метода синтеза и анализа стохастической модуляционной математической модели речевого сигнала.

3.2. Математическая модель речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами и случайными начальными фазами.

3.3. Математическая модель речевого сигнала в виде амплитудно-модулированного импульса с полигармоническими несущим и модулирующим колебаниями при случайных начальных фазах.

3.4. Математическая модель речевого сигнала в виде суммы квазидетерминированного случайного процесса и белого шума с ограниченным по полосе частот спектром.

3.5. Математическая модель речевого сигнала в виде суммы квазидетерминированного случайного процесса и процесса авторегрессии.

3.6. Модель авторегрессии с постоянными коэффициентами для вокализованного речевого сегмента после предварительной фильтрации.

Выводы к главе 3.

ГЛАВА 4. МЕТОДЫ РАСЧЕТА ПАРАМЕТРОВ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА, ПОСТРОЕННЫХ НА ОСНОВЕ ТЕОРИИ МОДУЛЯЦИИ

4.1. Метод и характеристики аналитического расчета амплитудных параметров математических моделей речевого сигнала, построенных на основе теории модуляции.

4.2. Методы оценки частоты основного тона речевого сигнала

4.2.1. Алгоритмы оценки частоты основного тона речевого сигнала модифицированных корреляционного и спектрального методов.

4.2.2. Метод, алгоритм и характеристики оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели

4.2.3. Оценка частоты основного тона и её характеристики методом максимального правдоподобия при известных амплитудах и начальных фазах несущих гармоник.

4.2.4. Оценка частоты основного тона и её характеристики методом максимального правдоподобия при неизвестных амплитудах и начальных фазах несущих гармоник.

4.3. Метод и характеристики оценки формантных частот речевого сигнала на основе его полигармонической математической модели.

Выводы к главе 4.

ГЛАВА 5. ПРОВЕРКА АДЕКВАТНОСТИ МАТЕМАТИЧЕСКОЙ МОДЕЛИ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ

ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

5.1. Методика проверки математической модели речевого сигнала на адекватность экспериментальным данным

5.2. Методы аналитического расчета весовых коэффициентов меры различимости.

5.2.1. Метод на основе критерия минимизации расстояния между "своими" и эталоном.

5.2.2. Метод на основе критерия максимизации расстояния между "чужими" и эталоном.

5.2.3. Метод на основе критерия минимаксного расстояния между "своими", "чужими" и эталоном соответственно.

5.3. Меры различимости речевых сигналов и оценка порога принятия решения для задач аутентификации личности по голосу применительно к полигармонической математической модели.

5.4. Алгоритмы функционирования систем аутентификации личности по голосу.

5.4.1. Способ, алгоритмы и устройство системы верификации личности по голосу на основе математической модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами

5.4.2. Оценка качества работы системы верификации личности по голосу.

5.4.3. Система идентификации личности по голосу, основанная на полигармонической математической модели речевого сигнала.

Выводы к главе 5.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Голубинский, Андрей Николаевич

Актуальность темы; В настоящее время аутентификация личности по голосу широко применяется в системах . . контроля доступа к информационным или: материальным ресурсам на основе биометрических параметров. Системы аутентификации личности по голосу обладают рядом преимуществ относительно других биометрических систем, основными из которых являются сравнительно небольшая стоимость и относительная простота практической реализации.

Повышение надежности систем аутентификации личности по голосу является актуальной научно-технической задачей. Точность идентификации (установление) и верификации (подтверждение) личности по голосу в существенной мере определяется адекватностью математической модели,, описывающей речевой сигнал. Увеличение точности в' рамках существующих методов описания речевых сигналов приводит, как правило, к значительному увеличению количества параметров модели, что влечет за собой увеличение систематической, ошибки , и времени обработки поступивших данных, а также снижение значимости таких параметров для характеристики индивидуальных особенностей голоса человека. Высокий уровень, ошибок систем аутентификации по голосу обуславливается также трансформацией голоса вследствие болезней, особых эмоциональных состояний, возрастных изменении и т. д.

Используемые в диссертации теоретико-методологические посылки основываются^ на трудах отечественных и зарубежных исследователей в области акустической теории речеобразования и обработки речевых сигналов, таких как:Т. Фант, М.Л. Сапожков, Дж. Фланаган, A.A. Пирогов, Б. Атал, Дж. До-дингтон, JI.P. Рабинер, Б. Гоулд, Р.В. Шафер, Д.Д. Маркел, Ä.X. Грей, С., Jle-, винсон, Б.М. Лобанов, Л.А. Чистович, H.F. Загоруйко, Г.С. Рамишвили, Ю.Н. Прохоров, В.11. Сорокин, В.Г. Михайлов, Т.К. Винцюк, В.И. Галунов, В.Р: Женило, Р.К./Потапова, A.B. Аграновский, С.В: Дворянкин, A.A. Петровский, В. Чу, Р.Г. Голдберг, С.Л. Коваль и др. '

Обоснованию'подходов к разработке математических моделей речевых сигналов посвящено сравнительно немного научных публикаций. Это объясняется, прежде всего, сложной полиинформативной и полимодуляционной структурой.речевого сигнала, а .также большим количеством информации, используемой при анализе и синтезе математических моделей речевых сигналов. Однако, сегодня прогресс микроэлектроники наряду с применением цифровых технологий преобразования речевых сигналов дает возможность оперировать большими объёмами информации, обрабатывая её с приемлемой скоростью. При этом зачастую цифровые речевые технологии опережают речевую науку.

Наибольшую точность описания имеют математические модели, соответствующие физике процессов, поэтому при разработке математической модели речевого сигнала необходима её адекватность акустической теории речеобразования. Таким образом, повышение надежности проектируемых систем аутентификации возможно за счет разработки и использования новых методов построения адекватных математических моделей речевых сигналов.

В последнее время проявляется интерес к созданию математических моделей речевых сигналов, основывающихся на теории модуляции в рамках детерминированного подхода и характеризующихся небольшим количеством существенных параметров речевых сигналов и высокой точностью их описания. Однако общие свойства параметров речевых сигналов, описанных -такими моделями, практически не исследованы.

Таким образом, повышение надежности систем верификации и идентификации личности по голосу и развитие голосовых систем разграничения доступа определяются решением крупной актуальной научной проблемы - разработки теоретических основ анализа и синтеза высокоточных адаптивных математических моделей речевых сигналов с минимальным количеством высокоинформативных физически интерпретируемых существенных параметров применительно к задачам голосовой аутентификации.

Работа выполнена в рамках госбюджетных НИР кафедры радиотехники Воронежского института МВД России.

Цель и задачи исследования. Целью работы является разработка методов построения математических моделей речевых сигналов для верификации и идентификации личности по голосу.

Для достижения данной цели в работе решены следующие задачи:

1. Разработка концепции построения математических моделей речевых сигналов для задач голосовой аутентификации на основе акустической теории речеобразования.

2. Разработка методов синтеза и анализа математических моделей речевого сигнала на основе , теории модуляции с использованием I детерминированного и стохастического подходов.

3. Разработка обобщённого метода аналитического расчета амплитуд несущих гармоник полигармонических математических моделей речевого сигнала.

4. Разработка высокоточных методов оценки частоты основного тона и формантных частот речевого сигнала.

5. Разработка способа проверки адекватности математической модели речевого сигнала экспериментальным данным.

6. Разработка мер различимости для верификации и идентификации личности по голосу и методов аналитического расчета их весовых коэффициентов.

7. Создание и реализация алгоритмов функционирования систем верификации и идентификации личности по голосу.

Методы исследования. При решении поставленных задач использовались современные аналитические и вычислительные методы теории вероятностей и математической статистики, теории случайных процессов, теории речеобразования, математического анализа, цифровой обработки сигналов, теории оптимального приёма, кластерного анализа, численные методы, методы программирования и моделирования на ЭВМ.

Научная новизна работы заключается в том, что в ней впервые:

1. Дана систематизация математических моделей речевых сигналов для задач аутентификации по голосу и сформулирована концепция их построения в явном виде, включающая в себя систему признаков модели и требований к ее структуре, существенным параметрам и методам их определения и оценки точности их расчетов, методам проверки модели на адекватность и мерам различимости.

2. Для задач аутентификации по голосу на основе теории модуляции разработаны и апробированы методы синтеза и анализа детерминированных и стохастических импульсных полигармонических математических моделей речевого сигнала с получением аналитических выражений для характеристик моделей.

3. Разработаны методы выделения модулирующего колебания и аналитического расчета амплитуд несущих колебаний полигармонических математических моделей речевого сигнала, построенных на основе теории модуляции, с оценкой точности расчетных параметров в аналитическом виде. 4: Разработана математическая! модель речевого сигнала в виде суммы квазидетерминированной компоненты с полигармоническими модулирующим и несущим колебаниями и процесса авторегрессии. 5. Разработаны методы и-алгоритмы и получены выражения для оценки точности вычисления'частоты основного тона речевого сигнала на основе полигармонической математической модели: по минимуму невязки коэффициентов корреляции, а'также по формированию оптимальной оценки при известных и неизвестных амплитудах и начальных фазах несущих гармоник.

6. Разработан метод оценки формантных частот вокализованных участков речи на основе полигармонической математической модели.

7. Получен способ проверки адекватности математической модели речевого сигнала экспериментальным данным по коэффициентам корреляции при использовании критерия соответствия на базе коэффициента множественной корреляции.

8; Для задач аутентификации личности по голосу разработаны, новые эффективные меры различимости-речевых сигналов для математической модели в виде импульса АМ-колебания с несколькими несущими частотами, методика вычисления начального значения порога меры различимости для критерия; принятия решения. . . ''

9. Разработаны алгоритмы и синтезированы структурные схемы устройств аутентификации диктора по голосу, обеспечивающие повышение точности систем разграничения доступа! . Практическая значимость исследования заключается» в перспективах' расширенного применения разработанных методов синтеза и анализа математических моделей речевых сигналов в практических системах аутентификации по голосу/ Разработанные структурные схемы устройств и алгоритмы реализации систем верификаций и идентификации личности по голосу, могут быть положены в основу реальных технических устройств, работающих в составе систем разграничения доступа. Полученные в работе методы высоко-, точных оценок существенных параметров моделей речевых сигналов призваны повысить, надёжность систем голосовой идентификации и верификации самого широкого спектра их практического приложения. ' Внедрение научных результатов. Полученные в диссертации результаты использовались при выполнении научно-исследовательских работ в Воронежском институте МВД России, внедрены в научно-исследовательский процесс в ОАО «Концерн «Созвездие» (г. Воронеж), в ОАО «ВНИИ «Вёга» (г. Воронеж), в ФГНИИЦ РЭБ ОЭСЗ Министерства обороны России (г. Воронеж),, в- Военной академии связи (г. Санкт-Петербург), в ЗАО «Учебно-методический центр при Санкт-Петербургском государственном университете телекоммуникаций им; проф. М.А. Бонч-Бруевича» (г. Санкт-Петербург). Кроме того, результаты внедрены в учебный процесс в Воронежском институте МВД России и в практическую деятельность ЗАО «ВТБ 24».

На защиту выносятся:

1. Метод синтеза и анализа математических моделей речевого сигнала на основе теории модуляции с использованием детерминированного подхода.

2. Метод синтеза и анализа математических моделей речевого сигнала на-основе теории модуляции с использованием стохастического подхода.

3. Обобщенный метод аналитического расчета; и выражения для оценки точности амплитудных параметров математических моделей речевого сигнала, построенных на основе теории модуляции.

4. Метод и характеристики оценки частоты основного тона речевого сигнала на основе полигармонической математической модели по минимуму невязки коэффициентов корреляции. • ,

5. Метод и характеристики оценки частоты основного тона речевого сиг-, нала при неизвестных амплитудах и начальных фазах несущих гармоник, основывающийся на полигармонической математической модели.

6. Метод оценки формантных частот вокализованных участков речи на основе полигармонической математической модели.,

7. Меры различимости речевых сигналов для аутентификации личности по голосу на основе математической модели, в виде импульса АМ-колебания с несколькими несущими частотами. ; • • ' .' .■■

8. Алгоритмы функционирования и структурные схемы устройств аутентификации диктора по голосу в системах разграничения доступа.

Апробация; работы; Основные положения диссертационной работы . докладывались;и обсуждались на Международных и Всероссийских научно-технических конференциях, таких как: VII, X, XI, XVI международная научно-техническая- конференция "Радиолокация, навигация, связь" (Воронеж, 2001, 2004, 2005, 2010); XV международная научная: конференция "Информатизация и информационная безопасность правоохранительных органов" (Москва, 2006); . Международная научно-практическая конференция "Современные проблемы борьбы с преступностью" (Воронеж,: 2006); Международная научно-практическая конференция "Обеспечение общественной безопасности в Центральном федеральном округе Российской Федерации" (Воронеж, 2007); .Международная научно-практическая конференция "Преступность в России: состояние, проблемы предупреждениями раскрытия преступлений" (Воронеж, 2008); Международная научно-практическая конференция^ "Обеспечение законности и правопорядка в странах СНГ" (Воронеж, 2009); Международная научно-практическая конференция "Общественная безопасность, законность й правопорядок в III тысячелетии" (Воронеж*. 2010); XXIII международная научная конференция "Математические методы в технике и технологиях" (Саратов, 2010); XVI международная научно-техническая. конференция "Информационные системы и технологии" (Нижний Новгород, 2010); VII международная научно-практическая конференция; "Актуальные вопросы современной науки" (Таганрог, 2010); Международная научно-техническая конференция "Наука1 и образование - 2010" (Мурманск, 2010); I международная научно-практическая конференция "Наука и современность" (Новосибирск, 2010); VI международная; открытая научная конференция "Современные проблемы информатизации в технике и технологиях" (Воронеж, 2001); XV международная; открытая: научная конференция "Современные проблемы; информатизации в экономике: и обеспечении безопасности" (Воронеж, 2010); Всероссийская конференция "Интеллектуальные; информационные системы" (Воронеж, 1999);. Всероссийская; научно-практическая конференция "Современные проблемы борьбы с преступностью" (Воронеж, 2003, 2005); V, VII всероссийская;: научно-практическая конференция "Охрана^ безопасность и связь',' (Воронеж, 2005, 2009); Общероссийская научная конференция "Актуальные вопросы^ современной науки и образования" (Красноярск, 2010); XXII сессия; "Российского акустического общества" (Москва,,2010). . ' '

Публикации. По теме диссертации опубликовано 66 научных работ, из них 1 монография, 1 учебное пособие, 18 статей в ведущих рецензируемых научных журналах, которые входят в утвержденный ВАК Минобрнауки. РФ «Перечень, периодических научных и научно-технических изданий, выпус- / каемых в- Российской-Федерации,, в! которых рекомендуется публикация основных результатов^ диссертации на соискание' ученой. степени доктора наук», 1 патент на изобретение, 1 рукопись, депонированная в ВИНИТИ, 1 регистрация программы в ФАП, 4 заключительных отчета о НИР, 11 статей и материалы 28 докладов на международных и всероссийских научных, научно-технических и научно-практических конференциях [335-400].

Личный вклад автора. Основные научные результаты получены автором лично. Из 66 работ по теме диссертации 34 написаны без соавторов. В научных работах, выполненных в соавторстве, автору принадлежат основные идеи по методам построения и расчета параметров математических моделей речевых сигналов, постановке экспериментов и анализу их результатов, а также алгоритмы и структурные схемы устройств аутентификации.

Структура и объём работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы, включающего 400 наименований. Общий объём диссертации составляет 403 страницы машинописного текста, включая 53 рисунка и 19 таблиц.

Заключение диссертация на тему "Модели речевых сигналов для аутентификации личности по голосу"

Выводы к главе 5

1. Разработанная методика проверки адекватности математической модели речевого сигнала, использующая критерий соответствия на основе коэффициента множественной корреляции, обеспечивает корректность оценки соответствия модели экспериментальным данным по сопоставлению коэффициентов корреляции математической модели и речевого сигнала.

2. Повышению точности решения практических задач аутентификации по голосу с использованием полигармонических моделей речевого сигнала способствует повышение частоты дискретизации до 8 кГц при разрядности квантования 16 бит. Дальнейшее повышение частоты дискретизации и разрядности квантования не приводит к заметному уменьшению ошибки модели.

3. Разработаны методы аналитического расчёта весовых коэффициентов меры различимости между существенными параметрами математической модели эталонного и аутентифицируемого диктора в виде взвешенной суммы квадратов ошибок посредством:

- минимизации расстояния между "своими" и эталоном;

- максимизации расстояния между "чужими" и эталоном;

- обеспечения минимаксного расстояния между "своими", "чужими" и эталоном соответственно.

Регуляризация неустойчивого решения системы линейных уравнений в первых двух методах обеспечивается использованием псевдообратной матрицы в характеризации по Муру-Пенроузу.

4. На основе систематизации известных мер различимости предложены две новые эффективные меры различимости речевых сигналов для математической модели в виде импульса АМ-колебания с несколькими несущими частотами в задачах аутентификации личности по голосу.

5. Разработана методика вычисления начального значения порога меры различимости для критерия принятия решения о результате аутентификации, учитывающая значения доверительных интервалов вариаций существенных параметров.

6. Разработанные алгоритмы аутентификации диктора по голосу в системах разграничения доступа, основанные на полигармонической математической модели речевого сигнала, обеспечивают среднюю' вероятность равных ошибок верификации и идентификации соответственно 0,2-0,8% и 0,5-1,5%.

7. Синтезированные структурные схемы устройств верификации и идентификации позволяют повысить надёжность и эффективность работы систем обеспечения информационной безопасности.

ЗАКЛЮЧЕНИЕ

Основным содержанием диссертации является разработка и исследование импульсных детерминированных и стохастических математических моделей с полигармоническими модулирующим и несущим колебаниями применительно к аутентификации личности по голосу, а также синтез на их основе алгоритмов и устройств голосовой аутентификации в системах контроля и управления доступом к информационным и материальным ресурсам. С помощью сочетания физического и статистического подходов к изучению речевых сигналов удалось преодолеть ряд трудностей в построении их моделей с малым количеством существенных параметров и достичь прогресса в изучении особенностей речевого сигнала, которые присущи акустической волне, генерируемой и излучаемой речевым трактом человека.

На основе полученных в диссертации результатов можно сформулировать следующие выводы.

Требованиям к математическим моделям речевых сигналов с точки зрения обеспечения высокой надёжности систем аутентификации по голосу: высокой точности, минимальному количеству относительно просто рассчитываемых существенных параметров, в наибольшей мере удовлетворяют модели, основанные на физических принципах акустической теории речеобра-зования и описывающие вокализованные сегменты речи.

Разработанная на основе данного подхода модуляционная импульсная полигармоническая математическая модель речевого сигнала позволяет компактно описать вокализованные сегменты речи, учитывая временную вариацию спектра речевого сигнала соответствующей модуляцией амплитуд и частот модели. Существенными параметрами математической модели речевого сигнала, характеризующими уникальность голоса, являются усреднённая частота основного тона и амплитуды несущих гармоник.

Характеристикой речевого сигнала для расчёта существенных параметров его детерминированной математической модели служит автокорреляционная функция, а для стохастической модели - функция корреляции, число значимых отсчетов которых следует выбирать исходя из уровня ослабления автокорреляционной функции относительно её наибольшего значения и из условия захождения функции корреляции в доверительные границы нулевых о значений, полученных по методу Бартлетта. По номеру отсчёта функции корреляции, начиная с которого она заходит в границы Бартлетта, можно также проводить разграничение речевых сегментов на вокализованные и не-вокализованные.

Выделение модулирующего колебания полигармонической математической модели речевого сигнала осуществляется путём пропускания огибающей речевого сигнала через фильтр нижних частот.

Получены аналитические выражения характеристик модуляционной импульсной полигармонической математической модели: автокорреляционной функции и спектральной плотности энергии (при детерминированном подходе), функции корреляции и спектральной плотности мощности (при стохастическом подходе), которые могут эффективно применяться для аутентификации по голосу на основе вокализованных участков речи.

Случайная компонента вокализованных сегментов речевого сигнала корректно описывается случайными начальными фазами модулирующего и несущего колебаний модуляционной полигармонической математической модели. Введение в данную модель аддитивной компоненты в виде ограниченного по полосе частот белого шума обеспечивает приемлемую точность учета шумовой составляющей речевого сигнала, а использование в качестве аддитивной компоненты процесса авторегрессии дает высокую точность описания речевых сегментов с различной степенью вокализации, определяемой отношением "сигнал-шум". Разработан обобщённый метод аналитического расчета амплитуд несущих гармоник модуляционных полигармонических математических моделей речевого сигнала. В явном виде выражена зависимость точности оценки амплитуд несущих гармоник от математической модели и ее ошибки.

Разработанный метод оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели обеспечивает относительную погрешность оценки частоты основного тона менее 0,3%, при шаге частотной сетки А/=0,1 Гц, причем для большинства практических случаев в оценочной модели "достаточно трёх гармоник несущего колебания. Снижение относи

366 тельной погрешности измерения частоты основного тона в два раза и более может быть достигнуто предварительной фильтрацией речевого сигнала цифровым полосовым фильтром с нижней и верхней частотами среза /снриж =60 Гц и /сврерх =340 Гц.

На основе метода максимального правдоподобия разработаны способы получения оптимальной оценки частоты основного тона для известных и неизвестных амплитуд и начальных фаз несущих гармоник. Дисперсия оценки определяется отношением "сигнал-шум", длительностью вокализованного сегмента, количеством и значениями амплитуд несущих гармоник в оценочной модели.

Оценки частоты основного тона и амплитуд несущих гармоник используются в методе оценки формантных частот, синтезированном на основе полигармонической модели речевого сигнала.

Для проверки адекватности "математической модели речевого сигнала по сопоставлению коэффициентов корреляции математической модели и речевого сигнала разработана методика, использующая критерий соответствия на основе коэффициента множественной корреляции.

Для задач аутентификации личности по голосу разработаны методы аналитического расчёта весовых коэффициентов меры различимости между существенными параметрами математической модели эталонного и аутенти-фицируемого диктора в виде взвешенной суммы квадратов ошибок, две новые эффективные меры различимости речевых сигналов для математической модели в виде импульса АМ-колебания с несколькими несущими частотами, методика вычисления начального значения порога меры различимости для критерия принятия решения, учитывающая значения доверительных интервалов вариаций существенных параметров.

Разработанные алгоритмь1 аутентификации диктора по голосу в системах разграничения доступа обеспечивают среднюю вероятность равных ошибок верификации и идентификации соответственно 0,2-0,8% и 0,5-1,5%, что позволяет повысить надёжность и эффективность работы синтезированных на их основе систем обеспечения информационной безопасности.

Библиография Голубинский, Андрей Николаевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Агапиев А.Н. Идентификация пользователей вычислительных систем на основе современных речевых технологий / А.Н. Агапиев, В. И. Милашен-ко. 2009. -http://www.bnti.ru/showart.asp?aid=220&lvl=02.09.10.

2. Аграновский A.B. Метод текстонезависимой идентификации диктора на основе индивидуальности произношения гласных звуков / A.B. Аграновский, Д.А. Леднов, С.А. Репалов // Акустика и прикладная лингвистика. Ежегодник РАО. 2002. - Вып. 3. - С. 103-115.

3. Аграновский A.B. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов / A.B. Аграновский, Д.А. Леднов. М: Радио и связь, 2004. - 150 с.

4. Азаров И.С. Вычисление мгновенных гармонических параметров речевого сигнала / И.С. Азаров, A.A. Петровский // Речевые технологии. 2008. -№ 1. - С. 67-77.

5. Айвазян С.А. Прикладная статистика: Исследование зависимостей / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. М.: Финансы и статистика, 1985. -487 с.

6. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности / С.А. Айвазян, М.В. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. М.: Финансы и статистика, 1989. - 607 с.

7. Айвазян С.А. Прикладная статистика: Основы моделирования и первичная обработка данных / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. М.: Финансы и статистика, 1983. - 471 с.

8. Айфичер Э.С. Цифровая обработка сигналов: практический подход / Э.С. Айфичер, Б.У. Джервис. -М.: Изд. дом "Вильяме", 2004. 992 с.

9. Акустика: Справочник / А.П. Ефимов, A.B. Никонов, М.А. Сапожков, В.И. Шоров; Под. ред. М.А. Сапожкова. 2-е изд. - М.: Радио и связь, 1989. - 336 с.

10. Ю.Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание / А. Ал-берт. М.: Наука, 1977. - 224 с.

11. П.Амосов A.A. Вычислительные методы для инженеров / A.A. Амосов, Ю.А. Дубинский, Н.В. Копченкова. М.: Высш. шк., 1994. - 544 с.

12. Амосов A.A. Скалярно-матричное дифференцирование и его применение кконструктивным задачам теории связи / A.A. Амосов, В.В. Колпаков // Проблемы передачи информации. 1972. — Т.8. - Вып.1. - С. 3-15.

13. Анго А. Математика для электро- и радиоинженеров / А. Анго. М.: Наука, 1965.- 780 с.

14. Н.Андерсон Т. Введение в многомерный статистический анализ / Т. Андерсон. М.: Физматгиз, 1963. - 500 с.

15. Андерсон Т. Статистический анализ временных рядов / Т. Андерсон. М.: Мир, 1976.-775 с.

16. Атал Б. Автоматическое опознавание дикторов по голосам / Б. Атал // ТИИЭР. 1976. - Т. 64. - № 4. - С. 48-66.

17. Ахиезер Н.И. Лекции по теории аппроксимации / Н.И. Ахиезер. М.: Наука. Гл. ред. физ.-мат. лит., 1965. -406 с.

18. Бабкин A.B. Особенности применения технологии TD-PSOLA для модификации характеристик вокальных аллофонов / A.B. Бабкин // Труды международной конференции "Диалог 2000". Ml, 2000. - Т. 2: «Прикладные проблемы». - С. 33-40.

19. Бабкин В .В. Помехоустойчивый. выделитель основного тона речи / В.В. Бабкин // 7-я международная конференция и выставка "Цифровая обработка сигналов и её'применение". М., 2005.

20. Базара М. Нелинейное программирование: Теория и алгоритмы / М. Базара, . К. Шетти. -М.: Мир, 1982. 583 с.

21. Баронии С.П. Автокорреляционный метод выделения основного тона речи. Пятьдесят лет спустя7 С.П. Баронин // Речевые технологии. 2008. - № 2.-с.з-12.

22. Баскаков С.И. Радиотехническиё цепи и сигналы / С.И. Баскаков. М:: Высшая школа, 2005. - 462 с.

23. Ьатороев К.Б. Аналогии и модели в познании7 К.Б. Батороев. Новосибирск: Наука, 1981. - 320с.

24. Ьеклемешев Д.В. Дополнительные главы линейной алгебры / Д.В. Бекле-мешев. М.: Наука. Гл. ред. физ.-мат. лит., 1983. -336 с. ■

25. Беллман Р. Введение в теорию матриц / Р. Беллман; Под ред. В.Б. Лидско го. М.: Наука, 1976. - 352 с.

26. Бендат Дж. Прикладной анализ случайных данных / Дж. Бен дат, А. Пирсол. М.: Мир, 1989. - 540 с.

27. Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов / Р. Блейхут. -М.: Мир, 1989.-448 с.

28. Бокс Дж. Анализ временных рядов. Прогноз и управление / Дж. Бокс, Г. Дженкинс. -М.: Мир, 1974. Вып. 1. - 408 с.

29. Болл P.M. Руководство по биометрии / P.M. Болл, Дж.Х. Коннел, Ш. Пан-канти, Н.К. Рахта, Э.У. Сеньор. -М.: Техносфера, 2007. 368 с.

30. Боровков A.A. Курс теории вероятностей / A.A. Боровков. М.: Наука, 1976.-480 с.

31. Боровков A.A. Математическая статистика / A.A. Боровков. М.: Наука, 1984.-472 с.

32. Брейсуэлл Р. Преобразование Хартли / Р. Брейсуэлл. -М.: Мир, 1990. 175 с.

33. Бронштейн И.Н. Справочник по математике для инженеров и учащихся ВТУЗов / И.Н. Бронштейн, К.А. Семендяев. М.: Наука. Гл. ред. физ.-мат. лит., 1980.-976 с.

34. Ван Трис Г. Теория обнаружения, оценок и модуляции / Г. Ван Трис. М.: Сов. радио, 1972. -Т.1.-744 с.

35. Ван Трис Г. Теория обнаружения, оценок и модуляции / Г. Ван Трис. М.: Сов. радио, 1975. - Т.2. - 344 с.

36. Варакин JI.E. Системы связи с шумоподобными сигналами / Л.Е. Варакин. -М.: Радио и связь, 1985.-384 с.

37. Вахитов Я.Ш. Теоретические основы электроакустики и электроакустическая аппаратура / Я.Ш. Вахитов. М.: Искусство, 1982. - 415 с.

38. Введение в цифровую фильтрацию / Под ред. Р. Богнера, А. Константини-диса. М.: Мир, 1976. - 216 с.

39. Величкин А.И. Передача аналоговых сообщений по цифровым каналам связи / А.И. Величкин. М.: Радио и связь, 1983. - 240 с.

40. Величкин А.И. Теория дискретной передачи непрерывных сообщений / А.И. Величкин. М.: Сов. радио, 1970. - 296 с.

41. Вемян Г.В. Передача речи в сетях электросвязи / Г.В. Вемян. М.: Радио и связь, 1985.-272 с.

42. Веников В.А. Теория подобия и моделирования / В.А. Веников. М.: Высшая школа, 1986 - 480с.

43. Вентцель Е.С. Теория вероятностей / Е.С. Вентцель. М.: Высшая школа, 1998.-576 с.

44. Винцюк Т.К. Анализ распознавание и интерпретация речевых сигналов / Т.К. Винцюк. К.: Наукова думка, 1987. - 264 с.

45. Вокодерная телефония / Под ред. A.A. Пирогова. М.: Связь, 1974. - 535 с.

46. Воробьев В.И. Теория и практика вейвлет-преобразования / В.И. Воробьев, В.Г. Грибунин. СПб.: ВУС, 1999. - 204 с.

47. Галунов В.И. Верификация и идентификация говорящего: Обзорная статья / В.И. Галунов. 2002. - 14 с. http://auditech.ru/article/verobz.doc

48. Галунов В.И. Современные речевые технологии: Обзорная статья / В.И. Галунов. 1999. - 6 с. http://auditech.ru/article/SpecomRus.doc

49. Галяшина Е.И. Судебная фоноскопическая экспертиза / Е.И. Галяшина. -М.: Триада, 2001. 262 с.

50. Галяшина Е.И. Теория и практика судебной экспертизы / Е.И. Галяшина, Смотров С.А., С.Б. Шашкин, Э.П. Молоков. СПб.: Питер, 2003. - С. 9-212.

51. Гантмахер Ф.Р. Теория матриц / Ф.Р. Гантмахер. М.: ФИЗМАТ ЛИТ, 2004. - 560 с.

52. Герасимов A.B. Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала: автореф. дис. канд. физ.-мат. наук: 05.13.01 / A.B. Герасимов. Нижний Новгород, 2007. - 20 с.

53. Гитлин В.Б. Совместный алгоритм выделения основного тона речи по методам GS и автокорреляционной функции спектра /В.Б. Гитлин, Д.А. Лузин // Речевые технологии. 2008. - № 3. - С. 39^49.

54. Глазунов A.C. Компьютерное распознавание человеческих лиц / A.C. Глазунов // Открытые системы. 2000. - № 3. - С. 43-47.

55. Гмурман В.Е. Теория вероятностей и математическая статистика / В.Е. Гмурман. М.: Высшая школа, 1998. - 479 с.

56. Гнеденко Б.В. Курс теории вероятностей / Б.В. Гнеденко. М.: Наука, 1967.-496 с.

57. Голд Б. Цифровая обработка сигналов / Б. Голд, Ч. Рэйдер. М.: Сов. радио, 1973.-368 с.

58. Гольденберг Л.М. Цифровая обработка сигналов: Справочник / Л.М. Голь-денбёрг, Б.Д. Матюшкин, Н.П. Поляк. М.: Радио и связь, 1985. - 312 с.

59. Гольденберг JI.M. Цифровая обработка сигналов / Л.М. Гольденберг, Б.Д. Матюшкин, М.Н. Поляк. М.: Радио и связь, 1990. - 256 с.

60. Горелик А.Л. Метода распознавания / А.Л. Горелик, В.А. Скрипкин. М.: Высшая школа, 1984. - 222 с.

61. Горелик Г.С. Колебания и волны / Г.С. Горелик. М.: Физматгиз, 1959. - 572 с.

62. Гроссман К. Нелинейное программирование на основе безусловной минимизации / К. Гроссман, A.A. Каплан. М.: Наука, 1981. - 183 с.

63. Гудонавичюс Р.В. Распознавание речевых сигналов по их структурным свойствам / Р.В. Гудонавичюс, П.П. Кемешис, А.Б. Читавичюс. Л.: Энергия, 1977. - 479 с.

64. Гусев М.Н. Расчет и измерение качества речевых сигналов / М.Н. Гусев, М.В. Дегтярев. СПб.: «ГеликонПлюс», 2008. - 276 с.

65. Дворянкин C.B. Обоснование критериев эффективности защиты речевой информации от утечки по техническим каналам / C.B. Дворянкин, Ю.К. Макаров, A.A. Хорев // Защита информации. INSIDE. 2007. № 2. - С. 18-25.

66. Десятчиков< A.A. Метод обработки дистанционной биометрической информации в системах контроля и управления доступом: автореф. дис. канд. техн. наук: 05.13.11 / A.A. Десятчиков. М., 2007. - 24 с.

67. Дженкинс Г. Спектральный анализ и его приложения / Г. Дженкинс, Д. Ватте. -М.: Мир, 1971. Вып.1. - 316 с.

68. Дженкинс Г. Спектральный анализ и его приложения / Г. Дженкинс, Д. Ватте. М.: Мир, 1972. - Вып.2. - 286 с.717Добёшй И. Дёсять' лекций по вейвлетам / И. Добеши. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. 464 с.

69. Доддингтон Дж.Р. Распознавание дикторов: Идентификация людей по голосу / Дж.Р. Доддингтон // ТИИЭР. 1985. Т. 73. - № 11. - С. 129-146.

70. Женило В.Р. Компьютерная фоноскопия / В.Р. Женило. М.: Академия МВД России, 1995. - 208 с.

71. Зубов Г.Н. Состояние и перспективы голосовой биометрии (по итогам участия ЦРТ в Voice Biometrics Conference 2007) / Г.Н. Зубов, М.В. Хитров. -http://speechpro.ru/fíles/publications/biometry.doc

72. Иберла К. Факторный анализ / К. Иберла. М.: Статистика, 1980. - 398 с.

73. Иванов А.И. Нейросетевые алгоритмы биометрической идентификации личности. — Серия «Нейрокомпьютеры и их применение». Кн. 15. -М.: Радиотехника, 2004. С. 22-50.

74. Идентификация лиц по фонограммам русской речи на автоматизированной системе «Диалект». Пособие для экспертов / Н.Ф. Попов, А.Н. Линьков, Н.Б. Кураченкова, Н.В. Байчаров; Под ред. A.B. Фесенко. М.: Войсковая часть 34435, 1996. - 102 с.

75. Исакович М.А. Общая акустика / М.А. Исакович. М.: Наука, 1973. - 495 с.

76. Ищенко С.М. Обобщенная модель слухового механизма анализа и выделения периодичности сложных звуков. Блок-схема модели. / С.М. Ищенко // Акустический журнал. 1998. Т. 44. - № 2. - С. 226-231.

77. Ищенко С.М. Слуховой анализ периодичности звука и его огибающей: математическая модель / С.М. Ищенко // Акустический журнал. 2004. Т. 50. - № 4. - С. 562-567.

78. Калач A.B. Введение в сенсорный анализ / A.B. Калач, А.Н. Зяблов, В.Ф. Селеменев. Воронеж: Научная книга, 2007. - 164 с.

79. Катков О.Н. Автоматизация процесса верификации абонентов АСУ с речевым управлением: автореф. дис. канд. техн. наук: 05.13.06 / О.Н. Катков. Орел, 2008.-20 с.

80. Квасов А.Н. Модель голосообразования и анализ речевого сигнала в норме и при патологии: автореф. дис. канд. техн. наук: 05.13.18 / А.Н. Квасов. -Томск, 2007. 20 с.

81. Кендалл М. Многомерный статистический анализ и временные ряды / М. Кендалл, А. Стьюарт. М.: Наука, 1976. - 736 с.

82. Кендалл М. Статистические выводы и связи / М. Кендалл, А. Стьюарт. -М.: Наука, 1973.-900 с.

83. Кибзун А.И. Стохастическое управление динамическими системами / А.И. Кибзун.-М.: МАИ, 1991. 57 с.

84. Киселев А.Н. Оценка параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа: автореф. дис. канд. техн. наук: 05.13.187 А.Н. Киселев.-Тула, 2005. 20 с.

85. Корн Г. Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн. Mi: Наука,! 973. - 832 с.

86. Крамер Г. Математические Методы статистики/ Г. Крамер. М.: Мир, 1975.-648 с. : ' . ' : "

87. Крамер Г. Стационарные случайные процессы / Г. Крамер, М. Лидбет-тер.- М.: Мир, 1969.-398 с.

88. Красильников В.А. Введение в акустику / В.А. Красилышков. М.: Изд-во МГУ, 1992.- 152 с. 7

89. Крауфорд Ф. Волны / Ф. Крауфорд. М.: Наука, 1976. - 527 с.

90. Купер Дж. Вероятностные методы анализа сигналов и систем / Дж. Купер, К. Макгиллем. М.: Мир, 1989. - 376 с.

91. Курочкин С.Н. Проблемы создания многоуровневой системы распознавания речи / С.Н. Курочкин, А.Г. Бродин // Автоматизация и управление в машиностроении. 2009. - № 2. -http://magazine.stankin.ru/arch/n02/automation/art05.html

92. Ланкастер П. Теория матриц / П. Ланкастер. М.: Наука. Гл. ред. физ.-мат. лит., 1978.-280 с.

93. Лебедев А.Н. Моделирование в научно-технических исследованиях /

94. A.Н. Лебедев. М.: Радио и связь, 1989. - 224 с.

95. Левин Б.Р. Вероятностные модели и методы в системах связи и управления / Б.Р. Левин, В. Шварц. М.: Радио и связь, 1985. - 312 с.

96. Левин Б.Р. Теоретические основы статистической радиотехники / Б.Р. Левин. -М.: Радио и связь, 1989. 656 с.

97. Левин К.Е. Исследование алгоритмов обработки речевых сигналов при распознавании команд в системах компьютерной телефонии: автореф. дис. канд. техн. наук: 05.12.13 / К.Е. Левин. Владимир, 2006. - 19 с.

98. Леднов Д.А. Разработка и исследование математических моделей обработки и распознавания речи на основе множественных баз признаков: автореф. дис. канд. техн. наук: 05.13.16 /Д.А. Леднов. -Ростов-на-Дону, 1999.

99. Леонов A.C. К анализу резонансных частот речевого тракта / A.C. Леонов,

100. B.Н. Сорокин // Информационные процессы. 2007. Т. 7. - № 4. - С. 386-400.

101. Леонов A.C. Артикуляционный ресинтез фрикативных / A.C. Леонов, И.С. Макаров, В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. 2004. Т. 4. - № 2. - С. 141-159.

102. Лепендин Л.Ф. Акустика / Л.Ф. Лепендин. М.: Высшая школа, 1978. -448 с.

103. Липцер Р.Щ. Статистика случайных процессов / Р.Ш. Липцер, А.Н. Ширяев. М.: Наука, 1974. - 696 с.

104. Лобанов Б.М; Компьютерный синтез и клонирование речи / Б.М. Лобанов, Л;И! Цирульник. Минск: Белорус. Наука, 2008.-337 с.

105. Лобанов Б.М: О развитии речевых технологий в. Бел ору сии / Б.М. Лобанов // Речевые технологии. 2008. - № 1'. - С. 49-59.

106. Лукин А.Н. Радиофизические методы измерения параметров сложных источников излучения: дис. докт. физ.-мат. наук: 01.04.03 / А.Н. Лукин. -Воронеж, 1998.-415 с.

107. Макаров И.С. Резонансы разветвленного речевого тракта с податливыми стенками / И.С. Макаров, В.Н. Сорокин // Акустический журнал. 2004. Т. 50.-№3.-С. 389-396.

108. Максимов М.И. Оптимальные и субоптимальные алгоритмы обработки речевых сообщений при наличии аддитивных искажений:, автореф. канд. техн. наук: 05.1 ЗЛ 7/ М.И. Максимов. Воронеж, 2009. -24 с.

109. Маюсоул Дж. Векторное квантование при кодировании речи / Дж. Мак-хоул, С. Рукос, Г. Гиш//ТИИЭР, 1985.-T. 73, №11, С. 19-61.

110. Мапков М.А. Моделирование и разработка комплекса программ идентификации голосового сообщения по фонемной составляющей и индивидуальным характеристикам голоса: автореф. дис. канд-. техн. наук: 05.13.18 / М.А. Малков. М., 2009: - 22 с.

111. Малла С. Вейнлеты в обработке сигналов/ С. Малла. -Mí*: Мир, 2005. 671 с.

112. Мандель И;Д: Кластерный- анализ /. И.Д. Мандель. М: Финансы и статистика, 1988; -176 с.

113. Маркел Дж. Линейное предсказание речи / Дж. Маркел, А.Х. Грей. М.: Связь, 1980. -308 с.

114. Маркин Д:Н. Разработка метода и технических средств компандирова-ния?спектров речевых сигналов: автореф. дис. канд. техн. наук: 05.11.18 / Д.Н. Маркин. СПб., 2008. - 22 с.

115. Маркин Д.Н. Результаты новых исследований на основе модуляционной теории звуковых сигналов / Д.Н. Маркин, В.К. Уваров // В сб. Факультету аудиовизуальной техники 75 лет. - СПб.: Изд. СПбГУКиТ, 2005. - С. 36-41.

116. Марпл СЛ. Цифровой спектральный анализ и его приложения / СЛ. Марпл. М.: Мир, 1990. - 584 с.

117. Математика: Энциклопедия / Под ред. Ю.В. Прохорова. -М.: Большая Российская энциклопедия, 2003. 845 с.

118. Медведев М.С. Фонемная сегментация речевого сигналах использованием вейвлет-преобразования / М;С. Медведев // Труды V Всероссийской' конференции по математическому моделированию и информационным технологиям. Новосибирск, 2004. С. 256-262.

119. Методические рекомендации по практическому использованию программы SIS при работе с речевыми сигналами / Центр речевых технологий. -СПб., 1997. -394 с.

120. Методы автоматического распознавания речи / Под ред. У.А. Ли. М.: Мир, 1983.-Кн. 1. -328 с. . , - ;

121. Михайлов В.Г. Измерение параметров"речи / В.Г. Михайлов, Л.В! Златоустова; Под ред. М.А. Сапожкова. М.: Радио и связь, 1987. - 168 с.

122. Морз Ф. Колебания и звук / Ф. Морз. M.-JL: ГИТТЛ, 1949. - 496 с.

123. Морозов В.П. Искусство резонансного пения. Основы резонансной теории и техники / В.П. Морозов. 2-е изд. - М.: Московская государственная консерватория им. П.И. Чайковского, 2008. - 590 с.

124. Назаров М.В. Методы цифровой обработки и передачи речевых сигналов /М.В. Назаров, Ю.Н. Прохоров. -М.: Радио и связь, 1985. 176 с.

125. Нечитайло С. Виртуальные вокалисты / С. Нечитайло // «Музыкальное оборудование», http://www.muzoborudovanie.ru/org/mo/mo.php, 2004, 11.

126. Новиков Л.В. Основы вейвлет-анализа сигналов / Л.В. Новиков. — СПб.: ИАнП РАН, 1999.-152 с.

127. Оппенгейм А. Цифровая обработка сигналов / А. Оппенгейм, Р. Шафер. 2-е изд. - М.: Техносфера, 2007. - 856 с.

128. Основы цифровой обработки сигналов: Курс лекций / А.И. Солонина, Д.А. Улахович, С.М. Арбузов, Е.Б. Соловьева. 2-е изд. - СПб.: БХВ-Петербург, 2005. - 768 с.

129. Отнес Р. Прикладной анализ временных рядов. Основные методы / Р. Отнес, Л. Эноксон. М.: Мир, 1982. - 428 с.

130. Очков В.Ф. Mathcad 8 Pro для студентов и инженеров / В.Ф. Очков. -М.: КомпьютерПресс, 1999. 523 с.

131. Павловец А.Н. Гармоническая модель речевого сигнала: определение параметров и их квантование / А.Н. Павловец, П. Зубрыцки, A.A. Петровский // Сборник докладов БГУИР. 2007. - № 4. - С. 21-25.

132. Павловец А.Н. Квантование огибающей спектра в вокодере, основанном на декомпозиции речевого сигнала на периодическую и апериодическую составляющие / А.Н. Павловец, A.A. Петровский // Цифровая обработка сигналов. -2005.- № 3. С. 13-21.

133. Панов М.В. Русский язык / М.В. Панов // Русский язык. 2002. - № 26. -http://rus. 1 september.ru/article.php?ID=200202610

134. Патент на изобретение №2161336 США: МПК 7 Gl 0L17/00. Система для верификации говорящего / Р.Дж. Мэммон, К. Фаррел, М. Шарма, Н. Дивэнг, 3. Занг, X. Ассалех, Х.-Ш. Леу № 98100221/09; заявл. 06.06.96; опубл. 27.12.2000.

135. Патент на изобретение № 2184399 РФ: МПК 7 G10L15/00. Способ выделения основного тона из речевого сигнала / A.B. Аграновский, Д.А. Лед-нов, A.M. Потапенко, С.А. Репалов, П.М. Сулима № 2000124181/09; заявл. 22.09.2000; опубл. 27.08.02.

136. Патент на изобретение №2230375 РФ: МПК 7 G 10 L 15/00, G 10 L 17/00. Метод распознавания диктора и устройство для его осуществления / П.В. Лабутин, А.Н. Раев, С.Л. Коваль № 2002123509/09; заявл. 03.09.02; опубл. 10.06.04.

137. Патент на изобретение № 2297676 РФ: МПК 7 G10L15/02. Способ распознавания слов в слитной речи / A.B. Аграновский, Д.А. Леднов, М.Ю. Зул-карнеев, Р.Э. Арутюнян-№ 2005108961/09; заявл. 30.03.05; опубл. 10.09.06.

138. Патент на изобретение № 2351023 РФ: МПК 7 Gl0L17/00. Способ верификации пользователя в системах санкционированного доступа / В.Н. Сорокин, А.И. Цыплихин -№ 2007116231/09; заявл. 02.05.07; опубл. 27.03.09.

139. Перов П.В. Прикладная спектральная теория оценивания / П.В. Перов. -М.: Наука, 1982.-432 с.

140. Петровский A.A. Низкоскоростной вокодер с моделью речеобразования "гармоники + шум" / A.A. Петровский, В.В. Серков // Цифровая обработка сигналов. 2002. - № 2. - С. 2-12.

141. Попов В.П. Основы теории цепей / В.П. Попов. М.: Высшая школа, 1998.-575с.

142. Применение цифровой обработки сигналов / Под ред. A.B. Оппенгейма. -М.: Мир, 1980.-312 с.

143. Прохоров A.A. Биометрия на службе безопасности / A.A. Прохоров // Компьютер-пресс. 2000. - №3. - С. 68-73.

144. Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов / Ю.Н. Прохоров. М.: Радио и связь, 1984. - 240 с.

145. Рабинер Л.Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор / Л.Р. Рабинер // ТИИЭР.1989. Т. 77. №2. С. 86 - 120.

146. Рабинер JI.P. Теория и применение цифровой обработки сигналов / JI.P. Рабинер, Б. Гоулд. -М.: Мир, 1978. 848 с.

147. Рабинер JI.P. Цифровая обработка речевых сигналов / JI.P. Рабинер, Р.В. Шафер. М.: Радио и связь, 1981. - 496 с.

148. Радиотехнические цепи и сигналы / Д.В. Васильев, М.Р. Витоль, Ю.Н. Горшенков и др.; Под ред. К.А. Самойло. М.: Радио и связь, 1982. - 528 с.

149. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу / Г.С. Рамишвили. М.: Радио и связь, 1981. - 224 с.

150. Pao С.Р. Линейные статистические методы и их применения / С.Р. Pao. — М.: Наука. Гл. ред. физ.-мат. лит., 1968. 548 с.

151. Репалов С.А. Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи: автореф. дис. канд. физ.-мат. наук: 05.13.18 / С.А. Репалов. Ростов-на-Дону, 2003. - 23 с.

152. Римский-Корсаков A.B. Электроакустика / A.B. Римский-Корсаков. -М.: Связь, 1973.-272 с.

153. Рихтер С.Г. Кодирование и передача речи в цифровых системах подвижной радиосвязи / С.Г. Рихтер. М.: Горячая линия - Телеком, 2009. - 304 с.

154. Ржевкин С.Н. Курс лекций по теории звука / С.Н. Ржевкин. М.: Изд-во МГУ, 1960.-336 с.

155. Розенберг А. Автоматическая верификация диктора: Обзор / А. Розен-берг // ТИИЭР. 1976. Т. 64. - № 4. - С. 66-79.

156. Ронжин А.Л. Методы и программные средства многоканальной дистанционной обработки речи и их применение в интерактивных многомодальных приложениях: автореф. дис. докт. техн. наук: 05.13.11 / А.Л. Ронжин. -СПб., 2010.-34 с.

157. Ронжин А.Л. Речевой и многомодальный интерфейсы / А.Л. Ронжин, A.A. Карпов, И.В. Ли. -М.: Наука, 2006. 173 с.385

158. Рытов С.М. Введение в статистическую радиофизику / С.М. Рытов. М.: Наука, 1976.-Ч. 1.-494 с.

159. Рытов С.М. ведение в статистическую радиофизику / С.М. Рытов, Ю.А. Кравцов, В.И. Татарский. М.: Наука, 1978. - Ч. 2. - 463 с.

160. Самарский A.A. Введение в численные методы / A.A. Самарский. М.: Наука, 1982.-273 с.

161. Самарский A.A. Математическое моделирование: Идеи. Методы. Примеры / A.A. Самарский, А.П. Михайлов. М.: Наука. Физматлит, 1997. - 320 с.

162. Сапожков М.А. Вокодерная связь / М.А. Сапожков, В.Г. Михайлов. -М.: Радио и связь, 1983. 247 с.

163. Сапожков М.А. Речевой сигнал в кибернетике и связи / М.А. Сапожков. М.: Связьиздат, 1963. - 452 с.

164. Сапожков М.А. Электроакустика/ М.А. Сапожков. -М.: Связь, 1978. -272 с.

165. Сапунов Г.В. Система автоматического распознавания речевых команд для параллельных архитектур: автореф. дис. канд. техн. наук: 05.13.05 / Г.В. Сапунов. -М., 2006. 28 с.

166. Свириденко В.А. Системы верификации и идентификации диктора от SPIRIT Corp. / В.А.Свириденко, П.В.Мартынович. http://www.dancom.ru/rus/AIA/Archive/RUIISPIMTDOKLADR.pdf

167. Серапин Г.К. Некоторые возможности интерполяционного восстановления участков сигнальной функции / Г.К. Серапин // Доклад на Всесоюзном совещании секции речи Комиссии по акустике АН СССР. Апрель. 1956.

168. Сергиенко А.Б. Цифровая обработка сигналов / А.Б. Сергиенко. — 2-е изд. СПб.: Питер, 2006. - 751 с.

169. Серебренников М.Г. Выявление скрытых периодичностей / М.Г. Серебренников, A.A. Первозванский. М.: Наука. Гл. ред. физ.-мат. лит., 1965. -244 с.

170. Сизиков B.C. Устойчивые методы обработки результатов измерений / B.C. Сизиков. СПб.: Спецлит, 1999. - 240 с.

171. Скаляров О.П. Динамический хаос и фракталы в крупномасштабной временной организации акустического речевого сигнала / О.П. Скаляров // Труды Нижегородской акустической научной сессии. Нижний Новгород: ННГУ, 2002. - С. 401-403.

172. Скаляров О.П. Нелинейная модель акустического голосового источника / О.П. Скаляров // Акустический журнал. 1997. Т. 43. - № 5. - С. 675-680.

173. Скаляров О.П. Фракталы и крупномасштабная временная структура акустического речевого сигнала и музыки / О.П. Скаляров // Электронный журнал «Техническая акустика», http://webcenter.ru/~eeaa/ejta/, 2004, 21.

174. Скляров О.П. Элементы теории ритма речи на основе физической феноменологии его нарушений: автореф. дис. докт. физ.-мат. наук: 01.04.02 / О.П. Скляров. СПб., 1999. - 32 с.

175. Скаляров О.П. V/U-ритм речи при чтении как индикатор состояния функции речевого дыхания у заикающихся / О.П. Скаляров // Электронный журнал «Техническая акустика», http://webcenter.ru/~eeaa/ejta/, 2004, 16.

176. Скучик Е. Основы акустики / Е. Скучик. М.: Мир, 1976. - Т. 1. - 520 с.

177. Скучик Е. Основы акустики / Е. Скучик. М.: Мир, 1976. - Т. 2. - 542 с.

178. Скучик Е. Простые и сложные колебательные системы / Е. Скучик. -М.: Мир, 1971.-557 с.

179. Слуцкий Е.Е. О квадратичной ошибке коэффициента корреляций в случае однородных связанных рядов / Е.Е. Слуцкий // Избр. тр. М.: Изд. АН СССР, 1960.-С. 144.

180. Смирнова H.A. Идентификация дикторов на основе сравнения параметров реализации мелодических контуров высказываний / H.A. Смирнова // Труды международной конференции "Диалог 2007". М., 2007. - С. 502-507.

181. Советов Б.Я. Моделирование систем / Б .Я. Советов, С. А. Яковлев. М.: Высшая школа, 2009. - 343 с.

182. Советский энциклопедический словарь / Под ред. A.M. Прохорова. М.: Советская Энциклопедия, 1980. - 1600 с.

183. Сорокин В.Н. Об автокорреляционном анализе речевого сигнала / В.Н. Сорокин, В.П. Трифоненков // Акустический журнал. 1996. Т. 42. - № 3. -С. 418-425.

184. Сорокин В.Н. Сегментация и распознавание гласных / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы. 2004. Т. 4. - № 2. - С. 203-220.

185. Сорокин В.Н. Синтез речи / В.Н.'Сорокин. М.: Связь, 1992. - 392 с.

186. Сорокин В.Н. Теория речеобразования / В.Н. Сорокин. М.: Радио и связь, 1985.-312 с.

187. Сорокин В.Н. Устойчивость оценок формантных частот / В.Н. Сорокин, И.С. Макаров, A.C. Леонов // Речевые технологии. 2009. - № 1. - С. 3-21.

188. Сорокин В.Н. Фундаментальные исследования речи и прикладные задачи речевых технологий / В.Н. Сорокин // Речевые технологии. 2008. -№1.-С. 18-48.

189. Сосулин Ю.Г. Теория обнаружения и оценивания стохастических сигналов / Ю.Г. Сосулин. М.: Сов. радио, 1978. - 320 с.

190. Стретт Дж.В. (лорд Рэлей) Теория звука / Дж.В. Стретт. 2-е изд. - М.: Гостехиздат, 1955. - Т. 1. - 476 с.

191. Стретт Дж.В. (лорд Рэлей) Теория звука / Дж.В. Стретт. 2-е изд. - М.: Гостехиздат, 1955. - Т. 2. - 476 с.

192. Теория обнаружения сигналов / Под ред. П.А. Бакута. М.: Радио и связь, 1984.-440 с.

193. Тихонов А.Н. Методы решения некорректных задач / А.Н. Тихонов, В.Я. Арсенин. -М.: Наука. Гл. ред. физ.-мат. лит., 1979. 285 с.

194. Тихонов В.И. Выбросы случайных процессов / В.Н. Тихонов. Mi: Наука, Гл. ред. физ.-мат. лит., 1970. - 392 с.

195. Тихонов В.И. Марковские процессы / В.И. Тихонов, М.А. Миронов. -М.: Сов. радио, 1977. 408 с.

196. Тихонов В.И. Нелинейные преобразования случайных процессов / В.И. Тихонов. М.: Радио и связь, 1982. - 296 с.

197. Тихонов В.И. Нелинейная фильтрация и квазикогерентный прием сигналов / В.И. Тихонов, А.К. Кульман. М.: Сов. радио, 1975. - 704 с.

198. Тихонов В.И. Оптимальный прием сигналов / В.И. Тихонов. М.: Радио и связь, 1983.-320 с.

199. Тихонов В.И. Статистическая радиотехника / В.И. Тихонов. М.: Сов. радио, 1966. - 678 с.

200. Трахтман А.М. Основы теории дискретных сигналов на конечных интервалах / A.M. Трахтман, В.А. Трахтман. -М.: Сов. радио, 1975. 208 с.

201. Трофимова Т.И. Курс физики / Т.И. Трофимова. М.: Высшая школа,1998.-542с.

202. Уваров B.K. Некоторые вопросы модуляционной теории звуковых сигналов. СПб.: СПбГУКиТ, 2005.

203. Уваров В.К. Разработка теоретических основ и технических средств компандирования звуковых сигналов: автореф. дис. докт. техн. наук: 05.11.18 / В.К. Уваров. СПб., 2003. - 46 с.

204. Уваров В.К. Речь и слух. СПб.: СПбГУКиТ, 2005.

205. Уизем Дж. Линейные и нелинейные волны / Дж. Уизем. М.: Мир, 1977.-624 с.

206. Уидроу Б. Адаптивная обработка сигналов / Б. Уидроу, С. Стирнз. М.: Радио и связь, 1989. - 440 с.

207. Фадеев A.C. Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования: автореф. дис. канд. техн. наук: 05.13.01 / A.C. Фадеев. Томск, 2008. - 20 с.

208. Фалькович С.Е. Оптимальный прием пространственно-временных сигналов в радиоканалах с рассеянием / С.Е. Фалькович, В.И. Пономарев, Ю.В. Шкаврко. М.: Радио и связь, 1989. - 296 с.

209. Фалькович С.Е. Оценка параметров сигнала / С.Е. Фалькович. М.: Сов. радио, 1970. - 336 с.

210. Фалькович С.Е. Статистическая теория измерительных радиосистем / С.Е. Фалькович, Э.И. Хомяков. М.: Радио и связь, 1981. - 288 с.

211. Фант Г. Акустическая теория речеобразования / Г. Фант. М.: Наука, 1964.-284 с.

212. Фант Г. Анализ и синтез речи / Г. Фант Новосибирск: Наука, 1970. - 306 с.

213. Федер Е. Фракталы / Е. Федер. М.: Мир, 1991.-254 с.

214. Физика: Энциклопедия / Под ред. Ю.В. Прохорова. М.: Большая Российская энциклопедия, 2003. - 944 с.

215. Физические величины: Справочник / А.П. Бабичев, H.A. Бабушкина, A.M. Братковский и др.; Под ред. И.С. Григорьева, Е.З. Мейлихова. — М.: Энергоатомиздат, 1991. 1232 с.

216. Физиология речи. Восприятие речи человеком / Л.А. Чистович, A.B. Венцов, М.П. Грамстрем и др. Л.: Наука, 1976. - 388 с.

217. Философский словарь / Под ред. И.Т. Фролова. М.: Политиздат, 1980. - 444 с.

218. Финк JI.M. Сигналы. Помехи. Ошибки. / Л.М. Финк. М.: Радио и связь, 1984.-256 с.

219. Финк Л.М. Теория передачи дискретных сообщений / Л.М. Финк. М.: Сов. радио, 1970. - 728 с.

220. Фишер P.A. Статистические методы для исследователей / P.A. Фишер. -М.: Гостехиздат, 1958. 267 с.

221. Фланаган Дж. Анализ, синтез и восприятие речи / Дж. Фланаган. М.: Связь, 1968.-396 с.

222. Фланаган Дж. Вычислительные машины говорят и слушают. Речевое общение человека с машиной / Дж. Фланаган. ТИИЭР, 1976. Т. 64. - № 4.

223. Френке Л. Теория сигналов / Л. Френке. М.: Сов. радио, 1974. - 344 с.

224. Фукунага К. Введение в статистическую теорию распознавания образов / К. Фукунага М.: Наука, Гл. ред. физ.-мат. лит., 1979. - 368 с.

225. Харкевич A.A. Борьба с помехами / A.A. Харкевич. М.: Наука, Гл. ред. физ.-мат. лит., 1965. - 275 с.

226. Хаясака Т. Электроакустика / Т. Хаясака. М.: Мир, 1982. - 246 с.

227. Хемминг Р.В. Цифровые фильтры / Р.В. Хемминг. М.: Сов. радио, 1980.-224 с.

228. Хеннан Э. Анализ временных рядов / Э. Хеннан. М.: Наука, 1964. - 216 с.

229. Химмельблау Д. Прикладное нелинейное программирование / Д. Хим-мельблау. М.: Мир, 1975. - 534 с.

230. Хитров М.В. Распознавание русской речи: состояние и перспективы / М.В. Хитров // Речевые технологии. 2008. - № 1. - С. 83-87.

231. Худсон Д. Статистика для физиков / Д. Худсон. М.: Мир, 1970. - 296 с.

232. Цвикер Э. Ухо как приемник информации / Э. Цвикер, Р. Фельдкеллер. -М.: Связь, 1971.-256 с.

233. Чистович Л.А. Слуховое измерение первой форманты / Л.А. Чистович, B.C. Шупляков. В кн.: Анализ речевых сигналов человеком. Л., 1971. - С. 19-28.

234. Чуй К. Введение в вейвлеты / К. Чуй. Пер. с англ. Я.М. Жилейкина. -М.: Мир, 2001.-412 с.

235. Шалимов И.А. Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств: автореф. дис. докт. техн. наук: 05.13.17 / И.А. Шалимов. М., 2005. - 47 с.

236. Ширман Я.Д. Основы теории обнаружения радиолокационных сигналов и измерение их параметров / Я.Д. Ширман, В.Н. Голиков. М.: Сов. радио, 1963.-278 с.

237. Ширман Я.Д. Теория и техника обработки радиолокационной информации на фоне помех / Я.Д. Ширман, В.Н. Манжос. М.: Радио и связь, 1981. -416с.

238. Шредер М. Фракталы, хаос, степенные законы / М. Шредер. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. - 528 с.

239. Шустер Г. Детерминированный хаос / Г. Шустер. М.: Мир, 1988. - 240 с.

240. Юрков П.Ю. Разработка и исследование методов и средств голосовой аутентификации с динамически изменяемым множеством ключевых слов: автореф. дис. канд. техн. наук: 05.13.19, 05.13.17 / П.Ю. Юрков. Таганрог, 2006. - 16 с.

241. Яворский Б.М. Справочник по физике / Б.М. Яворский, A.A. Детлаф. -М.: Наука. Физматлит, 1996. 624 с.

242. Яглом A.M. Корреляционная теория стационарных случайных функций / A.M. Яглом. JL: Гидрометеоиздат, 1981. - 279 с.

243. Якушев Д.И. Моделирование гласных звуков / Д.И. Якушев, О.П. Скляров // Акустический журнал. 2003. Т. 49. - № 4. - С. 567-569.

244. Якушев Д.И. Геоинформационное моделирование пространственно-временных геофизических процессов с полигармонической структурой: автореф. дис. докт. техн. наук: 25.00.35 / Д.И. Якушев. СПб., 2008. - 35 с.

245. Янке Е. Специальные функции / Е. Янке, Ф. Эмде, Ф. Лёш. М.: Наука, 1977.-344 с.

246. Ярлыков М.С. Применение марковской теории нелинейной фильтрации в радиотехнике / М.С. Ярлыков. М.: Сов. радио, 1980. - 360 с.

247. Burke D. Speech processing for IP networks: Media resource control protocol (MRCP) / D. Burke. John Wiley & Sons, 2007, 373 p.

248. Campanella S.J. A survey of speech bandwidth compression techniques / S.J. Campanella // IRE Trans, on Audio, AU-6, № 5, 1958, pp. 104-116.

249. Campbell J. Speaker recognition / J. Campbell, A.K. Jain, R.M. Bolle, S.Pankanti // Biometrics: Personal Identification in Networked Society, Kluwer Academic Press, Boston, MA, 1999, pp. 165-190.391

250. Chen F. Designing human interface in speech technology / F. Chen. -Springer Science+Business Media, 2006, 398 p.

251. Chu W.C. Speech coding algorithms: Foundation and evolution of standardized coders / W.C. Chu. John Wiley & Sons, 2003, 582 p.

252. Dau T. Quantitative model of the «effective» signal processing in the auditory system: I. Model structure / T. Dau, D. Puschel, A.A. Kohlrausch // Journ. Acoust. Soc. Am., 1996, vol. 99, no 6, pp. 3615-3622.

253. Deller J.R. Discrete-time processing of speech signals / J.R. Deller, J.H.L. Hansen, J.G. Proakis // IEEE Press, USA. 2000.

254. Furui S. Digital speech processing, synthesis, and recognition / S. Furui. — Marcel Dekker, 2000, 472 p.

255. Gabor D. New possibilities in speech transmission / D. Gabor // J. IRE, vol. 94, part 3, November, 1948, pp. 369-390.

256. Gabor D. Theory of communication / D. Gabor // J. Inst. Elect. Engrs, vol. 93, part 3, 1946, pp. 429-457.

257. George E.B. Speech analysis/synthesis and modification using an analysis-by-synthesis/overlap-add sinusoidal model / E.B. George, M.J.T. Smith // IEEE Trans, on Speech and Audio Process., 1997, vol. 5, no. 5, pp. 389-406.

258. Goldberg R.G. A practical handbook of speech coders / R.G. Goldberg, L. Riek. CRC Press, 2000, 247 p.

259. Harris R.A. Crafting the new conversational speech systems / R.A. Harris. -Elsevier, 2004, 619 p.

260. Heck L.P. Handset-dependent background models for robust text-independent speaker recognition / L.P. Heck, M. Weintraub // In Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, April, 1997.

261. Hermansky H. Perceptual linear predictive (PLP) analysis of speech / H. Hermansky // Journ. Acoust. Soc. Am. 1990, vol. 87, no 4, pp. 1738-1752.

262. Huang X. Spoken language processing: a guide to theory, algorithm and system development / X. Huang, A. Acero, H.W. Hon. Prentice-Hall, 2001, 965 p.

263. Kingsbury B.E.D. Robust speech recognition using the modulation spectrogram / B.E.D. Kingsbury, N. Morgan, S. Greenberg // Speech Communication. 1998, vol. 25, no 1-3, pp. 117-132.

264. Klatt D.K. Analysis, synthesis, and perception of voice quality variationsamong female and male talkers / D.H. Klatt, L.C. Klatt 11 J. Acoust. Soc. Am. 1990, vol. 87, pp. 820-857.

265. Koishida Kazuhito. Efficient encoding of Mel-generalized cepstrum for CELP coders / Koishida Kazuhito, Tokuday Keiichi // Tokyo Institute of Technology. 1997.

266. Lamel L.F. An improved endpoint detector for isolated word recognition / L.F. Lamel, L.R. Rabiner, A.E. Rosenberg, J.C. Wilpon // IEEE transactions on Acoustics, Speech and Signal Processing, ASSP-29, Aug. 1981, vol. № 4, pp. 777-785.

267. Levinson S.E. Mathematical models for speech technology / S.E. Levinson. -John Wiley & Sons, 2005, 284 p.

268. Lippmann R.P. Speech recognition by machines and humans / R.P. Lippmann // Speech Communication, 1997, vol. 22. no. 1, pp. 1-16.

269. Maragos P. Energy separation in signal modulations with application to speech analysis / P. Maragos, J.F. Kaiser, T.F. Quatieri // IEEE Trans, on Signal Process., 1993, vol. 41, no. 10, pp.3024-3051.

270. McAulay RJ. Low-rate speech coding based on the sinusoidal model / R.J. McAulay, T.F. Quatieri (Advances in speech signal Processing / S. Furui and M.M. Sondhi, eds.) //New York: Marcel Dekker Inc., 1992, pp. 165-207.

271. McAulay R.J. Sinusoidal coding in speech coding and synthesis / R.J. McAulay, T.F. Quatieri (W. Klein and K. Palival, eds.) // Amsterdam: Elsevier Science Publishers. 1995, pp. 121-176.

272. McAulay R.J. Speech analysis/synthesis based on a sinusoidal representation / RJ. McAulay, T.F. Quatieri // IEEE Trans. On Acoustics, Speech and Signal Process. 1986, vol. 34, no. 4, pp. 744-754.

273. Park A. ASR Depended Techniques for speaker identification / A. Park, T.J.1. Hazen//Proc. ICSLP. 2002.

274. Pattern recognition in speech.and language processing / edited by W. Chou and B.H. Juang. CRC Press, 2003, 385 p.

275. Rabiner L.R. Fundamentals of speech recognition / L.R. Rabiner, B.H. Juang.- Prentice-Hall International, 1993, 277 p.

276. Ramamohan S., Sinusoidal model-based analysis and classification of stressed speech / S. Ramamohan, S. Dandapat // IEEE Transactions on Audio, Speech and Language Processing. May 2006, vol. 14, no. 3, pp. 737-746.

277. Reynolds D.A. Automatic speaker recognition / D.A. Reynolds // Current approaches and future trends. In Proc. IEEEAutoID, March 2002, Tarrytown, NY, pp. 103-108.

278. Spanias A.S. Speech coding: a tutorial review / A.S. Spanias // Proc. of the IEEE, 1994, vol. 82, no. 10, pp. 1541-1582.

279. Stylianou Y. Apply the harmonic plus noise model in concatenative speech synthesis / Y. Stylianou // IEEE Trans, on Speech and Audio Process. 2001, vol. 9, no. 1, pp. 21-29.

280. Tchorz J. A model of auditory perception as front end for automatic speech recognition / J. Tchorz, D. Kollmeier, JASA, 1999. 106(4), pt. 1. pp. 2040-2050.

281. Vaseghi S.V. Advanced digital signal processing and noise reduction / S.V. Vaseghi. John Wiley & Sons, 2006, 480 p.

282. Vorobiov V.I. Inter component phase processing of speech signals for their recognition and identification of announcers / V.I. Vorobiov // XVIII Session of the Russian Acoustical Society, 2006, pp. 529-532.

283. Wilpon J.C. An improved word-detection algorithm for telephone-quality speech incorporating both semantic constraints / J.C. Wilpon, L.F. Lamel, L.R. Rabiner, T. Martin // AT&T Bell Laboratories Technical Journal, Mar. 1984, vol. 63, № 3, pp. 479-497.

284. Wilson A.D. Hidden markov models for modeling and recognizing gesture under variation / A.D. Wilson, A.F. Bobick // Hidden Markov Models: Application in Computer Vision. World Scientific Publishing Company, 2001.

285. Yegnanarayana B. An iterative algorithm for decomposition of speech signals into voiced and noise components / B. Yegnanarayana, C. d'Alessandro, V. Dar-sions // IEEE Trans, on Speech and Audio Coding, 1998, vol. 6, no. 1, pp. 1—11.

286. Yu Shao. A versatile speech enhancement system based on perceptual wavelet denoising / Yu Shao, Chang Chip-Hong // In: IEEE International Symposium on Circuits and Systems. 2005, vol. 2, pp. 864-867.

287. Ролдугин C.B. Расчет параметров авторегрессионной модели речевого сигнала / C.B. Ролдугин, А.Н. Голубинский // Вестник ВИ МВД России! -2001.-С. 28-33.

288. Ролдугин С.В!. Модели речевых сигналов для идентификации личности по голосу / C.B. Ролдугин, А.Н. Голубинский, Т.А. Вольская // Радиотехника.-2002.-№ 11. С. 79-81.

289. Синтез алгоритмов различения звуковых и оптических сигналов: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: А.Н; Лукин. № ГР 01021801 - Воронеж, 2004. - 91 с. -А.Н. Голубинский: раздел 1 - С. 10-39.

290. Голубинский А.Н. О расчете параметров модели речевого сигнала в ви- • де импульса АМ-колебания с несколькими несущими / А.Н.'.Голубинский //

291. Международная научно-практическая конференция "Современные проблемы борьбы с преступностью": Сборник материалов. Воронеж: ВИ МВД России, 2006. - С. 43-44.

292. Голубинский А.Н. Алгоритмы оценки частоты основного тона и обертонов речевого сигнала / А.Н. Голубинский // Вестник ВИ МВД России. -2006.-С. 15-19.

293. Голубинский А.Н. Расчет параметров модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими / А.Н. Голубинский // Вестник ВИ МВД России. 2006. - С. 20-24.

294. Голубинский А.Н. Спектральный анализ речевого сигнала и его модели в виде импульса АМ-колебания с несколькими несущими / А.Н. Голубинский // Вестник ВИ МВД России. 2006. - С. 25-29.

295. Голубинский А.Н. Методы аппроксимации экспериментальных данных и построения моделей / А.Н. Голубинский // Вестник ВИ МВД России.2007.-№2.-С. 138-143.

296. Голубинский А.Н. Модель речевого сигнала в виде импульса АМ-колебания с несколькими несущими для верификации личности по голосу / А.Н. Голубинский // Системы управления и информационные технологии. -2007.-№4.-С. 86-91.

297. Голубинский А.Н. Методика аппроксимации речевого сигнала на основе особенностей его характеристик / А.Н. Голубинский // Вестник ВИ МВД России. 2008. - № 1.-С. 128-134.

298. Голубинский А.Н. К вопросу о разработке математической модели речевого сигнала на основе особенностей его характеристик / А.Н. Голубинский // Системы управления и информационные технологии. 2008; - № 2. -С. 80-85.

299. Голубинский А.Н. К вопросу о физической интерпретации модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами / А.Н. Голубинский // Вестник ВИ МВД России. 2008. - № 2. - С. 84-90.

300. V чая модуляции суммой гармоник / А.Н. Голубинский И Системы управления и информационные технологии. 2008. - № 4.1. - С. 156-161.

301. Обработка звуковых и оптических сигналов: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: А.Н; Лукин.-№ ГР' 01068673; Воронеж, 2008; - 50 с. - А.Н. Голубинский: разделы 1-8 - С. 5-50.

302. Голубинский А.Н. Расчет частоты основного тона речевого сигнала на основе полигармонической математической модели / А.Н. Голубинский // Вестник ВИ МВД России. 2009. - № 1. - С. 81-89.

303. Голубинский А.Н. Метод аналитического расчета параметров математических моделей речевого сигнала, построенных на основе теории модуляции / А.Н. Голубинский // Системы управления и информационные технологии. 2009. - № 1.3.-С. 332-336.

304. Голубинский А.Н. Критерии соответствия математической модели речевого сигнала экспериментальным данным / А.Н. Голубинский // Системы управления и информационные технологии. 2009. - № 2.1. - С. 113-118.

305. Голубинский А.Н. Метод оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели / А.Н. Голубинский // Телекоммуникации. 2009. - № 8. - С. 16-21.

306. Голубинский А.Н. Методы аналитического расчета весовых коэффициентов меры различимости на примере задачи верификации личности по голосу / А.Н. Голубинский // Вестник ВИ МВД России. 2009. - № 2. - С. 93-102.

307. Голубинский А.Н. Математическая модель речевого сигнала, основанная на аппроксимации спектра набором постоянных составляющих в соответствующих полосах частот / А.Н. Голубинский // Безопасность информационных технологий. 2009. - № 2. - С. 12-18.

308. Голубинский А.Н. Стохастические модели речевого сигнала, и их частные случаи в виде квазидетерминированных и детерминированных моделей / А.Н. Голубинский // Телекоммуникации. 2009. - № 9. - С. 15-20.

309. Голубинский А.Н. Методика вычисления информационной составляющей речевого сигнала / А.Н. Голубинский // VII всероссийская научнопрактическая конференция "Охрана, безопасность и связь": Сборник материалов. Воронеж: ВИ МВД России, 2009. - С. 37-41.

310. Голубинский А.Н. Выделение модулирующего колебания из огибающей речевого сигнала / А.Н. Голубинский, О.М. Булгаков // Системы управления и информационные технологии. 2009. - № 4.1. - С. 130-134.

311. Голубинский А.Н. Методика проверки на адекватность математической модели речевого сигнала экспериментальным данным / А.Н. Голубинский // Информационные технологии. 2009. - № 12. - С. 54-59.

312. Голубинский А.Н. К вопросу о выделении модулирующего колебания из огибающей речевого сигнала / А.Н. Голубинский, О.М. Булгаков // Вестник ВИ МВД России. -2009.-№ 4.-С. 108-116:

313. Совершенствование средств низовой УКВ радиосвязи: Отчет о НИР (заключительный) / Воронежский институт МВД России. Руководитель: Ю.К. Рогачев. № ГР 03095963. - Воронеж, 2009. - 140 с. - А.Н. Голубинский: разделы 1,2 - С. 12-79.

314. Голубинский А.Н. Теория цифровой обработки сигналов: Учеб. пособие / А.Н. Голубинский, C.B. Ролдугин, И.В. Лазарев. Воронеж: ВИ МВД России, 2009. - 132 с.

315. Голубинский А.Н! Метод расчета весовых" коэффициентов меры разли401чимости речевого сигнала, моделируемого импульсом АМ-колебания с несколькими: несущими / А.Н. Голубинский, О.М. Булгаков // Телекоммуникации.-2010.-№1.-С. .10-15. ;; ,:

316. Голубинский А.Н. Оценка вокализации речевого сигнала на основе его коэффициента корреляции / А.Н'. Голубинский, 0:М1 Булгаков // I международная научно-практическая конференция "Наука и современность":

317. Сборник материалов.-Ч; 2.-Новосибирск, 2010. С.,83-88.

318. Голубинский А.Н. Оценка частоты основного тона речевого сигнала при априори неизвестных амплитудах и начальных фазах полигармонического несущего колебания / А.Н. Голубинский // Вестник ВИ МВД России. -2010.-№3.-С. 110-117.

319. Патент на изобретение № 2399102 РФ, 8 G 10 L 17/00. Способ и устройство автоматической верификации личности по голосу / А.Н. Голубинский -№2008143852/09; Заявл. 05.11.2008; Опубл. 10.09.2010; Бюл. № 25.

320. Голубинский А.Н. Математические модели речевых сигналов для верификации и идентификации личности по голосу / А.Н. Голубинский, О.М. Булгаков. Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2010.-364 с.

321. УТВЕРЖДАЮ» Зам. Генерального директора ОАО «Концерн «Созвездие»наук1. Николаев2010г.о внедрении результатов диссертационной работы Голубинского А.Н. «Модели речевых сигналов для аутентификации личности по голосу»

322. Подписи председателя комиссии Н.М. Радько и членов комиссии Н.М. Тихомирова1. Рахманнн03. 2010 г.и Д.Н. Рахманина заверяю:1. ОАО «Концерн Созвездие1. О.И. Щеглова2010 г.