автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Моделирование и распознавание речевых сигналов на фоне интенсивных помех
Оглавление автор диссертации — кандидата технических наук Армер, Андрей Игоревич
Список сокращений, принятых в диссертации.2
Введение.3
Глава 1. Методы представления, моделирования, обработки и распознавания речевых сигналов.7
1.1. Слуховое восприятие.7
1.2. Система речеобразования и фонетический состав речи.10
1.3. Способы представления РС.16
1.4. Представление помех. 19
1.5. Модели РС.22
1.6. Задачи обработки РС.27
1.7. Улучшение качества РС.29
1.8. Задачи распознавания РС.32
1.9. Проблемы в области распознавания РК.34
1.10. Методы распознавания РК.39
1.10.1. Спектральные методы распознавания РК.39
1.10.2. Методы, основанные на вейвлет-анализе.42
1.10.3. Статистические методы распознавания РК.45
1.10.3.1. Методы распознавания РК, основанные на использовании скрытых марковских цепей.45
1.10.3.2. Распознавание РК с использованием нейронных сетей.47
1.10.4. Методы распознавания РК, основанные на обработке изображений.49
1.10.5. Выбор метода распознавания РК.51
1.11. Способы повышения помехоустойчивости распознавания РК.51
1.12. Выводы.56
Глава 2. Моделирование изменчивости РС.57
2.1. Постановка задачи.57
2.2. Анализ изменчивости РС.58
2.2.1. Статистические характеристики изменчивости длительности произнесения PC.63
2.2.2. Статистические характеристики изменчивости громкости произнесения PC.67
2.2.3 Статистическое исследование непостоянства количества квазипериодов в вокализированных фонемах PC.70
2.2.3.1. Статистические исследования количества квазипериодов в произнесениях фонем.73
2.3. Моделирование изменчивости PC с использованием авторегрессионных моделей.75
2.3.1. Создание вариантов PC с помощью двумерной модели Хабиби . 75
2.3.2. Моделирование вариантов PC вдоль строк изображения, полученного двумерной моделью Хабиби.79
2.3.3. Моделирование вариантов PC вдоль траектории на изображении, полученном двумерной моделью Хабиби.83
2.3.4. Определение параметров авторегрессионных моделей вариативности PC.87
2.4. Получение вариантов РК с помощью управления количеством квазипериодов в фонемах.90
2.5. Анализ акустического восприятия моделируемых вариантов PC . 93
2.6. Использование моделей вариативности при статистическом различении РК.95
2.7. Выводы.102
Глава 3. Распознавание PC на фоне интенсивных шумов.103
3.1. Постановка задачи.103
3.2. Статистическое обнаружение и распознавание сигналов на фоне шумов. 104
3.2.1. Обнаружение сигналов на фоне шумов.105
3.2.2. Зашумление эталонов при распознавании сигналов на фоне шумов.108
3.3. Распознавание PC через преобразование их в автокорреляционные портреты . 112
3.3.1. Построение АКП PC.112
3.3.2. Свойства АКП PC.114
3.3.3. Взаимные искажения АКП, связанные с различным произнесением PC.118
3.3.4. Построение АКП по характерным точкам PC.121
3.3.5. Совмещение АКП. 125
3.3.6. Совмещение АКП с использованием алгоритма динамического программирования. 128
3.4. Распознавание PC на фоне шумов через преобразование их в АКП.133
3.4.1. Использование зашумленных эталонов при ^ распознавании АКП PC. 134
3.5. Выводы.137
Глава 4. Программный комплекс и статистическое исследование алгоритма распознавания РК. 139
4.1. Введение. 139
4.2. Алгоритм распознавания РК на фоне шумов с использованием зашумления эталонов. 140
4.2.1. Обнаружение границ РК.140 л 4.2.2. Зашумление эталонов.141
4.2.3. Построение АКП РК.142
4.2.4. Совмещение АКП.143
4.2.5. Принятие решения о принадлежности РК одному из классов эталонов. 145
4.2.6. Графический интерфейс комплекса программ для распознавания РК на фоне шумов на ЭВМ.146
4.3. Статистические исследования алгоритма распознавания РК на фоне шумов.148
4.3.1. Статистическое исследование алгоритма на имитированном речевом материале.148
4.3.2. Статистическое исследование алгоритма на реальном речевом материале.149
4.4. Вычислительные затраты и аппаратные требования при функционировании комплекса программ распознавания РК на фоне шумов. 151
4.4.1. Расчет времени распознавания РК.151
4.4.2. Аппаратные требования для системы распознавания РК на фоне шумов «Говорун».152
4.4.3. Аппаратные требования для системы
Редактор речевых команд» . 153
4.5. Выводы.153
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Армер, Андрей Игоревич
Актуальность темы. В настоящее время в силу значительного развития наземных, водных и воздушных транспортных систем с целью обеспечения их надежной и безаварийной работы большое внимание уделяется оптимизации контроля и управления этими системами. В связи с этим активно ведется разработка технических средств, позволяющих повысить управляемость транспортных систем и снизить нагрузку на оператора (водителя или пилота). В частности, в авиации очень резко стоит вопрос о снижении эмоциональной и физической нагрузки летчиков. В большой степени решению этого вопроса способствует разработка систем, позволяющих осуществлять управление и контроль над бортовым оборудованием с помощью естественного для пилота языка - речевых команд (РК). Подобные системы должны функционировать в условиях интенсивных помех (шума двигателя, ветра, системы воздухообеспечения и т. д.). Поэтому весьма актуальными являются исследования в области распознавания РК на фоне интенсивных шумов. Развитие методов моделирования речи и речевых сигналов (PC) и, кроме того, разработка эффективных методов повышения помехоустойчивости распознавания РК в значительной степени способствует созданию надежных алгоритмов распознавания РК на фоне помех. Существуют системы распознавания, предназначенные для работы в условиях с пониженным шумом, однако они не выполняют своей функции в шумной среде кабины транспортного средства. Те же системы, которые рассчитаны на работу в условиях интенсивных шумов, относятся, в основном, к закрытым зарубежным военным разработкам. В связи с этим распознавание РК на фоне шумов является актуальной задачей.
Об актуальности названных задач свидетельствует ряд научных федеральных программ, направленных на их решение, в частности, «Исследования и разработки по приоритетным направлениям развития науки и техники» Федерального агентства по науке и инновациям, конкурс на проведение фундаментальных научных исследований по областям знаний «Навигация, наведение и управление подвижными объектами», «Теория человеко-машинных систем управления» РФФИ и др.
Цель н задачи работы. Целью диссертации является разработка эффективных методов распознавания РК на фоне интенсивных шумов, построение алгоритмов и программ для ЭВМ, реализующих эти методы.
Для достижения поставленной цели решаются следующие задачи.
- Исследование характеристик изменчивости PC, являющейся одним из основных факторов, мешающих распознаванию РК.
- Разработка математических моделей изменчивости PC.
- Разработка методов снижения влияния шума на качество распознавания РК.
- Развитие алгоритмов распознавания РК, представленных в виде изображений.
Разработка комплекса программ для ЭВМ, реализующего предложенные алгоритмы. ф Методы исследования. При решении поставленных задач применялись методы теории статистических решений, теории вероятностей, математической статистики, теории обработки изображений, методы ^ оптимизации, математического анализа, математического и статистического моделирования с применением вычислительной техники.
Научная новизна положений, выносимых на защиту.
1. Впервые был предложен подход к моделированию изменчивости PC.
2. Разработан ряд авторегрессионных моделей изменчивости PC, применение которых позволяет имитировать варианты произнесения исходного PC. Использование данных моделей позволяет получить речевой материал для отладки и тестирования алгоритмов распознавания РК. ф 3. Предложен метод статистического различения РК, использующий модель изменчивости PC.
4. Получена новая форма записи отношения правдоподобия (ОП) при fr обнаружении или распознавании сигналов на фоне шумов. Данная форма ОП приводит к новому методу снижения влияния шума на качество обнаружения или распознавания, основанному на зашумлении эталонов.
5. Разработан новый метод построения автокорреляционных портретов (АКП) PC по характерным точкам (XT) сигнала, впервые применен метод динамического программирования при совмещении АКП.
Достоверность. Достоверность положений диссертации обеспечивается корректным использованием математических методов и подтверждается ® результатами статистических экспериментов на реальном речевом материале.
Практическая значимость. Представленное описание алгоритмов дает разработчикам возможность их применения при проектировании надежных систем распознавания РК на фоне интенсивных шумов. Предложенный метод снижения влияния шума на качество обнаружения или распознавания * сигнала может быть использован не только при распознавании РК на фоне шумов, но и в фазометрии, навигации и т. д.
Реализация работы. Результаты работы использованы в госбюджетных и хоздоговорных НИР Ульяновского государственного технического университета, в разработках Ульяновского конструкторского бюро ф приборостроения, что подтверждено актом внедрения, а также используются в учебном процессе УлГТУ в курсе «Основы теории обработки изображений». По результатам работы получен патент РФ «Устройство распознавания речевых команд в условиях шумов» и получено положительное решение на получение патента РФ «Способ измерения фазового сдвига в условиях интенсивных помех».
Апробация работы. Основные результаты работы докладывались на 4-й
Всероссийской с участием стран СНГ научно-практической конференции I1 «Современные проблемы создания и эксплуатации радиотехнических систем» (Ульяновск, 2004); 7-й Международной научно-техн. конф. «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, 2004); 2-й Международной конф. «Автоматизированный контроль и информационные технологии, IASTED'2005» (Новосибирск, 2005); Международной научно-техн. конф. «Next generation concurrent engineering, СЕ-2005» (USA, Lubboc, 2005); Международной конф. «ICCSA'2006» (UK, Glasgow, 2006); Международной конф. «Континуальные алгебраические логики, исчисления и нейроинформатика в науке и технике» (Ульяновск, 2006) и на ежегодных конференциях профессорско-преподавательского состава Ульяновского ф государственного технического университета (2004-2006 гг.). *
Публикации. По теме диссертации опубликовано 12 печатных работ, в • том числе 10 статей, 1 доклад на конференции и 1 патент на изобретение. д.
Объем и структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 119 наименований. Общий объем 168 страниц.
Заключение диссертация на тему "Моделирование и распознавание речевых сигналов на фоне интенсивных помех"
4.5. Выводы
1. Предложенный метод дикторозависимого распознавания РК из ограниченного словаря на фоне интенсивных шумов реализован комплексом программ для ЭВМ.
2. Статистические исследования предложенного метода показали вероятность правильного распознавания РК на фоне шумов 0-3 дБ: 0,9440,980 на имитированном речевом материале и 0,942-0,975 на реальном речевом материале, произносимом в реальном времени.
3. Время распознавания одной РК на ПК типа Пентиум-Н (300 Mhz) составляет менее 0,4 с.
ЗАКЛЮЧЕНИЕ
В диссертации предложены математические модели вариативности PC, разработан новый метод повышения помехоустойчивости распознавания РК на фоне помех. Это позволило получить эффективный алгоритм распознавания РК на фоне шумов. Основные результаты диссертации заключаются в следующем.
1. Проведенные исследования основных характеристик изменчивости PC позволили получить данные, необходимые для моделирования изменчивости PC. В результате предложен ряд авторегрессионных моделей изменчивости PC.
2. Применение моделей изменчивости при статистическом различении классов РК позволяет упростить как саму процедуру принятия решения, так и запись ОП при построении решающего правила.
3. Получена новая запись ОП при обнаружении или распознавании PC на фоне помех, приводящая к методу снижения влияния шума на распознавание РК, основанному на зашумлении эталонов. Выигрыш полученного метода по сравнению с методом, использующим компенсацию шума, составляет около 15% при отношении сигнал/шум 6 дБ и около 38% при отношении сигнал/шум 1,7 дБ.
4. Предложен новый метод построения АКП PC по XT сигнала, при совмещении АКП применен метод динамического программирования, что позволило повысить эффективность алгоритма распознавания РК, основанного на построении и совмещении АКП.
5. По разработанным алгоритмам создан комплекс программ для ЭВМ, показавший вероятность правильного распознавания РК от 0,942 до 0,980 при отношении сигнал/шум 0-3 дБ.
Библиография Армер, Андрей Игоревич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Аггравал Дж.К., Дейвис JI.C., Мартин У.Н. Методы установления соответствия при анализе динамических сцен // ТИИЭР, т. 69, N 5, 1981. с. 77-90.ф 2. Альтман Я.А. Слуховая система. Л.: Наука, 1990. - 620 с.
2. Андерсон Т. Статистический анализ временных рядов / Пер. с англ. под ред. Ю.К. Беляева. М.: Мир, 1976. - 758 с.
3. Беллман Р. Динамическое программирование. М.: Изд-во иностр.лит., 1960.-400 с.
4. Бердышев В.И., Петрак JI.B. Аппроксимация функций. Сжатие численной информации. Приложения. Екатеринбург, 1999.-е. 127-150.
5. Биллингсли П. Сходимость вероятностных мер: Пер. с англ. / Под ред. А. В. Прохорова. М.: Наука, 1977. - 351 с.
6. Блауэрт И. Пространственный слух. М.: Энергия, 1979. - 224 с.
7. Богуславский И.А., Владимиров И.Г. Адаптивное оценивание вектора сдвига // Техническая кибернетика, N4, 1990. с. 47-64.
8. Бойков Ф.Г., Старожилова Т.К. Применение вейвлет-анализа сигнала в системе распознавания речи // Труды международной конференции
9. Диалог'2003», Звенигород, 2003. с. 12-19.
10. Борукаев Т.Б., Грузман И.С. Совмещение изображений при наличии масштабных искажений и разворота // Тез. докл. Междунар. конф. «ОИДИ90». Новосибирск: ВЦ СО АН СССР, 1990. - с. 40.
11. И. Ванцвайг М.Н., Полякова М.П. Установление поточечного соответствия изображений // Тез. докл. 2-й Всеросс. с участием стран СНГ конф. «Распознавание образов и анализ изображений» РОАИ-2-95. -Ульяновск: УлГТУ, 1995. ч. 2.
12. Вартанян И.А. Слуховой анализ сложных звуков. Л.: Наука, 1978. -151с.
13. Васильев К.К., Крашенинников В.Р. Адаптивные алгоритмы обнаружения аномалий на последовательности многомерных изображений // Компьютерная оптика. — Вып. 14-15,4.1, 1995. с. 125-132.
14. Васильев К.К., Крашенинников В.Р. Методы фильтрациимногомерных случайных полей. Саратов: СГУ, 1990. - 128 с.
15. Вентцель Е.С. Теория вероятностей. — М.: Академия, 2005. — 576 с.
16. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. С-Пб.: ВУС, 1999. - 204 с.
17. Галунов В.И. Речь как система. // Труды XIII сессии РАО, т. 3, 2003.-с. 19-21.
18. Галунов В.И., Соловьев А.Н. Современные проблемы в области распознавания речи // Информационные технологии и вычислительные системы. Вып. 2. Под. ред. С.В. Емельянова, 2004. 112 с.
19. Грузман И.С., Киричук B.C., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах. —ф Новосибисрк: Изд-во НГТУ, 2000. -168 с.
20. Губанов А.В., Ефимов В.М., Киричук B.C. и др. Методы оценивания взаимного смещения фрагментов изображений // Автометрия, N 3, 1988. с. 70-73.
21. Гудонавичюс Р.В., Кемешис П.П., Читавичюс А.Б. Распознавание речевых сигналов по их структурным свойствам. Л.: Энергия, 1977. - 64 с.
22. Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ "Регулярная и хаотическая динамика", 2001. - 464 с.
23. Дуб Дж.Л. Вероятностные процессы / Пер. с англ. под ред. A.M. Яглома. М.: ИЛ, 1956. - 606 с.
24. Зайченко Ю.П. Исследование операций. Киев: «Вища школа», 1975.-320 с.
25. Златоустова Л.В., Михайлов В.Г. Спорные вопросы теории восприятия единиц речи // Вестник МГУ, Филология, 1995.
26. Калинов Д.В. Моделирование и фильтрация речевых сигналов с использованием преобразования в изображения // Диссертация на соискание ученой степени кандидата технических наук. Ульяновск, 2003. - 141 с.
27. Книппер А.В. Индивидуальные вариации длительности элементов речи // Речевая информатика. Сборник трудов под ред. В.В. Зяблова. М.: Наука, 1989.-с. 34-48.
28. Кондратьев П.А. Анализ кривых в метеорологии // Журнал геофизики и метеорологии, №4, 1927. с. 313-327.
29. Королев Н.И. Достоверность корреляционного метода совмещения точечных изображений // Автометрия, N 5, 1993. с. 103-110.
30. Крашенинников В.Р. Основы теории обработки изображений. -Ульяновск: УлГТУ, 2003. 151 с.
31. Крашенинников В.Р., Калинов Д.В. Спиралевидная авторегрессионная модель квазипериодического сигнала, связанная с изображением на цилиндре // Вестник УлГТУ. Сер. Информационные технологии, №3, 2000. с. 4-10.
32. Крашенинников В.Р., Ташлинский А.Г. Адаптивно-морфологические методы совмещения изображений // Тез. докл. 2-й Всеросс. с участием стран СНГ конф. «Распознавание образов и анализ изображений» РОАИ-2-95, ч. 2.-Ульяновск: УлГТУ, 1995.-е. 149-150.
33. Крашенинников В.Р., Ташлинский А.Г., Армер А.И. Способ измерения фазового сдвига на фоне интенсивных помех // Решение о выдаче патента РФ на заявку № 2005114135/28 от 27.04.2006.
34. Крашенинников В.Р., Ташлинский А.Г., Армер А.И. Устройство распознавания речевых команд в условиях шумов // патент РФ № 2267820 от 10.01.2006.
35. Крашенинников И.В. Методы определения периода речевых сигналов // Труды Ульяновского научного центра «Ноосферные знания и технологии» РАЕН. Ульяновск, УНЦ НЗиТ РАЕН, т.2, вып. 1, 1999. - с. 111-116.
36. Крашенинников И.В. Моделирование, пространственно-временная фильтрация и распознавание речевых сигналов на фоне помех // Диссертация на соискание ученой степени кандидата технических наук. Ульяновск, 2000.-138 с.
37. Крашенинников И.В. Периодическое комплексирование речевых сигналов в изображение // Труды Международной конференции "Методы и средства преобразования и обработки аналоговой информации", т. 3. — Ульяновск: УлГТУ, 1999. с. 56-58.
38. Крашенинников И.В. Устойчивое к шумам распознавание речевых сигналов, преобразованных в изображения текущих коррелограмм // Тез. докл. 32-й научно-технич. конференции УлГТУ, ч.2. Ульяновск: УлГТУ, 1998.-с. 9-10.
39. Кринов С.Н., Слуцкер Г.С. Экспериментальная дикторонезависимая система понимания слитной речи // Речевая информатика. Сборник трудов под ред. В.В. Зяблова. М.: Наука, 1989. - с. 87-95.
40. Лабутин В.К., Молчанов А.П. Слух и анализ сигналов. М.: Энергия, 1967.-79 с.
41. Левин Б.Р. Теоретические основы статистической радиотехники / Б. Р. Левин. М.: Радио и связь, 1989. - 656 с.
42. Мазуренко И.Л. Компьютерные системы распознавания речи. // Интеллектуальные системы, т.З. вып. 1-2 —Москва, 1998.
43. Мазуренко И.Л. Одна модель распознавания речи. В сб.: Компьютерные аспекты в научных исследованиях и учебном процессе М.: Издательство Московского университета, 1996. - с. 136-147.
44. Малеев О.Г., Козлов Ю.М. Способ дикторонезависимого распознавания изолированных речевых команд // Патент РФ № 2103753 от0302.1997 г.
45. Маркел Дж. Д., Грэй А.Х. Линейное предсказание речи / Пер. с англ. М.: Связь, 1980. - 308 с.
46. Михайлов В.Г. К теории восприятия звучащей речи: соотношениеакустических и перцептивных параметров // Акустический журнал, т. 43, №2, 1997.-с. 219-224.
47. Моттль В.В., Копылов А.В. Алгоритмы совмещения изображений при растровых искажениях // Тез. докл. 2-й Всеросс. с участием стран СНГ конф. «Распознавание образов и анализ изображений» РОАИ-2-95, ч. 2. -Ульяновск: УлГТУ, 1995.-е. 162-164.
48. Моттль В.В., Мучник И.Б. Скрытые Марковские модели в структурном анализе сигналов. М.: Физматлит, 1999. - 352 с.
49. Мясникова Е.Н. Объективное распознавание звуков речи. Л.: Изд-во «Энергия», 1967. - 148 с.ф 55. Пиконе Дж. Методы моделирования сигнала в распознавании речи /
50. Пер. с англ. Р. Попов. Кемерово, 2000. - 79 с.
51. Поляк Б.Т., Цыпкин ЯЗ. Оптимальные псевдоградиентные У алгоритмы адаптации // Автоматика и телемеханика, N 8, 1980. с. 74-84.
52. Потапова Р.К. Речь: коммуникация, информация, кибернетика. М.: Радио и связь, 1997. - 568 с.
53. Пояснительная записка к этапу разработки эскизного проекта составной части опытно конструкторской работы «Речевая информационно-управляющая система «Говорун-1». Ульяновск: ОАО УКБП, 2004.-222 с.
54. Прикладная теория случайных процессов и полей // Коллективная монография под ред. К.К. Васильева и В.А. Омельченко. Ульяновск: УлГТУ, 1995.-е. 105-145.
55. Проблемы построения систем понимания речи. // Под ред. Цемель• Г.И., Сорокина В.Н. М.: Наука, 1980. - 144 с.
56. Прохоров Ю.Н. Статистические методы и рекуррентное предсказание речевых сигналов. М.: Радио и связь, 1984. - 240 с.
57. Пытьев Ю.П. Морфологический анализ изображений // Докл. АН СССР, т. 269, 1983.-е. 1061-1064.
58. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов: i Пер. с англ. под ред. М.В. Назарова, Ю.Н. Прохорова. М.: Радио и связь,1981.-495 с.
59. Репин В.Г., Тартаковский Г.П. Статистический синтез при априорной неопределенности и адаптация информационных систем. — М.: Советское радио, 1977. 432 с.
60. Сапожков М.А. Речевой сигнал в кибернетике и связи / М.А.ф Сапожков. М.: Связьиздат, 1963. - 452 с.
61. Сейдж Э.П., Меле Дж. Теория оценивания и ее применение в связи и управлении / Пер. с англ. под ред. Б.Р. Левина. М.: Связь, 1976. - 495 с.
62. Семавин В.И. Определение скорости движения по анализу последовательности кадров телевизионного изображения // Материалы 1-й Поволжской научно-техн. конф. «Научно-исследовательские разработки и
63. Ф высокие технологии двойного применения». — Самара: РАН, ч. 2, 1995. с.118.120.
64. Семушин И.В. Адаптивные схемы идентификации и контроля при I1 обработке случайных сигналов. Саратов: СГУ, 1985. - 180 с.
65. Серебренников М.Г., Первозванский А.А. Выявление скрытых периодичностей. -М.: Наука, 1965. 244 с.
66. Ситняковский И.В., Мейкшан В.И., Маглицкий Б.Н. Цифровая сельская связь. — М.: Радио и связь, 1994. 248 с.
67. Сорокин В.Н. Временные параметры элементов русской речи // Речевая информатика. Сборник трудов под ред. В.В. Зяблова. М.: Наука, 1989.-е. 5-33.
68. Сорокин В.Н. Теория речеобразования. М.: Радио и связь, 1985. -312 с.
69. Сорокин В.Н., Суханов В.А. Скрытые марковские модели в ф распознавании речи // Речевая информатика. Сборник трудов под ред. В.В.
70. Зяблова. М.: Наука, 1989. - с. 104-118.
71. Степанов О.А. Оптимальное решение задачи уточнения координат объекта в корреляционно-экстремальных системах навигации при использовании информации о поле в виде кадра // Автометрия, N 2, 1994. с. 18-27.
72. Столниц Э., ДеРоуз Т., Салезин Д. Вейвлеты в компьютерной графике. М.: РХД, 2002. - 272 с.
73. Тихонов В.И., Кульман Н.К. Нелинейная фильтрация и квазикогерентный прием сигналов. М.: Сов. радио, 1975. - 704 с.
74. Уидроу Б., Стирнз С. Адаптивная обработка сигналов / Пер. с англ. под ред. В.В. Шахгильдяна. М.: Радио и связь, 1989. - 440 с.
75. Фант Г. Акустическая теория речеобразования. М.: Наука, 1964. -• 283 с.
76. Физиология речи. Восприятие речи человеком / Под ред. JI.A. Чистович. JL: Наука, 1976. - 386 с.
77. Фланаган Дж. Анализ, синтез и восприятие речи. — М.: Связь, 1968. -396 с.
78. Фурман Я.А. О понятии формы плоского изображения // Автометрия, N 5,1992. с. 113-120.
79. Хайдер А.С. Математические модели и комплекс программ для Ф автоматического распознавания дикторов // Автореферат диссертации насоискание ученой степени кандидата технических наук. — Санкт-Петербург: ЛЭТИ, 2004. 17 с.
80. Ф 85. Харкевич А.А. Борьба с помехами. М.: Наука, 1965. - 277 с.
81. Хеннан Э. Многомерные временные ряды / Пер. с англ. под ред. Ю.А. Розанова. М.: Мир, 1974. - 575 с.
82. Черри Е., Хале М, Якобсон Р. К вопросу о логическом описании языков в их фонологическом аспекте // Новое в лингвистике. Под. Ред. В.А. Звягинцева. М.: ИЛ, 1962. - с. 279-298.
83. Чучупал В.Я., Маковкин К.А., Чичагов А.В. К вопросу об оптимальном выборе алфавита моделей звуков русской речи для распознавания речи // Искусственный интеллект, том 4, №1. Киев: Наука i освгга, 2002. - с. 575-579.
84. Чучупал В.Я., Чиганов А.С., Маковкин К.А. Цифровая фильтрация ф зашумленных речевых сигналов. М.: Вычислительный центр РАН, 1998.51 с.
85. В. Atal Effectiveness of linear prediction characteristics of the speech |) wave for automatic speaker identification and verification // J. Acoust. Soc.
86. Amer., Vol. 55, 1974.-pp. 1304-1312.
87. C.A. Brooks difference periodogramm, a method for the rapid determination of short periodicities // Proc. Roy. Soc., A105, 1924. p. 346.
88. V. Chuchupal, Makovkin Konstantin, Gorokhovsky Konstantin, Chichagov Alexander A Study of the Acoustic Model Choice for Russian Speech Recognition. In Proc. Intern. Workshop "Speech and Computer", SPECOM, 2002. pp. 53-56.
89. M. Desimio, T. Anderson, J. Westerkamp Phoneme recognition with a model of binaural hearing // IEEE Trans. Speech and Audio Processing, vol. 4, No.• 3, 1996.-pp. 157-165.
90. N.I. Durlach, K.J. Gabriel, H.S. Colburn, C. Trahiotis Interaural correlation discrimination. II Relation to binaural unmasking // J. Acoust. Soc. Amer., Vol. 79, N5, 1986.-pp. 1548-1557.
91. Y. Ephraim, D. Malah Speech enhancement using a minimum mean square error short-time spectral amplitude estimator // IEEE Trans. Acoust.,
92. Speech, Signal Processing, vol. ASSP-32, 1984. pp. 1109-1121.
93. D.M. Green, W.A. Yost Binaural analysis // Handbook of sensory physiology, vol. 5/2. Berlin: Springer-Verlag, 1975. pp. 403-408.
94. A. Habibi Two-dimensional Bayesian Estimate of Images. // In Proc. IEEE, vol. 60, July 1972. pp. 873-883.
95. H. Hermansky, N. Morgan, A. Bayya, P. Kohn Compensation for the effect of the communication channal in auditory-like analysis of speech // In Proc. EUROSPEECH, 1991.-pp. 1367-1370.
96. F. Jelinek Statistical Methods for Speech Recognition. Cambridge: The MIT Press, 1998.
97. V.R. Krasheninnikov, A.G. Tashlinskii, I.V. Krasheninnikov An adaptive algorithm for the identification of fingerprints// Pattern Recognition and Image Analysis. Birmingham, Al. 35201-1831,USA, vol.6, N 2, 1996. p. 277.
98. M. Kringleboth, T. Gundersen Frequency characteristics of the middle ear//J. Acoust. Soc. Amer., Vol. 77, N 1, 1985. pp. 159-164.
99. R. Lippmann, B. Gold "Neural classifiers useful for speech recognition"in. Proc. IEEE First Int. Conf. Neural Net. Vol. IV, 1987. pp. 417-422.
100. H. Lucke Which Stochastic Models Allow Baum-Welch Training? // IEEE Trans. Signal Processing, vol. 44, No. 11, 1996. pp. 2746-2756.$ 106. D. Macho, Y.M. Cheng Noise reduced speech recognition parameters //
101. US patent № 6678656 B2,2004.
102. B. Meng Speech recognition: not a typical engineering problem // Digit Des. N 6, 1985.-p. 49-57.
103. G. Miller, P. Nicely An Analysis of Perceptual Confusion among Consonants // J. Acoust. Soc. Am.,V. 27, № 2, 1955, pp. 338-352.
104. H. Mostafavi, F.W. Smith Image correlation with geometric distortion // IEEE Trans., v. AES-14, N 3, 1978. pp. 478-500.
105. A. Peinado, J. Segura, A. Rubio, P. Garcia, J. Perez Discriminative Codebook Design Using Multiple Vector Quantization in HMM-Based Speech• Recognizers // IEEE Trans. Speech and Audio Processing, vol. 4, No. 2, 1996. -pp. 89-94.
106. J.E. Porter, S.F. Boll Optimal estimators for spectral restoration of noisy speech // IEEE Int. Conf. Acoust., Speech, Signal Processing, 1989. pp. 258261.
107. W.S. Rhode Some observations on cohlear mechanics // J. Acoust. Soc.
108. Amer., Vol. 64, N 1,1978. pp. 158-176.
109. J.D. Robbins, A.N. Netravali Interframe television coding using movement compensation // Proc. Int. Conf. Commun.- Boston, 1979. pp. 23.4.123.4.5.
110. A. Sankar, C.-H. Lee, A Maximum-Likelihood Approach to Stochastic Matching for Robust Speech Recognition // IEEE Trans. Speech and Audioш Processing, vol. 4, No. 3, 1996. pp. 190-201.
111. В. Shahshahani A Markov Random Field Approach to Bayesian Speaker Adaptation. IEEE Trans. Speech and Audio Processing, vol. 5, No. 2, 1997. pp. 183-191.
112. E.A.G. Shaw, M.R. Stinson The human external and middle ear models and concepts // Mechanics of hearing. Delft: Martinus Nijhoff, 1983. pp. 3-10.
113. S.A. Singh Distinctive Feature Analysis of Responses to a Multiple Choice Intelligibility Test // IRAL, №6,1968. pp. 37-53.
114. Y. Yamada, K. Takahashi Speech recognition system in which voised intervals are broken into segments that may have unequal durations // US patent № 4979212, 1990.
115. W.A. Yost, J. Walton Hierarchy of masking-level differences obtained for temporal masking // J. Acoust. Soc. Amer. Vol. 61, N 5, 1977. pp. 1376— 1378.
116. Модель изменчивости речевых сигналов, позволяющая получать варианты произнесения речевых команд. Имитированные варианты используются при подготовке библиотеки эталонных речевых команд и для тестирования и отладки системы распознавания.
117. Алгоритмы повышения помехоустойчивости системы распознавания речевых команд, основанные на зашумлении эталонов опорным шумом.
118. Алгоритм распознавания речевых команд, основанный на построении и совмещении автокорреляционных портретов, позволяющий повысить вероятность правильного распознавания речевых команд.
119. Указанные результаты были реализованы в математической модели РИУС «Говорун-1» и в макетном образце РИУС, которые внедрены в состав комплексных стендов бортового радиоэлектронного оборудования перепек
120. Главный конструктор, к.т.н.1. В.П. Деревянкин1. Начальник НИО-151. А.В. Михеичев
-
Похожие работы
- Выделение и предобработка сигналов в системах автоматического распознавания речевых команд
- Разработка и исследование системы распознавания речевых сигналов, искаженных вибропомехами и фоновыми шумами
- Синтез, анализ и практическая реализация алгоритмов распознавания и предобработки речевых сообщений
- Алгоритмы распознавания типов комбинированных помех для обнаружителей радиосигналов
- Модели и алгоритмы распознавания коротких речевых команд на основе пробных спектральных преобразований входного сигнала
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность