Исследование и разработка методов автоматического синтеза речи по фонемному тексту

Лобанов, Борис Мефодьевич

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка методов автоматического синтеза речи по фонемному тексту

доктора технических наук: Лобанов, Борис Мефодьевич
город: Минск
год: 1984
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов автоматического синтеза речи по фонемному тексту»

Оглавление автор диссертации — доктора технических наук Лобанов, Борис Мефодьевич

ВВВДЕНИЕ.

ГЛАВА I. ЛИНГВОМУСТИЧЕСКИЕ ОСНОВЫ СИНТЕЗА. РЕЧИ

ПО ТЕКСТУ.

1.1. Система фонем русского языка и аллофония речи.

1.2. Просодические характеристики русской речи.

1.3. Элементы акустической теории речеобразо-вания.

1.4. Формантная модель синтеза звуков речи.

Выводы.«.

ГЛАВА 2. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ФОРМАНТНЫХ

И ПРОСХЩЧЕСКИХ ХАРАКТЕРИСТИК РЕЧИ.

2.1. Формантные параметры аллофонов речи одного диктора.

2.2. Формантные частоты гласных и согласных многих дикторов.

2.3. Просодические характеристики односинтагменных фраз.г

Выводы.

ШВА 3. МОДЕЛЬ АРТИКУЛЯТОРНОЙ ДИНАМИКИ РЕЧЕ0БРА30ВАНШ.

3.1. Артикуляторно-командное представление фонем.

3.2. Динамика движения активных артикуляторов.

3.3. Временная организация артикуляторных движений.

Выводы.

ГЛАВА 4. ВЫЧИСЛЕНИЕ ФОРМАНТНЫХ ПАРАМЕТРОВ ПО ФУНКЦИЯМ

ДВИЖЕНИЯ АРТИКУЛЯТОРОВ.

4.1. Формантная модель ^внутрислоговой коартикуляции.

4.2. Вычисление текущих значений формантных частот.

4.3. Вычисление текущих значений амплитудных параметров.

Выводы.

ГЛАВА 5. СИНТЕЗ ФОРМАНТНЫХ ПАРАМЕТРОВ ПО ФОНШНОМУ

ТЕКСТУ.

5.1. Динамический формантный портрет фонемы.

5.2. Модификация формантных параметров фонемы в речевом потоке.

5.3. Алгоритм синтеза формантных параметров по фонемному тексту.

Выводы.

ГЛАВА 6. МОДЕЛЬ СИНТЕЗА ПРОСОДИЧЕСКИХ ХАРАКТЕРИСТИК РЕЧИ.

6.1. Особенности просодической организации русской речи.

6.2. Просодические портреты интонем.

6.3. Алгоритм синтеза просодики речи по тексту. 218 Выводы.

ГЛАВА 7. СИНТЕЗ РЕЧЕВОГО СИГНАЛА ПО ФОРМАНТНЫМ ПАРАМЕТРАМ.

7.1. Методы синтеза речевых сигналов.

7.2. Источники возбуждения формантной модели речевого тракта.

7.3. Аналоговая и цифровая реализации формаятного синтезатора.

Выводы.

ГЛАВА 8. АППАРАТУШО-ПРОГРАММНАЯ РЕАЛИЗАЦИЯ СИНТЕЗАТОРОВ

РЕЧИ КАК УСТРОЙСТВ РЕЧЕВОГО ВЫВОДА ИНФОРМАЦИИ

ИЗ ЭВМ.

8.1. Алгоритмы фонемно-интонационного транскрибирования текстов, выводимых из ЭВМ.

8.2. Серийное устройство речевого вывода на базе синтезатора речи "Фонемофон-3".

8.3. Синтезаторы речи серии "Фонемофон-4".

Выводы.

Введение 1984 год, диссертация по информатике, вычислительной технике и управлению, Лобанов, Борис Мефодьевич

Современный уровень развития вычислительной техники и ее повсеместное внедрение в человеко-машинных системах управления делают актуальной организацию общения человека и ЭВМ в одной из наиболее удобных для человека форм - в форме речевого диалога на естественном языке. Речевой способ общения в человеко-машинных системах имеет принципиальные преимущества, главными из которых являются следующие:

- удобство, естественность и простота общения,не требующая специальной подготовки, что существенно расширяет круг потенциальных пользователей автоматизированных систем управления, повышает эффективность использования ЭВМ;

- разгрузка зрительного канала при выводе информации и устранение ручных манипуляций при вводе, что увеличивает оперативность взаимодействия с ЭВМ и уменьшает число ошибок оператора;

- возможность использования в качестве терминалов обычных телефонных аппаратов и существующей сети телефонной связи, что существенно сокращает объем капитальных затрат при вводе в действие человеко-машинных систем массового обслуживания.

К настоящему времени созданы все предпосылки для промышленного освоения принципиально нового типа внешних устройств ЭВМ -устройств речевого ввода-вывода информации (УРВБ). Внедрение УРВБ будет иметь важное народно-хозяйственное значение. Можно указать на следующие основные области их применения:

I. Автоматизированные системы управления технологическими процессами. Здесь УРВБ используется самостоятельно, либо в комплексе с визуальным дисплеем (управление промышленными роботами,

САПР различного назначения, системы автоматизированной наладки и монтажа аппаратуры).

2. Человеко-машинные системы оперативного управления сложными объектами. Здесь УРВБ используется в дополнение к визуальному дисплею (система управления воздушным движением, диспетчерская служба энергосистем и т.п.).

3. Автоматизированные системы управления предприятий и отраслевые АСУ. УРВБ подключается к местной телефонной сети и обеспечивает выдачу информации по телефону по инициативе пользователя или ЭВМ (телефонная референтская служба министерств и ведомств, информационно-справочные службы в подсистемах контроля за выполнением приказов, материального снабжения, кадров и др.).

4. Телефонные информационно-справочные системы массового обслуживания. Здесь УРВБ подключается к городской телефонной сети (системы расчета с абонентами за услуги связи, телефонные справочные системы, службы сервиса и др.).

Перечисленные примеры далеко не полностью охватывают возможные сферы применения УРВБ. Важно отметить следующее: применение УРВБ существенно повысит эффективность использования вычислительной техники и сделает ЭВМ доступной самому широкому кругу пользователей.

Указанные преимущества систем речевого ввода-вывода информации в ЭВМ, их практическая реализуемость и умеренная стоимость при использовании новых поколений БИС и СБИС заставляет все большее число специалистов обращаться к проблеме автоматического-го анализа и синтеза речи. За последние несколько лет за рубежом (главным образом в США и Японии) резко возросло число сообщений о проектируемых или законченных образцах синтезаторов и анализаторов речи, выполненных на базе специализированных БИС иж микрокомпьютеров [ I ] .

Следует отметить, что речь идет только о разработке, производстве и внедрении устройств речевого ввода-вывода информации первого поколения, характеризующихся сравнительно низкими показателями назначения (объем словаря, надежность, удобство пользования и др.). Что же касается разрабатываемых в рамках различных научных программ и пока еще далеких до завершения систем речевого ввода-вывода, которые по своим показателям приближаются к естественным системам речевого общения между людьми (неограниченный объем словаря, слитная речь, высокая надежность связи и др.), то можно с уверенностью ожидать их еще более широкое распространение во всех сферах использования вычислительной техники.

Создание систем речевого общения с ЭВМ требует решения двух основных проблем: проблемы автоматического синтеза и проблемы автоматического анализа и распознавания речи. Настоящая работа посвящена исследованию вопросов, связанных, в основном, с решением первой проблемы. К настоящему времени существует ряд законченных разработок, обеспечивающих речевое воспроизведение от нескольких десятков до нескольких сотен слов [ 2 ] . Не умаляя их практического значения, отметим, что такого рода устройства вряд ли могут быть в полной мере названы синтезаторами речи. Фактически они выполняют функции цифрового магнитофона, обеспечивая речевое воспроизведение с произвольной выборкой из памяти отдельных слов или фраз, предварительно начитанных диктором.

В полном объеме проблема синтеза речи решается в тех исследованиях и разработках, в которых ставится задача автоматического синтеза речи произвольного словарного состава непосредственно по орфографическому или фонемному тексту сообщения. Эта задача еще окончательно не решена ни для одного из языков, хотя на ее решение были затрачены усилия многих исследователей в США, Японии, Франции и других странах. Исследователи сталкиваются здесь с принципиальными трудностями, связанными с созданием кибернетической системы, моделирующей речевое чтение человеком произвольных текстов. Следует отметить также, что далеко не все результаты, полученные для одного языка,годятся при разработке синтезатора речи другого языка. Фонетические системы каждого конкретного языка уникальны. Необходима конкретно-языковая разработка правил ритмико-мелодической организации речи, ассимиляции, коар-тикуляции и редукции звуков.

Впервые возможность синтеза русской речи по тексту была продемонстрирована в 1971 году в работе М.Ф.Деркача, Н.Г.Загоруйко, Г.Фанта и И.Лиженкранца [ 9 J , выполненной в Лаборатории передачи речи Королевского технологического института в Стокгольме. Определенный вклад в решение различных аспектов проблемы синтеза русской речи по тексту внесли также работы Л.В.Бондарко [4] , С.В.Голубцова [б] , В.И.Галунова [б] , Л.В.Златоустовой [7J , В.И.Еули [8] , Э.Ю.Кюннапа [э] , В.Н.Сорокина [ю] , Г.Д.Фролова [ilj , Л.А.Чистович [l2] и ряда других исследователей. Однако единая теория синтеза русской речи по тексту оставалась не разработанной. Не было также работ, направленных на создание универсальных устройств синтеза речи, способных выполнять функции стандартного внешнего устройства ЭВМ для вывода информации в речевом виде.

Таким образом, исследование проблемы синтеза речи по тексту актуально как в теоретическом плане создания кибернетической модели чтения текста человеком, так и в практическом плане создания универсальных устройств речевого вывода информации из ЭВМ, обеспечивающих синтез речи по произвольной выходной алфавитноцифровой информации.

К настоящему времени сложились три основных подхода в исследованиях и разработках проблемы синтеза речи: компиляционный, бионический и лингвоакустический.

В основу компиляционного подхода положено предположение, что любое сложное речевое сообщение может быть получено путем простого соединения (компиляции) элементарных речевых единиц. Элементарные единицы начитываются диктором, соответствующие им сигналы компрессируются тем или иным способом, кодируются и записываются в ПЗУ. При синтезе речевого сообщения из ПЗУ считыва-ются в нужной последовательности закодированные речевые единицы с одновременным восстановлением речевого сигнала.

Очевидная идейная простота компиляционного метода и простота его технической реализации обусловили большое количество зарубежных сообщений о проектируемых и законченных разработках компиляционных синтезаторов и их применении [ 2 ] . В СССР проделаны опыты синтеза русской речи, когда в качестве элементарных речевых единиц использовались аллофоны [13 ] , слоги [14 ] , словоформы [l5] , синтагмы или фразы [1б] . К настоящему времени выяснилось, однако, что удовлетворительный по качеству компиляционный синтез речи возможен лишь при использовании в каче;-стве элементарных речевых единиц отдельных фраз либо отдельных словоформ, подставляемых в определенное место стандартной фразы. Попытки добиться возможности высококачественного синтеза произвольного текста путем простой компиляции словоформ,слогов или аллофонов не привели к положительным результатам. Стало ясно, что все эти элементы речи тесно связаны внутри фразы. В слитной речи не существует аналогов этих элементов, произнесенных изолированно, и, наоборот, речь, составленная из изолированно произнесенных элементов, звучит ненатурально.

В определенной степени противоположным компиляционному является бионический подход к созданию систем синтеза речи. При этом подходе решается задача моделирования физиологических процессов речеобразования у человека. Исследуются и моделируются нейрофизиологические [l7j , механические f10 J , аэродинамические f18J и акустические [19] аспекты физиологии речеобразования. Признавая большую общенаучную значимость этого подхода, отметим, что в практическом отношении он еще очень далек от завершения. В настоящее время имеются весьма фрагментарные бионические модели речеобразования и делаются лишь первые попытки их использования для построения устройств синтеза речи [20] .

Третий, лингвоакустический подход к проблеме синтеза речи, разрабатываемый в данной диссертации характеризуется стремлением получить функциональную модель речеобразования, адекватную реально существующим языковым и акустическим явлениям. Входом такой модели является синтезируемый текст произвольного содержания, выходом - акустические речевые сигналы, обеспечивающие высококачественное звучание заданного текста. По своему существу разрабатываемая в рамках данного подхода модель является кибернетической функциональной моделью чтения текстов человеком. Она рассматривается как аналог естественного процесса образования речи и учитывает, с одной стороны, законы реализации и функционирования в речи лингвистических единиц различного уровня, а с другой - конкретное акустическое проявление деятельности речевого аппарата в процессе звуковой реализации этих лингвистических единиц.

Лингвоакустический подход базируется на двух фундаментальных понятиях: лингвистического - фонемы и акустического - форманты.

Под фонемой понимается наименьшая языковая единица, имеющая смыслоразличительное значение. Из последовательности фонем строятся слова35, являвдиеся элементарными носителями смысла. Смысл высказывания выражается посредством цепочки слов, состоящих в свою очередь из цепочки фонем. Это означает, что если мы сумеем построить устройство, которое по последовательности фонем будет синтезировать разборчивые речевые сигналы, то с помощью такого устройства станет возможным автоматически выразить в устной форме смысл любого правильно сформулированного предложения или текста.

Под формантами понимаются частотные резонансы (полюса передаточной функции) речевой акустической системы. Параметры формант (частота, ширина, амплитуда) определяются акустическими свойствами системы. В частности, один из наиболее важных параметров - частота форманты, тесно связан с геометрической конфигурацией речевого тракта [2l] . Поскольку в процессе производства речи конфигурация речевого тракта непрерывно изменяется, то в соответствии с этими изменениями закономерно изменяются фор-мантные частоты. Доказано, что формантное описание речевого сигнала является наиболее экономным [ 22] , а речь, восстановленная по формантным параметрам, практически неотличима от естественной [ 23 ] .

Таким образом, формантное описание, с одной стороны, позволяет весьма точно и экономно описать речевой сигнал, а с другой

36 На письме слова отображаются последовательностью букв. Для русского языка существуют простые алгоритмы преобразования "буква - фонема" [?] . оно тесно связано с процессами артикуляции звуков, т.е. в конечном счете с фонемным текстом сообщения.

Более 10 лет тому назад эти соображения стимулировали автора к разработке в рамках лингвоакустического подхода фонемно-формантного метода (ФФ-метода) синтеза речи. Непосредственной разработке ФФ-метода предшествовали исследования информационно-модуляционной структуры речи [ 24-26 ] , разработка методов анализа фонетических и акустических признаков речевого сигнала [2730 J , формантных характеристик русских фонем [ 31-33 ] и интонационных характеристик речи [34-35] . На базе этих исследований в 1972 году был создан первый в стране фонемно-формантный синтезатор речи "Фонемофон-I". Результатом дальнейших исследований ФФ-метода явилось создание все более совершенных второй (1974г), третьей (1978г) и четвертой (1982г) моделей синтезатора русской речи. Из них "Фонемофон-3" освоен в производстве в 1982 году и является первым серийно выпускаемым отечественным синтезатором речи. Подготавливается к производству модель синтезатора речи "Фонемофон-4", освоение которой намечено на 1983 год. Различные аспекты технической реализации ФФ-метода защищены авторскими свидетельствами на изобретения [36-44] .

Экспертная оценка качества синтеза речи, полученная для последней модели "Фонемофон-4", показала ее полную разборчивость и вполне удовлетворительную практически для всех применений натуральность звучания. Отметим также, что в техническом плане реализация ФФ-метода не представляется слишком громоздкой. На элементах средней интеграции объем синтезатора не превышает 6-10 плат, а с применением К-МОП БИС в ближайшие 1-2 года ожидается его одноплатная реализация.

В связи со сказанным можно констатировать, что для целей синтеза русской речи развиваемый в диссертации ФФ-метод достиг достаточно высокой степени завершенности. ФФ-метод по своей сути может быть с успехом адаптирован также для синтеза иноязычной речи. За рубежом ведутся широкие исследования и разработки различных аспектов ФФ-метода синтеза английского [45] , немецкого [46 ] , французского [47 ] и других языков. Однако в этих исследованиях отсутствует четкая последовательность в использовании лингвоакустического подхода. Зачастую разрабатываемые методы являются комбинацией лингвоакустического подхода с компилятивным [46,47] или бионическим [45] . Разработанный автором в рамках ФФ-метода многоязычный синтезатор речи "Фонемофон-5" демонстрирует конструктивность лингвоакустического подхода и для синтеза иноязычной речи.

Исследования, проведенные в области создания моделей синтеза речи по тексту, позволили вскрыть тонкие глубинные и поверхностные структуры звуковой организации речевого потока. Удовлетворительный по качеству синтез речи по тексту в принципе невозможен, если не созданы всеобъемлющая и детально проработанная акустическая модель полной системы фонем языка, модель их модифика'-ций в речевом потоке под действием комбинаторных, позиционных и просодических факторов. Таким образом, по мере разработки все более качественной модели синтеза речи по тексту накапливается все больше достоверной информации об эталонных образах каждой фонемы и их модификаций в речевом потоке. Эта информация является исключительно ценной для смежной области - автоматического фонемного распознавания речи.

Диссертация содержит 8 глав, введение и заключение.

Заключение диссертация на тему "Исследование и разработка методов автоматического синтеза речи по фонемному тексту"

Выводы

1. Для высокоэффективного использования синтезаторов речи как внешних устройств ЭВМ необходимо осуществить фонемно-интона-ционное транскрибирование текстов, выводимых из ЭВМ. Алгоритм автоматического транскрибирования следует разрабатывать, исходя из разумного компромисса между их алгоритмической сложностью и допустимым машинным акцентом речи, синтезированной по полученной фонемно-интонационной транскрипции.

2. Для расширения сферы применения синтезаторов речи как серийных устройств речевого вывода информации в их состав должны входить блоки, обеспечивающие связь синтезатора речи с базовой ЭВМ и телефонной сетью. Этим условиям удовлетворяют синтезаторы речи серии "Фонемофон-З".

3. Окончательным схемным решением построения синтезатора речи является структура, в которой алгоритм синтеза формантных параметров реализуются на элементах микропроцессорной техники с использованием микропроцессорных наборов. При этом достигается унификация схемных решений, возможность оперативного совершенствования алгоритмов синтеза речи, простота замены отдельных программных лингвоблоков при переходе с одного языка на другой. Этим условиям удовлетворяют синтезаторы речи серии пФонемофон-4и.

ЗАКЛЮЧЕНИЕ

Основными новыми научными результатами работы являются:

1. Создание лингвоакустического направления исследований и разработки методов синтеза речи по тексту, основанного на использовании результатов экспериментально-фонетических исследований речи, развитии акустической теории речеобразования и обобщении опыта построения устройств речевого вывода информации. Разрабатываемые в рамках этого направления методы синтеза речи являются по своему существу кибернетическими функциональными моделями чтения текста человеком.

2. Детальная разработка в рамках лингвоакустического направления фонемно-формантных методов синтеза речи, базирующаяся на двух фундаментальных понятиях: лингвистического понятия - фонемы и акустического - форманты. Конечным итогом разработки этих методов явилось установление функциональных и алгоритмических связей в цепочке преобразований: орфографический текст -— фонемный текст-е- формантные параметры -речевой сигнал.

3. Получение экспериментальных данных о полном наборе значений формантных параметров основных аллофонов русской речи для одного и многих дикторов, построение на их основе эталонных формантных характеристик фонем.

4. Экспериментальное подтверждение и уточнение роли просодических характеристик речи (частоты основного тона, длительности звуков и их интенсивности) в формировании интонации и ударений односинтагменных фраз.

5. Создание функциональной модели артикуляторной динамики речеобразования, с использованием которой получены артткулятор-но-командный код фонем, уточнена динамика фонемных переходов и сформулированы принципы временной организации фонетических явлений в текущей речи,

6.Теоретическая разработка и создание простого метода вычисления текущих значений формантных параметров по временным функциям движения артикуляторных параметров. В основу метода положена линейная аппроксимация артикуляторно-формантных связей с учетом явлений коартикуляции.

7. Принципиальное решение задачи синтеза формантных параметров непосредственно по фонемному тексту, основанное на определении понятия динамического портрета фонемы. Динамический портрет фонемы является универсальной моделью ее представления в пространстве частотно- и амплитудно-временных формантных характеристик.

8. Экспериментальная разработка и создание библиотеки динамических портретов 42-х фонем русской речи. Разработка и создание комплекса правил и алгоритмов модификации фонемных портретов в речевом потоке, учитывающих явление внутрислоговой коартикуляции, редукции и ряда других аллофонических явлений речи.

9. Теоретическая разработка и создание универсальной модели синтеза просодических характеристик речи, в основе которой лежит способ создания мелодики, ритмики и энергетики речи посредством конечного набора нормированных портретов интонем.

10. Экспериментальная разработка и создание библиотеки нормированных портретов интонем русской речи, комплекса правил и алгоритмов модификации портретов интонем при синтезе речи по заданному тексту.

11. Теоретическая разработка и создание модели формирования сигналов тонального возбуждения формантных фильтров, форма которых адекватна форме колебаний, создаваемых голосовыми связками. В основу модели положен принцип независимого регулирования параметров импульсов возбуждения, формируемых при синтезе речевого сигнала.

12. Принципиальное решение задачи формантного синтеза речевых сигналов с помощью ограниченного числа последовательно соединенных формантных фильтров. Экспериментальная и теоретическая разработка модифицированного формантного фильтра для решения этой задачи.

13. Исследование и разработка алгоритмов фонемно-интонацион-ного транскрибирования орфографических текстов для синтеза речи по выходной алфавитно-цифровой информации ЭВМ. Создание универсальной структуры многоязычного синтезатора речи, в котором задача перехода от одного языка на другой решается путем замены небольшого числа программных лингвоблоков.

Основными новыми практическими результатами работы являются:

1. Разработка универсального синтезатора русской речи, решающего в реальном масштабе времени задачу автоматического чтения произвольного текста неограниченного словаря с высокой разборчивостью и качеством синтетической речи.

2. Создание принципиально нового типа внешних устройств ЭВМ

- устройств речевого вывода информации, предназначенных для озвучивания выходной алфавитно-цифровой информации из ЭВМ.

3. Разработка схемотехнических вопросов построения модели синтезатора речи, выполненного полностью на элементах цифровой техники с целью его микроминиатюризации и исполнения в виде нескольких БИС или СБИС.

4. Создание технического обеспечения телефонных информационно-справочных систем с речевым выводом, в которых синтезатор речи связан с ЭВМ и телефонной сетью и предназначен для выдачи информации абонентам телефонной сети по их инициативе, или по ини

- циативе ЭВМ.

5. Разработка схемотехнических и аппаратурно-программных аспектов построения синтезаторов речи, обеспечивших впервые в СССР их серийное производство как внешних устройств СМ и ЕС ЭВМ.

6. Создание впервые в СССР ряда экспериментальных и промышленных систем с речевым выводом инфорлации, опытно-промышленная эксплуатация которых подтвердила высокую экономическую эффективность внедрения синтезаторов речи в автоматизированных системах управления различных уровней.

Научные и практические результаты диссертационной работы, начиная с 1968 года, неоднократно докладывались и прошли апробацию на Всесоюзных семинарах по автоматическому распознаванию слуховых образов (АРСО-4 - APC0-I3), а также на ряде других, в том числе международных 90,91,97 , конференциях и семинарах.

Разработанные устройства синтеза речи демонстрировались на ведомственных выставках, на ВДНХ СССР и международных выставках TELE сом (Женева, 1979г) и "Связь-81" (Москва, 1981г).

Библиография Лобанов, Борис Мефодьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Лебосс Б. Промышленность осваивает системы синтеза и распознавания речи. Электроника, 1980, № 12, с. 78-89.

2. Соловьев В.А. Методы и средства синтеза речи. Зарубежная электронная техника, № 12 (246), М., 1981, с. 1-49.

3. Деркач М.Ф., Загоруйко Н.Г. и др. Синтез русской речи по правилам. Вычислительные системы. Вып. 44, Новосибирск, 1971, с. 70-91.

4. Бондарко Л.В. Структура слога и характеристики фонем. Вопросы языкознания, 1967, № I, с. 34-46.

5. Голубцов С.В. Синтез речи. Труды Всесоюзной школы-семинара АРСО-4. Киев, 1969, с. 107-130.

6. Галунов В.И. и др. Биофизика речеобразования. Сб. докладов симпозиума "Модели речевого процесса в норме и патологии". Л., 1980, с. 25-44.

7. Златоустова Л.В. и др. Алгоритмы преобразования русских орфографических текстов в фонетическую запись. М., Изд. МГУ,1970.

8. Куля В.И., Питомец Г.И. Синтез речевых сигналов на ЭВМ по предварительно размеченному орфографическому тексту. Сб. трудов Всесоюзной конференции "Анализ и синтез речи". Изд. МПШШ, Минск, 1973, с. I8I-I96.

9. Кюннап Э.Ю. Синтезаторы речевого сигнала. Таллин, "Валгус", 1975.

10. Сорокин В.Н. К теории речеобразования. В кн.: Речевое общение в автоматизированных системах. М., "Наука", 1975, с.103-127.

11. Фролов Г.Д. Автоматическое преобразование с помощью ЭВМ русской письменной речи в устную. В кн.: Проблемы кибернетики. Вып. 28, М., "Наука", 1974, с. 245-268.

12. Чистович Л.А. и др. Речь. Артикуляция и восприятие. Л., "Наука", 1965.

13. Иванова Р.С., Трунин-Донской В.Н. Организация аллофонно-го компилятивного синтеза речи. Тезисы докладов Всесоюзной школ-лы-семинара APC0-II. Ереван, 1980, с. 159-162.

14. Вайншток А.П. и др. Фрагментная компиляция речи. Тезисы докладов Всесоюзной школы-семинара APC0-I2. Киев, 1982, с. 387389.

15. Людовик Е.К. Система пословного синтеза речи на 1000 слов. Тезисы докладов Всесоюзной школы-семинара APC0-II, Ереван, 1980, с. 137-139.

16. Лобанов Б.М., Данченко Б.В., Первой Л.М. Синтез речи методом компиляции формантных параметров. Тезисы докладов Всесоюзной школы-семинара APC0-II. Ереван, 1980, с. 163.

17. Галунов В.И. Структура речевого процесса. Сб.докладов симпозиума "Модели речевого процесса в норме и патологии". Л., 1980, с. 3-14.

18. Сорокин В.Н. Шумы турбулизации в речеобразовании. Тезисы докладов Всесоюзной школы-семинара APC0-I2. Киев, 1982,с. 432-435.

19. Maeda S. The Role of the Sinus Cavities in the Production of Nasal Vowels.Proc.of ICASSP-82,Paris,1982, p.911-914.

20. Hiki S., Nijad K., Oizumi J. Speech Synthesis by Control of Eerophysiological Parameters. Proc. of Conference on

21. Speech Communication and Processing Massachusetts, 1972,p. 136-139.

22. Фант Г. Акустическая теория речеобразования. М., "Наука", 1964.

23. Фланаган Д. Вычислительные машины говорят и слушают. Речевое общение человека с машиной. ТИИЭР, т. 64, № 4, с. 5-17.

24. Pant G., Martony J. et al. Resent Progress in dormant Synthesis of connected speech. J.A.S.A., v.33,H6, 1961, p.834.

25. Лобанов Б.М. 0 речевом сигнале в свете общей теории связи. Сб.: "Новые разработки радиотехнических устройств". Минск, 1968, с. 170-184.

26. Лобанов Б.М. Некоторые вопросы анализа речевых сигналов. Автореф. дис. . канд. техн. наук. НИИР, М., 1968,с.2'tS.

27. Lobanov. More about Speech signal and the Main Principles of its Analysis. IEEE Trans, on Audio and Electro acoustics,1. И 3, 1970, p. 316-517.

28. Лобанов Б.М. Об автоматическом выделении шумных звуков. Электросвязь, № II, 1968, с. 21-24.

29. Лобанов Б.М. Об автоматическом выделении шумных звуковметодом фазовой плоскости. Акустический журнал, вып, 3, 1970,с.425428.

30. Бухтилов Л.Д., Дегтярев Н.П., Лобанов Б.М. О выделении признака "тон не тон". Тр. Акустического ин-та, вып. XII, М., 1970, с. 17-20.

31. Дегтярев Н.П., Лобанов Б.М. Об автоматическом распознавании группы взрывных звуков. Тезисы докладов УН Всесоюзной акустической конференции. Л., 1971, g. 31-33.

32. Lobanov В.М. Classification of Russian Vowels Spoken by Different Speakers. J.A.S.A. N2(2). 197% P- 521-523.

33. Lobanov B.M. On the Classification of Russian Fricatives in SV-syllables for Different Speakers. J.A.S.A., N4 (2), 1971, p. 1324-1327.

34. Башкина Б.М., Лобанов Б.М. Исследование свойств слуховой адаптации при классификации гласных. Труды Всесоюзного семинара АРСО-6. Таллин, 1971, с. I28-I3I.

35. Лобанов Б.М. Вопросы автоматического анализа и синтеза фразовой интонации. Тезисы докладов Всесоюзной конференции "Анализ и синтез речи". Минск, 1972, с. 3II-3I2.

36. Лобанов Б.М., Башкина Б.М. Синтез по правилам просодических характеристик односинтагменных фраз. Труды Всесоюзного семинара AFC0-7. Алма-Ата, 1973, с. 124-126.

37. Лобанов Б.М. Устройство для синтеза речи. Авт. свид. № 459797. Заявл. 25.7.72г.,Б.И. № 5, 1975.

38. Лобанов Б.М. Формантный синтезатор речи. Авт. свид. № 479107. Заявл. 19.2.73г. , Б.И. № 28, 1975.

39. Лобанов Б.М., Данченко Б.В., Слуцкер Г.С. Устройство для синтеза речи. Авт. свид. £ 485492. Заявл. 9.1.73г.,Б.И.№35, 1975.

40. Лобанов Б.М., Данченко Б.В. Формирователь импульсов тонального возбуждения. Авт. свид. № 492914. Заявл. 7.6.74г.Б.И.№8,19*5.

41. Лобанов Б.М. Синтезатор речи. Авт. свид. № 533966.Заявл. 15.1.75Г, Б.И. № 40, 1976.

42. Лобанов Б.М. Устройство для синтеза речи. Авт. свид. № 568962. Заявл. 6.1.76г., Б.И. № 30, 1977.

43. Лобанов Б.М., Данченко Б.В. Устройство для синтеза речи. Авт. свид. № 568853. Заявл. 6.1.76г., Б.И., № 30, 1977.

44. Лобанов Б.М., Данченко Б.В. Устройство для вывода речевой информации. Авт. свид. № 533925. Заявл. П.7.75г. ,Б.И.М8,1978.

45. Allwood Е., Scully С. A composite Model of Speech.Production. Proc. of .ICASSP, Paris, 1982, p.936-939

46. GroBmann E.R. Speech. Synthesis in the Time Domain from

47. Text. Proc. of ICASSP, Paris, 1982, p. 936-939.

48. Courbon J.-L., Emerard F. Cparte: a Text-to-Speech Machine Using Synthesis by Diphones. Proc. of ICASSP, Paris, 1982, P.1597-1600.

49. Речевая связь с машинами (тематический выпуск). ТИИЭР,т. 64, № 4, 1976.

50. Зиндер Л.Р. Памяти академика Л.В.Щербы. Л., 1951,М£3.

51. Аванесов Р.И. Фонетика современного русского литературного языка. М., 1956, с.

52. Панов М.В. русская фонетика. М., 1967,с.Ч5&.

53. Зиндер Л.Р. Общая фонетика. Л., I960,е.33€,

54. Матусевич М.И. Современный русский язык. Фонетика. М., 1976 ,t.lZ4.

55. Бондарко Л.В. Звуковой строй современного русского языка. Л., 1977, C.ZZ3.

56. Артемов В.А. Метод структурного анализа речевой интонации. М., 1962, c.i£8.

57. Златоустова Л.В. Фонетическая структура слова в потоке речи. Казань, 1962, с. f3<?.

58. Брызгунова Е.А. Звуки и интонация русской речи. М., 1977.

59. Светозарова Н.Д. Интонационная система русского языка. Л., 1982, е. Zl Ч.

60. Артемов В.А. Экспериментальная фонетика. М., 1956, е.'З^.

61. Жинкин Н.И. Механизмы речи. М., 1958, о.ч<в.

62. Скалозуб Л.Г. Палатограммы и рентгенограммы согласных фонем русского литературного языка. Киев, 1963,

63. Матусевич М.И., Любимова Н.И. Альбом артикуляции звуков русского языка. М., 1963, с, &R.

64. Сапожков М.А. Речевой сигнал в кибернетике и связи. М., Связьиздат, 1963, е, ^гъ,

65. Фланаган Дж. Анализ, синтез и восприятие речи. М.,Связь, 1968, C.3qg,

66. Лобанов Б.М. Принципы автоматического синтеза интонационных структур. В кн.: Автоматическое распознавание слуховых образов. Тбилиси, 1978, с. 158-160.

67. Бухтилов Л.Д., Лобанов Б.М., Минкевич Б.Б. Алгоритм автоматического синтеза интонации по печатному тексту. В кн.: Автоматическое распознавание слуховых образов. Тбилиси, 1978,с.132-133.

68. Dunn Ы. Methods of Measuring Vowel Formant Bandwidth. J.A.S.A., v. 33, 1961, p.1737-17^6.

69. Лобанов Б.М., Данченко Б.В. Формантный синтез речи по последовательности аллофонов. Труды Всесоюзной акустической конференции. М., 1973, с. I09-II2.

70. Дегтярев Н.П., Лобанов Б.М. Об автоматическом анализе и синтезе звонких фрикативных звуков. Труды Всесоюзной акустической конференции. М., 1973, с. 105-108.

71. Фант Г. Анализ и синтез речи. Новосибирск, "Наука", 1970.

72. Бондарко Л.В. Слоговая структура речи и дифференциальные признаки фонем. Докт. дисс., ЛГУ, 1969te.3&?,r

73. Цеммель Г.И. Опознание речевых сигналов. М., "Наука",1971.

74. Лобанов Б.М. Об автоматическом синтезе некоторых просодических характеристик русской речи. Труды Всесоюзной конференции "Анализ и синтез речи". Минск, 1973, с. 196-202.

75. Лобанов Б.М., Башкина Б.М. Синтез интонации и ударение простейших односинтагменных фраз. Труды Всесоюзной конференции "Анализ и синтез речи". Минск, 1973, с. 86-94.

76. Отчет по НИР А 69-70, шифр "Фонема", гос.регистр. № 71045042, Минский радиотехнический институт, 1973,

77. Отчет по НИР № 253-75-465 "Разработка устройств синтеза речи для вывода информации из ЭВМ". МОНИИС, Минск, 1977, еАМ.

78. Fant G. Mote on Vocal Tract Size Factors and Non-Uniform F-Pattern Scalings. SIL-QPSR-4, Jan. 1967,

79. Gerstman L.J. Classification of Self-Normalized Vowels. IEEE Trans, on Audio and ElectroacOust. И 1, 19687 p. 112 V

80. Stevens И.E* Acoustic Correlates of Place of Articulation for Stop and Fricative Consonants. Q.P.R. MIT, N 89, 1968, p./99 -206.

81. Flanagan J. et al. Synthetic Voices for Computers. IEEE Spectrum, v. 7, В 10, 1970, pp. 22-45.

82. Flanagan J. et al. Synthesis of Speech from Dynamic Model of the Vocal Cords and Vocal Tract. Bell Syst. Tech. J., v. 1975» PP. 485-506.

83. Кокер К. Модель артикуляторной динамики и управления. ТИИЭР, J& 4, 1976, с. 38-48.

84. Coker С. et al. Automatic Synthesis from Ordinary English Text. IEEE Trans. Audio Electroacoust.V.AU-21,1973,p.293-298.

85. Shigenava M. Articulatoiy Movements by the Time Optimal control. Proc. of the 7"bh Int. Congr. on Acoust. Budapest, 1971» PP. 241-244«

86. Лобанов Б.М., Панченко Б.В. Динамическая модель фонемно-артикуляторного преобразования. Тезисы докладов УШ Всесоюзного семинара AFC0-8, Львов, 1974, с. 94-96.

87. Лобанов Б.М., Минкевич В.В. Алгоритмы временной организации слога в системе фонемного синтеза речи. Тезисы докладов XI Всесоюзной школы-семинара, AFC0-XI. Ереван, 1980, с. 156-158.

88. Лобанов Б.М. Текущее определение формантных частот по функциям движения артикуляторов. Тезисы докладов УН Всесоюзногосеминара АРСО-8. Львов, 1974^ с. 91-93.

89. Lobanov В.М., Panchenko B.V. An Articulator?" Model of

90. Speech. Synthesis. Repoi^ts oji Open Seminar on Acoustic. Wroclaw, 1975,P. 120-125.

91. Lobanav B.iui. Articulatory-Formant Speech Synthesis from Printed text. Proc. of Franco-Soviet Symp. on Speech. Grenoble, 1981, p. 224-251.

92. Бойкевич A.M., Лобанов Б.М. Принципы построения синтезатора речи на базе программируемой ЭВМ. Тезисы докладов XI Всесоюзного семинара APC0-II., Ереван, 1980, с. 143-145.

93. Itakura F., Saito S. An Audio Response Unit Based on Partial Correlation. IEEE Trans. C0M-20, 1972,/<>• 2/7-2.23.

94. Маркел Д., Грэй А. Линейное предсказание речи. М.,"Связь", 1980j с. ЗЮ.

95. Ohman S. Numerical Model of Co articulation. J.A.S.A., v. 41, N 2, 1967, p.

96. Буданицкий Э.Г., Лобанов Б.М. Исследование коартикуляции на акустическом уровне. Тезисы докладов УШ Всесоюзного семинара АРСО-8, Львов, 1974, с. 67-69.

97. Lobanov В.М. On the Acoustic Theory of Co articulation and Reduction. Proc. 1САБР-82, Paris, 1982, p. 915-918.

98. Лобанов Б.М., Панченко Б.В. Модель фонемно-артикулятор-ного синтеза речи. Доклады Всесоюзного симпозиума "Модели речевого процесса в норме и патологии". Л., 1980, с. 41-59.

99. Holmes J.W. et al. Speech Synthesis by Rule. Language and Speech., N 7, 1964, pp. 127-143.

100. Ainsworth W. A System for Converting English Text into Speech. Proc. of Conference on Speech Comm. and Processing, Mass., 1972, pp. 34-37

101. Klatt D. The Klattalk Tert-to-Speech Conversion System. Proc. of ICASSP-82, Paris, p. 1589-1592.

102. Santos J., ITombela J. Texrb^to-Speech Conversion in Spanish. A Complect Rule-Based. Synthesis System. Proc. of ICASSP-82, Paris, 1982, p. 1593-1596.

103. Лобанов Б.М., Данченко Б.В., Рождественская А.Р. Формантный синтезатор речи с фонемным управлением. Тезисы докладов УШ Всесоюзного семинара АРСО-8, Львов, 1974, с. II4-II6.

104. Бабин И.И., Лобанов Б.М., Данченко Б.В. Об одном решении задачи вывода информации из ЭВМ в речевом виде. Вопросы радиоэлектроники. Серия ЭВТ, №11, М., 1974, с. II0-I24.

105. Лобанов Б.М., Данченко Б.В. Алгоритм фонемного синтеза речи по печатному тексту. Тезисы докладов симпозиума "Экспериментально-фонетические исследования речевого текста". Минск, 1977.

106. Лобанов Б.М. и др. Устройство речевого вывода информации "Фонемофон-3" для ЭВМ. Управляющие системы и машины. Киев, № 2, 1982, с. 33-37.

107. Лобанов Б.М., Лавлович Н.А. Методика построения формантных портретов фонем для синтеза речи по тексту. Тезисы докладов 12го Всесоюзного семинара APC0-I2, Киев, 1982, с. 417-421.

108. Лобанов Б.М., Марченков М.А. Алгоритмы синтеза формантных параметров по тексту. Тезисы докладов 12-го Всесоюзного семинара APC0-I2, Киев, 1982, с. 414-417.

109. Лобанов Б.М., Карневская Е.Б. Модели синтеза по тексту мелодического контура русских и английских фраз. Тезисы докладов 12-го Всесоюзного семинара APC0-I2, Киев, 1982, с. 399-402.

110. Лобанов Б.М., Марченков М.А. Алгоритмы синтеза по тексту мелодического и ритмического контуров фразы. Тезисы докладов 12-го Всесоюзного семинара APC0-I2, Киев, 1982, с. 412-414.

111. I. Fujisaii H., Sudo H. A Generative Model for the Prosody of Connected Speech in Japanise. Proc. of Conference on Speech Comm. and Processing. Mass., 1972? P

112. И2. Meli R., Fallside F. The Modelling of Fo Contours. Proc. of ICASSP-82, Paris, 1982, p. 947-949.

113. Зиндер Л.Р. Статистика русской речи. Л., Изд. ЛГУ,1958.

114. Златоустова Л.В. Изучение звучащего стиха и художественной прозы инструментальными методами. Сб. "Контекст. Литературно-художественные исследования". М., 1976, е,

115. Джайнт М. Цифровое кодирование речевых сигналов. Квантизаторы для ШШ, ДИШ и ДМ. ТИИЭР, т. 62, № 5, 1974, с. 83-107.

116. Шафер Р., Рабинер Л. Цифровое представление речевых сигналов. ТИИЭР, № 4, 1975, с. I4I-I59.

117. Cummiskey P. et al. Adaptive Quantization in Differential PCM Coding of Speech. Bell Syst. Tech. J., Sept., 1975,pp. 110^-1118.

118. Фланаган Д. Вычислительные машины говорят и слушают. Речевое общение человека с машиной. ТИИЭР, т. 64, № 4, 1976,0.5-17.

119. Koenig W.A. A New Frequency Scale for Acoustic Measurement. Bell Lab. Records, v. 27, W9, pp. 299-501.

120. Вокодерная телефония. Под ред. А.А.Пирогова. М.,"Связь", 1974, е. 49s~.

121. Пирогов А.А. Гармоническая система сжатия спектра речи. Электросвязь, № 3, 1959, с. 8-17.

122. Chevillard A. Uouvelle Approache pour la Simulation Dy-namique du Canal Vocal. Revue d1Acoustique,M24, 1975»РР» 2^-29*

123. Italoira F., Saito S. Digital Filtering Techniques for Speech Analysis and Synthesis.7th ICA,Budapest,1971 ,p. 261-264.

124. V/aidLta H. Direct Estimation of the Vocal Tract Shape by Inverse Filtring of Acoustic Speech Waveforms. IEEEj-Fpec-^-wm,

125. Акинфиев Н.Н. К вопросу построения теории речевых сообщений. Научно-технический сб. Гос. НИИ МРТН СССР, 1957, вып. 4, с. 3-25.

126. Atal В., Schroeder М. Predictive Coding of Speech Signals. Proc. Conf. Commun. and Process. 1967, pp. 360-361.

127. Маркел Д., Грэй А. Линейное предсказание речи. М., "Связь", 1980,с,Зо8,

128. Markell J. Digital inverse filtring. A New Tool for Formant Trajectory Estimation. IEEE Trans, on Audio and Electro-acoust•,v. AV-20, 1972, pp. 129-137»

129. Atal В., Hanauer S. Speech Analysis and Synthesis by Linear Prediction of the Speech Wave. J.A.S.A., v. £0, 1971,pp. 637-655.

130. Atal В., Schroeder M. Adaptive Predictive Coding of Speech Signals Bell.Syst.Tech.J.,v.49, 1970, pp.1973-1986.

131. Хофф M., Ли В. Программное обеспечение и синтез речи. Электроника, В 3, 1980., с. 47-55.

132. Rabiner R. et al. Digital Hardware for Speech Synthesis 7th Int. Congress on Acoust.,Budapest, 1971, pp. 157-159.

133. Бухтилов Л.Д., Гурьянов Н.И., Лобанов Б.М. Оптимизация характеристик формантных фильтров в последовательном синтезаторе речи. Тезисы докладов XI Всесоюзного семинара APC0-II, Ереван, 1980, с. 33-35.

134. Бухтилов Л.Д., Гурьянов Н.И., Лобанов Б.М., Минкевич В.В. Цифровой формантный синтезатор. Тезисы докладов 12-го Всесоюзного семинара APC0-I2, Киев, 1982, с. 445-448.

135. Кучеров В.Я., Лобанов Б.М. Синтетическая речь в системах массового обслуживания. М., "Радио и связь", 1983^ С, i-ъо.

136. Stevens К. Airflow and Turbulence Noise for Fricatives and Stop Consonants: Static Considerations. J.A.S.A., v. 50,1. N 4, 1971, pp. 1180-1192.

137. Holms J. The Influence of Glottal Waveform on the Naturalness of Speech from a Parallel Formant Synthesizer. IEEE Trans, on Audio and Electroacoust., N 3» 1973, pp. 298-305.

138. Rosenberg A. Effect of Glottal Pulse Shape on the Quality of Natural Vowels. J.A.S.A., N 2, p.2, 1971, PP« 583-590.

139. Flanagan J., Ladgraf L. Self-Oscilating Sours for Vocal-Tract Synthesizer. IEEE Trans. AU-16, 1, 1968, pp.57-64.

140. Toshio T. "Analysis-by-Synthesis", Method Utilizing Spectral Features of Voice Source and Measurement of Glottal Waveform Parameters. J .Radio Res. Lab., If 97,1971, pp.209-220.

141. Rothenberg et al# A Three-parameter Voice Source for Speech Synthesis. Proc. of Speech Comm. Seminar. Stockholm, 1974, pp. 235-243.

142. Gold В., Rabiner L. Analysis of Digital and Analog For-mant Synthesizers. IEEE Trans, on Audio and Electroacoust., AU-16 N 1, 1968, pp. 57-64.

143. Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. М., "Радио и связь", 1981.^.3/5

144. Голд Б., Рэйдер И. Цифровая обработка сигналов. М., "Сов. радио", 1973, е.2.3з>

145. Опенгейм А., Шафер Р. Цифровая обработка сигналов. М., "Связь", 1979, с. г

146. Лобанов Б.М., Первой Л.М. Синтезатор речи, на микро-ЭВМ "Электроника-60". Тезисы докладов XII Всесоюзного семинара АРСО-12, Киев, 1982, с. 492-495.

147. Лобанов Б.М., Панченко Б.В. Преобразователь "графема-фонема" для синтеза речи по орфографическому тексту. Тезисы докладов УШ Всесоюзного семинара АРС0-8, Львов, 1974, с. III-II3.

148. Лобанов Б.М., Панченко Б.В. Преобразование число-числительное при синтезе речи по печатному тексту. Тезисы докладов Всесоюзной школы-семинара "Автоматическое распознавание и синтез речи" (АРСО-9), Минск, 1976, с. 75.

149. Лобанов Б.М., Панченко Б.В. Синтез просодических характеристик по печатному тексту. Тезисы докладов Всесоюзной школы-семинара "Автоматическое распознавание и синтез речи" (АРСО-9), Минск, 1976, С.

150. Лобанов Б.М. Формантный синтез речевого сигнала в системе вывода информации из ЭВМ. Тезисы докладов Всесоюзного совещания "Проблемы передачи данных в АСУ". Киев, 1974,с. 127-128.

151. Лобанов Б.М., Минкевич В.В., Панченко Б.В. Фонемно-фор-мантный синтез речи для вывода информации из ЭВМ. Сб. трудов НТК АН БССР, Минск, 1978, с. I5I-I60.

152. Лобанов Б.М. и др. Речевое отображение алфавитно-цифровой информации в АСУ. Тезисы докладов НТК "Современная радиоэлектроника, проблемы и перспективы развития". Минск, 1974.

153. Лобанов Б.М., Данченко Б.В., Усов Л.П. Проект телефонной диалоговой системы "Абонент-АСУ МТС". Тезисы докладов Всесоюзной школы-семинара АРСО-9. Минск, 1976, с. 78.

154. Винцюк Т.К., Лобанов Б.М., Шинкаж А.Г. Система распознавания речи и система устного диалога "СРД-Речь-I" на основе микро-ЭВМ. Тезисы докладов ХП Всесоюзного семинара APC0-I2, Киев, 1982, с. 516-521.

155. Златоустова Л.В. и др. Алгоритмы преобразования русских орфографических текстов в фонетическую запись. М., МГУ, 1970.

156. Аванесов Р.И. Русское литературное произношение. М.,1972.

157. Синтезатор речи I5KC2000-0I4. Техническое описание УРМ3.852.035 ТО

158. Синтезатор речи I5KC2000-0I4. Комбинированный тест. Руководство оператора. УРМ3.852.035

Похожие работы

Информатика, вычислительная техника и управление
05.13.00