автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка программного обеспечения для исследования речевых сигналов
Автореферат диссертации по теме "Разработка программного обеспечения для исследования речевых сигналов"
3 8 - г 9 11
АКАДЕМИЯ НАУК СССР ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР
На правах рукописи
АНДРЕЕВ Сергей Вадимович
РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ИССЛЕДОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ
(специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей)
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель кандидат физ.- мат. наук, заведующий сектором Чучупал В.Я.
МОСКВА, 1991
1 -\
Ч5!
Работа выполнена в Вычислительном Центре АН СССР.
Научный руководитель кандидат физ.- мат. наук Чучупал В.Я.
Официальные оппоненты: доктор физико-математических наук Серебряков В.А., доктор технический наук Фролов Г.Д.
Ведущая организация: Институт технической кибернетики
АН БССР :
Защита диссертации состоится РР^ГУ^^^Г 1991 г.
в час. на заседания социализированного совета
К002.32.01 по защите диссертаций на соискание ученой степени кандидата наук при ВЦ АН СССР по адресу: 117967, Москва, ул.Вавилова, д.40.
С диссертацией можно ознакомиться в библиотеке математического института АН СССР.
Автореферат разослан 1991г.
Ученый секретарь специализированного совета,
кандидат физ.-мат. наук —* Рудакоь К.В
/■■».., - ----
\ у* <>7:!ГТ~/
; , , ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.
Актуальность темы. Речевая технология - это обширный класс исследований в различных направлениях: фонетика и лингвистика, медико-биологические и логопедические исследования, криминалистические экспертизы и автоматическое распознавание речи, синтез речи, верификация и идентификация дикторов, восстановление архивных записей и многие другие.
Многие годы анализ речевых сигналов проводился с помощью самых различных приборов, в том числе осциллографов, анализаторов спектра и т.д. В последнее время при проведении таких исследованиий все большее внимание уделяется использованию компьютеров, что связано с целым рядом причин.
Во-первых, исследования речевых сигналов требуют и сложных вычислений и обращения с большим объемом исходного материала. Во-вторых, число специалистов - прикладников в самых разных областях, заинтересованных в использовании знаний о природе и особенностях речевых сигналов, достаточно велико, но дороговизна и сложность в организации специальных акустических лабораторий сдерживали широкое развитие таких исследований. Переход от аналоговых методов к компьютерным дал сильный толчок проведению самых разнообразных исследований в области речевой технологии. В-третьих, компьютерные методы позволяют моделировать процессы, которые с большим трудом удается (или вообще невозможно) смоделировать на аналоговых устройствах.
Все эти причины и предопределили устойчивый многолетний интерес к переходу на компьютерные методы исследований речевых сигналов и к разработке программного обеспечения для проведения таких исследований.
Акт\альность темы исследования вызвана необходимостью со-иаиия такого программного обеспечения, которое могло бы'-
служить основой при проведении исследований речевых сигналов и для создания других специализированных программных комплексов в области речевой технологии.
Целью настоящей работы является:
- разработка принципов организации сложных систем для исследования речевых сигналов;
- разработка алгоритмов обработки и визуализации речевых сигналов;
- разработка программного обеспечения для использования фонетических баз данных;
- создание программного комплекса, ориентированного на проведение фонетических и лингвистических исследований
- специалистами -прикладниками; комплекс должен
обеспечивать качественно новый уровень исследований с применением методов статистического анализа на основе фонетических баз данных; комплекс должен быть рассчитан на разные уровни подготовки исследователей в области программирования, включая минимальный.
Научная новизна. Разработаны требования к составу программного обеспечения систем для исследований в области речевой технологии. Разработаны принципы построения больших программных комплексов для проведения исследований речевых сигналов. Предложены и проверены алгоритмы визуализации акустических сигналов и их параметров. Разработано программное обеспечение для построения баз данных, ориентированных на фонетические и лингвистические исследования. На основе предложенных принципов построения программных комплексов для исследований в области речевой технологии создана система SLIRE - интерактивная система для исследований речевых сигналов на IBM PC совместимых компьютерах.
Практическая ценность. Полученные результаты по организации систем для исследования речевых сигналов
. использованы при разработке системы ЗЬШЕ. Разработанная система применяется для отладки новых методов исследований. Система применяется и при обучении экспертов-криминалистов.
Апробация работы и публикации. Результаты работы докладывались на всесоюзном совещании "Акустика речи и слуха" (Минск, 1990), на 16 Всесоюзном семинаре по автоматическому распознаванию слуховых образов (АРСО-16, Суздаль, 1991), на совещании "Методика перцептивных речевых исследований" (Ленинград, 1991).
По теме диссертации опубликованы работы [1 - б].
Структура диссертации. Диссертация состоит из введения, четырех глав с разделами и заключения; содержит 106 страниц машинописного текста. Библиография включает 48 наименований.
СОДЕРЖАНИЕ РАБОТЫ.
Во введении дается общий взгляд на проблему разработки программного обеспечения для исследования речевых сигналов и излагается краткое содержание работы по главам..
Первая глава содержит анализ тенденций развития программ для исследования речевых сигналов и обзор используемых в области речевой технологии программных комплексов .
На первом этапе применения компьютеров для исследования речевых сигналов использовались библиотеки процедур, реализовывавшие наиболее широко используемые алгоритмы обработки сигналов. Библиотеки создавались специалистами, занимавшимися речевыми исследованиями и по мере необходимости становившимися программистами. Системная часть таких программ была не велика, основную часть работы составляло программирование алгоритмов, а на программирование достаточно развитого интерфейса не хватало
ни времени, ни знаний, поэтому разрабатываемые программы хорошо работали, обычно, только в присутствии авторов.
Следующим этапом была разработка систем различного назначения для'' решения четко определенного класса задач. Системы такого типа различались наполнением доступных библиотек, уровнем проработки процедур визуализации и степенью развития интерфейса. Это были "закрытые" системы -они полностью лишали пользователей возможности добавлять что-то свое (алгоритмы, программы визуализации) к уже созданным программам.
Следующим шагом явилось создание программных комплексов, которые унаследовали все достижения "закрытых" систем, но открыли их для пользователей, позволяя исследователям добавлять в уже отлаженные комплексы свои собственные алгоритмы обработки сигналов. Такое развитие систем сделало их очень гибкими и способствовало их широкому распространения.
Последним достижением в области организации программных комплексов для исследования речевых сигналов явился переход к системам - "оболочкам".' Это безусловно "открытые" системы, но включающие массу очень полезных свойств, каждое из которых ранее реализовывалось в рамках отдельной программы. Теперь специалист - прикладник один раз запускает, систему и производит полный анализ и исследование речевых сигналов, совершенно не обращаясь к другим программам. Такие системы включают не только удобное взаимодействие с файловой системой, нр и работу с фонетическими ' базами данных, запись сигналов и их прослушивание с помощью акустической аппаратуры, статистический анализ полученных данных и многое другое.
В последние годы наметились 2 основных направления создания систем для исследования речевых сигналов: системы, ориентированные на использование мощных рабочих станций, и
системы, ориентированные на наиболее широко распространенные персональные ЭВМ типа IBM PC. Различие в технических возможностях этих классов ЭВМ определяют различие в способах построения таких систем, их направленности, сферах и широте применения.
Общими чертами таких комплексов является наличие всевозможных программ записи, анализа и воспроизведения звука, удобного простого интерфейса для исследования любой части речевого сигнала, доступных библиотек наиболее широко используемых алгоритмов обработки сигналов и выделения их основных параметров. Иногда такие системы дополняются набором алгоритмов для какой-нибудь более узкой области исследований (например, биоакустика или распространение звуков под водой). Обработка сигналов на рабочих станциях ведется в режиме реального времени с использованием специальных графических экранов высокого разрешения. К наиболее известным системам на ' основе рабочих станций, используемым для исследований речевых сигналов, относятся система Waves, разработанная в лаборатории фирмы AT&T Bell на базе станции Sun, Spire, разработанная в Массачусетском Технологическом институте на базе Lisp машины, и система DSP Sona-Graph фирмы Kay Elemetrics Corporation.
Системы, ориентированные на стандартные повсеместно используемые ПЭВМ, не могут сравниться по быстродействию и вычислительным возможностям с рабочими станциями. Эти системы намного более дешевые, поэтому находят широкое применение, но не за счет повсеместного использования какой-либо одной системы, а за счет того, что каждая из таких систем обладает какой-то своей изюминкой, ориентированностью на определенную группу пользователей, причем эта специализация, совмещенная с высокой эффективностью разработки и отработанным интерфейсом, делает лучшие из таких систем не менее полезными для исследований в области-!
речевой технологии, чем рабочие станции. Лучшими из таких систем являются разработанный в Англии пакет прикладных программ ILS (Interactive Laboratory System) и система CSL (Computerized Speech Lab), представленная фирмой KAY Elemetrics Corporation.
- Вторая глава посвящена анализу требований, предъявляемых к разрабатываемому программному обеспечению, и путям их решения. Предлагаются новые алгоритмы решения некоторых проблем, возникающих при создании больших программных комплексов для исследования речевых сигналов.
Программный комплекс для исследования речевых сигналов должен включать следующие виды программ:
- программы связи с АЦП и ввод сигналов в ЭВМ;
- программы цифровой обработки исходных сигналов;
- программы визуализации сигналов средствами машинной графики;
- вспомогательные программы расчета характеристик сигналов;
- программы создания различных баз данных и работы с ними;
- программы для статистической обработки информации, хранящейся в базах данных.
Комплексы, объединяющие все эти программы, могут быть организованы разными способами ("замкнутые" системы, "открытые" системы, системы - оболочки). Наряду с изменением самого принципа построения программных комплексов, происходит и постоянный - поиск наилучших алгоритмов обработки данных и визуализации результатов.
Большая часть анализа речевых сигналов (расчет спектров, сонограмм и т.д.) основана на. использовании каких-либо < алгоритмов для вычисления быстрого преобразования Фурье (БПФ), и здесь огромное значение приобретает скорость и точность вычислений. Известно большое количество алгоритмов БПФ. Большинство описанных и включенных в библиотеки алгоритмов направлены на вычисления с максимально
. допустимой точностью, то есть работают с числами в плавающей арифметике (нередко, с двойной точностью). Большие же вычисления, требуемые при расчетах спектров и, особенно, сонограмм, а также то, что исходные данные от АЦП приходят в виде целых чисел, -наводят на мысль о желательности использования целочисленных алгоритмов для расчета БПФ. Это единственный способ на машинах типа IBM PC хоть каким-то образом приблизиться к работе в реальном масштабе времени. Автором был модифицирован алгоритм Винограда, позволивший существенно (в 30 раз) ускорить вычисления спектров.
Алгоритмы визуализации сигналов . (и их параметров) должны быть увязаны как с используемой аппаратурой, так и с особенностями отображаемых сигналов. Увязка с аппаратурой означает использование не "жестких", а "плавающих" алгоритмов, способных принимать во внимание различную разрешающую способность и различные способы хранения экранной информации применяемых в настоящее время видеоадаптеров (CGA, EGA, VGA^ Hercules).
Алгоритмы визуализации включают визуализацию осциллограмм, сонограмм и ' различных параметров сигналов. Алгоритмы визуализации осциллограмм принимают во внимание требуемый вид рисования сигналов и соотношение между числом отсчетов в выбранном отрезке сигнала и размерами экранной области, в которой происходит отображение.
Одним из самых сложных видов отображения является визуализация сонограмм, причем существует принципиальная разница между алгоритмами отображения черно-белых и цветных сонограмм. Алгоритмы черно-белого отображения основаны на изображении каждой спектральной составляющей в виде матрицы (m *.п) определенной плотности. Размерности матрицы зависят от выбранного числа градаций яркости (числа уровней для отображения амплитуд спектральных составляющих), и ограничивают предельное разрешение по
частоте и длительность участка сигнала для сонограммы. Цветные сонограммы отличаются тем, что каждая спектральная составляющая может отображаться в минимальный элемент экрана - в точку. Такие сонограммы, во-первых, более информативны и наглядны, а, кроме того, обеспечивают большее разрешение по частоте и позволяют получить сонограммы более продолжительных отрезков речи без искажения полученных результатов. Возможно применение алгоритмов, объединяющих некоторые свойства как черно-белых, так и цветных сонограмм.
Многие проблемы визуализации параметров речевых сигналов стали особенно наглядны при переходе от "замкнутых" систем к "открытым". В "замкнутых" системах был четко обозначен набор параметров для визуализации, поэтому проблемы расположения и выделения нужной информации всегда можно было решить оптимальным образом. В современных "открыты."" системах каждый пользователь получает возможность подключения к программному комплексу своих собственных программ расчета каких-то параметров. Число и вид этих параметров заранее неизвестны, и единственно приемлемый способ решения проблем визуализации - это применение программ визуализации с некоторыми чертами искусственного интелекта.
Естественный процесс перехода к "открытым" системам, предоставляя специалистам - прикладникам новые большие возможности в исследовании речевых сигналов, породил и совершенно новые проблемы для разработчиков таких систем. "Открывание" системы неизбежно означает снижение надежности таких систем и требует включения в комплексы программ защиты от фатальных ошибок пользователей.
Третья глава посвящена проблемам организации и использования специализированных баз данных для проведения фонетических и лингвистических исследований. Рассмотрены
вопросы, касающиеся создания и заполнения фонетических баз данных, организации поиска данных з таких базах и использования данных базы для проведения статистического анализа.
Проведение фонетических и лингвистических исследований связано с использованием огромного объема исходного речевого материала, поэтому самым естественным предложением была идея использования фонетических баз данных. Такие базы данных хранят два вида информации: основную, то есть собственно фонетическую и лингвистическую информацию, и дополнительную, используемую в качестве параметров при проведении статистических исследований. Эта информация может быть самой разнообразной, включая как характеристики проводимых исследований, так и особенности дикторов, и особенности записи сигналов.
Создание и заполнение баз данных в определенной степени связано с визуализацией речевых сигналов. Степень связи зависит от алгоритмов, применяемых при сегментации сигналов (в различных системах возможно применение автоматической, полуавтоматической или ручной сегментации). При любом способе сегментации ключевым для функционирования баз данных является вопрос о том, какая информация будет размещена в базах данных, и о способе ее представления. Основная информация - фонетическая - хранится в виде фонетической транскрипции. Основные проблемы - это отсутствие единой общеупотребительной фонетической транскрипции и широкое использование для обозначения фонетической информации различных нестандартных символов. Это создает довольно большие трудности для обмена информацией между различными специализированными базами фонетических данных и использованию этой информации для проведения статистического анализа.
Поиск информации в фонетических базах данных зависит от образца поиска (по основной информации, по дополнительной или смешанный поиск) и от вида поиска (поиск по фонетической информации может быть одно- или многоуровневый). Сам поиск информации в базе и основанный на .этих данных статистический анализ могут проводиться как непосредственно во время работы программного комплекса, так и из отдельных пользовательских программ, используя набор процедур доступа к данным из фонетических баз.
В работе представлен следующий образец организации фонетических баз данных, а также предложен набор процедур, образующих библиотеку для внешних пользователей, желающих работать с фонетическими базами данных.
Основной элемент фонетической информации - это описание сегмента. СЕГМЕНТ - это отрезок речевого сигнала, характеризующийся временем начала, временем окончания, типом и текстовой информацией, которая выводится на экран для обозначения сегмента. Тип сегмента - это число, необходимое для разделения всех сегментов на группы (безударные гласные, подлежащие, заимствованные слова и
т.д.). В качестве текстовой информации может быть и
* 4
произнесенный текст, и звук, и буква, и специальный символ.
Дополнительная информация - это ДИКТОРЫ, ПРОЕКТЫ и СИГНАЛЫ. Каждый вид дополнительной информации - это структура определенного вида, но структуры эти связаны друг с другом. Каждый СИГНАЛ был произнесен каким-то ДИКТОРОМ. Любой сигнал может быть разбит на СЕГМЕНТЫ, причем сегментация одного и того же СИГНАЛА может быть произведена разными способами в соответствии с различными ПРОЕКТАМИ.
Для связи программ с базами данных имеются две процедуры "ОткрытьБазу" и "ЗакрытьБазу". Так как основная фонетическая информация - это сегменты файлов-сигналов, то
две процедуры выдают информацию о файлах: "ФайлыБазы" и "СписокИменФайлоз". Пары аналогичных процедур предусмотрены для ДИКТОРОВ и ПРОЕКТОВ. Для обращения к разным файлам имеются процедуры "ПервыйФайл", "СледующийФайл", "ПредыдущийФайл" и "ПоследнийФайл". Для ускорения поиска нужного файла можно использовать процедуру "УстановитьТипПоиска". Другой способ обращения к файлам - это получить полный список имен файлов, а затем осуществлять поиск по, имени. Аналогичный набор процедур существует и для сегментов: "ПервыйСегмент", "СледующийСегмент", "ПредыдущийСегмент"- и "Последний Сегмент". Более сложный, . но более гибкий вариант "НайтиСегмент" позволяет вести поиск сегмента в соответствии с частично или полностью заданным образцом.
Фонетические базы этого типа и Процедуры работы с ними были реализованы в рамках разработки системы SLIRE.
Четвертая глава ■ посвящена описанию разработанной системы SLIRE. Описаны общие принципы построения системы, работа блока визуализации сигналов и их параметров, организация баз данных и взаимодействие системы с акустическими устройствами.
Система SLIRE (Speech and Language Interactive Research Environment) - это интерактивная система для разнообразных исследований речевых сигналов на персональной ЭВМ типа IBM PC. Система работает под управлением MS DOS; стандартным образом взаимодействует с файловой системой; допускает использование EGA или .VGA мониторов. Сцстема создавалась как рабочая среда, соединяющая в единое целое все стадии исследования речевых сигналов: запись и воспроизведение сигналов с помощью АЦП / ЦАП и акустической аппаратуры; разнообразные способы визуализации, расчета параметров и характеристик сигналов; создание и использование баз данных, ориентированных , на фонетические и лингвистические
исследования, проведение статистического анализа на основе данных, хранящихся в базах данных.
Система SLIRE задумывалась и была реализована как единая цельная система, все возможности которой реализуются внутри единого исполняемого модуля, а не путем последовательного обращения к отдельным программам, решающим каждая свою локальную задачу. Такая реализация системы позволила унифицировать сходные подзадачи, возникающие на разных стадиях работы системы, а также позволила; сделать систему намного более простую для пользователей, что очень существенно, так как система рассчитана на специалистов-прикладников, не являющихся специалистами в области программирования.
Вся система управления комплексом SLIRE построена на использовании многоуровневой системы меню, которая практически исключает фатальные для системы действия пользователей. Работа с системой не требует от пользователя знания программирования, а только легкого знакомства с принципами организации файловой системы ПЭВМ.
Система SLIRE взаимодействует с файловой системой в нескольких случаях:
- ввод сигнала в систему для последующего анализа;
- операции с исходными сигналами (вырезание части сигнала, замена одного сигнала на другой, соединение различных сигналов в один);
- настройка системы на базу данных;
- связь системы с независимой программой пользователя.
Визуализация сигналов и их параметров - это тот основной модуль, вокруг которого и строится работа всей системы SLIRE. Система позволяет воспроизводить осциллограммы в различных масштабах (от растянутого изображения до сильно сжатого с коэффициентом компрессии до сотен и тысяч) и видах (показ огибающей, поточечное изображение, гистограммы и т.д.),
рисовать спектры, соответствующие фильтрам различной' ширины (от 40 до 400 гц) и вида, а также сонограммы. В систему встроены удобные инструменты настройки цветовых параметров (свыше 150), физических параметров, используемых при расчетах, и параметров конфигурации. На рисунке приведен типичный вид экрана работающей системы.
Большое разнообразие видов представления информации и большое число различных параметров, влияющих на визуализацию, тем не менее не сделали систему очень сложной в управлении. Простота работы с системой достигнута за счет использования подсказок, разноуровневой системы HELP, развитого аппарата настройки параметров и унификации системы команд.
Отличительной особенностью системы SLIRE является предоставляемая пользователям возможность создания в процессе работы (и использования в дальнейшем) баз данных, которые могут содержать информацию для проведения фонетических, лингвистических и некоторых других
исследований. Ориентация на такие исследования определяет что и как хранится в базах данных, создаваемых при работе системы, и какие возможности появляются у специалистов по использованию этих данных.
Базы данных системы SLIRE создаются при работе системы, а обращение к ним допустимо не только из самой системы, но и из внешних программ пользователей. При работе системы пользователь имеет доступ ко всей информации, хранящейся в базе, причем интерфейс общения с базами данных сделан максимально удобным для пользователей. На рисунке приведен вид системы при работе в базе данных.
Фонетические базы данных, создаваемые и. заполняемые при работе системы SLIRE, позволяют хранить и использовать данные о ДИКТОРАХ, ПРОЕКТАХ и СИГНАЛАХ, а вся фонетическая информация хранится в СЕГМЕНТАХ. Кроме самой системы SLIRE существует еще небольшая библиотека процедур, позволяющая внешним программам получить и использовать любую информацию из этих баз данных.
В главе 4 также подробно рассмотрена работа с фонетическими базами данных, вопросы взаимодействия системы с внешними акустическими устройствами и управление системой SLIRE.
В заключении сформулиронаиы основные полученные в диссертации результаты.
1. Рассмотрены требования к программным комплексам для анализа речевых сигналов. Проанализированы тенденции развития систем для исследования речевых сигналов. Проведено сравнение различных принципов построения таких комплексов (библиотеки программ, "закрытые" системы, системы оболочки); выявлены их преимущества и недостатки при разработке программ в области речевой технологии. Обосновано преимущество систем - оболочек и указаны проблемы в их реализации.
2. Подробно рассмотрены состав и структура программного комплекса для анализа речевых сигналов. Сформулированы требования к отдельным группам процедур. Рассмотрены группы алгоритмов, применяющихся в области речевой технологии.
3. Подробно рассмотрены алгоритмы визуализации речевых сигналов и их параметров. Предложен и реализован алгоритм визуализации многоцветных сонограмм.
4. Предложена и реализована модификация алгоритма вычисления БПФ по методу Винограда, позволяющая существенно ускорить соответствующие вычисления на IBM PC.
5. Рассмотрены проблемы организации фонетических баз данных. Предложена структура таких баз и рассмотрены проблемы взаимодействия фонетических баз данных с программными комплексами для исследования речевых сигналов. Рассмотрены вопросы применения таких баз данных для проведения статистического анализа.
6. На основе анализа структуры фонетических баз данных разработано программное обеспечение для использования этих баз при проведениии статистического анализа.
7. Разработана система SLIRE - программный комплекс для проведения исследований речевых сигналов. Система SLIRE включает в себя полный набор модулей необходимых при проведении таких исследований: блок связи с АЦП / ЦАП
преобразователями и акустической аппаратурой, процедуры цифровой обработки сигналов, процедуры визуализации речевых сигналов и их параметров, блок создания, заполнения и использования фонетических баз данных. Разработанная система SLIRE может служить-базовым программным обеспечением для создания различных специализированных систем в области речевой технологии.
8. «Разработанная система SLIRE используется для проведения фонетических и лингвистических исследований и при обучении и в работе экспертов-криминалистов.
ПУБЛИКАЦИИ
1. Андреев C.B., Чучупал В.Я. VOIGRA - программный комплекс для интерактивной работы с речевыми базами данных на ПЭВМ. // Цифровая обработка акустических сигналов. М.: ВЦ АН СССР, 1989, С. 5 - 17.
2. Чучупал В.Я., Андреев C.B., Гончаров С.Л. Интерактивная система для исследования "акустических сигналов. // Фундаментальные, науки - народному хозяйству. М.: Наука, 1990, С.160 - 164.
3. Андреев C.B., Чучупал В.Я. SL1RE-2 - интерактивная система для исследования речевых сигналов на IBM PC. М.: ВЦ АН СССР, 1990, 26с.
4. Андреев C.B., Чучупал В.Я. Разработка автоматизированною рабочего места ■ для исследования речевых сигналов. // Всесоюзная конференция "Искусственный интелект-90", том 2, С. 77-80. Минск, 1990.
5. Андреев C.B. Интерактивная система для исследования речевых сигналов на IBM PC. // Автоматическое распознавание . слуховых образов. Тезисы докладов 16-го всесоюзного семинара (АРСО-16). 1991, С. 210-211.
6. S.Andreyev, V.Chuchupal Workstation for speech analysis. // Proceedings XII-th ICPhS, v.2, p.482-485, 1991.
-
Похожие работы
- Методы создания и использования речевых баз данных и инструментальных средств анализа и исследования речи для развития речевых технологий
- Модели и алгоритмы в системах анализа речевых сигналов
- Диалоговая система цифровой обработки зашумленных речевых сигналов
- Выделение и предобработка сигналов в системах автоматического распознавания речевых команд
- Разработка и совершенствование математических моделей речевых сигналов для задач анализа и синтеза речи
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность