Разработка алгоритмов и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей

Абдиев, Болат Азимбекович

Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка алгоритмов и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей

кандидата технических наук: Абдиев, Болат Азимбекович
город: Москва
год: 1992
специальность ВАК РФ: 05.13.11

Автореферат по информатике, вычислительной технике и управлению на тему «Разработка алгоритмов и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей»

Автореферат диссертации по теме "Разработка алгоритмов и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ВЫЧИСЛИТЕЛЬНЫЙ .ЦЕНТР

На правах рукописи

АБДИЕВ Болат Аэиыбекович

РАЗРАБОТКА АЛГОРИТМОВ И ПРОГРАММ ДЛЯ АКУСТИКО -■ХОПЕТИЧЕСКОГО АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ

(специальность С5.13.11 - математическое и программное обеспечение вычислительных .машин, комплексов, систем и сетей)

Автореферат диссертации на соискание ученой степени кандидата технических наук

МОСКВА - 1992

Работа выполнена в Вычислительном центре РАН

Научный руководитель: кандидат фиэико - математических

наук Е Я. Чучупал

Официальные оппоненты: доктор технических наук, профессор Г. Д. Зролов кандидат технических наук ' С. Я Кринов

Ведущая организация: Институт математики СО РАН

Защита состоится "Ат""' . 1992 г. в ' часов

на воседании специализированного совета К 002.32.01 при Вычислительном центре РАН по адресу 117333 . Иэсква. В - 333, ул. Вавилова. 40.

С диссертацией модно ознакомиться в библиотеке ВЦ РАН

1092 г.

Автореферат разослан "

Ученый секретарь специализированного совета К 002.32.01 при ВЦ РАН доктор физ. -мат. наук

К. В. Рудаков

Г, -

ОБДЛЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Одной 'из наибо'лее эффективных и естественных для человека форм общения является речевое взаимодействие. Основное.отличие вычислительных систем пятого поколения' от ЭВМ предыдущих' поколений состоит в использовании "интеллектуальной" периферии, ориентированной на непрофессионального пользователя и обеспечивающей обмен информацией с ЭВМ на естественном для человека языке.

Использование речевого канала вместо обычных терминальных устройств значительно облегчает условия работы, повышает производительность его труда, увеличивая скорость вэода данных.

' Создание систем распознавания и синтеза речи открывает новую .область практических применений, способных расширить возможности человека; Актуальность и перспективность работ по построению средств речевого общения "человек - ЭВМ" косвенно подтверждается большими затратами на исследования в этой области. .

Качественно новые сферы возможного практического применения распознавателей речи раскрываются при отмене ограничений на размер словаря, необходимость чсполнительного обучения при смене диктора и максимальном приближении языка системы распознавания к естественному. Однако создание подобных' систем свя-» зано с преодолением целого ряда слолных проблем.

К шли,' з частности, относятся: учет - изменчивости акустических характеристик -речевых .сигналов • в зависимости от фонетического контекста,- задача маркировки непрерывного речевого сигнала на акустнчеегси инвариантные, единицы, а таюе ква-эифонем.чая классификация' этих единиц/ Надежность обнаружения и классификаций кваэифонетических единиц в процессе акустико фонетического анализа во. многом определяет характеристики (точность распознавания) системы," поэтому большое внимание разработчиков речевых систем уделяется совершенствованию вето-дов акустико - фонетического анализа. ., . -

Делью диссертационной работы является создание новых ' методов .и. алгоритмов-акустико - фонетического анализа йа основе нейронных' сетей, их программная реализация, апробация числен-

• - 2 -

ными экспериментами и применение для распознавания речи.

Основные задачи исследования:

- сравнительный анализ методов первичной обработки и представления речевых сигналов с помощью традиционных подходов и основанных на нейронных сетях;

- разработка методов первичного описания и представления, речевых сигналов на основе нейронных сетей;

- экспериментальное исследование моделей нейронных сетей;

- анализ и разработка алгоритмов обучения для таких моделей. , .

Научная новизна работы:

- исследовали разработан метод фонетической маркировки и сегментации слитного речевого сигнала, учитывавший априорную информацию о закономерностях изменения параметров речевого сигнала ( в том числе эффгкт коартикуляции и длительность звуков);

- исследован и разработан метод для выбора наилучшего решения на основе индивидуальных решений о фонетической принадлежности сегментов речевого сигнала, генерируемых в параллельных каналах анализа; . ■

- экспериментально реализован и исследован метод акусти-ко - фонетического анализа и фонетической маркировки на основе многослойной нейронной сети Кохонена.

Практическая ценность работы заключается в построении Эф-, фективных алгоритмов и программного обеспечения анализа сигнала, обучения и распознавания речевых образов.

Реализация результатов работы. Диссертационная работа вы-' . поднялась в рамгсах плановый теш "Распознавание и синтез слу-. ховых образов" ВЦ АН СССР в соответствии с утвержденным постановлением Президиума АН СССР N131 от 7.06.91 г. ИГР 0188.0026039. ' ' ■

Апробация работы. Осшодные результаты работы докладывались на Всесоюзной шкоде - семинаре "Автоматическое распознавание речевых образов'' АРСО - 16 (Москва. 1991), на семинаре сектора автоматического распознавания речи ВЦ АН СССР, а такяе на 3-ей Всесоюзной .конференции "Исследование звуковых систем языков аборигенов Сибири сопредельных регионов" (Новосибирск, 1988),

Публикации. По теме. диссертации опубликовано пять печатных работ. "

Структура и объем работы. Диссертационная работа состоят из введения, трех глав, выводов и заключения н содержит 91 страницы текста, в том числе 2 таблиц , 6 рисунков и 2 приложений. В списке литературы 81 наименований.

оодерданнв рлвога

Во введении обоснованы актуальность и научная .новизна ра-•боты. Сформулированы цели и основные задачи, решаемые в диссертации и излагается краткое содержание работы по главам, а также приводятся сведения об апробации результатов работы.

•В первой главе рассматривается класс вычислительных алгоритме! , известных под паз:анием модели нейронных сетей , который стал особенно интенсивно'развиваться в. последние 6-8 лет. Это связано с надеждами получить, на этой основе, эффективные параллельные процедуры сбора, анализа и обработки данных, которые будут обладать некоторыми свойствами, присущими центральной нервной системе живых организмов, например, созданию абстрактных представлений, обобщению, и т. п. Показано,- что известные модели нейронных сетей успешно выполняют функции ассоциативной памяти, предобработки и кластеризации данных, могут Сьггь использованы как вместо традиционных классификаторов образов в системах распознавания:

Подробно рассматривается модель самоорганизующихся гарт признаков Кохонеиа. Как и другие модели, она претендует на качественное описание процессов, ■ происходящих в центральной нервной системе, а именно является моделью т.н. вычислительных карт (признаков). . ■

Модель самоорганизующихся гарт признаков описывает сеть, которая после периода обучения ("без учителя!') может рассматриваться как карта, состоящая из элементов, каждый из которых является детектором некоторого подмножества из обучающего пространства образов, причем расположение тгих детекторов • в сети не случайно, а соответствует некоторой проекции пространства образов на поверхность сети, и эта проекция сохраняет

топологические свойства .пространства образов. .Сеть Кохонена состоит из набора элементов, образующих М- мерную решетку. Все элементы сети получают в качестве входа один и тот же вектор, признаков образа xtt)-iх'(t)>, 1-1,N. Каждый элемент сети u(n) характеризуется собственным набором коэффициентов связей, по которым к нему поступает сигнал 3T(t): тГгГ,t)-im4ni t)>, l-l.N. Величина реакции элемента u(n) на входной вектор признаков х"(Л) вычисляется как расстояние между этими векторами в некоторой метрике р . Алгоритм формирования сети-состоит из двух последовательных шагов:

Начальные значения ¡гГ(гГ,0) выбираются случайным образом. При-t>0 пусть jT(t)- очереднс.ч входной вектор признаков, тогда:

1. Оцениваются координаты n*(t) такого элемента сети,

uCnM.). что: rT'(t)- arfrmln^iHÇn", t),xlt))

2. Для всех { u(lî): J (n,.n*(t))<r(t)>:

n, t+1 ) n, t) + Щ t+1 ) ( 3f( t) -m( n. t) )

Параметры r(t) и <x(t)' предполагаются при этом выбранными так. что, обеспечивается сходимость процесса , в частности r(t) (О, ct(t) I 0. Характеристики .алгоритма как класси- . Фякатора образов обусловлены следующими свойствами. При выборе параметра a(tj так , что о(. ( t) i 0, ^ci(t)->_d.5(t)<co и в предположении, что подстройка "коэффициентов свя'зи m(n, t) выполняется по обучающей последовательности образов <7(t)>, которые выбираются из пространства образов случайным способом, сьязг; 7i( гГ, t) формируются так , что нейронную сеть можно рассматривать кап сеточно заданную функцию или карту для равномерной аппроксимации функции плотности вероятности совместного распределения компонент векторов x(t) в. иредлоло-jiîBUH, что таковая существует. Уточнить' -это положение можно еледующш образом. Если элемент u (п*). n*(t) - argmin£>(x(t), m(iT, t)) назвать соответствующим входному вектору Признаков х( t) и предположить существование меры с* , характеризующей

- б -

плотность распределения компонент х(Ь) в пространство признаков (так, что количество вегаоров ~(Ь)с-и, и- измеримо относительно^ ) равно а такхе обозначить и(аЫхН)/х(1Н1. и х(Ь) соответствует и(П)>, то:

1. Для любых п,, па: -и(ГГ,)-11(п2) т. е. веса элементов подстраиваются в процессе обучения таким образом, что сеть становится равномерно покрывающей пространство признаков и кагдай элемент соответствует равному по мере ^ мнодгству образов.

2. Близкие в смысле близости координат элементы сети соответствуют близким по метрике элементам пространства признаков.

Об'^ая методнкл использования Фонемных карт, заключается в следу щем. После Формиров яил величин коэффициентов ГОТ, и бы--полняется процедура маркировки элементов карты. Для каждого элемента и(а) определяется, с [^агсоП вероятностью он.'сбответе-твует той или иной фонетической категории. Дня этих целей используется тестовый сигнал, в котором, с номоаыо эксперта для каждого вектора признаков хШ определено, к какой фонетической кагегории он относится. Тестовый сигнал поступает на вход алгоритма и для каждого элемента и(п) сети строится гистограмма распределения фонетических категорий к которым принадлежали те ЗГШ, которым^.,соответствовал в ходе маркировки элемент и(п).

После выполнения описанной процедуры на карте обычно можно выделить компактные области, состояние из элементов сети, со-ответствуюдах одному и тому те звуку (или тому типу фонетических категорий, которые использовались для маркировки элементов карты). Отметим, что во всех приведенных экспериментах в качестве признаков для описания речевого сигнала использовались спектральные параметры, например, выходы полосовой гребенки Фильтров. Дальнейшая процедура анализа речевого сигнала с помете.» описанной 'нейронной сети, заключается э следующем: выс-• каэывание преобразуется в поток векторов признаков хН) для каддого из которых определяется соответствующий ему элемент сети и'(п) и в выходной поток символов, порождаемый алгоритмом

анализа заносится метка той фонетической категории, к которой относится u*(n). Над.полученной таким образом цепочкой,состоящей из cm,толов - имен Фонетических категорий, затем выполняются различные фильтрационные преобразования для устранения ложных вставок символов и т. п. Все одноименные метки, следующие друг за другом, объединяется .в один фонетический сегмент, причем, если его длительность меньше некоторого порога; то такой сегмент игнор1фуется.

Использование карт призншсов связано с выбором таких их характеристик, как размерность, количество элементов, выбор законов изменения величин oi(t) и r(t) которые обычно выбираются исходя из эмпирических.соображений. Как показывает численное моделирование bu5od этих параметров, возможно , не играет решающей роли для окончательного вида сформированной карты,опре- • делял, в основном,скорость сходимости процесса При конечной размерности карты признаков можно также ожидать существенного влияния вида метрики . р на результат процесса формирования карта ■

Таким образом, ■ в результате анализа различных архитектур нейронных сетей было, установлено, что наиболее перспективным с точки зрения организации представления данных' является класс, сетей Кохонена; ' '

.Во второй' главе рассмотрен алгоритм самоорганизующихся карт признаков Кохонена, .использование которого в модели мно- . гослойной сети дает возможность выполнять агрегацию признаков, переходя от простых локальных к более, сложным признакам, учитывающим контекстную информацию. Далее рассматривается' алгоритм акустико - фонетического анализа на основе многослойной сети Кохонена.

Пусть речевой сигнал описывается в дискретные ыоменты времени t-.0,l,2,... ' вектором признаков x(t)-{xl(t)>, 1-1,К. Сеть состоит из нескольких слоев и каждый, элемент ui(n) 1-го слоя идентифицируется упорядоченным набором своих координат. Все элементы некоторого, 1-го слоя получают в ■момент времени t один и тот же входной вектор признаков x",(t) размерности N. Первый олой сети является картой распределения параметров векторов xlt) , которые описывают речевой сигнал, а каздый из пос-

ледующих слоев, .например 1-й, картой распределения (2т-1)-грамм, образованных вектором 5ГС(Ь). Каждый элемент сети имеет собственный набор т.н. коэффициентов связи Дп"Л)-{т;(гГ, t) >, i-1,N , которые определяют его индивидуальную реакцию на входной вектор признаков. Каждый слой получает входной сигнал от предыдущего и посылает выходной' сигнал в последующий слой. Допустим, .если в момент времени t-2,t-l.t на 1-1 слое координатами центров возбуждения были ^(t-2). n",( t-1) ,n*i(t), то входным сигналом для пг-го слоя в момент времени t будет" вектор ЗГ.( t) — (n,*(t-2) ,n,'(t-l) ,n,'(t)). Кроме того.все элементы связаны с отдельным вектором названий m(n, t) по одной связи на каждую компоненту вектора и величина которой настраивается .в процессе обучения и пропорциональна корреляции- между описываемой этим элементом n-граммой признаков и соответствующей фонетической категорией.

•Тормирование сети заключается в настройке величин /Rn.t), rii(r>,t) и осуществляется в течение двух последовательно выполняемых фаз обучения. Первоначально (при t-О) значения этих связей ^выбираются случайным образом. При поступлении в момент времени t, t>0 вектора признаков j^d) на 1-й слой сети:

„Ч

1. Определяется гГ'( l,t)-aremin р (m^fT.t) ,х"0(1)) (1)

для всех u.(n): g (n,nr(t)) < r(t)

m (n,t+l) - m.( n", t) + t) ( jc.( Ь)-йь(rT, t)) (2)

с v <- *■

где t) - коэффициент адаптации: 0<ct( t)<l, сЦ t)l 0, - метрика в R. • -

2". На'вход следующего 1+1 слоя сети поступает входной вектор

xAt)- (n('(t-2),n.'(t-l),n.'(t)) (3)

На второй фазе обучения при неизменных mÇn, t) выполняется модификация идентификационных связей ш(гГ,t). Первоначально все пКп, t)-0. Для формирования этих связей используется предварительно размеченная экспертом запись речевого сигнала. 'Разметка задает соответствие f: x(t)-{\0, где W— фонетические кате-

горни, которые необходимо идентифицировать. Такой тестовой сигнал подвергается первичному анализу и полученные вектора признаков используются как входные для описанной сети. Если хА(Ь) - входной вектор признаков для слоя 1 в момент времени Ь. то:

1.' Определяем координатный вектор п*(1Л) в соответствии с (1).

• 2. Для элемента ий(п*(1,Ь)) модифицируем значение весов идентификационных связей:

_ , " (,1я1:(пт(1Л)Л)+б.0>0, если ¡-Г(ЗГи))

т (п'(1Л). _ V (4)

, [ т^(п*(1Л)Л) в противном случае

3. Нормируем полученный вектор связей:

_ . тЧп'.Ь)-

- —:---(5),

и по (3) рассчитываем вектор х^л.Ь). ■ •

К концу такого обучения набор компонент пьЧгГЛ) представляет гистограмму распределения' различных • .фонетических категорий' для изображаемой и(л) траектории значений параметров. Ре.вдм сегментации организуется следующим образом: вектор, признаков ' В"' момент времени I подается на вход сети и в соответствии с (1) в каждом слое 1 определяются координаты активного элемента ~п*(.1,Х). Далее, по (3) формируется еходной вектор признаков хди для следующего слоя 1+1. Принадлежность вектора параметров в момент времени Ь к фонетической категории I., определяется '

. I - агатах { шах т.'(пЧ1Л),1)>. " (б)

ч • • I •

.Однако следует'иметь в. виду, что из-за многомерности век-. . торов х(и<, оценка требуемых распределений представляет собой трудоемкую'работу,, а точность'.этой оценки сильно , з'ависйт от

обьема обучающей выборки. Поэтому методами статистических решений полностью решается задача распознавания лишь в тех случаях, тогда распределения пар (к; х(I)) имеет достаточно простой аналитический вил или удовлетворяет некоторым требованиям симметричности, независимости, некоррелированности. и т. д. ' Практически, распределения в реальных случаях таким требованием не удовлетворяют.

Отмеченные выпе трудности можно значительно уменьшить при использовании рассматриваемого ниже многорядного алгоритма принятия решений. Б основу метода поломено несколько основных принципов (самоорганизации, неокончательности промежуточных резений, внешнего дополнения, самоотбора промежуточных репе-ний, единственности окончательного^решения), которые дают возможность наиболее эффективно. ресать более сложные задачи при наличии ограниченных ооучающих данных.

Проблема, возникающей? при использовании многослойной сети заключается в выборе оптимальных процедур принятие реиения на основе набора частных решений, генерируемых отдельными слоями сети. Для этого предлагается использовать решающие правилу оптимальной сложности получаемые на основе многорядного алгоритма принятия решений. Этот алгоритм отличается от многослойного , перцептрона тем, что если в каждом последующем слое перцелтро-на допускаются все решения, то эдес;) ' в результате проверки принимаемых решений на проверочной выборке оставляется только часть решений. Кроме того, в отличие от перцептрсна в многорядном алгоритме может осуществляться самообучение. Немаловажным достоинством этого алгоритма является и то, что он не предусматривает каких-либо ограничений на число признаков и на количество обучающей выборки. "

На основе вышеизложенного был предложен алгоритм применительно к навей задаче. Пссле первого эгапа обучения, т.е настройки связей между элементами соседних слоев, приступим ко второму этапу обучения. При неизменных вел! шнах связей элементов* .различных слоев, по поступающему, сигналу формируем входной вектор признаков хН) для рассматриваемого алгоритма. Компоненты вектора признаков определи., гея в каждом слое следующим Образом:

1. Если для каждого 1-го слоя хН) -очередной входной вектор признаков, то определяем координатный вектор .

- п: ' - - :

пЧ1Л) - агет1п5>'(гГс(.гГЛ).х;.(и) п

где р* ( • ) - некоторая метрика

что . в свою очередь определяет компоненты вектора признаков ■

х^П -СиГ (п11Л)Л.)Я1(пЧ2Д)Л).....вГ^гГиЛ),«)

I - это номер последнего слоя.

2. По размеченной экспертом обучавшей выборке определим значения частот для каллой пары признаков вектора х (Ь) по классам Р( (I) х£ (О /й)), где 1-СМ; к-1,п-1; 1-2Тп; М - количество фонетических категорий , п - количество компонентов

вектора

3. По полученным в шаге 2 эмпирическим законам распределение пар признаков , строим вероятностные распределения Р(х.(0хс(О/??1) (в которых нет равных нулю значений ьероят- : ностей). .

4. С помощи матрицы потерь и распределения априорных вероятностей классов Р(Й1) и найденных значений Р(х4 Шх^и/ КО по минимуму риска, подсчитанному по выражению:

1-1

■где - риск реиения с)}, принятого по признаком .ч4ШхсН) в пользу ой фонетической категории; . •

классифицируем фонетическую принадлежность проверочкой выборки.

- И -

5. Выполняем селекцию' п пар признаков, которые даиг наи-Оольаую точность распознавания на проверочной выборке.

6. Осуществляется переход ко второму ряду селекции , когда . отобранные пары признаков заменяются решениями, принятыми на их основе по минимуму риска. Эти решения представляют собой признаками второго ряда (г - 1,л; г < С*).

7. Алгоритм повторяется, начиная с шага 2 для признаков второго ряда у( Ь) и т. д.

8. Расчет останавливается на тем ряду, на котором достигается стабильные решения, не изменяющиеся при переходе к последующему ряду селекции.

'Прослеживая дерево решений, приведших к стабильному решению. найдем совокупность пар признаков первого ряда. Решение о фонетической принадлежности входного вектора признаков х в момент времени Ь определяется из следующей формулы

агБгМп (сШ - агдш1п{2]]Р(КОЬ[Р1,с11(ЗГм(Ь))]Ра(х;(1),Я1)>

<1з с1;| 1-1

где агетт £(<!.))- решение о фонетической принадлежности по минимуму риска вектора признаков пропущенных через ряды селекции, т.е. х^Ь) - (х.Ш.х^Ь) ,..., х,дт , где п*< п. Р (х;(Ь) /1?!) - выражение, аппроксимирующее многомерное вероятностное распределение вектора.х^СЬ) произведением вероятностных распределений пар признаков Р(х^(Ь)хг(и/1?1) в каждой 1 - ой фонетической категории. ' •

Третья глава была посвящена экспериментальному исследованию методов первичной обработки и распознав лии речи с г пользованием нейронной сети. . Для ' практической реализации алгоритмов изложенных во второй главе был разработан программны") комплекс. В состав комплекса входили следующие блоки: блок Фонетических база данных, блок формирования нейронной сети Ко-

хонеиа для анализа сигналов, блок акустико - фонетического анализа на основе искусственной нейронной сети.

В экспериментах шюьэовалась однослойная сеть, алгоритм Формирования и обучения которой.изложен во второй главе. Выполнение экспериментов включало в себе следующие этапы: формирование карты признаков на материале слов и стандартных фраз языка заказов авиабилетов, оценку возможности использования элементов сети для распознавания звуков по значениям параметров в текущей момент времени. В качестве устройства первичного анализа использоьалась гребенка полосовых аналоговых фильтров. 1?<>личш1Ы выходов гребенки измерялись через 10 ме и полученный вега'ор признаков использовался для формирования и обучения однослойной сети, состоящей из 250 элементов (образующих квадратную матрицу 10X10 элементов).

Наиболее важными представляются следующие результаты работы блока акустико - фонетического анализа :

- структура сформированных весов идентификационных.связей сети Кохонена, в частности, возможность формирования на карте признаков компактных областей, состоящих из нейронов - детекторов определенных звуков; ...

- точность работы процедуры акустико - фонетического ана- ' ли а на основе нейронной сети, без дополнительных улучшающих процедур типа Фильтрации полученных символьных цепочек, только на основе анализа отдельных векторов хН) параметров сигнала

Для реализации процедуры поиска фонем в последовательности сгенерированных меток предложена темпоральная модель звука, ■ учитывнвдэя его длительность.

Далее рассмотренная вше модель блока акустико - фонетического анализа была доработана с целью построения более точной процедуры сегментации и маркировки речевого сигнала, а затем использована в системе распознавания команд языка вакаэов авиабилетов.

Обучение системы распознавания выполнялось на материале 163 слов'из фонетической базы данных, произнесенных одним, диктором. Тестирование выполнялось на высказываниях того «е диктора, не вошедших в базу данных (естественно, Материалом был рабочий язык системы заказа билетов - т.е. подмножество тех же

163 слов). • Точность распознавания слов для данного диктора составляла 92 - 95 7..

А также, в проведенном эксперименте для получения оптимального реиения о фонетической принадлежности, которые полу-ч;шись в параллельно функционирующих каналах анализа сигнала, алгоритм многорядного принятия решений останавливался на 7-м ряду, на котором достигался стабильные рекения, пе изменяющиеся при переходе к последующему ряду. Для ускорения процесса сходимости алгоритма к оптимальным решениям использовалась процедура обучения матрицы потерь и априорных вероятностей. Таким образом, найдено единственное оптимальное по сложности решающее решение.

ОСНОВ1ШВ РЕЗУЛЬТАТЫ РАБОТЫ ,

1. Разработана система для акустико - фонетического анализа речевых сигналов на основе нейронной сети Кохонена.

2. Предложи Метод 'фонетической маркировки слитной речи, учитывающий априорную информацию о закономерностях изменения параметров речевого сигнала.

3. Разработана система распознавания команд на основе модели нейронной сети Кохонена.

Л. Предложен' метод для выбора наи.1учшего решения на основе индивидуальных решений о фонетической принадлежности сегментов речевого сигнала, генерируемых в параллельных каналах анализа.

Р. Предложена темпоральная акустическея модель звука

б. Экспериментально исследованы методы акус лко - фонети-еско-го анализа и алгоритм фонетической маркироЕки на основе нейронной сети.

- 14 - ■

Основные полоиения диссертации опубликованы в следу таи работах:

1. Абдиев Б,.А., Ващгнко В.Ф. Использование функции Е!ессе-ля для автоматического синтеза речи // Автоматическое .распознавание и* синтез слуховых образов. - М.: ВЦ АН СССР, • 1937] С. 89 -91.

2. Абдиев Б. А. Распознавание речевых образов на основе нейронных сетей // Лингвочетодические аспекты обучения иностранному языку в техническом вузе. - Пенза, 1989. С. 35 - 37.

3. Абдиев Н. А. Армирование оптимального решающего правила многослойной нейронной сети // ЦиФ!>овая' обработка акустических сигналов. - М.:' ВЦ АН СССР. 1989. - С. 45 - 53.

4. Абдиев Б. А. Фонетический анализ слитной речи на основе нейронной сети. - М.: БД АН СССР, 1990. - с. 17.

5. Абдиев Б. А. Метод фонетической маркировки слитной речи на основе многорядного алгоритма принятия решений // Автоматическое распознавание слуховых образов: тезисы докладов- 16-го Есесеюэного семинара (АРСО - 16). - Ы.: 1991. - С. 4 - 5.

Подписано 1 г.очать 16.10,52 г. ¿ор^гт буу.аг'и 6Сх?Л 1/16

пач;л; 1,0,ХЧ.изд.л. 0,5о. Тира* 1С0

Каз.ГЭУ.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00