автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка алгоритма и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей

кандидата технических наук
Абдиев, Болат Азимбекович
город
Москва
год
1992
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка алгоритма и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей»

Автореферат диссертации по теме "Разработка алгоритма и программ для акустико-фонетического анализа речевых сигналов на основе нейронных сетей"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ВЫЧИСЛИТЕЛЬНЫЙ .ЦЕНТР

Йа правах рукописи

АВДИЕВ Болат АзииСекович

РАЗРАБОТКА АЛГОРИТМОВ И ПРОГРАММ ДЛЯ АКУСТИКО -«ОПЕТИЧЕСКОГО АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ

(специальность 05.13.11 - математическое и программное обеспечение вычислительных .мааин. комплексов, систем и сетей)

Авторе^рат диссертации на соискание ученой степени кандидата технических наук

МОСКВА - 1992

Работа выполнена в Вычислительном центр« РАН

Научный руководитель: кандидат фиэико - математических

наук В. Я Чучупал

Официальные оппоненты: доктор технических наук, профессор Г. Д. Фролов кандидат технических наук ' ' С. К Кринов

Ведущая организация: Институт математики СО РАН

Зашита состоится 1вд2 г. в ^ часов

на заседании специализированного совета К 002.32.01 при Вычислительно« центре РАН по .адресу 117333 . Москва, В - 333. ул. Вавилова, 40.

С диссертацией можно ознакомиться в библиотеке ВЦ РАН Автореферат разослан п/Л 1992 г.

Ученый секретарь специализированного совета К 002.32.01 при ВЦ РАН доктор физ. -шт. наук К. К Рудаков

ОЕШ ХАРАКТЕРИСТИКА РАБОТН

Актуальность работы. Одной из наибо'лее эффективных и естественных для человека форм общения является речевое взаимодействие. Основное.отличие вычислительных систем пятого поколения 'от ЭВМ предыдущих« поколений состоит в использовании "интеллектуальной" периферии, ориентированной на непрофессионального пользователя и обеспечивающей обмен информацией с ЭВМ на естественном для человека языке.

Использование речевого канала вместо обычных терминальных устройств значительно облегчает условия работы, повышает производительность его труда, увеличивая скорость ввода данных.

' Создание систем распознавания и синтеза речи открывает новую .область пршггнческих применений, способных расширить возможности человека; Актуальность и перспективность работ по построению средств речевого общения "человек -ЭВМ' косвенно подтверждается большими затратами на исследования в этой области. .*

Качественно новые сферы возможного практического применении* распознавателей речи раскрываются при отмене ограничений на размер словаря, необходимость дополнительного обучения при смене диктора и максимальном приближении я гика системы распознавания к естественному. Однако создание, подобных': систем связано с преодолением целого ряда сложных проблем.

К ним,' з частности, относятся: учет - изменчивости акустических характеристик речевых-сигналов • в зависимости от фонетического контекста,•■; задача каркяровкинепрерывного речевого сигнала на акустичесгл .инвариантные, единицы, а таккэ ква-зифоиемаая классификация'этих единив'Надежность обнаружения и юсчссифякзцки квазиФонетических "единиц в процессе акуегико - ■ фонетического анализа во. многом 'определяет характеристики (точность распознавания) системы,"-.''поэтому больше внимание разработчиков речевых систем уделяется совершенствования методе!) акустико - фонетического анализа, . , .

Пелью диссертационной работы является создание новых методов и. алгоритмов -акустико - фонетического анализа йа основе нейронных' сетей, их программная реализация, апробация числен-

- -.2 -

ными экспериментами и применение для распознавания речи.

Основные задачи наследования:

- сравнительный анализ методов первичной обработки и представления речевых сигналов с помощью традиционных подходов и основанных на нейронных сетях;

- разработка методов первичного описания и представления, речевых сигналов на основе нейронных сетей;

- экспериментальное исследование моделей нейронных сетей;

- анализ и разработка алгоритмов обучения для таких моделей.' • _ .

Научная новизна работы:

- исследовании разработан метод фонетической маркировки и сегментации слитного ¡речевого сигнала, учитывающий априорную информацию о закономерностях изменения параметров речевого сигнала (-в том числе эффект коартикуляции и длительность звуков);

- исследован и разработан метод для выбора наилучшего решения на основе индивидуальных решений о фонетической принадлежности сегментов речевого сигнала, генерируемых в параллельных каналах анализа; ' .

- экспериментально реализован и исследован •метод акуоги-ко - фонетического анализа' и фонетической маркировки на основе многослойной нейронной сети Кохонена.

Практическая ценность работы заключается в построении эф-, Фективяых алгоритмов, и программного обеспечения анализа сигнала, обучения и распознавания речевых образов.

Реализация ре&ультатов работы. Диссертационная работа вы. поднялась в рамках плановый теш "Распознавание и синтез слу-. ховых образов" ВЦ АН .СССР б соответствии с. утвержденным постановлением Президиума АН СССР N1 31 от ' 7.06.91 г. НГР 0188.0026039. ' ■

Апробация работы. Оснодные результаты работы докладывались на Всесоюзной школе - семинаре "Автоматическое распознавание речевых образов" АРСО - 16 (Шсква, 1991), на семинаре сектора автоматического распознавания речи ВЦ АН СССР, а также на 3-ей Всесоюзной .конкуренции "Исследование звуковых систем языков аборигенов Сибири сопредельных регионов" (Новосибирск, 1988),

- з ••

Публикации. По теме. диссертации опубликовано пять печатных работ. ' ' ,

Структура и объем работы. Диссертационная работа состоит из введения, трех глав, выводов и заключения и содержит 91 страницы текста, в том числе 2 таблиц , б рисунков и 2 приложений. В списке литературы 81 наименований.

СОДЕРЯШЕ РАБОТ!!

Во введении обоснованы актуальность и научная новизна ра-•боты. Сформулированы цели и основные задачи, решаем»; в диссертации и излагается краткое содержание работы по главам, а также приводятся сведения об апробации результатов работы.

•В первой главе рассматривается.класс вычислительных алго-рнтмо1 , известию под наз: зшием модели нейронных сетей , который стал особенно интенсивно развиваться в. последние 6-8 лет. Это связано с надеждами получить,' на этой основе, эффективные параллельные процедуры сбора, анализа и обработки данных, которые будут обладать некоторыми свойствами, присущими центральной нервной системе живых организмов, например, созданию абстрактных представлений, обобщению, и т.п. Показано.• что известные модели нейронных сетей успешно выполняют функции ассоциативной памяти, предобработки и кластеризации данных, могут быть использованы как вместо традиционных классификаторов образов в системах распознавания; '

Подробно рассматривается модель самоорганизующихся карт признаков Кохонена- Как и- другие модели, она претендует на качественное описание процессов, ■ происходящих, в центральной нервной системе, а именно является модель.» т.н. вычислительных карт (признаков). . -

- • Модель самоорганизукящхся карт признаков описывает сеть, которая после периода обучения ("без учителя") "может рассматриваться как карта, состоятся из элементов, каждый из которых является детектором некоторого подмножества из обучающего пространства образов, причем расположение этих детекторов • в сети не случайно, а соответствует некоторой проекции пространства образов на поверхность сети, и эта проекция сохраняет

топологические свойства .пространства образов. .Сеть' Кохонена состоит из набора элементов, образующих М- мерную решетку. Все элементы сети получает в качестве входа один и тот хе вектор, признаков образа xtt)-{xl(t)}, i-l,W. Каждый элемент сети u(n) характеризуется собственным набором коэффициентов связей, по которым к нему поступает сигнал xlt): пГ(гГЛ)-{га1(п,Ь)}, i-l,N. Величина реакции элемента u(n) на входной вектор признаков xt t) вычисляется как расстояние мевду этими векторами в исгсо-торой метрике § . Алгоритм Армирования сети-состоит из двух последовательных шагов:

Начальные значения rRîT,0) ыОиракл'ся случайным образом. При-t>0 пусть зГсЬ)- очередной, вводной вектор признаков, тогда:

1. Оцениваются координаты î7*(t) такого элемента сети,

u(n\t), что : rT'(t)- argrnln^(n(rr,t),x[tj)

2. Для всех { u(n): J (n,n'(t) )<r( t)}:

m( iT, t*-l ) -i( n,t).+ <*( t+l) ( ЗГС t) - Я n, t) )

Параметры r(t) и oi.(t) предполагаются при этом выбранными так, что обеспечивается сходимость процесса , в частности r(t) I О, &(t)lO, Характеристики .алгоритма 1«к класс и- . Фикатора образов обусловлены следующими свойствами. При выборе параметра a(t) таи , что o(.(t)|0, ^ol(t)- оо

и в предположении. что подстройка "коэффициентов свя'эи in(n,t) выполняется по обучающей последовательности обра-.' зов {x(t)>, которые вы0!-,рается из пространства образов случайным способом, свяэя m(n, t) формируются так , что нейронную сеть мокно рассматривать как сеточло заданную функцию или карту для равномерной аппроксимации функции плотности вероятности совместного распределения компонент векторов xlt) в. предположении, что таковая существует. Уточнить' это положение можно следумщш образом. Ест элемент u (п'1, n'(t) - argminp( х(t). iïï(n,t)) назвать соответствующим входному вектору Призна- . ков хе-t) и предположить существование мери ы. .характеризующей

- б -

плотность распределения компонент 5Г(Л) в пространстве признаков (так, что количество векторов Г(Ь)£и, и- измеримо относительно ^ ) равно ^ЧШ, а также обозначить и(п)-{х(О/хИНЬ. и х(Ь) соответствует и(п)>, то:

1. Для любых п,, п,: -и(гТ()-Ь'(пг) т. е. веса элементов подстраиваются в процессе обучения таким образом, что сеть становится равномерно покрывающей пространство признаков и каждый элемент соответствует равному по мере ^ множеству образов.

2. Близкие в смысле близости координат элементы сети соответствуют близким по метрике элементам пространства признаков/

Общая методика использования фонемных карт, заключается в следу цем. После формиров ния величин коэффициентов ЩгГ;Ь) вы-, полняется процедура маркировки элементов карты. Для кавдого элемента и(п) определяется, с "какой вероятностью онГс'бответс-твует той или иной фонетической категории. Для этих целей используется тестовый сигнал, в котором, с помощью эксперта для каждого вектора признаков х(Ь) определено, к какой фонетической категории он относится. Тестовый сигнал поступает на вход алгоритма и для каждого элемента и(п) сети строится гистограмма распределения фонетических категорий к которым принадлежали те5Г(.и, которым .соответствовал в ходе маркировки элемент и(п).

После выполнения описанной процедуры на карте обычно можно выделить компактные области, состояние из элементов сети, со-ответствукхцнх одному.и тому же звуку (или- тому типу фонетических категорий, которые использовались■для маркировки элементов карты). Отметим, что во всех приведенных экспериментах'в качестве признаков для описания речевого сигнала использовались спектральные параметры, например, выходы полосовой гребенки фильтров.' Дальнейшая процедура анализа речевого сигнала с помощью описанной 'нейронной сети, заключается, в следующем: выо-•казывшие преобразуется в поток векторов признаков х( Ь) для кадяого из которых определяется соответствующий ему■ элемент сети и*(7о и в выходной поток символов, порождаемый алгоритмом

- б -

анализа заносится метка той фонетической категории, к которой относится u*(n). .Над .полученной таким образом цепочкой,состоящей из символов - имен фонетических категорий, эатем выполняются различные фильтрационные преобразования для устранения ложных вставок символов и т. п. Все одноименные метки, следующие друг за другом, объединяются в один фонетический сегмент, причем, если его длительность меньше некоторого порога; то такой сегмент игнорируется.

■ Использование карт признаков связано с выбором таких их характеристик, как размерность, количество элементов, выбор законов изменения'величин oi(t) и r(t) которые обычно выбираются исходя из эмпирических.соображений. Как показывает численное моделирование дыбор этих параметров, возможно , не играет решающей роли для окончательного вида-сформированной карты.опре- • деляя, в основном,скорость сходимости процесса. При конечной размерности карты признаков моино'также ожидать существенного влияния вида метрики. р на результат процесса формирования карты. • ■ '

Таким образом, в результате анализа различных архитектур нейронных сетей было, установлено, что наиболее перспективным с точки зрения организации представления данных' является класс, сетей Кохонена;

. Во второй' главе рассмотрен алгоритм самоорганизующихся карт признаков Кохонена, .'использование которого в модели мно- . гослойной сети дает возможность выполнять агрегацию признаков, переходя от простых локальных к более, сложным признакам, учитывающим контекстную информации. Далее рассматривается алгоритм акустико - фонетического анализа на основе многослойной сети Кохонена. -

Пусть речевой сигнал описывается в дискретные моменты времени t-0,1,2,... '• вектором признаков x(t)'--ix'l(t)>, 1-CN- Сеть состоит из нескольких слоев и каждый элемент ие(п) 1-го слоя идентифицируется упорядоченным набором своих координат. Все элементы некоторого, 1-го слоя получает в .-.момент времени t один и тот же входной, вектор признаков 5Г. ( t) размерности N. Первый слой сети яйляется картой распределения параметров векторов x(t) , которые описывают речевой сигнал, а каждый из пос-

ледующих слоев, -например 1-й, картой распределения (2т-1)-грамм, образованных вектором зГ£С Ъ). Каадый элемент сети имеет собственный набор т.н. коэффициентов связи т!п",Ь)-<тЧгГ.Ь)>, ¡~ 1.М , которые определяют его индивидуальную реакцию на входной вектор признаков. Каждый слой получает входной сигнал от предыдущего и посылает выходной' сигнал в последующий слой. Допустим, если в момент времени 1-2,1-1.Ь на 1-1 слое координатами центров возбуждения были Ь-2), гС,(Ь-1) .г^ДЬ), то входным сигналом для т-го слоя в момент времени I будет' вектор ЗГС (Ь) — (пДи-гКп/.и-пД'Ш). Кроне того.все элементы связаны с отдельным вектором названий г^п.Ь) по одной связи на каждую компоненту вектора и величина которой настраивается .в процессе обучения и пропорциональна корреляции- меяду описываемой этим элементом п-граммой признаков и соответствующей фонетической категорией.

Формирование сети заключается в настройке величин п?п.Ь), йпЛ) и.осуществляется в течение двух последовательно выполняемых фаз обучения. Первоначально (при Ь-О) значения этих связей -выбираются случайным образом. При поступлении в момент времени Ь, 1>0 вектора признаков х"г(0 на 1-й слой сети:

1. Определяется. п"'(1Д)-аггп!>г> (^(п,(1) для всех иДп): 5>(п,п'(иУ < г(Ь)

йГ,(пЛ+1) - тХп.и + аСШхЛО-т^гГ.Ш (2)

где эЦ1)- коэффициент адаптации: 0<с<.(Ь)<1. 0. £ - метрика в й. - , ' -

2. На 'вход следующего 1*1 слоя сети поступает входной вектор

5T.it)- (п^а-гз.п.'и-П.п^У) (3)

На второй фазе обучения при неизменных пЦ п, I) выполняется модификация идентификационных связей т(пД). Первоначально все гХп, и~0. Для формирования этих-связей используется предварительно размеченная экспертом запись речевого сигнала. 'Разметка задает соответствие Г: х( I) ЧУЛ, где V— фонетические кате-

гории, которые необходимо идентифицировать. Такой тестовой сигнал подвергается первичному анализу и полученные вектора признаков используются как входные для описанной сети. Если х"4(Ь) - входной вектор признаков для слоя 1 в момент времени I, то:

1. Определяем координатный вектор п*( \ ,Ь) в срответствии с (1).

' 2. Для элемента и^пЧЬ О) модифицируем значение весов идентификационных связей:

_ " Лт,Чп*и.Ь),Ь)+б,б>0, если

т (пг( 1Л), (4)

, | псЧп'(1,и.Ь) в противном случае

3. Нормируем полученный вектор связей:

ч

, тЧп*Д)/ .

- ---:---, ' (5),

11т (Н*.1)Ц

и по (3) рассчитываем вектор и. ■ •

К концу такого обучения набор компонент ш^(гГ, Ь) представляет гистограмму распределения различных - .фонетических категорий ' для изображаемой и( п) траектории значений параметров. Режим сегментации организуется следуюким образом: вектор признаков ' в ' момент времени I подается на вход сети и в соответствии с (1) в каэдсм слое 1 определяются координаты активного элемента 7Г*(1,Л,). Далее, по (3) формируется входной вектор признаков ^.,(1) для следующего слоя 1+1. Принадлежность ' вектора параметров в момент времени I к фонетической категории Iопределяется '

.'1 - агетах { шах г1,.Чп'(1Л)Л)>. • ' '' (6)

. .Однако следует'иметь в. виду, что из-за многомерности век. торов х( оценка требуемых распределений представляет , собой трудоемкую работу, а точность этой оценки сильно : з'ависйт от

обьема обучающей выборки. Поэтому методами статистических решений полностью реиаетея задача распознавания лишь в тех случаях, когда распределения пар (к; х( t))' имеет достаточно простой аналитический вид или удовлетворяет некоторым требованиям симметричности, независимости, некоррелированности. и т.д.' Практически, распределения в реальных случаях таким требованием не удовлетворяют.

Отмеченные выше трудности можно значительно уменьшить при использовании рассматриваемого ни.\е многорядного алгоритма принятия решений. Б основу метода положено несколько основных .„ принципов (самоорганизации, неокончательности промежуточных - решений, внешнего дополнения, ' самоотбора промежуточных решений, единственности окончательного решения), которые дают возможность наиболее эффективно, решать более слолные задачи при наличии.ограниченных ооучавщих данных.

Проблема, возникающая нри использовании многослойной сети • заключается в выборе оптимальных процедур принятие решения на основе набора частных решений, генерируемых отдельными слоями сети. Для этого предлагается использовать, реванше правила оптимальной сложности получаемые на основе многорядного алгоритма принятия решений'. Этот алгоритм отличается от многослойного , перцептрона тем,. что §сли в каждом последующем слое перцептро-на допускаются все реиения, то здес;> ' в результате проверки ' принимаемых решений на проверочной, пыборке оставляется только " часть решений. Кроме того, в отличяе от перцептрсна в многорядном алгоритме может осуществляться самообучение. Немаловажным достоинством этого алгоритма является и то, что он не предусматривает каких-либо ограничений на число признаков и'на количество обучающей выборки.

На основе выиеизломгяного был предложен алгоритм применительно к нашей задаче. После первого этапа обучения, т. е настройки связей меяду элементами соседних слоев, приступим ко второму этапу обучения. • При неизменных вел; шах связей элементов • .различных слоев, по поступающему, сигналу формируем входной вектср признаков x*(t) для рассматриваемого алгоритма. Компоненты вектора признаков определяется в каждом слое следующем образом:

1. Если для каждого 1-го слоя хН)-очередной входной вектор признаков, го определяем координатный вектор

7Г(1Л) - агк'пппгГД.п,Ъ).х^.(и) л

где£*( - ) - некоторая метрика

что , в свою очередь определяет компоненты вектора признают, х^Ш:

х^(П -{¡Г (пХ1Д)Л>.л>»(л,(2Л)Л)..-..ти(гГ,(ЬЛ)Л))

Ь - это номер последнего слоя.

2. По размеченной экспертом обучающей выборке определим значения частот для каллой, пары признаков вектора х (и по классам Р(хк( I) х(Ш/{Ц) , где 1—ГТМ; К-1. п-1; 1-2Тп; М - количество фонетических категорий , п - количество компонентов

вектора ЗГ( I).

3. По полученным в иаге 2 эмпирическим законам распределения пар признаков , строим вероятностные распределения Р(х. (t)кl(t)/Rt) (в которых нет равных нулю значений вероят- . ностей). . •

4. С помощью матрицы потерь I. распределения априорных вероятностей классов Р(К1) и найденных значений Р(х4 (ихД1)/ $1) по минимуму риска, подсчитанному по выражению:

М ' . •

1-1

гД<?рь£ - риск решения с!ь принятого по признаком х4(Ь)хсШ в пользу з- ой фонетической категории;

классифицируем фонетическую принадлежность проверочной выборки.

- и -

5. Еыполняем селекцию' п пар признаков, которые дают наибольшую точность распознавания на проверочной выборке.

6. Осуществляется переход ко второму ряду селекции , когда . отобранные пары признаков заменяются решениями, принятыми на их основе по минимуму риска. Эти решения представляют собой признаками второго ряда у4(Ь.) (г - ГГп; г < С,1).

7. Алгоритм повторяется, начиная с иага 2 для признаков второго ряда уШ и т.д.

8. Расчет останавливается на том ряду, на котором достиг гается стабильные решения, не изменяющиеся при переходе.к последующему ряду, селекции.

'Прослеживая дерево решений, приведших к стабильному. решению, найдем совокупность пар признаков первого ряда Решение о фонетической принадлежности входного вектора признаков х (Ь) в момент времени Ь определяется из следующей формулы

■и

'алрип (<Ш - агдш1п{2]р(К1)иК,1,ф(ЗГм(1))]Ра(Г/и,Я1)>

<11 • ■ <и 1-1

где агепип<р(с1,))- решение о фонетической принадлежности по минимуму риска вектора признаков пропущенных через р.чды селекции, т.е. - (хДЬ),Xj.it) ,..., х_ДШ , где п*< п. Р (х'„и)

/Ш) - выражение, аппроксимирующее многомерное вероятностное распределение вектора .х^(Ь) произведением вероятностных распределений пар признаков Ох£ Ш/1Ю в каждой 1 - ой фонетической категории. ' •

Третья глава была посвящена экспериментальному исследованию методов первичной обработки и распознав яии речи с Г'поль- . зованием нейронной сети. . Для ' практической реализации алгоритмов изложенных во второй главе был разработан программный комплекс. Б состав комплекса входили следующие блоки: блок фонетических база данных, блок формирования нейронной сети Ко-

хекеиз для анализа сигналов, .блок акустико - фонетического анализа на основе искусственной нейронной сети.

В экспериментах яспоьэовалась однослойная сеть, алгоритм Формирования и обучения которой изложен во второй главе. ' Выполнение экспериментов включало в себе следующее этапы: формирование карты признаков на материале слов и стандартных фраз языка заказов авиабилетов, оценку возможности использования элементов сети для распознавания звуков по значениям параметров в текущий момент времени. В качестве устройства первичного анализа использовалась гребенка полосовых аналоговых фильтров. Величины выходов гребенки измерялись через 10 ме и подученный вектор признаков использовался для формирования и обучения однослойной сети, состоящей из 256 элементов (образующих квадратную матрицу 16X1 б элементов).

Наиболее важными представляются следующие результаты работы блока акустико - фонетического анализа :

- структура сформированных весов идентификационных.связей сети Кохонена, в частности,.возмохность формирования на карте признаков компактных областей, состоящих из нейронов - детекторов определенных звуков; ...

- точность работы процедуры акустико - фонетического ана- ' ли а на основе нейронной сети, без дополнительных улучшающих процедур типа фильтрации подученных символьных цепочек, только на основе анализа отдельных векторов хН) параметров сигнала

Для реализации процедуры поиска фонем в последовательности стенерщювашш меток предложена темпоральная модель звука, учитывавшая его длительность.

Далее рассмотренная выше модель блока акустико - фонетического анализа была доработана с целью построения более точной процедуры сегментации и маркировки речевого сигнала, а затем использована в системе распознавания команд языка заказов авиабилетов. '

Обучение систему распознавания выполнялось на материале 163 слов'из фонетической базы данных, произнесенных одним, диктором. Тестирование выполнялось на высказываниях'того же диктора, не вошедших в базу данных (естественно, Материалом был' рабочий язык системы заказа билетов - т. е. подЙю*ест£га тех же

163 слов). • Точность распознавания слов для данного диктора составляла 92 - 95 %.

А так«?, в проведенном эксперименте для получения оптимального решения о фонетической принедлежносги. которые получались в параллельно функционирующих каналах анализа сигнала, алгоритм многорядного принятия решений останавливался на 7-м ряду, на котором достигался стабильные решения, не изменяющиеся при переходе к последующему ряду. Для ускорения процесса сходимости алгоритма к оптимальным решениям использовалась процедура обучения матрицы потерь и априорных вероятностей. Таким образом, найдено единственное оптимальное по сложности решающее решение,

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ ,

1. Разработана система для акустико - фонетического анализа речевых сигналов на основе нейронной сети Кохонена.

2. Предложен метод 'фонетической маркировки слитной речи, учи-■ тываюший априорную информация о закономерностях изменения

параметров речевого сигнала.

3. Разработана система распознавания команд на основе модели нейронной сети Кохонена.

А. Предложен' метод для выбора наилучшего решения на основе индивидуальных решений о фонетической принадлежности сегментов речевого сигнала, генерируемых в параллельных каналах анализа.

5. Предложена темпоральная акустическгя модель звука.

6. Экспериментально исследованы методы анус ико - фонетического анализа и алгоритм фонетической маркировки на ослове нейронной сети.

Основные положения диссертации опубликованы в следующих работах: "

1. Абдиев Б, А., Ващенко В. Ф. Использование функции Вессе-ля для автоматического синтеза речи // Автоматическое .распознавание и" синтез слуховых образов. - М.: ВЦ АН СССР, -1987] С. 89 -91. '

2. Абдиев Б. А. Распознавание речевых образов на основе нейронных сетей // Лингвометодическле аспекты обучения иностранному языку в техническом вузе. - Пенза, 1989. С. 35 - 37.

3. Абдиев Б. А. Формирование оптимального решающего правила многослойной нейронной сети // Цифровая' обработка акустических сигналов. - М.: ВЦ АН СССР, 1989. - С. 45 - 53.

4. Абдиев Б. А. Фонетический анализ' слитной речи на основе нейронной сети/ - М: Щ АН СССР, 1990. - с.17.

5. Абдиев Б. А. Метод фонетической маркировки .слитной речи на основе многорядного алгоритма принятия решений // Автоматическое распознавание слуховых, образов: тезлсы докладов- 16-го Всесоюзного семинара (АРСО - 16). - Ы.: 1991. - С. 4 - 5.

Водпко&ьо в почать ¡.6,10,52 г. Зор^пт йум^ги-60х?А 1/16

пвч;л; 1,0Д4.изд.л. 0,9с. Тираж

Каз.ГЭУ.