автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Устройство речевого диалогового управления для промышленного робота
Автореферат диссертации по теме "Устройство речевого диалогового управления для промышленного робота"
МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО ОБРАЗОВАНИЯ РЕСПУБЛИКИ УЗБЕКИСТАН
ТАШКЕНТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. АБУ РАЙХАНА БЕРУНИ
РГБ ОД
На правах рукописи
КУШНАРЕНКО Александр Леонидович
УСТРОЙСТВО РЕЧЕВОГО ДИАЛОГОВОГО УПРАВЛЕНИЯ ДЛЯ ПРОМЫШЛЕННОГО РОБОТА
Специальность 05.13.05 — Элементы и устройства вычислительной техники и систем управления
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
ТАШКЕНТ - 1994
Работа выполнена в Ташкентском государственном техническом университете.
Научный руководитель:
доктор технических наук, заслуженный деятель науки РУз, профессор П. Ф. ХАСАНОВ.
Официальные оппоненты:
доктор технических наук, профессор САДЫК.ОВ С. С., кандидат технических наук МУХАМЕДЖАНОВ В. С.
Ведущая организация — НИИ «Алгоритм»^/7^М"^^
нии специализированного совета К 067.07.29 по присуждении ученой степени кандидата технических наук в Ташкентском государственном техническом университете им. А. Р. Беруни в _
_32 & ауд._ _(Ташкент, ВУЗгородок
ул. Университетская- 2).
С диссертацией можно ознакомиться в библиотеке ТашГП им. А. Р. Беруни.
Защита состоится
часов на заседа
Автореферат разослан
1994 г.
Ученый секретарь специализированного совета, д. т. н.
ХАМДАМОВ Р. >
- 3 -
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Совреивнная робототехника, вобрав .в :ебя многие достияения фундаментальных и прикладных наук, шженерных разработок, открывает качественно новие перспек-гивы автоматизации производственных процессов. " •'
Наиболее серьезные усовериенствования коснулись систе.м правления роботами. Большие успехи предвеиаят современные иучные исследования в области создания очувствленннх роботов с адаптивными свойствами и элементами искусственного ин--геллекта. Так называемые интел^ектные роботы обладают мниле-щен. зрением, слухом, обонянием,' осязанием. ■
В связи с этим особое значение приобретает,проблема ре-)9вого, с опорой на естественный язык, ввода - вывода в авто-•.атизированных распознающих устройствах.
Все больнее распространение' получают базируичиеся на ¡стественном языке системы речевого ввода, удовлетворяющие ) основном вышеуказанным требованиям, предъявляемым к универ-:альноиу искусственному языку. До последнего времени-системы )ечевого ввода считались слишком дорогими по сравнении с сис-:емами, функционирующими на базе одного из' искусственных язы-:ов. Однако, по официальнним данным, цени на системы речево-'о ввода за последние десять лет .снизились примерно в 1 тыс. )аз, что свидетельствует о всс.болызем их внедрении. Устройг :тва речевого ввода начинают входить в конфигурацию персо-шльных ЭВМ, например IBM PC, Apricot, ' -
Аля управления промышленными роботами или аналогичными
1лектромеханическими приводами, имевшими ограниченное'число
»
степеней подвизнос'ти,'. большинство распознающих систен являйся функционально избыточными и дорогостоящими, поэтому на-¡более перспективным является разработка специализированных iCTpoftcTD речевого управления, работавших в реальной масштабе ремени при'низких аппаратурных затратах, умеющих, помиио зто-о, возмоеность общения на естественном языке, т.е. ввод ко-анды и получение информации на естественном языке-. '•
Применение систем распознавания и синтеза речи "позволяет беспечить доброжелательность программного обеспечения, supo-ое их распространенна. увеличить производительность труда, а
• ... -А -
такав решить важную социальную задачу для людей имеющих физи-. ческив недостатки.
Диссертационная работа выполнена в соответствии с темой НИР ТГГУ "Разработка аксиоматического метода создания интеллектуальных компьютерных, робототехнических систем интеллектуального моделирования, проектирования, обучения и автоматизации производства" Н 01930000949.
' Целью диссертационной работы является разработка устройства речевого диалогового управления (УРДУ) промышленным ро-1 ботом распознающего ограниченный словарь команд робота и синтезирующего речевые сообщения оператору.
На зааитц выносятся следующие положения:
1.. Обоснование целесообразности использования методов ускоренной классификации для ограниченного словаря и синтеза речевых сообщений. . - •
2. Принципы построения УРДУ для управления роботом.
3. Метод распознавания ограниченного словаря команд ро,-бота основанный на выделении последовательностей, гласных звуков в слове и вычислении качественных и количественных признаков речевого сигнала.
4. Способ кодирования звуковых сигналов для хранения в библиотеках. . ,
5. Способ синтеза речевых фраз.для обеспечения диалогов! го режима работы,, основанный на использовании свойств период) ности речевых сигналов и библиотек звуков, ^раняцихся в коди] ванной форме. ... ' '
6. Структурные схемы устройств распознавания ограничен» (•о словаря и устройств синтазирования речевого сигнала для У1
Цето^ика рсслецования. В процессе выполнения работы при! мялись аналитические и экспериментальные методы исследований Для подтверждения полученных результатов были использованы ы дады мажинного и натурного эксперимента в лабораторных, услов] як и в условиях иыитирулцих производс^веннные. ■ НацадЯг^-лювизна. Разработана теоретико-множестаенная мод ^ УРДУ к формализованные модели элементов УРДУ применительно к методам проектирования с элементами.искусственного интеллект' йа основании проведенного синтеза страктур УРДУ разработанны обвие структурные схемы УРДУ. Предложении аналитические вира
- 5 - ■.-■•' зния и алгоритмы, отраяающие процесс преобразования й обрэ-¡тки информации в УРДУ. .'•-..-
Практическая ценность работы. Разработанное УРДУ мо«ет-быть .пользовано самостоятельно.как функционально законченное уст- >
1йство. либо в составе вычислительного комплекса в качестве левого интерфейса, Нояет работать в системах речевого опове-ниа. бортоЕНх компьютерах, выполнять функции классификации алоговнх сигналов, обладающих свойствами периодичности, в честве системы диагностики.
Реализация результатов' работы. Результаты диссертацион- ' й работы были практически применены в научно-исследозательс-х работах и учебном процессе кафрдрн "Робетотехнические и формационные системы" ТашГТУ. •
На основании предложенных методик построения устройств чевого диалогового управления и способов преобразования ¡!ече-й информации, разработан действующий образец УРДУ, на котором введены экспериментальные исследования достоверности распоз-зания ограниченного словаря речевых коианд и синтеза рече-< сообщений. . •
Результаты диссертационной работы были приняты к внедрению заводе при НИИПП (г.Томск), получен акт'внедрения СЙФВНИИ , 1МГАЗ (г.'Тавквнт) по микропроцессорному управлению исполни-гьными механизмами. ' . -
Апробация работы. Основные .положения диссертационной рабо-докладывались и обсундались на: Всесоизной научно-техничес-. конференции "Проблемы соверввнствования устройств и лето-приема, передачи и обработки информации", г.Москва, 1988 г, вузовской научно-технической конференции'молодях у<*виах и подавателей "Эффективность использования ресурсов яря со-венствовании управления производство», технологическими . цессами и оборудованием", г. Тавкеят, 19В8'г.*, Четвертой союзной научно-технической конференции "Матеиатическсе, оритмическбв и техническое обеспечение АСУ ТП", г. Носква, 3 г.: Республиканской научно-технической конференции "Пробке вопросы развития и повышения эффективности внедрения эматических производственных комплексов с разной" степень» «логической гибкости", г. Тавкент, 1Э8Э г.; Еяегодннх гно-техйических конференциях профессорско-преподаватело-
'! • 6 * ската состава ШИН (ТПУ), г.Таякёнт, 1987-1993 г.; Научных сфюйарак кафедры "РИС" центра Эй и ВТ Ташкентского Государ-ствнного Технического* Университета, г.Ташкент, 1990-1993 г. ( Д^бдикацик. По результатах диссертационной работы опубли-^обйно 10 работ, в той числе получено 4 авторских свидетель^ М, а такхе I положительное решение на выдачу патента. I Структура и объем работу. Диссертационная работа состоит /из введения, пяти глав и заключения, излохенных на /В/ стр< /ницах машинописного текста с иллюстрациях» и таблицах» на-у ''страницах, списка литератур* из 102 наименований и пр.илоаеш ' на 3? страницах,
КРАТКОЕ СОДЕРШИЕ РЙБОТЙ
обоснованна актуальность темы, сформулирован нв цели исследования, показана целесообразность постановки, задачи построения устройств речевого'диалогового управления на основе концепций проблемы создания интеллектуальных робо-тотехнических систем. Выделены полохения, выносимые на защит приведено краткое содержание работы.
В первой главе проведен обзор сцществувцих систем рарпрз навания речи, построен классификационный.граф систем распозн ' вания речи с учетом уровней распознавания от слитной речи до отдельных звуков, осуцествле>2 выбор метода-распознавания ограниченного словаря речевых команд, исследован выходной сигн преобразователя'акустической информации, проведен анализ гла пых звуков и определены их коды фори.определеныинформативн признаки речевого сигнала: количество слогов в слов'е, родиче тво и длительность пауз, длительность, периодов гласных, поел '1овательность гласных в слове. Определены основные функции ЗРДУ. ' ; :
Сравнительный анализ показал, что суцествуские системы , распознавания речевых сигналов, от систем распознавания отдельных звуков до систем распознавания слитной речи, основан 'не дроблении речевого сигнала на более мелкие звуковые едини цц т.е. слитную речь на отдельные слова, отдельные слова на отдельные слоги, или фонемы, слоги на звуки, вычисляя затем качественные и количественные признаки, зависание от выбран-
- 7 - : , / ...•
го метода классификации с Последущей обработкой боЛьмих, ссивов информации. Это обстоятельство требует использований стродействуюцих вычислительных систем, и быстрых алгоритме работки, • . . ...
Анализ методой, распознавания показал, что значительная ик сть основывается на ряде допущений, таких как! устойчивость гнала по длительности и спектральному составу,'отсутствие новых помех, что делает их малопригодными для практического пользования. С другой стороны, наиболее удачные системы спознавания речи содеряат больмие библиотеки эталонных ва- -а'нтов для каядой звуковой единицы,'что приводит к увелиЧе-в времени классификации. •
Для речевого управления промышленным роботом предложен ме-? ускоренного распознавания ограничнного словаря речевых кона основа выделения последовательностей гласных в сло'^в шчис'ления качественных и количественных.признаков речевого ■нала. , ;. . .; •
Исследования гласных звуков выявили следующие закономерен:- _ • •
- сигналы гласных звуков обладают периодичностью, причеи ' дельность.периодов находится в зависимости от частоты ос-ного тона диктора,'- ...
- сигнал, формирующий гласный'звук, имеет три участка;, астание. стабильный , убывание; • •. .
- период гласного звука на стабильном участке довольно '■ ойчив по длительности, но подвергается значительным изме-иям формы внутри периода;
- на переходных участках присутствуют сразу два звука -дыдувий и последующий; ''..'"
- голосу каядого диктора соответствуй характерные измене-формн периода, которые и придают соответствую^«! тембровуй зеку речи; ■ . > '
Для ускорения процесса.классификации, поисктлаейих в сло-)существляется на стабильных участках звучания гласных зву-, определяемых по наибольшей интенсивности звучания, на те использования кодов фора для каядого периода'звука. Вычисление 'кода формы позволяет как бы налояить эталонный год гласного звука на исследуемый сигнал и сдвигать его в
■ I . .. - а- - •
дол^ сигнала осуществляя выбор не поэлементно, а окном.
;'Для оценки верности выбранного звука .производится фиксации места совпадения кода формы в слоге, а затем, в случае нескольких совпадений более приоритетным будет совпадение на стабильном участке звучания гласного звука.
! Окончательное реиение при распознавании речевой команды принимается после анализа определяемых информативных признано! речевого сигнала: длина слова, количество слогов, количество слов в команде, количество пауз в слове, длительность пауз в 'слове.
Во второй главе предложена-теоретико-множественная модель 'формализованные модели элементов УРДУ, проведен синтез структ УРДУ, разработана обцая структурная схема УРДУ для-управления промышленным роботом. •
Анализ суцествувцих УРДУ показывает, что формально,конкретное УРДУ мояно представить как подмножество декартового Произведения следующих восьми множеств:
УРДУ < К х С х Р х X х И х К х У х Р х РР >.,. где К- множество компонентов входящих в состав данного РДУ; С-, множество детерминированных связей, необходимых для -.V образования С из К; '
Р- множество функций, определяющих допустимую комбинации комп • нентов и детерминированных связей между ними; Х- множество характеристик УРДУ; 1 И- множество методов распознавания речевой информации; . Н- множество методов синтеза речевой информации; ' ■ •
V- множество-уровней распознаванияС отдельные _слова,звуки,слит
• ная речь); •• . Р- множество правил компоновки сложных команд состоящих из не ,'■•*•-, кольких слов; ! , РР-множество правил формирования речевого <этвета; -т Множество компонентов К представляет собой-множество функционально, законченных блоков, выполняющих каждый одну ко» крвтно определенную функцию к иыешцих строго определенное кс | лмчегтво входов и выходов. Конкретными-примерами таких блоков г иогзт служить акустические микрофоны, усилители, АЦП. ЦАП, ре личные блоки цифрового преобразования и обработки,' Икожестзо детерминированных связей С представляет со бой
тожество связей меяду компонентами УРДУ, причем правила, по .ка-орым составляются данные связи, определяются функцией Г.строго адаюдей допустимые комбинации компонентов и связей между; ними,
Множество характеристик; X содерзит все характеристики, рисуцие УРДУ, начиная от входных и выходных величин и заканчи-ая стоимость» УРДУ.
Множество.методов распознавания речевой информации К пределйют- множество подходов при реализации конкретного УРДУ лияя на скорость распознавания', и, определяя слозность реализа-ии и достоверность результата.
' Уровень распознавания из множества V характеризует возиоз-орти распознавать непрерывную ре1!!-, отдельные слова или отельные звуки и непосредственно -определяет техническую'слож-эсть н аппаратные затраты устройства. • .
Правила компоновки сложных команд, состоящих из песко;'.!-и слов из множества Р позволяют увеличить вознояности рас-ззнаваемого словаря системы за счет специального подбора -ог-шичекного словаря команд и составления из него значительно >льиего иоличеста комбинаций лак например, "рука робота иап-1ВО", "рука робота налево", где'слова "рукл" и "робота" 1Вторяится.. • ■'■•'.
Множество методов синтеза' речевой информации Н для фор-[рования речевого ответа и обеспечения режима работы на ес-ственнпм языке определяют возможности и объем словарного . паса устройства. • 1
Правила формирования речевого ответа из мнокества РР оп-деляят порядок склеивания отдельных синтезируемых слов при рммровании подтверждения введенной'команды, при выполнении манды или формировании сообщения о причине, по которой ко-нда не была выполнена.
Основу компонентов К составляет множество блоков или молей блоков УРДУ. Модели блоков УРДУ долинн быть удобным)! я перевода на язык системы синтеза структур УРДУ . а такве ?авать главные особенности УРДУ, ¡(одели блоков, исполЬзуе-з в большинстве существующих систем синтеза, отрававт при-ию-следстаеиные связи блоков и, как правило, в оцновходнои зианте графовых моделей представляется в виде дуги с се на-1Ьной и конечной вершинами, либо в виде элементарного звона
• - 1С -
параметрической структурной cxeuu. Начальная и конечная перешив соотвегствуат входной л выходной физическим величинам, параметрам.' Дуга указывает на наличие причинно-слодствениой связи И8ВД9 входной и выходной величинами, Выходы моделей отоб-равают не только выходные величины, но и их имя и функцию, зависимости вход-выход, таким образом, составление модели, несут информацию о всех входных величинах элементов УРДУ.-Такие подели соответствуют частям графа (структурам) типа Гзеезда"входа", первшш-стоки которых соответствуй виходник величинам. Списковая модель вида < выходная величина: -.V
4 а/
входная величина ( î ) >• ииеет структуру "звезда входа"-. Для ви-•полнения блоков УРЛУ 'функции, соответствующей данной модели, ! необходиио оозбуядешш одного из его входов, при згой на других (побочных) входах долины бить задана необходимые ревиыы.
Такая модель блоков УРДУ удобна тем, что по испв синтеза структур РР одновременно накапливаются номера побочьчгх входов элемента, соответствующих несвязанный входным вервинам подслеп элементов УРДУ, образующих принцип действия УРДУ. Описанная модель1позволяет использовать для синтеза УРДУ методы дедуктивного вывода, -
Процесс синтеза с'труктури УРДУ, моишо представлять как поиск, решения Р интеллектуальной задачи ИЗ - < ТР, liîi, 3, Pï, •в которой.исходными данными слцкат входные величины УРДУ, требуемый результат ТР - выходный величины, знаний.3 - модели преобразования элементов УРДУ. Решение - этой'задачи приводит к построению последовательности ( цепочки ) блоноз УРДУ во вза-* несвязанной системе УРДУ-. Отнйионпе взаимосвязанность" отображается'в виде графа взаимосвязей блоков УРДУ и" указывает на однотипность выходных величии одних блоков с входными '•величинами других блоков УРДУ. Для данного метсГда большинство элементов УРДУ описываются списковой модельй вида; ; J$:~<tt Wa Y'-'Vdn которая интерпретируется как
" где п - количество' входов модели блока 9РДУ, V - знак дизъюнкции. Для работы с такими неделями цспол"ьзуется следующее правило вывода :
j&eM ' ■
- и -
Основное достоинство данного правила вывода гостйит том, что после включение мозели блока УРДЗ вида.(.&4/-*,Д ) УРДУ по выходу 4.} остальные входы модели блока УРДУ вклп-аются в блок как побочные входы (или "висячие дугй"), При-енение этого правила позволяет создавать простую управляли структуру, и для этого находится новая модель, до тех ор, пока не будет лплучено равенство - ТР. • В качестве управляющей структуры алгоритма принята стра-егия "сначала вглубь" с возвратами. Данный алгоритм позволят синтезировать структуру УРДУ с'учетом побочных входов. По-', очные входи могут бить использованы для образования одной из ледуюанх структур в зависимости от типов побочных величин: труктуры с прямим преобразованием (со стабилизацией побочных еличин), дифференциальной структуры, структуры с обратной вязью (ОС). •
В результате проведенного .синтеза получен ряд структур Р/1Н для управления промышленный роботом. По выполняемый ф^икг иям УРДУ мо^но разделить на две основные части: устройство аспознавания .ограниченного словаря команд робота и устройство интеза речевых сообщений для обеспечения диалогового регина, ри рассмотрении 'полученных структур УРДУ обнаружено, что,в аждой полученной структуре УРДУ неизменно присутствуют опре-еленные элементы УРДУ. На основании вышесказанного., а такяе сновннх функций УРДУ разработали общие структдрн«е схемы УРДУ, вдеряащие следующие йсновныв блоки для устройства распознана- • ■ля ограниченного словаря: акустический фдаж,. б'яей* аяаяог«-. 1фро_вого преобразования, блок микропроГ'раийнс'Гс упрайлетт, ^числительный блок, блок сравнения: устройства синтеза рече-
сообщений содержит-: блок хранения фраз'! блок хранбния слов, пок хранения звуков, блок приращения, блок цифро - аналогово-: преобразования.
■ТРеТ|Ь.я г-"ава посвящена разработке устройства распознавания ■раниченного словаря речевых команд как счставной части- УРДУ, В целом УРДУ выполняет следующие функции: •..'..
- ввод речевых команд поданных голосом, дистайционно;..
- распознавание поданных команд в пределах ограниченного «варя; ."■■.■
- синтез речевого ответа для уточнения поданных кома'нд и
обеспечение диалога на естественном языке;
. - формирование управляющих сигналов" для управления исполнительными механизмами.
На основании проведенного раное анализа выходного сиги
! ла "акустического преобразователя била получена функция выход
' !
ного. аналогового сигнала акустического капала: •
I [Ш- у'Лк )
где,<?% - магнитный поток, с! - зазор иевдд полвс'о* и якор колебательная частота дка$рагки, число ситков' обнотыи г. - внутреннее электрическое сопротивлении микрофона.
Для выделения ш?форизтив!шх параметров и использовании и тодов программно!: обработки, производится дискретизация иолу
^ */> су
и формирование исходного массива Д ['1']
Из полученного сигнала формируется массив максимумов; м * {тая I, /цах гндх Л ¿г
где -тау -максимумы речевого'сигнала. '
Для исключения влияния индивидуальных особенностей диктора устранения яожтх выбросов, иа'ссив иашшуиав' сгланиваигся.с Порогом - £ ¿Д-/. ЦШоу ' '
так' ^ » гнп# /•/ сс.-ш ¡¡.■><ии'» таи >
Таким образом, получаеи сглавеннкй пассив максимумов-а {тех, элементы которого является мгновенными знача ииями функции-М/^огиОавщей речевого сигнала
¡гчп
Для определения количества слогов н определяемом сло-,88 вводится уровень порога , который определяется как:
Мп- Уг»т * {и*™™ - итп,) /2
где - \Jmin минимальное значение огибающей слова, углох- макс сальное значение сгибающей слова , Число слогов в слове вычисляется как:
ч. где п - сумка точек пересечения о'гибаящей. речевого сигнала через уровень порога 1)г1 . а интервалы межд точками пересечения; являются участками'звучания гласных звц
(ов наибольшей 'интенсивно!:™, где осуществляэтса пбиск пери->доВ'гласних. ■
Для классификации периодов гласных на стабильной участке •лога требуется сопоставить все периоды участка, а их обычно • |Т 15 до 25, с эталонами хранящимися п памяти, поскольку нель-я заранее точно определить На какоа фрагменте стабильного частка Дорна эталонов соответствует реальному сигналу.
Для -рвионмя этой задачи йл предложен способ первичного реобразовання сигнала с наложенной на него окон эталонов. ля этого из полученного сглаженного пассива иаксиицмов
' ф1ф!1й|)о»тся каСсвэ М^¡М}'] , состоящий з ! т с л о д о о а т! ■! ь 1! о с г!! единиц и нулей, получении,-; о результа-е сравнения элементов массива по условию :
М Г ^ ***** Гпъ У,/
' 1 '" I та*!*? умен-} ' ■
Аналогично' Формируится массивы для каждого эталона, а • »тем подученные касс ива эталонов &' виде последоаатальности Шпиц н нулеЛ накладывают на пассив И' (М>}. сравнивая па-зллельно цифровые последовательности.. Если последователь-)сти неравны, то окно сдвигается на один разряд вдоль маета М-'/Да] ■
Очевидно4, что при т.акон подходе возникнут случайные сов-' ¡дёиия, поэтому, если массив окна, эталона совпадет с^какиа-1 фрагментом установившегося участка, то будет сравниваться едуащий за ним фрагмент на совпадение. Только если не менео ех следующих друг за другом фрагментов совпадают с эталонен инимаетса реиение о прекращении процесса классификации глас го звука.
Этот процесс повторяется для каждого слога параллельно шести основным гласным звукам и,, в результате, получаем змозшуа последовательность гласных звуков в слове. ,
В случае, если не все гласные звуки удалось классифициро-ть, то классификация продолжается на уровне слов с учетом гадьних распознанных гласных. Если более половины гласных з не не удалось классифицировать то система формирует рече-'1 запрос о необходимости повторить произнесенную команду. Таки» образоя. после проведенных преобразований мы получи-
ли следующие параметры речевой команды: -вероятная последовательность гласных звцков в слове; -длина слова, равная числу i элементов массива АШ; -количество слогов; -количество слов в команде; -количество пауз в слове; -длительность пауз в слове,"
. Таким образом, математическое описание процесса преобразования информации позволяет реализовать устройство распознавания ограниченного словаря речевых команд работающее в реальной маситабв времени как на программном так и на программно-аппаратном уровне. • В четвертой главе рассматриваются вопросы разработки устройств сиитеза речевых сообщении для опеспрчешя диалогового ревща работы' на естественном языке с предварительным кодированием звуковых единиц. - _
Предлагаемый способ иодирования позволяет не только значительно сократить объем требуемой памятк хранения; ко »'сделать его инвариантным к -частоте'квантования сигнала, получая тем самым возможность записывать и" хранить речеемв сигналы с максимально врзмонным качеством.
Вводимый-аналоговый сигнал fiCt'î после квантования hoдвец гается дополнительной сегментации на линейно-возрастающие и линейно-сбывающие отрезки. Кандый элементарный отрезок, сксш бы много точек на нем не было, ыовно описать всего тремя параметрами : его длинной--L равной количеству тактов дискр( тизации -п , углом наклона , который моано вычислгс. ка! приращение амплитуды сигнала на один такт и знака нак-
лона отрезка - , .
(Ai- [}<)
или для всего отрезка как : / , » ,
й U- (Oi- Va)/„
Для вычисления учитываются, значения амплитуд начала и конца отрезка, т.е.
i,Q >
Ué с Uо. /■
где является знаковим битом используемым при восстанов лении сигнала.
- 15 -
Таким образом, в закодированном виде звуковой 'сигнал ■ представлен в виде массива приращений, знаков приращений и количества вагов для каздого приращения. Для примера, запись одного периода •звука "Л." при частоте дискретизации -10 кГц занимает 200 байт памяти хранения, а для" хранения в кодированной форме понадобится лиаь 10 байт.
Восстановление сигнала осуществляется путем прибавления ирирацйпип д. [) ' к те куц и и у значении сигнала п раз, если знак наклона отрезка полохитвлеи % = 1, или вычитания, если знак наклона отрицательный X - 0.
Для согласования периодов звуков мааду собой 'начальная и конечная амплитуда каждого периода звука щшшшаитса равными
нули.
ТакоЛ способ кодирования и 'восстановления периодов звука позволяет записывать и воспроизводить звуки с максимальной частотой дискретизации длй получения высокого качества звука us требуй увеличении памяти. Тогда как при традиционном способе записи речевнх_сигналов объем'требуемой памяти, для их «ранения прямопропррционалеи частоте дискретизации сигнала.
Исследование речевых сигналов показало, что более 10У. цлшш произнесенного слова занииаят участки иеизвуковых пе-laxoftoß, поэтому непосредственное склеивание периодов чистяк звуков сгенерирует неразоорчивув речь, за счет резких скачков' is иене ни я амплитуды и,длительности периодов,
Задача слияния двух соседних звуков реиается при помощи формулы•позвояяюцей плавно трансформировать период одного тука в другой с-учетом его амплитуда и длительности:
/е. (№i> - fiJiz Uix}-Xh . is j. ,, \ it Ä *----------------------ffi-fi;......................-" +\lJii+s>Uu)-&u
■де H - коэффициент, определявший скорость преобразований 1дного периода в другой.
Litt- элементы предыдущего звука (его период) (Jit - элементы последующего звука (его период).
Кроме этого, из формулы следует что изменяя коэффициент мовно искусственно модулировать речевой сигнал и менять .литоЛьность меззвукових переходов,
Универсальность этой формулы позволяет реализовать устрой-
сгво синтезируицее речевые сообщения апщ^ратно, без использования управляющего компьютера.
В пятой главе описани проведенные экспериментальные иссле дования УРДУ для промышленного робота.
Исследование динамического диапазона первичных преобразователей акустического канала УРДУ подтвердило возможность отфильтровывать-шумы окружающей'среды не превышающие уровень * 90-92Д6'автоматически, с использованием сдвоенных однонаправленных микрофонов расположенных под углом 180 между их акустическими осями.
Исследование' зоны чувствительности УРДУ огределило зону возможного располозепия оператора относительнс микрофонов УРД! не увеличивающее погрешность распознаваемости речевых команд.
С цельш оценки источников погрешности распознавания, определены зависимости'процента распознавания от .«а'стотн дискретизации речевого сигнала, количества слов библиотеки речевых команд и временен классификации.
'Анализ результатов эксперимента по распознаванию речевых команд от разных дикторов подтвердил необходимость предварительного обучения УРДУ в случае расхождения частоты основного тона эталонных периодов гласных и частоты основного тона дик-, тора более чем на 30 '/., . ; "'" '
В.результате экспериментальных исследований подтверждена . достоверность предложенного способа распознавания ограниченного словаря речевых команд для управления промыаленннм роботом, где средний процент распознаваемости- для команд состоящих из одного слова составляет 91,5 а оптимальная частота д^креп защш речевого сигнала равна 15 кГц,
Проведенные исследования по оценке быстродействия УРДУ, т.е. времени классификации речевой команды, подтвердили возможность использования УРДУ для управления промышленным роботом в реальном маситабе 'времени, при этом среднее время рас- ■ познавания команды состоящий из одного слова составляет О.бйбс Проведена оценка надежности системы на соответствии задан--'ным техническим условиям эксплуатации. ■•''..
В приложении приведены тексты машинных программ, реализующих алгоритмы синтеза структур УРДУ, классификации ограниченного словаря команд. синтезирования речевых сообщений, принци-
- 17 -
анальные схемы некоторых блоков УРДУ; акт об использовании результатов диссертационной работа, акт внедрения,
ЗАКЛЮЧЕНИЕ
1. При решении задачи управления промышленным роботом, 1мею«его'ограниченное количеств" степеней подвижности, наибо-iee эффективным является исполь-^вание быстродествующих,. специализированных, функционально законченных устройств распознания ограниченного словаря речевых команд с возможностью ра-)оты в. диалоговом режиме на естественном языке, по сравнению
: используемыми в настоящее время функционально-избыточными юрогостоящими, высокопроизводительными вычислительными компасами,
2. Обоснованна целесообразность использования методов ус-горенной классификации для ограниченного словаря с вычислением ;ачественных й колличественних признаков речевых сигналов.
3. Подтверждена достоверность предложенного метода уско-1внного распознавания ограниченного словаря речевых команд, ¡снованного на выделении последовательностей .гласных в слове,
i такяе вычислении качественных и количественных признаков ре-1евого сигнала. •
4. На основании исследования свойств периодичности звуков ;' маязвуковнх переходов был рредлоаен способ кодирования рече-ых сигналов для хранения их с высокой плотностью и, аналити-еские выражения для искусственного формирования мекзвуковых ереходов для устройства синтеза речевых сообщений, а также редложен способ синтеза речевых фраз для диалогового режима, спользувщий библиотеку;предварительно закодированных звуковых диниц.
5. На основании теоретико-ммнржественного описания УРДУ или предложены принципы построения УРДУ для управления робо-ом, а такяе, разработаны структурные схемы УРДУ, имеющие инимальное число первичных преобразователей, соответственно аналов УРДУ, для решения задачи речевого диалогового улрав-ениа промышленным роботом и предусматривавшие выделение всех еобхйдимых информативных признаков из соответствующего рече-ого сигнала, параллельную обрабоку, а такяе. разработано
- 18 - •. , ■ '. программное обеспечение для микропроцессорного варианта УРДУ 6. Экспериментальные исследования работоспособности УРД подтвердили достоверность распознавая ограниченного словар речевых команд и формирования речевые сообщений 6 реальном насштабе времени, а также определили ^ону чувствительности УРДУ и источники основных погрешностей распознавания.
Основные положения диссертации опщушкованы в следующих работах:
1. Кушнаренко А.Л. Система речевого управления промышленным роботом "Электроника НЦТМ" - Сб. цаучн.трудов. ТашПИ. Ташкент. 1991. - 44 с. ' . '
2. Иушнаренко А,Л. Об одном подходе к решению задачи классификации сигналов. - Сб. научн.трудор. ТашГШ - Ташкент, 1988. 31 с.
3. Киселев О.Д., Иушнаренко А.Л., Бекмухамедов Б.Н. Очувствление промышленного робота "Электроника НЦ-ТН" - Тез.. докладов НТК ч.2, Изевск, 1988. с. 33.
. " 4; Кушнаренко А.Л. Система речевого управления:промышленный роботом "Электроника НЦТМ". - в кн.: Интеллектуальные модели систем. Сб. научн. трудов."Ташкент. 1991.,с. 44. ,
5. Кушнаренко 'А.Л., Бекмухамедов Б.Н. Устрцйство cïjh- • теза программ для промышленного робота "Электроника НЦТМ"' с техническим зрением. - В кн.: Проблемные вопросы развития и повышения эффективности внедрения автоматических производственных комплексов с разной степенью технологической гибкости. Тез. докладов Республиканской НТК, ч.2, Ташкент. 1989. с. 39.
. б, Реш, о выд. пат. N5045189/10(026588 ) Устройств для восстановления речевого сигнала. Кушнаренко fl.Л.,Дегтярев C.B. - 06.92г,
'?. 'А.С. !N 1748152 С СССР J Вычислительное устройство. Куш наренко А.Л.. Дегтярев C.B. Б.И. ff 26 1992 г;
'8. А.С, N 1681749 (СССР) Устройство для автоматического вождения ХУМ. Хасанов П.Ф., Киселев О.Д., Дегтярев С.В.. Кушнаренко А.Л.; Б.И. N 37 1991 г, ' . ;
9. А.С. N 1672440 (СССР) Устройство для деления. Кушнаренко А.Л., Дегтярев C.B., Бекмухамедов Б.Н. Б.И. H 31 1991
10. А.С. H 1767498 (СССР) Устройство для деления.' Кушнаренко А.Л.Дегтярев C.B., Б.И. H 37 L992
\
• 13 -
Куинаренко Александр Леонидовичнинг ' "Саноат роботйнм бовкаришда диалог тарзидаги иутЛинг курилмаси" номли диссертация и«!'а берилган. Хисоблав техникаси ва б'шкарув тизимининг элемент ва кур1>л*аси, 05,13.05. -мутахассислиги буйича, • V ■ ' Т;1КРЬ
На нуткий буйрук диало1*ини бовкарувчи операторга нуткий ахборотни' вакллантириб беру^чи маълум бир лугатнй анг.ловчи санбат робот.ининг ивлаб чикйвига багивланган.
Нуткий сигналларни тасйиф килиш тадкик этилган ва нуткий буйрук, иунингдек ахборот бйлгйларини хисоблавда унлиларнинг тартибцни аниклаига асосланган чегараланган лугатни .тасниф этиш методи таклиф килинган. .
Сигналларни киритии частотасига богдик булмаган нуткий сигналларни хославтириш усуллари ва нуткий ахборотни синтез киливда олдиндан хосл^итириб куйилган торув бирликларининг кутибхонасидан фойдаланив усуллари таклиф килингаН",
Эл&ментлар курилмасининг анзодасининг тузичыа схеиалари ва дастурий; тагыинлаш назарий-куплик тавсифлав асосида ивлаб чикилган. ,
' ' Тавсия этилган мазкур англав; методи ва синтезининг тугри-пигини тасдикловчи эксперимент тадкикотларининг натияалари. • «елтирилган.
RESUME
of. the thesis of Kushnarenko fllexsander ■ Leonidovich -" Control speech dialogue system for industrial robot". The . specialized 05,13,05, - Elements and devices of coiputer technology and control systems,
This work is dedicated to the problem of creating of robot's control speech dialogue system which can recognize If sited vocabulary of'human commands and forming speech announce to the operator.
Hell-knoun methods of recognizing human.speech uere analysed and new method have been offered. It is based on determination vowels' suquences and information parameters of speech signal. It allows to create system without using personal computer and work in real-time.
For support the dialogue between robot and operator the new method of encfide, which is not demand on frequency of putting signal, and the method forcing speech announces are offered. They use the vocabulary of speech.^ignal/s ' parts which were transfora before.
On base of theoretical - plural description and models of elements of a device the ne.w structures'are elaborated.
. The results of experimental reseach confirming the new methods are. performed." ' i
-
Похожие работы
- Модели и алгоритмы управления группой мобильных роботов
- Устройства информационно-управляющей системы медицинского робота тепловизионной диагностики
- Алгоритмическое и программное обеспечение для моделирования и управления сборочными роботами
- Взаимовлияние приводов промышленного робота, работающего в цилиндрических координатах
- Разработка и исследование алгоритмов адаптивного управления взаимосвязанным движением упругих манипуляционных роботов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность