автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Базовые единицы слитной речи и их использование в решении задачи свободного естественно-языкового человеко-машинного общения
Автореферат диссертации по теме "Базовые единицы слитной речи и их использование в решении задачи свободного естественно-языкового человеко-машинного общения"
ГБ ОД
I г / ' ' РОССИЙСКАЯ АКАДЕМИЯ НАУК
ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ
На правах рукописи
ТОПРОВЕР Григорий Леонидогич
ВАЗОВЫЕ ЕДИНИЦЫ СЛИТНОЙ РЕЧИ И ИХ ИСПОЛЬЗОВАНИЕ В РЕШЕНИИ ЗАДАЧИ СВОБОДНОГО ЕСТЕСТВЕННО-ЯЗЫКОВОГО ЧЕЛОВЕКО-МАШИННОГО ОБЩЕНИЯ
Саеязнмшюсгь 05.1S.01 — Управление в теюшческах системах
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических паук
МОСКВА — 1995
Работа выполнена а Инггги-гуте проблем передачи информации Российской академии наух.
Научный руководитель: - гоктор технических наук,
проф. В.С.«айн
Официальные оппоненты: доктор технических наух И.П.Левпин;
кандидат технических наук Б.Л.Мазо
Ведуцая организация» Вычислительный центр Российской
С диссертацией можно ознакомиться а библиотеке ШШИ РАН.
академии наук
-часов на
заседании Специализированного совета Д 003.29.01 при Институте проблем передачи информации РАН по адресу:
101447 Москва, ГСП-4, ул. Ермоловой. 19.
.1995 г
Учен и* секретарь Специализированного совета
доктор технических наук
С.Н.Степанов
ОНфШ ХЛРАГТНРКСТЙКЛ РАБОТН
Актуальность темы.
Последние два десятилетия стремительного прогресса в области микроэлектроники и вычислительной тездаихи в корме из15еки7Л1 роль компьотерной техники в жизни лсдей и общества. Появление компактных, дешевых, и вместе с тем чрезвычайно производительных кокпьегеров, а такие периферийных устройств самого разного назначения привело к проникновение хомпыэ-герных систем (КС) В медицину, экономику, управление, юриспруденцию, культуру, творчество и даяе в повседневный быт. Виест ; с тем, на пути дальнейшего количес . ленного и качественного расширения круга пользователей КС стоит проблема управления компьютером на естественной языке (ЕЯ), ргзультато: чего стали многочисленные исследования в нашей стрсне и за рубеком, нзлр-зпеннкэ на соэданио ЕЯ гагтерфейса эви.
Особое место в ряду таких исследований занимает Ориентированная лингвистика - новое перспективное исправление в изучении и развитии Бэаииод^йстпкя "'¡елозех-хогК£ст*зэ". Создание» ка 6с рр:«яггированясй лингпиетики КС профессионального назначения со свободный диалогогьм общением 1М1 ЕЯ показали ->р<2ивычзйно высокие функциональны:? м эксплуатационные характеристики, но, к согаленип, не иаззли оззздеэмого успеха у пользователей. Причиной этих трудностей является очевидная несовместимость клавиатуры гак средства Евода обретений пользователя с абаоптгюй "естественность©" пажлеасивос систежкй обращений.
Выход из этого пояожаняя может быть кайдеп только -чераз оснащение ориетттирокагпго-лииг^стичесгах гостем понимания ЕЗ эффахтагкци средством речевого ввода информации (речевым интерфейсом), что призело бы к появлении надегакк, простых я, оСрег™-пга и не требует?«: специальной подготовки КС.
• определение роли и места речевого интерфейса в ориентдрозагяю-яингЕистачесоэ» системах па-опак:« ■
• анализ возиокностей использования узе суцэстаузвдих средств и способов распознавания/понимания речи а качестве ориентированно-лингвистического. речевого интерфейса;
• выбор и развитие методики поникания слитной речи, адехватной принципу действия сриентированно-лин«-*вистичесхих систем;
• исследование путей практической реализации указанной методики.
Научная новизна.
1. Развита адекватная методика понимания слитной речи в рамках ориентированно-лингвистической концепции понимания ЕЯ.
2. Предложен и исследован формализм базовых едагмд речи, позволявдий объединить принципиально различные подходы к распознаванио/поштанию слитной речи с целыз получения их взаимного дополнения.
3. Приведены теоретические основания принципов разработки ориентмрованно-лингЕИСтичесхого речевого интерфейса и описаны способы его практической реализации.
ПрякткчеСКЗЯ ненноя №,
Разработана высоконадежная методика обнаружения слов в потоке слитной речи, .основанная на. неконфликтном целенаправленной объединении пргйлдшиально различных способов и технологий распознавания/понимания ■ рачи, как уга существующих и оправдавших себя на практике, так и создаваемых заново.
Методика ориентирована на сопиастгное прииенение с существующими и . ■ перспективными ориентирозанно-
лингвистическими гистенами. поникания ЕЯ,- преяиазкач£йгнь2.г1 для управления компьютерными системами посредством диалога на естественном языке, и рассчитана на . работу с персональными компьптерами, осначениыии звуков»»»! хартвии тала 5оиг^В1авЬег или их аналогами.
Комплексная ориентированно-лингвистическая технология взаимодействия "человек-компьютер", речевой компонент
которой оснозен на продлогеккой методике, вызвала сирокий интерес разработчиков! и производителей акустико-Еычиелительных устройств и напла применение в ряде проектов,, что подтверждается соотготстзувли: ;и документами. Аптот? эатгиЕиет г
• хснцелцлп ориентзфоаянно-лингзистачесгсого речевого интерфейса;
• формализм ргчеви;: отнсадимй и базовых единиц речи;
• методику ргхске» осдачи сбяеругения слои в потоке слитной рэчм с по!Я5,з базовых единиц;
« способы практической реализации указанной методики. Дшх?5д1юя и публикация работы.
Результаты, отрезензшз п диссертации, догладывались и обсугдааяиеь на Конференции молодых ученых ШЛИ РАН (Москва, 1994 г -1, Всероссийской сгжаерэ сэкции * 1?адиопере дд пзде устройства." об^встга. ии. А.С.Псттсгза (Москва, 1995 г.), а
тахяэ -ка ст&иарах з гц ран, га*яу, кали рдн и друга*
Пз тс"'.з дгезеертедяи спубл5{ко~л"о 3 н&учкгс: работы.
£кзсертгзд4я ссстсгтг из агядакия, 4 глаз, загслочения и тгрилегекгл. .
еодв&гаЕПз влпег::
Во ДЕЗйвКЕЗ «беснойанй актуальность теки, с&гтазу.'хжсзакы ц охи «сспадокакж!, проведена акнотадая рзаруяьтатоз раСотгг.
■ 3 пзхжэяатся задачи ::сслэдогга:кя
. и аэзкаяныа гт/тп ее региапгя.
" В раздэЕе 1.1 даугся обзер прхзэджоз псстроекзгя сксте-1 пггг.агггттл ' ЕЯ «а с^гава кгизгз.'зязфдагпэго 'утшгггериогт»* ао/рюдя п чояоазкв-чегдгагнеку 31Л-с5~с?~:э, которые получил?« !гл.?2'х*'л; •• вра.геггв^рэзв1гко»л!даг2;1ЭТ1этесз!ИУ. В отязгея» от - зрздациенгзого {пс;:яо!зг!ггз{ст£па-г::о1^>) по.гп*о".1, состоящего а
моделировании человеческих (психологических) механизмов понимания ЕЯ текстов и направленного на постияение этих механизмов, утилитарный подход направлен на создание технических средств для ЕЯ взаимодействия с компьютерной системой конкретного практического назначения. В ориентированной лингвистике показано, что адекватным принци; .)М построения таких средств является имитационный принцип, согласно которому задача понимания ЕЯ обращений пользователя к К оказывается зг.-ачей распознавания образов, причем в роли признаков распознавания служит информация о наличии/отсутствии и порядке следования в текущем обращении определенных, заранее известных слов ЕЯ. Эти слова формирует^ текущий активный подсловлрь системы, который составляет малус часть всего, в общем случае неограниченно больного словаря; например, в одной из практических систем средний объем техуиих подсловарей равнялся 7,05 слов (минимум 5, .лаксииум 19) при объеме общего словаря около 30000 слов. Таким образом, задача понимания ЕЯ-обращений пользователя имеет в ориентированной лингвистике следующую качественную формулировку!
Пусть задано нескольхо слов ЕЯ и в каждом из своих обретении к КС пользователь аяхет использовать эти слова в любой комбинации. в тон числе не использовать их вообще. Шчяслительныни средстза&я! с заданной тсчносты? установить, какие из этих слов и. ¡з хахоы порядке были использованы в очередном обращении. Понятие обращения к КС определяется в ориентированной лингвистике. В нашем случае можно считать обращение коротким (1-3 предложения) ЕЯ текстом, ииеюцин целью инициировать некоторые действия со стороны КС.
В последние годы было построено несколько демонстрационных и ирохтических систем с текстовыми обращениями (т.е. с набором текста обращения на клавиатуре), в которых полная лексическая и синтаксическая свобода обращений сочеталась с чрезвычайно высокими
эксплуатационные характеристика:^. Еместе с тем, эти системы не обрели ояидаеной популярности у пользователей, что, видимо, объясняется неестественностъп клавиатуры ках средства пвода обретений, вступавщей в противоречие с языковой еитестиеккостыэ понимаемых системой обрацекий. В связи с этим появилась необходимость дополнить эти л перспективные систены речевым интср^тасом - агтапатно-прогрвкмныи комплексом, о&еспечкЕсшгим репение Задачи 1 з случае обращения пользователя к КС через акустический канал. Очевидно, что требование естественности обращений заставляет говорить о случае обработки слитной речи Без предварительной настройки .1а диктора, а также о высокой на^-'жности и быстродействии такого устройства. Перечислений» свойства и представляют собой набор требозяккй, предъявляемых к речэгст-гу ¡4лтер>.|ейсу сриентировазшо-лкнгвистических систем пешемания ЕЯ (далее - ориент>гроэакко-л!?нгпистическо;5у ре"евс!г/ интерфейсу) .
Раздел 1.2 содерглт анализ возяогтностей рспекия Задачи 1 с поггэзема уже создаягах средств распознавания слитной речи. СЗзсо основных методов, пр:с ведуцями
отечестзеякыии и зарубеккгии исс ле дозате летси, а также краткий анализ полученных гая результатов показьзает, '¡то неукхс-нное и стремительное улучшение параметров используемого акустического и вычислительного оборудования ко приводит, однако, г: адекватно^' поаызеште характеристик качества систем распознавания и лсаойязм слитной речи, причем со срекекем эта тенденция становится все более заметкой. Кие: то, надежность -менх систем постоянно приближается к некоторой асазяттотз, отрамаяп;ей наденность распознавания около Э74, что несоответствует требованию высокой . падехиост, лредг^зляелгоуу к ориентированно-лингвистическсму рйчэвону интерфейсу. На сснозагпш этого набявдвняя дзлзетея сызод о назоспгогэ-гссти резегвгя Задачи 1 I ростга! зг^«г.;ст1юг.а!кг.—! технологии распознавай«« речи, откуда следует необходимость создания для этей «ели новой технологии иге: :гздер:шг •-.15"! каксЯ-лкбо из у-а сувествусесия:.
- б -
В разделе 1.3 рс.сс2-к>трси источник поыагекия надежности распознавания речи в раагках ориентировавшей ям: гаястихи. Распоз>»;хваш1е речи и традиционных системах производится на основе и в терминах некоторого универсального набора признаков, процедур или фснетичесхих единиц, выбор которых и определяет, в конечном итоге, эффективность системы; при больпи- словарях ' такой . подход оказывается единственно возмогшьм. В противоположность, этому, незначительный объем каждого текуцего подсловаря ориентирозанио-лютТЕМстачесхих систем позволяет использовать для каядого слова уникальное,. наиболее адекватное ему описание, составленное, например, объединением компонентов, заимствованных из допояняядах друг друга, но принципиально различных укиверсалышх систем. Отсутствие ограничений на состав описания позволяет ожидать увеличения полноты и адекватности такого описания для пгхадой единицы, подлежащей распознаваний.
С учетом упомянутой уникальности описаний каздссй лз распознаваемых единиц, репение Задачи 1 предлагается начать с частной заданы сбпйру:;е:-1>1Я одного заданного слова в потоке сли-я;с.4 речи, ко-'горая имеет токае самостоятельное
пусть задано некоторое слово ЕЯ (сбсзкач:^ его у/} и в каждой из своих акустических обрсцашх к КС водьзаватея£ но.нет использонатъ иди по использовать_ это слово. Вичистргелыяшн средсгя&тх с веданной ъ'очиосты} установить, присутствует ян заданное слово у/ в очередного обращении. % ....
Реяенип этой задачи посаяцена Хг.аъа. 2. для получения формальной постановки и последующего. поиска формального реьения Задачи 2 в разделе 2.1 вводятся необходимые понятия, термины и обозначения.
"ели для регистрации ахустггчееязяс сигналоэ в КС принят
иакотсрый ясненяЛ влфаигг из <77 стволов (букв) Д = {а,.....,
то хягдал Конечная цепочка символов алфавита Г = ^ Д1 ilj ¿ П7.1 й / á называется ЕШШШбЗг а множество
й, Г sí? всех возможных реплик - языком реплик. Для реплих определяется закметпеагаияаг из теорзи формальных градп'-атип понятия длккы реплики Г (обозначение ¡r|) и отналениэ равенства реплих < г, = ,-«), a токзе операции катенацин ( I ) = r=r,fr2 = sjs...ffítsjl|...^( я аффиксации (£)
Г=г Л1..."', Г^ = , звкжго!?ге язык perrnrat. Для
больней когшактяоета изложения специальные сбозначетгия присваивается-иножесгтЕу n¡ всех реппик дгоаях < (reR¡ ojrj = í) и } ïîcscctb; R¿¡c.R реплик ограниченной длины I, вхпзчав1;ему »ее ъелгглкм длины яэ более ! {г « о ;"[ 5 ? ) .
Я-j четное от;1с>::еж;& G м^д дзкком реппнх Д определяется Kos вэдазтэзветво кекаггл'са хдеемзвэдакж: fi'*, т.е. б с Я". T.dixí cGC'?"» to S Е5ГЛЯК'ГГСЯ для реплих
Г-,,...Хл (обозначаЖгв Ctr¡,...,r,)=1 ); з противном слу-^a-s - не сяпгояняетвя {о5о?тачсике Gfrt,„.,r,)=3! .
• Sern: дял Я-ч.-гс-гвого othckohjuj G «ад языхстз реплик R вестей нсхотор.мЗ зкчвож.'уъЯ is' специально оговореризгм»»*
•гдеоь ~а сиязгэ}. алгеритл 'в тйггой, • что G(¡~u—rn}~a(r\.....гп)
szpii яг>бо;з то С кватза&тся ©тяегтением, якчиежвям
апгордакя« в (ш ■просто synscraaaai оиговвкиви} и для него &@юзгка&гсз - гагкзь
cncSses. указкзагяегг «ггукзкты аятогктма, ia яаяяявиеся дежггзкия. (Лксгеккя, длэ хотормх гздгзкдай nnropr-res ке csyssxrrsy-i?. .. ияи," ■- зжгаезкь,'. ' жазшеатся ::э$еркаяь»«»8« «кесгенги&зм». *• -1
'•..•'• • В va&çpàsas&h чести'раздела »ад языком реплик вооднтся. i* сколько oarsass (т.а. ¿«уыадсртнкО • оиюаенай, а «гем таеяе ¿TîtcSiK-Biff ■ Г.гаяг^гзи^э и оететеик» irioser-psnnroro
иначе называемое отношением сканирования по конечному подмножеству реплик. Определение 2-2
Отношение включения - двуместное отношение 81 СЙ2 такое, что
(г,,гг) = 1, если Зх,у. У=г7, \
б'1 ^,гг) = 0, если Улг.у: Определение 2■3
Пусть задано конечное подмножество реплик ОсЯ. Отношение сканирования по этоиу множеству - одноместное отношение 5® с Я такое, что
= если зава-, г*(/",£*) = 1, б®(г) = 0, если- Ус? е О: = 0.
Для всех стандартных отноиензхй доказана их вычислимость.
Далее над языком реплик Й выделяется особый класс отнсиений, определяемых следующим образомI Огтре депеки ? 2.4
Одноместное отношение называется речевин, если
С{г)= 1 => С(г,И/-2)=' V г./),г2 еЯ. -
Свойства отношений этого класса исследуются в разделе 2.2, где доказаны теоремы о представимости речевых отношений через более простые объекты - множества и стандартные отаовеюш, введенные в предыдущем разделе. Тео-реиа 2.1
Отношение сханировсоия б® с Я по тэбсщу кояочксяеу гшожеству реплик О является речевым отнокениеы. -ТУтоеия 2.,?,
Если в с" * речевое отношение, то существует конечное
множество реплик в* С в такое что 6=5® .
С,
Если хонечные множества ровни то задаваемые ини
речевые отношения равны, т. е. С,(г) = ^(Г),Уг е Я.
Эти теоремы показывает, что с поясды> отнопения сканирования речевое отношение всегда задается •некоторым конечным множеством реплик О и наоборот, любое конечное множество рептшк О задает, причем однозначно, некоторое речевое отноаение. Поскольку отношение сканирования стандартно, вся "индивидуальность" речевого отношения определяется инояеетвои О, которое естественно назвать ядерный множеством речевого отношения 8®,
Сказанное позволяет ввести в рассмотрение так называемое ¿.-ограниченное мнонество речевых отношений Л1 -множество речевых отнесений, задаваемых всеми элементами множества всех подмкояестэ множества реплик огрсниче.хной длины /., причем в силу конечности последнего множества механизм построения множества Л* коягет быть алгоритмизирован. Теоремой 2.4 доказано, что для любого речевого отноаекия йСгТ существует число (верхняя
граница отноиааия) такое, что ¿»еЛ1 при VI. Это, в своэ очередь, означает, что любое речевое отнеяеиие с известной вергдапй границей содгртз'ггсл а кекечнон гггогестве Л1, гтаханизм построения котг.рого из лестен, т.е. при наличии фег-пгаятьного критер:«, отличапдего интг-рзсуЕ^ее нас отношение от Есех других, это откозение гожно найти простым алгоритагкчееккм переборен ко гмо^оству .
Долс-е в раздела иссяедуптсл некоторь-е свойства ядерных кнокестз речесих отнс..гкий, г частности, теоретико-гэюгестденныз операции над ндаш.
УТГдТСТГ^пге ?. .1
¿Гслтг - сгяокэюст, зедта-ть-с- О^.СЗ^
сооззсг^от^ешго, то от"'ОЕгенн<2 з&дзнггое
//.'хозгестя ом = С* г> Г* , .яижгвгеаг .рвчевки, пртг/е">
С/гноше!Э1е в=С, называется произведением речевых
отнесений ¿?,ТС?2.
Утверждение 2.2
Если <3,,<32 - речевые отношения, заданные ынохестваюх соо1 ¿етства!гю, то отношение О-С^+О^, заданное ыхохествоы С? -С^ и , является речевым, причем
Отнопе] ле б= <3, + 63 называется суммой речевых отношений
Кроме того, для каждого речевого отношения определяется особый класс связанных с ним речевых отмопений, названных базовыми единицами: Определение 2.5
Вычислимое речевое отношение 3 называется базовой елкниней /БЕ) речевого отношения О, если (¡¿¿В. В разделе 2.3 рассматривается взаимосвязь между речевым ^тноаением и его базовыми единицами. Утверяпение 2.3
Если речелыо отношения В, и Вг являются БЕ речевого отношения в, та их произведение Б= В,« 63 и суша В= Вх+В^ также являются ЕЕ речевого отношения С.
Утвдрзж?^«; 2.4
Если О, В - речевые отношения и В=-в, то 3 является БЕ речевого отношения в, причем (Д\С)г0.
Как и лобые другие речевые отношения, БЕ задастся конечными мнояеетвами ;реплик (Теорема 2.2), поэтому по аналогии с ¿-ограниченным множеством речевых отчосений лf можно ввести ¿-ограниченное чноаество ЕЕ.
Рпреаеленив_2■б
I- ограниченный ынохествач БЕ ..,Вц} речевого
отношения О называется множество всех БЕ этого речевого отношения, задававшее конечными ыновестваии из множества Яц ограниченной длины
Как доказывается Теоремой 2.5, усиливающей Теорему 2.4, для любого речевого отношения в с Я суцестзует число (верхняя
Граница) ¿.ц®* такое, что ве^ при VI Это позволяет
эаклпчить, что лсбое речевое отнопеиие с известной верхней грающей »»нно найти простым алгоритмическим перебором по более узкому, чем ггюяество Л1, множеству В^сЛ1.
Возрадаясь к формализации Задачи 2, необходимо дать формальное определение понятия слона и его присутствия (использования) п реплике: Определение 2.7
Пусть над язихап реплик Я задано некоторое неформальное отночеоме №. Естсп 1>'/(г) = 1, то считается, что слово г/ присутствует в ретткке Г; если 1У(г) = О, то слово IV не присутствует в этоЗ реплике. Хотя отаозеязтэ V/ является неформальным (например, мнение эксперта, прослувиваа^его реплику г), оно определено над речоз£»« сбьектаьзг и должно обладать определенными фермаяькжа свсйстпггш, сгразоЕСТяс! свсйстал реч:{. В работе полагается, что эти свойства задастся следус^им постулат-т«, оснозакном на зхслериикггальных фактах и речевом опыте коздого гозоряцего
5»" яслзтется ретаггькг отгазЕгегагем с
иэБестгюИ верхней границей Ьу . С учетом сказанного. Задача 2 приобретает следугиий вид:
З^р^ча а*
Построить код язиксш рептя: Я вьтгясдаеяетв отиосеяяге Я, удог/гетвогогетгее условиям:
е° = Р(Щг)=0/Р(г)=0}2е>\ (2.2)
где - зедшггтгг таеяа ^яератаяосггг цраляльгкхгх1
распознавания}.
Рез«Еие этой задачи предлагается искать а классе БЕ отнояенмя IV, и для этого в разделе 2.4 осуцесталяется
переход от теоретико-множественного рассмотрения БЕ к вероятностным терминам. Доказанные в этом разделе Теорема 2.6 и 2.7 гласят, что речевое отношение Вц -произведение всех БЕ речевого отисазегаиз УУ из £.-
ограниченного множества БЕ Ф — /В).....Вм) при 1 й Ц-у - имеет
единичные вероятности распознавания и, следовательно, заведомо отвечает условиям (2.1) и (2.2). Однако, для построения этого отношения необходимо выявить какой-нибудь формальный критерий выделения Бл. из ыногества всех речевых отношений.
В разделе 2.5 предлагается тахой критерий.
Определение 2.8
Учебной выборкой размера N на зоне:! конечное ¡втгестяо
реалах ТЛ/ = {г,.....г^} с Я такое, что 1'/(г/у = бТд,.
Речевое отношение В характеризуется по учебкой выборке величиной частотности
которая, как известно, дает оценку вероятности Р(Б{г) ~ 1 /1'/(Г)~ 1). Именно этой величиной можно воспользоваться в качестве критерия принадлежности В к классу БЕ слова IV, сформулировав этот критерий следуюдии образом:
= 1 о Р(В{п = 1 / щг) = 1) = 1.
Обратная импликация этого критерия легко доказывается: действительно, если !/(£, Гн) 1, то В не может бьггь БЕ слова (У. Справедливость яе прямой импликации на даьном этапе исследования просто постулируется:
ГЬсхуяат X
Критерий У выполняется для мспалъзуеиай учебкой выборка, а подробное изучение условлй выполнимости этого постулата откладывается до раздела 4.3.
Далее и работе приводится конечный алгоритм cP[Lw\ составления -ограниченного множества Ф* базовых единиц речевого отношенкл W с верхней границей L^j.
Построенное эти алгоритмом множество ядер всех ограниченных БЕ речевого отнопении VJ служит входом описанного в том вге разделе алгоритма сР" , который строит БЕ с единичными вероятногтями правильного распознавания, что доказано специальном Утверждением 2.7.
Выводы, сделанные в заключительном разделе второй главы, позволяют утверждать, что разработанные механизмы ■> использования BS приводят к репенип Задачи 2*, а значит и Задачи 2.
В Главе Э производится поэтапное обобщение полученных в предыдущей главе результатов на случай основной Задачи 1.
В качестве первого этапа такого обобщения рассмотризается задача определения кратного присутствия заданного спорл з репг.чке, которая имеет --чедусзз^у j качественную Лоргтулироску: Задача 3
Пусть закона некоторое слово КЯ {обозначим его я) и a каядан лэ caosoc ахусптчгсккх обрацетот х КС полъэопателт* мояет использовать это слово несколько раз, з том числе кг siсполъзазатъ его яоабде. Въгшсттгелъними средства.ни с заданной точностью установить, сколько раз слово IV исполъзонапо в очередной релпязге. Эту за, ачу предлагается реиать как серии задач с вопросом ■ Использовано ли слово £'/ не менее N раз?" с возрастанием (или убыванием) N. Тогда Задача 2 есть частный случай при А>*=1. В работе подробно изучен случай Ы=2 и показано, что полученное репение легхо распространяется на произвольные W>0. 4
В целях получения формальной постановки Задачи 3 понятие двукратного присутствия слова W в реплике г получает следугщее имитационное определение:
Определение 3.1
Пусть на й задано некоторое неформальное отношение IV2. Если IV2 (Г) = 1, то слово слово № присутствуем в реплике Г не менее 2 раз; если И/2(г) = 0, то слово К' присутствует в этой реплике менее 2 раз. Введенное определение подчз'.чяется следующему постулату: ПСУТУЛЙТ 2
Г|г) = ЮЗг,,г2 еЯ,г = г,|г2: И^г,) = Щг2 }=--♦.. Этот постулат, как и Постулат 1, е-зном:! на эхперюсентаяьных данных и на речевом опьгге любого говорящего - более подробно этот вопрос рассмотрен в раздале 4.1.
В результате Задача 3 приобретает следукзув формулировку: Задача 3*
Построить над языхогг рейта: Я бичи многое отяосенгх , удовлетворяющее условиях:
в'^ = Я(1У2(/-) = 1 / Г2 (Г) = 1) :> е1 (3.1!
в°г=Р№21г) = 0/Рг(п=0)*ей (3.2)
где 0 - задашше числе {вероятности с^авильнаго
распознавания) . В качестве реиания этой задачи приводится алгоритм относительно которого доказала
Т^рреиа 3.1
Ясли конечное множество В* ей задлвт ЕЕ то
отношение = ей вичислино и
в^, возрастает с увеличением в^, причеи гаюв^, =1.
Из этой теоремы вытекает, что задаваемое алгоритмом отношение зовздоио удовлетворяет услогиз (3.2) и удовлетворяет условно (3.1) при соотиэтствусцек выборе БЕ.
По той зе схеме в разделе 3.2 Задача 2 обобщается на случай словаря из нескольких слов: Задана 4
Пусть задай словарь из нескольких разных слоя ЕЯ {обозначим его ..,У*и)) и а хаядам из своих акустических обращений к КС пользователь может использовать эти слова в побей комбинации, в так. числе не использовать их вообще. Вычислительными средствами с заданной тонкостью установить, какие слова из словаря присутствует в очередном обращении. Чтобы ' избегать громоздких построений, в работе проводятся подробные рассуждения только для ЛА=2 и показано, что нет никаких зтрепядстЕий ддя их распространения на случай произвольного АД.
Для того, чтобы отличать Задачу 4 от Задачи 2 'определяется понятие разных слов: Определен^«? 3.2
Слева называптся разными, если юс критериальные
отношения независимы, т.е. Р{Щг\! = Р^У,)
Далее дается нотационное определение совместного . присутствия слов в репли?:э,
Пусть на Я задано некоторое отношение 1У12 С й. Если ; ¡г) = 1. то я ■ реювоса Г присутствуют оба разных слова если 1У12(г) = О, то хотя бы одно из слов и/,,^ не присутствует в этой реплике. Введенное таким образом отношение совместного присутствия разных слов подчиняется постулату, подробно рассмотренному в разделе 4.1.:
Уг е (г) = 1 о Щ(г) = Щ{г) = 1.
Соответствующая формальная постановка задачи: Задача .4*
Построить над языком реплик R вычислимое отношение удовлетворяющее условиям:
e°u=pW.2C-) = 0/ft2(r)=O)i0° (ЗА)
где - заданные числа (вероятности правильного
распознаванияJ. Существование репения Задачи 4* с погюцьв БЕ доказано следугщей теоремой:
ТеутррМА .3.2
Если конечные множества В* С R.B* с Р. задаст БЕ В, Z31Ц,В2 r> tV2 <;ооглегс2»едгхо, то ттноаенне = Cj r\ BU4szcmuio и
1) в°г=Ж^г<г)=С/%'г) = 0) = |,
.2,1 е^ - (г) = 1 / B^j(Г) = t) возрастает с увежпеняех с^.е^, npr.-jezi maxel = 1.
ад
Из теоремы следует, что построганное откеявзкмэ заводов удовлетворяет условии (3.4) а удовлетворяет условно (Э) при соответствующем в&боре обеих БЕ. Тогда Задача 4*, очоыдаю, репается алгоритмом a^lBf \, представлявши! собой совмастное прияеиие алгоритма ¡2® с ядерными множествами Я* и в качестве лараиэтра.. Та.-:ой оиторйтм,
конечно, вычислим.
Следувщий этап обобщения результатов второй главы представляет собой определима порядка следования слов в ' реплике. Раздел 3.3, как обычно, открывается качественней формулировкой задачи:
Задача 5
Пусть в очередная сзаеи обрацетя! к КС пользователь
использовал пс • оторнз разные слона ЕЯ словаря !/У = {¡V,.....?ги}
л некотором, Еоз?юя1то кратной, каобиисцяи.
Вычислительная! средствам с заданной точностью установить порядок следования слов словаря IV л дайной реллетге.
В работе исследован сравнительно простой случай /Л=2 при не более чей однократном присутствии сйсз в реплике. При этом рассунделия проводятся в том зге порядке, что и в предыдущих разделах, а именно: неформальное отношение следования формализующий постулат - формальная постановка задачи -описание предлагаемого алгоритма решения задачи доказательство соотватствия предложенного алгоритма условиям задачи.
Определение 3 .4
Пусть для разных слов :Г],!'.'2 на языка реплик задано некоторое отношеннз С1У12 С Й. Ест* 1'/1_>2('') = 1, то I
сбрацетги г слово ¡'.'2 следует за словом Щ; в противном случае это из так. Поступа-у 4
И')_»2 (0=1 тогда и только тогда, когда
зх у
Ц(ХЯГ)=0.Щ{ХЯГ) = Х ■ (подрсбно - раздел 4Л)
?ляача 5*
Построить над яэыкои рептп-сс Я вычислимое сг.'гопгетге удовлетворяете условиями
= Р^ШП = 1 / = 1) й а1 (3.5)
= = 0 / = С) й а0 (3.6)
где 0£а',в°,:£1 - заданные ч::сла (вероятности прапильного распознавания}.
Дня реисния задачи предлагается алгоритм а1'*2],свс^та<а
которого отралхекы слэдук$гй теорелой: . Т^ФР'Жа 3,3
Если лго.теугс»<э шюхества В* с И,В* с Я эая&ат £2Г
з Щ.&2 1»г соответственно, то откасггшкг = вычисзпего и
возрастает
упетяр-хвш'еи
дзет
такс- =1. ад ****
Наконец, в разделе 3.4 показало, что Задача" 1 мокет быть представлена ировгрка к2-:сЕ!?ст»а . ипигз о юсех
допустжгых вариантах присутствия слоз заданного словаря в решхяхе, а. значит решается полньс-г ■ перебором таких гипотез с прюееяенмем соответствующей коьЗгазмго! алгорагк-кда ргаеюгя Задач 2, 3, 4 и 5,
В заключительной Гялвэ 4 разтеэгрши нахогояь-о практические аспскти повптр-ренля и иап эг.:.;: - - ££ е
качестве средства поиска слов 1- вотокг сжат;;::»; . Кьчляъ
такое рассмотрение целесообразно о вопроса о соспеетстЕЗи .ВБедедшик фор!гализкев сасйств^а» кегдедуегого сСъс.тт:., '.-.с-, речи. В разделе .'4.2 показала едмзютлеать попетая реплик, лежащего в осюьэ 1зрс-сеяагш.йх рлпсуадгзз5% сяотеке-регистрации речевьпе ехггпзяоз . и ... зчухохзж кдртах ¿'кпг. ЭоипсЗИсзЬег. что дозт '.основания сриэктерозатъ практаче?:5з;й разработки кманно во. втот ив уезройата. Дреме того, ж Ее раздела проведем ччательггь-! .кркигчееккй анализ цркнята::. а -.работе постулатов ' -»кг основе ' ,-кжгггзкся ".. ь. " гогтерелурз экспершкаггаяьньос данный:. • Результат анализа. ■-.»гоззоякэт.: закявчмт,' что ' в гтерьешак п^сгятого языка' репки; (АШ кет.-.« БошкЗВ юЬег) постулаты 1-4 о поимей стсасззь» доотоврриээт«.-
спрагэд липы для длительных речевых единиц (слова и словосочетания) и когут приценяться в практических разработках.
Езгзсте с тем приходится от2-?зтить, что предложенный в Глапэ 2 алгоритм псисха "идеальной" БЕ едва ли котгет быть полностьа реализован на совроиезяых ЭВМ в силу трудно сбозр;1КОЙ ¡комбинаторики предполагаемого перебора всех возкокных речоЕъве отношений из инозестза для получения
зггалестаа ^ (множества всех ЕЕ) . Зто требует разработки тех или иных средств оптимизации поиска БЕ, в частности, за счет исклпчеиия речевых оигозений, эаведегю не обладающих свойствами ЕЕ заданного слова.
Следует отметить, что прадстагление речевых отношений черэз их ядернькг множества не подходит для практических целей- списания . речевых -атноиений, поэтоггу в разделе 4.2 предложено и обосновано представление ' речевых отношений через так называенк^ алготх^т^зческие единицы, позвспясзцее компактно записывать речевые отнесения на популярных языках гфограынировакия, таких как С или- ?азса1. Алгоритмическая единица - это фун. цпя I). #£/ —> {0,1}, и поскольку мнонество . ограничено, то. алгоритмическая единица всегда вычислима. Показано, что лэбая алгоритмическая едшицд ио-ет быть представлена как функция, ггджоанкэя на ►геи или ином языке программирования, и .наоборот, лпбая програниная функция, интерфейс.которой отвечает определенным требованиям, задает иекоторуп алгоритмическую единицу. Отношение сканирования в функциональном представлении речевых отношений заменяется на
И ' ,,
сканирующий' функционал 5(Л,г) = V Л(/#г#(И-1~ I)). Учитывая
ыо Г|
конечность лобой реплики, иояно считать, что сканирующий функционал с побей алгоритмической единицей всегда вычислим.
В разделе 4.2 такие рассмотрены два способа целенаправленного построения БЕ. Первый способ заключается в привлечении у ¡те созданных методов идентификации феноединиц, например фанеиных признаков, надежность которых
подтверждается практикой. Учитывая огрсшиый опыт ¿аналогии в конструировании и выявлении таких ггетодов, этот способ представляется весьма перспезпивкым. ©оркали ;ы БЕ позволяет при этом объединять для обнаружения одного и' того ко словй методы различной и да:-,с насеетвгстииай прнроды, добиваясь таким образом их взаимодополнений.
Второй способ представляет собой изучение изкзнчивостк речевых единит через анализ наглядных ' изобретений реплик учебной выборки с использованием алгоритмических кзтодоэ обработки изображений или с лр: зягчаниэк экспертов. Опыт пзх&зыз&от, что этот способ яглягтся крайне эффек-КЕньга, хотя отличается высокой трудоемкость».
Предлагаемые к использование речевгет саогеюш, дога выстроенные с покодыэ указанных способов, подлежат проварке на принадлежность к классу БЕ .' заданного слова, осуществляемой по учебной выборке на основании Критерия У, справедливость которого была принята в Главе 2 как Постулат У. В разделе 4.3 ксследуотся вопросы повъпгеиум: представительности учебной выборки с цеиьэ увеличения доверительности получаемых на ней очанок вероятности РуБ{г) = 1 / ¡,7(Г) = 1), отраяалцэй соответствие исследуемого речевого отношения В опредзлакио базовой единицы слова Г.'. Здесь доказана теорема. о том, что вероятность Я{£(Г с = 1 /1/(3, Тл,) = 1} является наубыаеицей <£ук2аз.гсй р&лкггра учебной вьбаряи и нввозревтвоцсй ^укхдоай средней да-ш реплш: этой учебной выборки.
При использовании способов целенаправленного построеггкя БЕ, т.е. полного перебора, которьй по еорекэ 2. гарантафует нулевую ожбку погпюй тревоги , разработать способы получения оценки стой огибки распознавания. В этой сил: ,1 в .разделе 4.4 разработана иатод;1ка расчета вероятности й^=Р(£{г) = 1/1¥(г) = 1) дяк. произвольной отдельно взят ..¿5 БЕ В^Ш на ссксае гипотезы ксютактноети, применяемой в теории распознавания образов.
В разделе 4.5 списан ряд экспериментов, иллвстрируЕщих
предложенные в диссертации способы обнаружения заданных слов
ЕЯ в потоке слит)ой речи.
ЕНЕОДЫ и осаовпыв РВЗУЯЬТЛТН ДПССВРТДЩШ
1. Определены требования, предъявляемые к ориентированно-лингвистическому речевому интерфейсу.
2. Установлена невозмояность применения существующих систем распознавания/понимания речи в качестве ориентированно-лингвистического рзч вого интерфейса.
3. Выявлена специфика задачи понимания речи в ориентированно-лингвистических системах и вытекающие из нее возмояности повышения надежности распознавания/понимания речи.
4. Разработаны формализгах использования имитационного подхода к проблеме обнаруяения слов в потоке слитной речи.
5. Описаны теоретические алгоритмы автоматического получения базовой единицы, обеспечизатщей абсолютно безолгибочное обнаружение заданного слова ЕЯ з потоке слитной речи в рамках предложенных формализмов.
6. Построены алгоритмы обнаруяения кратного присутствия одного слова, совместного присутствия несхольхих слов и порядка следования слов в акустически реализованных обручениях.
7. Предложены способы целенаправленного построения методов рбнаруженля слов в потоке слитной речи с помощью формализма БЕ.
5. Разработаны способы оценки вероятностей опибок обнаружения слов в потоке слитной речи с применением БЕ.
9. Проведен ряд экспериментов, результаты которых подтверждает справедливость теоретических построений.
По теме диссертации опублк^овглы слодуга?:© работы:
X. Топровер Г.Е. Последовательность процедур в неоднородной системе распознавания слитной рсчя (! Труды Конференции молодых ученых ИППИ РАН. К., 1534.
2. Топровер Г.Л. Базохшз единицы? методика обнаружения слов в потоке слитной рета.М., 1995. Деп. В ЗКННТН 16.04.55, ФЕ 1073-В9:.
3. Топровер Г.Е. Учебная вьйррка для .систем обиаруления слов е потоке слитной речи с _>лорой на базовые единицы. К., 1995. Деп. Б ВЕЧИТИ 1Б.04.95, " ©Н 1074-Б95.
-
Похожие работы
- Разработка алгоритма автоматического формирования фонетической базы данных на основе информационной теории восприятия речи
- Разработка адаптивного метода робастного понимания слитной речи на основе интегральной обработки данных
- Разработка метода распознавания слитной речи применительно к компьютерному анализу
- Модели и программная реализация распознавания русской речи на основе морфемного анализа
- Разработка и исследование речевого интерфейса для системы автоматического управления робота
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность