автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Разработка речевых интерфейсов для автоматизированных информационно-поисковых систем с неконтроируемой лексикой

кандидата технических наук
Гюльназарян, Гагик Грачикович
город
Харьков
год
1988
специальность ВАК РФ
05.25.05
Автореферат по документальной информации на тему «Разработка речевых интерфейсов для автоматизированных информационно-поисковых систем с неконтроируемой лексикой»

Автореферат диссертации по теме "Разработка речевых интерфейсов для автоматизированных информационно-поисковых систем с неконтроируемой лексикой"

ШЪКОВСККЙ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНА!,ЕВ1 И1СТЙТ7Т РАДИОаПЕКТРОЯЙКИ км. аквд.М.К.ЯНШЛ

На правах рукописи

Г&ТЬНАЗАРЯН ГАГИК ГРАЧЖС8ИЧ

УДК 621.391

РАЗРАБОТКА РЕЧЕВЫХ ИНТЕРФЕЙСОВ ДЛЯ АВТШТИгГРОЗАНШХ ИКФОК.иЦИОННО-ПОИСКОВЫХ СИСТЕМ С НЕКОНТРаГМЕГЕМОЙ лЕкажои

05.25.05 - автоматизированные квБормацванные систем»

Автореферат

диссертации на сокскшша ученой стопекз кандидата технических паук

ХАРЫС0В-1583

Ра1ота выполнена е Вычислительно:.; Центр? АН СССР к Армянское ГОШ научно-технической информация

Научный руководитель - кандидат технических наук,

ст. и. с.Г"Трунин-"онской"в7н71

Официальные оипэненти -доктор технических наук,

профессор Боядареяко !>".Ф.,

кащшдат технических наук, ст.н.с. Крияоз С.Н. (ЖШ АН СССР)

Ведущая организация - Институт технической кибернетики

АН Белорусской ССР

Заката состоится "£2. " {Р&УЩаД 1989г. в__часов

на заседании специализированного совета К 068.37.01 в Харьковском ордена Трудового Красного Знаглени институте радиоэлектроники имени академика К.К.Янгеля (310726, г.Харъков~726, проспект Ленина, 14)

2 диссертацией можно ознакомиться в библиотеке института.

Автореферат разослан - /" деха/рЯ 1988г.

Ученый секретарь специализированного совета, кандидат технических наук, доцент

Э.А.Дедикоа

Актуальность работа. ХХУП съезд КПСС в числе приоритетных направлений ИТР указал на необходимость значительного улучшения качества н повышения эффективности информационного обеспечения научных разработок. Широкое внедрение информационных систем в научно-техническую деятельность выдвинуло в ряд первоочередных разработку удобных для человека средств общения с такими системами. Решение этой проблем на современном этапе развития вычислительной техники требует создания тершшалов, использувдих естественные и удобные для человека способы ввода информации, в частности, речевого.

В связи с разработкой достаточно большого числа промышленных речевых терминалов, работающих с настройкой на диктора (ИКАР.ЕЕЧЬ-I, МАРС и др. )и экспериментальных систем речевого ввода(СРВ) (Щ АН СССР, Ереванской политехническом институте и др.) создание удобных для человека интерфейсов сводится к задача« адаптации имеющихся СРВ для их использования в автоматизированных информационно-поисковых системах (АИПС) и кодификации подсистем АИПС, предназначенных для обеспечения процедур диалога. Решение поставленных задач в комплексе с решением проблем информационного поиска обеспечат значительное повышение эффективности современных АИПС и их широкое внедрение в различных областях науки и техники.

Целью "работы является исследование основных принципов организации речевой технологии общения "человек-АИПС" п разработка речевого интерфейса (включая разработку алгоритмов к программ распознавания ограниченного набора слов) для одной из таких систем, а именно, АИПС "Ш1СИМЕ", функционирующей в Армянском КИЙ научно-технической информации и технико-экономических исследований Госплана Ар&ЙСРИее модификаций.

Основные задачи исследования:

- анализ существующих технологий диалога "человек-ЭВМ" и разработанных в СССР а за рубежом речевых терминалов;

- исследование языковых средств общения "челоЕЭк-АЛПС" с целью ес адаптация к речевой технологии и разработка языка диалога для конкретной система;

- разработка метода оптимальной для речевой технологии орга-пззацза языковых средств АИПС с неконтролируемой лексикой;

- разработка алгоритмов распознавания алфавитного словаря для взсда произвольных слов я методов погашения надежности распознавания;

- разработка программных средств для речевого общения "че~ ловек-АИПС".

Научная новизна работы:

- определены основные требования, предъявляемые речевой технологией к синтаксису и семантике языковых средств АШ1С;

- разработан метод создания тематических подсловарей, включающих определяемое техническими возможностями современных СРВ количество терминов при условии максимального охвата лексики АИПС;

- разработан алгоритм неадаптивного распознавания алфавитного словаря для побуквенного ввода научно-технических терминов, не входящих в тематические подсловари;

- предложен метод авторедактирования отказов распознавания, основанный на вероятностном восстановлении нераспознанных при речевом вводе букв;

- разработана программные средства, реализующие полученные алгоритмы и методы.

Практическая ценность -работы определяется прежде всего тем, что решение проблемы неадантивного распознавания большого словаря в ближайшем будущем не представляется возмо,-жным и описанный в работе речевой интерфейс можно рассматривать как разумную альтернативу для речевых терминалов с указанными техническими возможностями.

Реализация результатов работы. Диссертационная работа выполнена в рамках плановой ШР БЦ АН СССР НГР X 0182.30431-42 -"Исследование принципов реализации акустического диалога "человек-иВы", а также в рамках тематических планов АрмНИИШИ за период 1982-1986 гг. Ввод в промышленную эксплуатацию запланирован в раг.:ках выполнения п.04.01.01.01 Республиканской научно-технической программы 86.Ц.09,"Создание республиканской автоматизированной системы НГЛ" (1988-1989 гг.).

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на научных семинарах секторов автоматического распознавания речи отдела проблем распознавания и методов комбинаторного анализа ВЦ АН СССР (июль, 1986г., июнь, 198,/г.] кафедр АСНТИ Ж КИР при ВШИ (февраль, 1986г.) и информатики Московского государственного института культуры (февраль, 1986г.) и на Закавказской научно-технической конференции молодых ученых

и специалистов "Информатика и вычислительная техника" (Ереван,декабрь, 1986 г.).

Публикации. По теме диссертации опубликовано 6 работ.

Объем и структура диссертации. Диссертационная работа изложена на 102 страницах машинописного текста, содержит 8 рисунков и 9 таблиц и состоит из введения, трех разделов, заключения, списка литературы из 95 наименований и 3 при-лсяени/.

СОДЕРЖАНИЕ РАВСТЫ

Во введении обоснована актуальность темы и необходимость системного подхода при разработке речевых интерфейсов для А^ШС, определено направление исследований и изложена структур диссертационной работы.

В первом разделе проведен анализ литературных источников, посвященных организации общения в системах "челсвск-33!.1" и автоматическому распознаванию речевых образов, обоснована необходимость речевого общения потребителей информации с /и":С, сформулированы задачи исследований.

Создание языков диалога относится к числу семантиче ;к 'X проблем языкового аспекта информационного обеспечения, Анализ входных языков (ВЯ), предназначенных для составления предписании на ввод, обновление, поиск, обобщение, редактирование и выдачу информации и используемых в функционирующих в СССР и за рубежом А-ШС (Е31СЛ-МЕ, ПОИСК, ДИАЛОГ, 5МАРТ. др.) показывает, что

тенденцией развития этих языков является значительное петление их функциональных возможностей при низком эргономическом уровне. Первопричиной этого является использование стандартных для сВМ третьего и четвертого поколений терминалов. Необходимость упрощения символьного ввода информации приводило к включения во ВЯ всевозможных сокращений слов и аббревиатуры, что требует от пользователей АИПС дополнительного обучения и использования различных процедур типа "меню" при работе. Повышение сервисного уровня диалога требует использования терминальных устройств, осноганных на естественных и удобных для человека способах передачи информации, в частности, речи. Для обоснования такого подхода к репению проблемы "демократизации" АИПС достаточно привести следующие данные. Спонтанная речь произносится, как правило, со скоростью 2-4 слова в секунду, а скорость печатания профессионала - 1,6-2,5 слов

в секунду. Для непрофессионалов скорость печатания равна 0,2-0,6 слова, более того, у опытной машинистки, одновременно печатающей и принимающей решение, скорость печатания равна 18 слов в минуту, тогда как речь произносится со скоростью примерно 100 слов в минуту.

Практическое применение прокшлленных экспериментальных СРВ в той или иной автоматизированной системе сопряжено с проблемами адаптации как СРВ, так и самих систем. Для АИПС указанные проблемы определяются их технологическими особенностями, что определяет направление работы в решении следующих задач:

- адаптации языковых средств АИПС к речевой технологии ввода информации, а именно, разработки методов оптимальной (в рамках технических возможностей современных СРВ) организации лексики АШС и создания тематических подоловарей;

- адаптации СРВ к технологическим особенностям ряда АШС, в частности, неконтролмруемости лексики.

Для дальнейшего увеличения словарного состава разработаны алгоритм неадаптивного распознавания алфавитного словаря для ввода не входящих в тематические подсловари научно-технических терминов и метод редактирования ошибок и отказов этого алгоритма.

Зтозой раздел диссертации пссвящен описанию основных принципов построения речевых интересов в АИПС. Основ;, раздела составляет исследование структурных особенностей ВЯ, функционирующего в речевой технологии, синтаксического анализа и редактирования вводимых с голоса предписаний (на примере конкретной АИПС).

Для описания объектов внешнего мира в ВЯ в качестве минимальней самостоятельной единицы определено элементарное высказывание - утверждение о принадлежности данному объекту одного из возможных признаков. В общем случае признак представляется парой, состоящей из наименования признака и его значения, т.е. в целом предписание в ВЯ представляется в виде цепочки следующих элементарных высказываний: (идентификатор объекта),(наименование признака, значения признака), ... (наименование признака, значения признака). При этом признаки представляются в предписаниях как позиционными, так и формализованными средствами, что нашло отражение в различных форматах их кодирования, а именно, позиционном, анкетном и триадном. Однако речевая технология ввода информации очевидно предполагает следующие свойства представления признаков;

позиционная и смысловая независимость в предписаниях, обес -

- У -

печинащие естественность и удобство их произношения;

необязательность в предписаниях ряда признаков, позволит;;;:-: ескрацать реальное время диалога.

Разработка ЕЯ для речевого ввода предписании прюмиеиа ? диссертационной работе для АИПС "ИЯ&Ш" и ее различных мод^икацд;;, состояло!! из следующих основных подсистем:

- подсистема ввода вторичных документов, в состав коте: о.: входят ряд программ конверсии различных форматов библйогр.;:п>окс-го описания документов;

- подсистема ввода и корректировки информационных закм-х-:-; пользователей;

- подсистем поиска релевантных документов;

- подсистема выдачи результатов поиска.

Структура А&А "РЖС'.'й.В" определяет пять основных ткпс:> од-писаний (включая предписание конца диалога) , п?елнз&кач->нк1:х /ля описания объектов в указанных подсистемах и два дсзслнятсль-ных типа, предназначенных для редактирования вводимо; г од:::: .аний. Правило формирования всех типов предписании задается ¡ермуло.:

где N - наименование объекта;

"к - наименование к-го признака;

- значения к-го признака (к=1,2, ).

ш

В т^Зл. I представлен разработана:::! Ъ/1. Символ '-" в . :. т-ствушей графе означает неприемлемость признака в данном ?.::-•• предписания, первый символ пары означает: Н - необязателен' ть, О - обязательность, а второй символ - С - однозначность, - •>::•-гозначность данного признака.

Синтаксический анализ вводимых предписаний основан ::л ;:"---л-лельном с речевым вводом просмотре предписаний "слева-шзпр.во". Для необязательных признаков предусмотрен род правил "по умо.т!;.-нию", согласно которым при завершении нормального ввода предпне:,-ний им присваиваются стандартные в рамках технологии оункцисниро-вания АИПС "РЛЛСИМЕ" значения. Множество возможных синтаксических конструкций ВД описывается графом & = (14,У). Множество вершин Ц задает лексику ВЯ. В соответствии с правилом формирования предписаний 11 представимо в виде объединения подмножеств

и^ии^щ-и

где: К« - задает подмножество наименований объектов;

- а -

Ь1г - задает подмножество наименований признаков; ^з - задает подмножество значений признаков. Состав подмноаеств [И^} представлен в табл. 2.

Таблица I

Наименование Типы предписаний: основные._дополнительные

признаков ввести Ввести По- Вы- Ко- Ислра- Уда-доку- запрос иск дать нец вить лить менты _ ____

ГАЛТШ (Н,М) (0,Ы)Ж - -

УДК - .(Н,М) - -

1Ш/Ш - (О.М)** - -

АБОНЕНТ - (0,0) (Н,М) (Н.М) -

ШШ - (Н.М) ■ - -

ЗАПРОС - - (Н.М) (Н.М) -

ВВОД (Н.О) Ш.О) - -

ШВСД (Н.О) (Н.О) (Н.О) (Н.О) -

(Н.М) • (Н.М)

ж - обязателен для запросов, предназначенных для поиска в массивах всех видов документов, кроме патентов.

кя

- обязателен для запросов на патентную информацию.

Таблица 2

Подмножество

Состав

Подмножество

Состав

Ц, ВВЕСТИ/ДОКШЕНТЫ/ ЗАПРОС/ПОИСК/ ШДАТЬДСНЕЦ/

иг ВВОД/ШВОД/ГАСШИ

1ЛКИ/НКИ/АБ0НЕНТ/ ТЕРШШ/ЗАПРОС/КОНЕЦ

И'3 = {пунктационные знаки]

I// = /0.1.2. ...

и\= (буквы русского алфа-л вйтaj

(научно-технические термины.?

ДИСК/ЛЕНТА/ /АЦПУ/ ДИСПЛЕЙ/КОНЕЦ

Из табл. 2 видно, что для речевого ввода входящих в состав Ы, и небольшого количества слов разработанные неддаптивные СРВ

обладают достаточно высокими показателями надежности (не менее 90% распознавания для произвольного диктора).

Однако использование этих же СРВ для ввода слов из подмножества t¿¡ неприемлемо, т.к. включение в его состав научно-технических терминов, используемых для выражения основного смыслового содержания информационных запросов при условии неконтролируемости лексики приводит к значительному превышению допустимого техническими возможностями СРВ объема словарного состава.

Сценка возможной модности подмножества Uj для АИПС "РЛПСИ-!A¿¡" показала, что для терминологии различных областей науки и техники IÍU*¡Í» 500. Выделение допустимого техническими возможностями современных СРЗ 200 тгрмимоз, наиболее используемых в запросах пользователей АИПС "РЛПСИШ" за период с 1981 по 1986 гг. по 16 отраслям науки и техники проводилось на основе следующего алгоритма.

Пусть С СиСг1..ч ctJ есть лексика информационных запросов одной из отраслей науки и техники. Если i í 2Ш, то все множество С рассматривается в качестве тематического подсловаря данной отрасли. В противнем случае обозначим через N ( с4 ) частот;/ встречаемости c¿ термина в запросах одной отрасли. В этих обозначениях Р (О = есть вероятность C¿ -го термлна.

Для произвольного С .CgjC'<=-C ¿¿О

определим отображение {

F(C'j : { C'j-" [0,1], глг F (С) = SPCcJ

Подмножество С <= С является искомым тематическим подсло-варем, если выполняется условзе:

F(C") = ma? [F (С')J

При составлении тематических подсловарей для АИЛС "PILÍJII'.S" было установлено, что для всех 16 отраслей науки и техники 0,85 ¿ F ( О 4 0,91. Предлагаемое в диссертационной работе для речевого ввода побуквенное произношение не входящих в тематические подсловари терминов основано на разработанном алгоритме неадаптивного распознавания названий букв русского алфавита. В современных СРВ использование алфавитного словаря рассматривается, в частности, как универсальное средство сравнения технических возможностей речевых систем. В СРВ, используемой в качестве интерфейса "челсвек-АИПС", побуквенное произношение позволяет вводить неконтролируемое количество терминов, не входящих в тема-

тическио псдслсьари путем добавления к рабочему словарю речевой системы эталонов названий букв русского алфавита.

В третьем разделе работы описаны алгоритм неадаптивного рас-нознагани.;£ незвымЛ бука русского алфавита и метод автоматического рсапктяговиия отказов распознавания.

Для разработки алгоритма распознавания проведена серия экспе-¡•H.veiiTtB, в которых участвовало 12 дикторов (7 мужчин и 5 женщин), гучзясая выборка состояла из пяти произношений названий букв русского ал в и та кандым диктором. Для казздой из букв были определены два тп::а эталонов:

- '.'.к'.'.педальцш - эталоны произношения одним диктором;

- бщенные.

j р-чулътате акустического анализа устройством выделения ре-че1-ы.с ::; ::зпаков /УЗЫ/ речевой сигнал представляется в виде матри-

l-ая отрока состоит из значений первичного признака, определяемых в а дискретные моменты времени.

3 используемой при разработке алгоритма распознавания аппаратуре £Щ АН СССР и ЗрТИ) дискретизация проводилась с периодом 10 ;.;с'..к, а из первичных были выбраны следующие восемь признаков:

- огибающая интенсивности речевого сигнала;

- признак гласности, характеризующий значение энергии сигнала в полосе частот 500 800 Гц;

- значения частоты основного тона;

- значения первых двух форматных частот;

- общее число кулевых пересечений сигнала;

- количество импульсов клииированного сигнала длительностью менее 150 мк сек;

- число экстремальных переходов речевого сигнала.

Решающее правило алгоритма распознавания, полученное в результате анализа значений коэффициента линейной корреляции соответствующих признаков индивидуальных эталонов всех букв определено следующим образом.

Пусть на вход алгоритш поступает некий речевой сигнал X. Этому сигналу соответствует обобщенный эталон буквы frv , если коэффициент линейной корреляции

f(XLmL)tO,S3 дляJ i e {¿,2,.., 2} (i)

Пра распознавания возксзиа слздущне результаты:

а) нормальное распознавало;

б) сшОка распознавания - выпшшвнае уеловая (I) пра фактическом несоотвегствяа произносимой и эталонной букв;

в) отказ распознавания - шшолнешю у еловая (I) идя для нескольких эталонов (эта буква рассматриваются как альтернативные) или зе ня для одной яз <5укв. Во втором случае э качества альтернативных рзссштрзваптся тэ буква Ш , для которых выполняется уело-

Ш6 f (ХМ>0,40 Ш 4u{i,2,-j] (2)

Для апробации разработанного алгоритма была попользованы индивидуальные эталоны названий всех букв произвольно выбранных трех дикторов. Путем перестановки соответствующих перзячякх признаков были получены модели 30 • Cg = S0180 проиапоаешй букв. Результаты распознавания моделей показали, что алгоритм распознавания еы-дал осябочное решение в 379 проанализированных на ЭЕ.З случаях, а отказов - в 5427 случаях. При этом из 5427 случаев только в 6 число альтернативных бут было равно 4, в 172 - 3, а в остальных -2 буквы. Надежность алгоритма распознавания составляет SO,4$, что соответствует надежности алгоритмов распознавания, разработанных на основе данной слста."л первичных признаков, а повышение надез-носта распознавания названий бука сводится,в основном, л задаче уменьшения числа отказов. Разработанный метод авторедактировандя отказов основан на следупцей гипотезе.

Пусть А » {а,,а„.-. otnj -алфавит. Обозначим через // (Ctj) частоту встречаемости OLj -ой бу!гвы на i -ой позиция в научно-технических терминах, через N ( (zj , ос¡¡+t ) - частоту встречаемости буквосочетания (aj, of,) на соответственно ( i , ¿+ позициях. В этих обозначениях отношение Р (<Х/ / аг^"' ) определяет вероятность встречаемости буквосочетания (Ofy, аг) на соответственно позициях ( i , <+ I).

Матраца частот имеет размерность (п3, т- I), где 171 -спмалъвая длина терзана н представляется в виде:

Соответственно определяется матрица вероятностей

той же разкарзоотп, что к катрзда //.

Пусть в результата распознавания псбуквенио введенного слова

получена последовательность

Л'*

«3. "А ■■■ У'

где - буквы, распознанные алгоритмом нормально;

и» -условный символ на ( -ой позиция слова, обозначающий букву, при распознавании которой алгоритмами выдан отказ; < - длкна слова (г?3).

Для букв у « А определим функции уН- (у , с ) следующим

образом:

Р^/а/].

РКУу)-

на

где

а (-з

Буква у ' является наиболее вероятной в данном слове -ой позиции, если

Эксперименты, проводимые с целью апробации метода авторедак-тировакяя отказов распознавания названий букв, проводились в тр; этапа. На первом этапе использовались матрицы /V и Р, полученные в результате анализа более чем 120 тысяч научно-технических терминов по советской и зарубежной экономике.

На первом этапз с экрана дисплея вводились 330 тестовых термина . , в каздом из которых вместо одной буквы, соответствующей отказу распознавания, вводился символ Э . В качестве множества альтернативных букв рассматривался весь алфавит. На перзом этапе экспериментов надежность авторедактирования составила 67,3,?.

IIa втором этапе экспердмеатоз, состоящих я:- дзух частот,тершая вводилась такзе с экрана дисплея. Ах$авзт бил разбагг на фоае-тяческяе группы /табл.З/ и прз вводе с тераяаала некоторого слова указывалась возмогшая группа альтернативных букв А'с А.

Таблица 3

Разбиение названий букв русского алфавита ка фонетические группы в данной сястемз первичных признаков

№ ЯП Названия буаэ

I. ка, пэ, тэ - твердые, взрывные глухие

2. бэ, вэ. гэ, дэ - твердые взрывные зкояквв

3. ЭЛ. ЕМ. эн - носовые и боковые

4. а, о. э - гласные I класса

5. и, а, э - гласные П класса

6. у, ы, 0 - гласные Ш класса

?. ча, па. ва - фрикативные I класса

8. эс, эф - фрикативные П класса

9. ха, па - фрикативные Ш класса

10. пэ - фрикативный 17 класса

II. йа, йо, йу - составные звука

12. эр, эл - дрозапшэ боковые

13. 5Э, ЗЭ - звонкие фрикативные

14. а - краткое

15. твердый я мягкий знака

В первой частя эксперимента тестовый цассяв состоял аз 330 терлзнов первого этапа, прз этом а 103 словах редактировалась пропущенная гласная /102 нормальных исхода яла 95,2$ надежности/, а в 224 - согласная буква /200 нормальные ясхода акя 89,3;"? надежности/. Обяая кадегяость кзтода радактярованая составила 91,5^.

Во второй часта аспольаогггзсь пащгченяыз путец нараанвшая на статистику, ссщзргтзейся в штрзце N , статяатака, погугзпноЗ а результата аналаза более 20 тнояч термапов по знфор:пт2кэ а 13 тысяч по азтс?лтг5Э, талеузгаяика л Енчасштельяой тзхшзкз. Тео-тоеьй шсош5 сосяояя пз 613 терЕИаов, аз которше 330 бнла тэраа-еы тестового кзоегша пзрзого гтала, 102 торкана по ЕНфорттшсз а

101 термин по автоматике, телемеханике и вычислительной технике.

Надежность метода редактирования составила ВО,вря этом для гласных и согласных соответственно 93,9^199 предъявления -137 нормальных исходов / и 69,4^/414 предъявлений - 370

нормальных исходов/.

Па третьем этапе эксперимента метод авторедактированая апро-сихзиался в комплексе с алгоритмом-распознавания названий букв, .'естоаьй массив состоял из 613 слов, анализируемых на втором агате. При программном формировании речевых образов этих слов из .".0480 моделей избирались произвольные произношения составляющих

Па первом иаге слова анализировались алгоритмом распознавания. При наличии отказа распознавания анализ данного слова продолжался алгоритмом авторедахтирозания. Алгоритмом распознавания при анализе моделей 7348 букв 613 слов было задано 46 сшибок и 059 отказов, а алгоритмом редактирования - из проанализированных ¿59 отказов ошибки были допущены в 49, т.е. надежность метода ав-;^актирования составила 93$, что согласуется с результатами второго этапа экспериментов.

Таким образом общая надежность составила 98,7/2.

Реализация вышеописанных алгоритмов и методов осуществлена п речевом интерфейсе, разработанном для АИПС "РИПСИМЕ". Описываемый интерфейс представляет собой алпаратурно-программный комплекс. Аппаратная часть состоит из разработанного в ЕхШ УБИ1.

Программная часть комплекса представлена на рисунке.

Программная часть состоит из следующих модулей:

015 Р- /диспетчер речевого интерфейса/;

К А55 - /модуль дискретного распознавания слов/;

/модуль распознавания букв русского алфавита/;

- /модуль предварительного преобразования произношений названий букв и получения нормированных эталонов/;

GEN- /модуль формирования матриц /Vu Р в режиме обучения и авторедактирования отказов распознавания названий букв в режиме эксплуатации/;

LINK - /модуль редактирования предписаний/.

Диспетчер интерфейса DIS Р предназначен для:

- передачи речевого сигнала от УВИ1 соответствующему модулю распознания / RASS RASS L

- синтаксического анализа предписаний /в том числе выполнение соглашений "по умолчанию"/;

- трансляции введенных предписаний на язык управления заданиями ОСЕС для вывода и выполнения программных модулей соответствующих подсистем AIfflC.

Вместе с передачей речевого сигнала от УВИ1 модуль 01SР дополнительно сообщает и номер подмножеств Uj <=. И , которой принадлежит анализируемая б данный момент диалога вершина графа G .

Программные модули RfiSS и RPSSL предназначены для распознавания речевых образов. Модуль tfiïSS реализует алгоритш распознавания ограниченного словаря для произвольного диктора, разработанные в ЕрПИ. Модуль RASSL реализует алгоритм распознавайте .»азваний букв русского алфавита.

Основной функцией программы &EÏÏ в режиме распознавания является авторедактирование отказов распознавания названий букз, а в режиме обучений - формирование матриц /V и Р .

Программный модуль ÙER предназначен для получения эталонов произношений названий букв русского алфавита.

Программный модуль LÎA/K предназначен для редактирования введенных предписаний, а также коррекции ошибок распознавания (реализация функций предписаний ИСЛРАШТЬ и УДАЛИТЬ).

Для определения эргономических характеристик речевого диалога 6 операторам ЭВМ, имеющих различный стаж работы как на ЬВМ, так и эксплуатации АШС /от 2 до V лет/, были предъявлены для произношения и набора с клавиатуры 40 заранее составленных предписаний /по 10 предписаний по каждому из имеющихся в ВЯ АШС "Р*Ш-СИМЕ" основной® типу предписаний/. В среднем в каждом из этих предписаний содержалось соответственно 16 слов в предписаниях типа ВВЕСТИ ДОКУМЕНТЫ, 21 в предписаниях типа ВВЕСТИ ЗАПРОС /из которых в среднем II слов составляли термины/, II в предписаниях типа ПСЙСК и 12 в предписаниях типа ВЫДАТЬ. Обучение операторов ВЯ длилось 20-25 кинут. Произношение предписаний фиксировалось с

Результаты хронометрирования показали, что значительное улучшение показателей производительности, определяемого формулой

К = (I—¿г-) х 100$,

1 tir

где I г - время речевого ввода,

t< - время набора с клавиатуры, наблюдалось у оператороз, имеющих меньший сталс работы на ЭВМ. При этом средняя продолжительность произношения подвергалась меньшим колебания.: /от 40,3 до 45,6 секунд/, в то время, как время набора тех же предписаний с клавиатуры имело больший диапазон /от 63,6 до «V,4 секунд/ и зависало в обратной пропорциональности от стажа оператора.

Естественность речевого ввода обеспечивало значительное повышение производительности труда операторов ЭВМ /от 29 до 45^) вне зависимости от их стажа и образовательного ценза.

ОСНОВНЫЕ ГЛЗУЛЬТА'Ш РАБОТЫ

1. Сформулированы требования к входным языкам АИС, налагаемые речевой технологией диалога, и разработан конкретный язык для АЛЛС "Г.^ЛСЛМЕ", удовлетворяющий этим условиям.

2. Предложена и на примере АИПС "ВШСИМЕ" и ее модификаций апробирована методика организации тематических подсловарей, объем которых (до 2С0 терминов) допускает использование отечественных промышленных и экспериментальных систем речевого ввода в качестве речевого интерфейса "пользователь - А>ШС",

3. Разработан алгоритм неадаптивного распознавания алфавитного словаря (названий букв русского алфавита).

4. Разшботан метод автоматического редактирования отказов алгоритма распознавания, основанный на вероятностных характеристиках позиционной встречаемости букв в терминах.

5. Создан комплекс программных средств речевого интерфейса Aime "Р'.Ии.и.Е" и ее модификаций.

6. Осуществлена опытная эксплуатация'речевого интерфейса. Определен ожидаемый экономический эффект внедрения разработанного интерфейса в промышленную эксплуатацию.

Содержание диссертации отражено в следующих публикациях:

I. Бурназян А.II., Гюльназарян Г.Г.

Перевод вводных форматов различных ИПС на вводной формат

¡¡ПС "',1.1;;.'^" // Тез ном докладов IX научного семинара по системным асляедовзаиям ГАСНТЛ. - Ереван: 17-20 апреля 1979 г. - Ч. 2.-С. 1-15-149.

2. Гзлыпз-.рз! Г.Г. Использование баз данных на шгизткых лентчх в АСНГЛ Армянско" СОР // Тезисы докладов Всесоюзно/, ксн->сропции "Зог.рее:: организации системы обмена ПТЛ ш: '"Л". - :.'..: ЗДМХ ССЛ-, 26-ЗС ноября 1080 г. - С. 113-115.

3. Гальназсрян Г.Г. Речевое управление .¡ПС // ¡¡сяс.т-эслляип систс ;.: автоматического речевого ввод;;. - '.,'..: ССОР, 1966. - С. 13-19.

4. Гильназарян Г.Г. Речевой даал.г с а«?'ляткэ.:;* капке-.'. Л..С "Р.ПиЛГ.С // Тсзнсы докладов Закавказской н^ чло-твхипчсояо;: конкуренции молодых ученых и специалистов "¡1н:ор\птика и вычислительная техник'!". - Креван: 1986. - С. 35-37.

5. Ггпьназарян Г.Г. Разработка системы речевого управления при информационном поиске // Анализ, распознавание и синтез речи / Под ред. Б.:.'. Трунняа-Донского/ - М.: ВЦ АН ОХР, 1967 г. - С. 87-91.

6. Гильназарян Г.Г. Принципы построения г.ьдспстсм речевого ввода в А.П13 // НТЛ, серия 2, .': 6, 1967 г. - С. 14-16.