автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Естественноязыковой интерфейс с базами данных с экспертными системами на основе многооконного меню

кандидата технических наук
Радковский, Георгий Николаевич
город
Москва
год
1992
специальность ВАК РФ
05.25.05
Автореферат по документальной информации на тему «Естественноязыковой интерфейс с базами данных с экспертными системами на основе многооконного меню»

Автореферат диссертации по теме "Естественноязыковой интерфейс с базами данных с экспертными системами на основе многооконного меню"

ВСЕСОЮЗНЫЙ ИНСТИТУТ НАУЧНОЙ И ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ РАН

На правах рукописи

РАДКОВСКИЙ Георгий Николаевич

ЕСТЕСТВЕННОЯЗЫКОВЫЙ ИНТЕРФЕЙС С БАЗАМИ ДАННЫХ И ЭКСПЕРТНЫМИ СИСТЕМАМИ НА ОСНОВЕ МНОГООКОННОГО МЕНЮ

Специальность 05.25.05 Информационные системы и процессы

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

\

МОСКВА 1992

\

\ ^

Работа выполнена во Всесоюзном институте нау ' I технической информации РАН.

Научный руководите л ь:

доктор технических наук, профессор Большаков Игорь Алексеевич

Официальные оппоненты:

доктор технических наук, профессор Белоногое Герольд Георгиевич; кандидат технических наук Лахути Делир Гасемович

Ведущая организация: Всесоюзный научно-технический информационный центр (ВНТИЦентр)

10 часов на заседании Специализированного совета Д003.02.01 во Всесоюзном институте научной и технической информации по адресу: 125219, Москва, ул. Усиевича, д. 20-а

С диссертацией можно ознакомиться в библиотеке Всесоюзного института научной и технической информации.

Защита состоится

года в

Автореферат разослан

1992 г.

Ученый секретарь Специализированного совета доктор технических наук

ПЕТРОВА Лидия Андреевна

-1 -

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

*^^И|Г;туальностъ проблемы.

Р последние годы для решения разнообразных прикладных задач получили большое распространение компьютерные диалоговые системы. Любая проблемно-ориентированная диалоговая система 4меет следующие два основных компонента:

- Функциональный - собственно прикладную систему (ПС) и

- диалоговый - подсистему, управляющую взаимодействием пользователя с данной прикладной системой, или так называемый диалоговый интерфейс.

С появлением персональных компьютеров (ПК) возрасло значение диалогового компонента, что связано в первую очередь с существенным расширением круга пользователей ЭВМ и его качественным изменением за счет конечных пользователей, не имеющих, как правило, специальной подготовки. Дополнительная сложность этой проблемы связана с появлением ПС, требующих особенно гибкого и богатого языка взаимодействия, по выразительным возможностям приближающегося к ЕЯ.

Производительность, ценность, конкурентноспособность ПС зависит не только от функциональных возможностей самой ПС, но в значительной и все более возрастающей степени определяется ныне ролью, которую играет интерфейс.

Сказанное определяет актуальность рассматриваемой в диссертации проблемы создания интерфейсных подсистем для взаимодействия неподготовленных пользователей с ПС широкого класса и делает экономически выгодным вкладывание средств и труда в "непроизводительную" часть программ - в диалоговый интерфейс.

Цель и задачи исследования.

Цель диссертации - разработка принципов и подходов к проектированию интерфейсных подсистем, предназначенных для взаимодействия конечных пользователей с ПС широкого класса, а также реализация на этой основе конкретной интерфейсной подсистемы.

Основная идея подхода состоит в следующем. Интерфейсная система обеспечивает возможность задавать запросы на некотором

I-I

четко определенном подмножестве ЕЯ, освобождая пользо^^^^^^Н необходимости заучивать ограничения, присущие этому^^^^И жеству. Для чего все возможные запросы к ПС разбивают дельные сегменты - слова или словосочетания, которые размещены в различных окнах экрана дисплея в качестве альтернатив многооконного меню. Пользователь выбирает слова или Фразы из этих окон, иаг за шагом Формируя из них целые предложения в качестве запросов к ПС. По мере выбора языковых фрагментов вводимый запрос воспроизводится в специальном окне и выглядит вполне естественно,

В процессе ввода запроса интерфейс подсказывает пользователю те языковые фрагменты, которые могут служить реальным продолжением уже введенного начала запроса. Тем самым достигается ввод запросов только из данного фиксированного подмножества, последующий перевод которых во внутренний язык ПС не требует сложного лингвистического анализа, и осуществляется более простыми средствами. Семантическая допустимость запросов достигается автоматически.

Возможность достаточно широкого применения этого подхода связана с решением целого ряда задач, а именно: выделение» подмножеств ЕЯ, допускающих намеченную выше обработку; описанием предметных областей и ПС, к которым целесообразно задавать запросы на подобных подмножествах; разработкой эффективных механизмов взаимодействия с пользователем и др.

Нетоды исследования.

Для решения поставленных задач использовались различны« методы дискретной математики и компьютерной лингвистики.

Научная новизна.

К новым результатам, полученным в диссертации, относятся: эвристический подход к выделению подмножеств ЕЯ и членению их на отдельные естественноязыковые сегменты, предлагаемые в качестве альтернатив для выбора в многооконном меню;

- Формальный механизм {цепочечная грамматика) для описания подмножеств ЕЯ, опирающийся на разбиение подмножеств н; словосочетания и позволяющий динамически, в процессе ВВ9Д; запроса, строить его структуру, предсказывать возможные про-

должения для введенного начала запроса, единообразно описывать подъязыки различных ЕЯ (русский, английский и др.):

- алгоритм перевода естественноязыковых запросов на язык предикатов первого порядка.

1

Практическая ценность и реализация результатов исследований.

Предложенный подход может быть применен при проектировании интерфейсных подсистем для широкого класса ПС. В этот класс входят фактографические базы данных, различные типы экспертных систем (ЭС), справочные системы и др.

На основе полученных в диссертации результатов разработана интерфейсная подсистема оболочечного типа, допускающая настройку на различные приложения. Данная подсистема апробирована в качестве интерфейса к ЭС по свойствам химических соединений.

Апробация работы.

Основные результаты диссертации докладывались и обсуждались на различных семинарах и конференциях, в том числе: Рабочей группе по ЛИВС (Ижевск, 1986); школе-семинаре "Персональные компьютеры и локальные сети" (Новый Афон, 1986); Общемосковском семинаре по искусственному интеллекту (ИПУ.1987); школе-семинаре "Формализация семиотических аспектов интеллектуальной деятельности" (Боржоми, 1988); Всесоюзном научном семинаре "Системные исследования ГАСНТИ" (Вильнюс, 1989).

По теме диссертации опубликованы три работы.

Структура и объем работы.

Диссертация состоит из введения, четырех глав, заключения и трех приложений. Список использованной литературы включает 55 наименований. х Основной текст содержит 110 страниц, 9 рисунков и 2 таблицы.

СОДЕРЖАНИЕ РАБОТЫ

В диссертации выбран следующий порядок изложения материала по главам.

Во_введении обоснована актуальность выбранной темы,

сформулирована цель и основные задачи исследования.

1-2

я прряпй пярр рассмотрено современное состояние интерфейсных подсистем. Отмечены подходы, призванные облегчить освоение и использование интерфейсных подсистем различных типов. Основное внимание уделено интерфейсам, ориентированным на конечных пользователей, и, в первую очередь, ЕЯ-интерфейсам и системам "меню".

При разработке систем взаимодействия с компьютером наиболее широкое распространение получили следующие типы пользовательских интерфейсов: командные языки, язык "меню", естественный язык и прямая манипуляция данными. Установилось мнение, что при общении с базами данных (БД) и сходными по сложности и функциям ПС наиболее подходящими для необученного пользователя являются системы меню и ЕЯ-интерфейсы.

В то же время оба эти подхода обладают рядом недостатков. Так, для традиционных ЕЯ-интерфейсов представляют трудности запросы, содержащие слова и синтаксические конструкции, которые система не в состоянии разобрать, а также запросы, лежащие вне компетенции ПС и поэтому не допускающие перевода на внутренний язык ПС. Кроме того, ввод запроса на ЕЯ довольно трудоемок (в отличии от ввода команды или выбора в меню) и требует хорошего владения клавиатурой. Известны недостатки и интерфейсов на основе меню.

.Отмечен появившийся в последнее время подход к проектированию интерфейсов, который позволяет преодолеть основные недостатки, присущие традиционным ЕЯ-интерфейсам и системам меню.

I При этом подходе пользователь вводит запрос к ПС на ЕЯ не в свободной форме, как в традиционных ЕЯ-интерфейсах, а прд управлением интерфейса, который помогает ему при выборе продолжения запроса, обеспечивая ввод только грамматически верных и семантически корректных запросов.

Еа_дтпрпй паи? описаны и исследованы языки на входе и

выходе предлагаемой интерфейсной подсистемы. .

При разработке интерфейса в качестве базовой использовалась ЭС по свойствам химических соединений. Приведенное описание Фактически является моделью, определяющей класс ПС, для которых возможно построение интерфейса, основанного на предлагаемом в диссертации подходе.

, ЭС содержит сведения о структуре химических соединений,, биологических свойствах (активностях) и их причинах (далее Фигурантах). Круг возможных запросов к ЭС довольно широк и содержит, например, следующие:

Какие биологические свойства известии для данного соединения ?

Какие структурные фрагменты являются причиной данного свойства?

Какими свойствами могут обладать соединения, содержащие данные структурные Фрагменты?

Какие соединения содержат данный Фрагмент и не обладают определенной активностью?

Формальный язык запросов ЭС является диалектом языка многосортной многозначной логики предикатов 1-го порядка. Он характеризуется относительно небольшим числом сортов переменных разных типов объектов, запросы о которых и будут обрабдты-заться системой (соединения (С), активности (А), Фрагменты :труктур соединений (Ф), и множества соединений, или химпч^с-сие ряды (Р)).

Отношения между объектами определяются набором двухмест-шх предикатов. Например:

(С =1=> А) и (С =В1=> А) - соединение С обладает свойст-»ом А (экспериментальный Факт) и соединение может обладать :войством (такой Факт ЭС не известен, но ЭС вырабатывает гипо-•езу о наличии этого свойства на одном из шагов своей работы);

ПРИЧИНА(Ф; А) и В_ПРИЧИНА(Ф; А) - фрагмент является при-1Иной свойства или возможной его причиной.

СОДЕРЖИТ(С/Ф; Ф1) - соединение С или Фрагмент Ф содержит |рагмент Ф1 и др.

Произвольная Формула логического языка строится из этих редикатов и имеет вид: ?(1)51Х К(Х). Здесь ?(1)>1Х - префикс апроса (X - кванторV или 3. 1 принимает значения 0, 1 и 2), а (X) - корень. Буквой К, возможно, с индексом, отмечается опросительная переменная.

Префикс выражает тип запроса и интерпретируется одним из ледующих трех способов:

?(0)УХ - "каковы все X, для которых верна формула К(Х)?";

1-3

?(1)3х - "каковы некоторые объекты X, для которых ...?"; ? (2 ))j X - "верна ли Формула К(Х)?".

Корни запроса, являясь замкнутыми Формулами, делятся на: "элементарные булевы" (выражают теоретико-множественные операции, определенные для объектов ЭС (пересечение, объединение, разность)), "элементарные процедурные" (им соответствуют перечисленные выше предикаты) и "смешанные", которые строятся из элементарных корней с использованием логических операций ОН, AND, отрицания и импликации.

Построение подъязыка для конкретной ПС и разбиение его на сегменты формализовано не до конца и на данном этапе не может быть возложено на ЭВМ. Это построение основано на следующем описании в нотации Бэкуса-Наура (Q - произвольное предложение подъязыка).

Q := ТИП_ЗАПР0СА ОБЪЕКТ^ ОПРЕДЕЛЕИИЕ.ОБЪЕКТА^ ТИП_ЗАПР0СА := {Найти/ Найти все/ Проверить, что/...}

ОБЪЕКТ : = { соединение/ фрагмент/ свойство/___}

0ПРЕДЕЛЕНИЕ_0БЪЕКТАо^ := <конкретное_значение(Х> /ПРОСТОЕ ОПРЕДЕЛЕНИЕ.ОБЪЕКТА^/ СОСТАВНОЕ_ОПРЕДЕЛЕНИЕ_ОБЪЕКТАоС

ПРОСТОЕ_ОПРЕДЕЛЕНИЕ_ОБ'ЬБКТА^ : = СПЕЦИФИКАТОР^.ОПРЕДЕ-ЛЕНИЕ_ОБЪЕКТА р Р

' СОСТАВНОЕ_ОПРЕДЕЛЕНИЕ_ОБЪЕКТА(< := ПРОСТОЕ_ОПРБДЕЛЕ-НИЕ_ОБЪЕКТА^/ ПРОСТОЕ_ОПРЕДЕЛЕНИЕ_ОБЪЕКТА^ СВЯЗКА СОСТАВНОЕ_ОПРЕДЕЛЕНИЕ_ОБТ>ЕКТА1^ СВЯЗКА := {и / или }

СПЕЦИФИКАТОР := { который содержит фрагмент/ который не содержит Фрагмент/.../ которое обладает свойством ... }

В этом определении Л и ^ указывают сорт переменной. Нетерминальный символ СПЕЦИФИКАТОР^ строится на основе предикатов Формального языка, аргументы которого относятся к сортам <1 и ($. По одному предикату строится несколько СПЕЦИФИКАТОРОВ в зависимости от того, какая переменная в предикате свободна, а также от наличия отрицания и различных грамматических форм входят щих в СПЕЦИФИКАТОРЫ слов. Так, по предикату С =1=> А будут построены фразы: котор. обладает свойством, котор. не обладава свойством, котор. обладают свойством, ... , котор. присуще соединению, котор. не присуще соединению и т.п.

<конкретное_значение¿ > - это значение ОБЪЕКТА^. Так, для соединений и Фрагментов это будут, как правило, номера, присваиваемые объектам на этапе ввода. Если для соединений существуют удобные и общепринятые названия, то в качестве значений южно применять и их.

На основании приведенных выше правил можно получить, вообще говоря, бесконечное множество запросов к ПС, в которое входят почти все реальные запросы к ПС. Так, например, 1риведенные выше запросы можно записать в виде:

Найти свойства, котор. присущи соединению С.

Найти Фрагменты, котор. являются причиной свойства А.

Найти свойства, котор. могут обладать соединения, котор. содержат Фрагменты Ф1 и Ф2.

Найти соединения, котор. содержат Фрагмент Ф и не облагают свойством й.

Построенное подмножество ЕЯ исследуется как с точки зре-1ия ЕЯ, так и с точки зрения соотношения между ним и языком гредикатов.

Уже в этом относительно небольшом подмножестве ЕЯ пред-:тавлены в той или иной мере многие "недостатки", присущие ЕЯ:

- не удается полностью избежать омонимии;

- на этом подмножестве, также как и во всем ЕЯ, нет юстаточно надежного способа определить, что подразумевал юльзователь в случае употребления в запросе совместно связок I и ИЛИ (проблема расстановок скобок);

- в запросах из подъязыка не всегда можно однозначно вос-:танавить кванторы. Например, требуется ли в запросе Найти соединения, котор. содержат Фрагменты, котор. принадлежат соединениям С1 и С2, чтобы соединения содержали все такие Фагменты или только некоторые.

Рассмотрены различные подходы к решению этих проблем, "ак, например, при восстановлении кванторе ставится кванторУ 1еред объектами, входящими в запрос во множественном числе и :вантор 3 - для объектов в единственном числе. Для специФика-•оров, соответствующих отрицанию предиката, более естественно юсстанавливать квантор V перед объектом в единственном числе иЗ 1еред объектом во множественном. Во фразе котор. не содержат

1-4

Фрагмент квантор будет восстановлен - котор. не содержат ] одного Фрагмента, а во фразе котор. не содержит Фрагменты котор. не содержат некоторые фрагменты.

Жесткая Форма запросов подъязыка не позволяет выразить все нюансы возможных ЕЯ-запросов к ПС. Запрос Какими свойствами обладают соединения, содержащие Фрагмент Ф? допускает три различные трактовки. Можно считать, что требуется найти: (1) все свойства; (2) все, но только общие свойства соединений; (3) для каждого соединения, содержащего Ф, свой список свойств.

Интерпретация в интерфейсе запроса Найти свойства, кото] обладают соединения, котор. содержат фрагмент Ф совпадает (2). Для выражения смыслов (1) и (3) одним запросом не обо{ тись. Так, например, для (1) надо вначале Найти содинени) котор. содержат фрагмент Ф, а затем, если ответом на него б> дет список соединений, например, С1, С4 и С9, надо запросит! Найти свойства, котор. обладает соединение С1, С4 или С9.

Логический язык ПС шире выделенного подъязыка, и не в< возможные запросы к ПС выразимы в интерфейсе. Цель работы сс стояла в обеспечении конечному пользователю возможности зада вать запросы к ПС на ЕЯ. Значительное же число формул требуе знания предметной области (ПО), внутреннего строения ПС и е "кухни". Единственная возможность выражения таких формул на Е состоит в их дословном "прочтении".

При исследовании соотношения между подъязыком и логичес ким языком ПС рассмотрены перечисленные выше классы корней.

Выразимость элементарных процедурных корней обеспечен наличием двух спецификаторов для каждого предиката логическог языка ,а тип кванторной приставки определяет число соответ ствующего объекта. Так, по корню УХс (Хс =1=> А) строим Фраз соединения, котор. обладают свойством А, а по корню Зка (С =1=> Ка) - свойство, котор. присуще соединению С1.

Выразимость булевых корней связана с предикатом СОДЕРЖИТ и спецификаторами: котор. содержит ... и котор. входит в .... остальные операции представлены через С. Например, для пересечения имеем X £ XI О Х2 < = > Х£Х1 и Х£Х 2. Для перевода булевых корней в интерфейсе может потребоваться более одного запроса.

го связано с тем, что на данном подъязыке удобно выражать ннарные отношения между объектами, а булевы операции зачастую таковым не сводятся. Ситуацию с такими корнями иллюстрирует »прос Какие соединения в пересечении с соединением С1 содер-лт Фрагмент Ф?

интерфейсе требуется два запроса

Проверить, что соединение С1 содержит Фрагмент Ф Найти соединения, котор. содержат фрагмент Ф. Для корней, являющихся комбинацией двух предикатов, дока-»но Утверждение о их выразимости в интерфейсе. Исключение вставляют корни двух типов:

ЗУ Р1( X, У) ОН Р2(У. К) и VУ Р1( X, У) АИР Р2(У, К) '1 и. Р2 - предикаты или их отрицания, К - конкретное значе-!е). Этим корням соответствуют, как правило, тривиальные и 1лосодержательные запросы. Подобным запросом является, напри-;р, следующий

?(1) ЗХсЭХ1ф (СОДЕРЖИТ( Хс, Х1Ф) ОЯ ПРИЧИНА( Х1Ф, А)) »ответствующий ему запрос на ЕЯ можно сформулировать гак: Найти соединение, которое содержит фрагмент или этот удгмент является причиной свойства А.

Ясно, что приведенная формула будет истинной для любого 'единения при подстановке в нее фрагмента, совпадающего с 1ИЧИНОЙ свойства А.

В предлагаемом интерфейсе запросы порождаются из словосо-таний и анализируются не после завершения ввода, а по мере юда, с уточнением смысла после выбора очередного сегмента. В язи с этим мало применимы традиционные методы описания и 1язанные с ними методы анализа ЕЯ-высказываний.

Предложена грамматика, названная цепочечной (ЦГ), которая шает поставленные задачи.

Словарь подъязыка образует множество естественноязыковых гментов, на которые заранее разбиты запросы.

В одну его статью помещены, как правило, все допустимые амматические Формы сегмента. Для каждой статьи выделяется едставитель, который и используется в многооконном меню при боре соответствующего сегмента. Например, объединены следу-ие спецификаторы: которое обладает свойством, которое обла-

1-5

дает свойствами и т.д., а также все их отрицания. В качестве представителя этих сегментов используется обобщенная Форма котор. ооладает(ют) свойством(ами).

Конкретные значения объектов в словарь не включены. Вместо них в словаре помещены категории <конкретное соединенно, <конкретный Фрагмент* и др. Обращение к этим категориям при вводе запроса инициирует работу специальной процедуры ввода, своей для каждого типа объектов, которая и осуществляет ввод соответствующих конкретных значений, а также проверку их на допустимость.

Синтаксис подъязыка делится на локальный синтаксис (ЛС) и глобальный синтаксис (ГС).

ЛС определяет потенциальную возможность сегментов языка соединяться друг с другом. Реализован он декларативно, для чего в словарную статью каждого сегмента включен семантический признак сегмента и список признаков, которыми должен обладать сегмент, чтобы его можно было присоединить к данному. Эти признаки называются соответственно входные коннекторы (ВхК) и выходные коннекторы (ВыхК). С каждым сегментом словаря связано число потомков (ЧП), определяющее число сегментов, которые можно присоединить к данному при составлении запроса.

"Рассмотрим фрагмент словаря сегментов базовой ПС.

Сегмент ВхК ВыхК ЧП

Найти н ОЕ, ОМ 1

Найти все н ОМ 1

соединение ОЕ СС, ЗС 3

соединения ОМ СС, ЗС 3

котор. обладает(ют) свойством(ами) СС СА, ЗА 3

котор. входит(ят) в соединение(я СФ СС, ЗС 3

«конкретный фрагмент> ЗФ 0 0

и / или ПР 0 0

Сегмент Найти все может быть началом запроса (коннектор 3) и ожидает после себя сегмент, входной коннектор которого

ОМ, т.е. сегмент с признаком "Объект в Множественном числе" ( соединения, фрагменты, свойства).

Сегмент соединение имеет выходным коннектором СС и СЗ и, следовательно, ожидает' после себя сегменты с признаком "Спецификатор Соединения" или "Значение Соединения", например, спецификатор котор. обладает свойством(ами) или <конкретное соединенно.

Сегмент <конкретный Фрагмент* имеет пустой выходной коннектор. Это связано с тем, что конкретное значение полностью определяет объект и после этого не допускает присоединения новых определений.

Связки имеют признак ПР - "Продолжить". Этот признак не входит в выходные коннекторы сегментов и формируется на основе ГС при анализе запроса.

ГС определяет правила построения допустимых структур из сегментов словаря. Эти структуры представляют собой деревья, наподобие деревьев синтаксической зависимости предложения, но связывают не отдельные словоформы, а целые сегменты. В работе для них применяют термин "Дерево запроса" (ДЗ).

Незаконченному запросу Найти соединения, котар. содержат Фрагмент Ф1 и котор. обладают свойствами соответствует следующее ДЗ (рис. 1).

Найти ОЕ 0

ОМ

2. соединения СС 1

1

котор. содержат СФ 2 С и котор. обладают СА 3

Фрагмент ЗФ свойствами ЗА

котор. является СА 0

причиной свойства ЗА

5 А1

О О

Рис.1. Дерево запроса.

Связка И не образует отдельной вершины, а вписана в вершину с тем определением, которое эта связка присоединяет.

Вершинам ДЗ кроме текстов альтернатив приписаны и характеристики из словаря - ВыхК и ЧП. Первоначально они дублируют параметры словаря, но при добавлении к ДЗ других сегментов значения этих характеристик изменяются.

При описании ГС используются понятия:

Текущая вершина - вершина, присоединеная к ДЗ последней;

Ветвь дерева - цепь, начинающаяся в корневой вершине и заканчивающаяся в вершине, которой ничего не подчинено;

Текущая ветвь - ветвь, идущая к текущей вершине ( 1-2-6);

Открытая вершина - это вершина, к которой возможно присоединение новых вершин либо непосредственно, либо через связку (вершины 2 и 6). В противном случае - это Закрытая вершина. Открытые вершины могут лежать только на текущей ветви ДЗ и отличаются от остальных вершин положительным значением ЧП.

ГС состоит из двух групп правил. Первая группа (ГС1) по построенному началу ДЗ определяет, является ли запрос завершенным или он должен быть продолжен, можно ли его уточнить, присоединив новые определения через связки и/или, каковы признаки сегментов, которые можно присоединить к ДЗ.

В результате работы ГС1 вырабатывается список Активных коннекторов (АК) - признаков, которым должны удовлетворять возможные продолжения запроса - активные сегменты.

ГС1 описывается набором Продукций (приведен Фрагмент для запросов, начинающихся словами Найти и Найти все).

ЕСЛИ текущая вершина открыта, ТО в АК включить ВыхК текущей вершины.

ЕСЛИ текущая вершина закрыта, ТО в АК включить признак К (запрос- завершен).

ЕСЛИ текущая вершина закрыта и на текущей ветви есть открытые вершины, ТО в АК включить признак ПР (продолжить).

ЕСЛИ последней в запрос введена связка, ТО в АК включить РыхК всех открытых вершин текущей ветви.

- 13 -

Вторая группа правил (ГС2) присоединяет активные альтернативы к ДЭ и изменяет параметры, приписанные его вершинам.

д трртурй гллвр излагается описание работы интерфейсной подсистемы и особенности используемого многооконного меню.

Главный экран интерфейсной подсистемы представляет собой многооконное меню. ЕЯ-сегменты, из которых составляются все запросы к ПС, размещены в окнах меню в качестве альтернант для последующего выбора. В каждое окно помещены альтернат!», относящиеся к одному классу, смысл которого отражен в загол.')--ке окна. Так, для базовой ЭС определены окна (рис. 2) :

- СДЕЛАТЬ - содержит начальные фразы запроса, выражавши, его тип: Найти, Найти все, Проверить, что и Пересчитать;

- ОБЪЕКТЫ - соединение, соединения, Фрагмент

- ОПРЕДЕЛЕНИЯ - содержит Фразы: котор. содержит(а - > фрагмент(ы), котор. обладает(ют) свойством(ами) и т.д. При присоединении альтернативы из данного окна к запросу нужная грамматическая Форма определения выбирается автоматически;

- ЗНАЧЕНИЯ - содержит следующие фразы: <конкретное соединенно , <конкретный Фрагмент> и т.д.

- СВЯЗКИ - содержит связки и и или;

- ПРЕДИКАЦИИ - это окно станет видимым только при вводе запросов, начинающихся с Проверить, что.

Помочь Исполнить ■г ПРЕДИКАЦИИ

Откатить Архив

г= СДЕЛАТЬ= Найти Найти все Проверить что

о

СВЯЭКИ=5, или

= ОБЪЕКТЫ=п соединение соединения фрагмент Фрагменты свойство свойства ряд соед. ряды соед.

ЗНАЧЕНИЯ

<конкр. соединение»

Формула Параметры Сбр «——_ ОПРЕДЕЛЕНИЯ ======

котор. содержит(ат) Фрагментеы) котор. входит(вт в соединение(я) котор. являет(»т)ся причиной свойств котор. присущее и) соединению(ям) котор. обладает(ют) свойством(ами) котор. имеет(ют) причиной Фрагмент(и котор. вюдит(ят) в фрагменты) котор. являет(вт)ся тормозом свойств котор. можете гут) обладать свойством котор. входит(ят) в ряд(ы) соединенш котор. кмеет(ют) тормозом Фрагмент!ы котор. включает(ют) соединеннее я) котор. кмеет(ют) возможной причиной I котор. являет(втся) возможным тормоз'

Найти Фрагменты

ЗАПРОС

Рис.2. Главный экран интерфейсной подсистемы

Пользователь набирает свой запрос из альтернатив, расположенных в этих окнах. Формируемый запрос отображается в окне ЗАПРОС, размещенном в нижней половине экрана. Для выбора альтернативы и присоединения ее к запросу надо подвести к ней указатель, заменяющий курсор, и нажать Enter.

В начале работы альтернативы окна СДЕЛАТЬ подсвечены -это активные альтернативы, только они могут служить началом запроса. Интерфейс допускает перемещение указателя только по активным альтернативам, обеспечивая на каждом таге выбор сегментов, которые могут служить реальным продолжением уже введенного начала запроса.

После выбора пользователем альтернативы она добавляется к запросу в окне ЗАПРОС, содержимое многооконного меню изменяется (активизируются и оказываются подсвеченными новые возможные продолжения запроса), а указатель перемещается иа альтернативу, являющуюся наиболее вероятным продолжением запроса.

Так, после выбора пользователем альтернатйвы Найти, активизируется меню ОБЪЕКТЫ, и указатель перемещается в это меню. На рис.2 показано состояние многооконного меню после последовательного выбора пользователем сегментов Найти и фрагменты. Начало запроса Найти Фрагменты воспроизведено в окне ЗАПРОС и активизирована часть альтернатив в окне ОПРЕДЕЛЕНИЕ: котор. входит(ят) в соединение(я), котор. являет(ют)ся причиной свой-ств(д) и другие, относящиеся к определению Фрагментов. Одновременно с этим становится активной и альтернатива <конкретный фрагмент» из меню ЗНАЧЕНИЯ,

Если в запрос нужно ввести конкретные значения (как, например, после ввода Найти все Фрагменты, котор. входят в соединение) , следует выбрать альтернативу <конкретное соединение> из окна ЗНАЧЕНИЯ. В результате запускается специальная процедура, инициирующая открытие на экране окна со списком условных имен всех известных интерфейсной подсистеме соединений. Пользователь Может отметить в нем нужное ему соединение, которое и будет включено в запрос.

Поведение интерфейса при вводе запро'сов, начинающихся словами Проверить, что, несколько отличается от описанного/вы-

ве. После выбора пользователем альтернатив Проверить, что и соединение откроется окно ПРЕДИКАЦИИ:

====, ПРЕДИКАЦИИ .1 I .1

содержит фрагмент(ы) обладает свойством(ами) входит в ряд(ы) соединений может обладать свойством(ами)

Благодаря ему пользователь получает возможность задавать системе ЛИ-запросы:

Проверить, что соединение С1 обладает свойством Й1.

Проверить, что соединение, котор. содержит фрагменты Ф1 и Ф2, не может обладать свойством А1.

Кроме окон на первой строке экрана расположено Операторное меню с перечнем операций по обработке запроса.

Откатить - отменяет последний выбор;

Сброс - очищает окно .ЗАПРОС, восстанавливая начальное состояние многооконного меию;

Параметры - позволяет заменить в запросе ранее введенные конкретные значения на новые;

Архив - сохраняет готовые запросы для использовать их в последующих сеансах и др. Завершенный запрос можно Исполнить.

Многооконность и меню в настоящее время стали.стандартными средствами, широко используемыми при разработке диалоговых интерфейсов. Использование этих механизмов в интерфейсе несколько отличается от общепринятого.

Все окна основного меню интерфейса одновременно присутствуют на экране и не перекрываются, обеспечивая пользователю постоянный обзор многооконного мен». Такой подход позволяет правильно оценить возможности интерфейсной подсистемы и заранее проложить в системе . меню траекторию запроса. В этом одно из преимуществ предлагаемого подхода, но с этим же связано и его основное ограничение - список ЕЯ-сегментов не может быть большим. Окна интерфейсной подсистемы могут служить для отображения больших списков. Для этого поддерживается механизм прокрутки. Но если объем словаря сегментов очень большой, то пользователю постоянно придется / прибегать к этому механизму, что существенно снижает эффективность работы интерфейса.

Системы меню, используемые в большинстве интерфейсных подсистем, являются иерархическими. В отличие от этого, многооконное меню является сетевым. Отдельные его кадры связаны не отношением подчинения, а отношением близости, отражающим членение предложений ЕЯ на части, связанные отношениями синтаксической смежности. При вводе запроса на разных стадиях его Формирования могут происходить многократные возвраты к одному и тому же кадру. Эти циклы позволяют рекурсивное наращивание запросов (.. . соединение, котор. содержит Фрагмент, котор. является причиной свойства ... и т.д.) и порождают,« в принципе, бесконечный список структурно различных видов запроса.

Кроме того, предложенное меню недетерминироваио. Если в традиционных системах выбор альтернативы однозначно определяет следующий кадр меню, то в многооконном меню после такого выбора активизируется, как правило, несколько кадров. И выбор пользователем продолжения запроса требует двух шагов: сначала из нескольких возможных кадров меню надо выбрать требуемый, а затем в нем выбрать нужную альтернативу.

Чктврстдя_сдава посвящена вопросам программной реализации

интерфейса.

Интерфейсная подсистема разработана для ПК IBM PC/XT или AT и компьютеров, совместимых с данными. Для ее работы требуется цветной дисплей, возможна реализация интерфейса с использованием манипулятора "мышка".

Исходный программный текст интерфейса содержит более 4,5 тыс. строк на языке Turbo Pascal 5.0 (TP). Исполняемый код занимает 65 Кбайт. Словари системы, содержащие лексику конкретного приложения, расположены на жестком диске.

Программа, реализующая интерфейсную подсистему, может быть условно разделена на две части - инициализирующую и исполнительную.

Инициализирующая часть содержит процедуры, которые считывают с внешних носителей словарь и параметры окон многооконного меню и переводят их в соответствующие внутренние структуры. При этом учитываются значения переменных, определяющих базовый ЕЯ и текущую ПС.

Наряду с алгоритмами в диссертации описаны и основные-структуры данных. Выбор каждой структуры обоснован внутренними особенностями данных и способом их использования.

Подробно рассмотрена организация словаря ЕЯ-сегментов. Учитывалось, что элементы словаря имеют существенно переменную длину (от 1 до 60 символов), допускают различные грамматические Формы (например, у спецификаторов до 28 таких Форм) и т.д.

Принято решение все ЕЯ-выражения альтернатив записывать подряд в один обший массив - POOL. Для доступа к ним используется индекс, каждая запись которого имеет постоянную длину и содержит указатель на начало альтернативы, ее длину, а также сведения, составляющие ЛС. В текст альтернативы включена управляющая информация, позволяющая делать необходимые грамматические согласования, сочинительные сокращения, Формировать отрицание и т.д. Например, спецификатор кагор. обладает(ют ' своПством(ами) хранится в виде котор/облада(27)\сво/)ств(5!. Числа в скобках (условные) указывают на словообразовательный класс словоформы и при выводе на экран заменяются на соответствующее окончание в зависимости от числа. Разделители (/ и Ч) позволяют модифицировать спецификатор.'

Одним из основных требований, которым должна удовлетворять интерфейсная подсистема, претендующая на достаточно широкое применение, является ее адаптивность. В работе под этим понимается интерфейс, обеспечивающий следующие возможности:

1) В рамках Фиксированной предметной области и ПС необходимо уметь подстраиваться к изменяющимся возможностям ПС.

Усложнение допустимого формального языка запросов ПС, включение новых классов формул в компетенцию ПС обеспечивает ЛС, позволяя без особого труда включать в формальный язык новые предикаты. Несложная настройка глобального синтаксиса позволяет регулировать допустимую разветвленность и вложенность определительных-конструкций в запросах к ПС.

2) Интерфейсная подсистема должна обеспечивать в рамках одного типа ПС относительно легкий переход к различным ПО. Этот переход не требует изменений в основном программном обеспечении и сводится к подготовке новых словарей. Настройки иогут потребовать процедуры, осуществляющие ввод конкретных

значений, из-за изменения типа значения фигурантов (например, целый или действительный) или границы допустимых значений. Для фигурантов, значения которых задаются перечислением, может измениться организация этого списка (линейный, иерархический и ДР.).

3) Интерфейсная подсистема не должна ограничиваться одним типом ПС. Возможна настройка ее на другие ПС. Этот переход облегчается разделением процесса перевода запроса во внутренний язык запросов ПС на два этапа. На первом этапе не используются особенности конкретной ПС и результатом его работы является достаточно универсальная структура - дерево запроса.

Переход от ДЗ к формальному языку запросов ПС требует переделки алгоритмов, строящих по ДЗ соответствующую Формулу внутреннего языка ПС.

4) Особое требование связано с обеспечением многоязычнос-ти, т.е. с возможностью Формулировать запросы на подмножествах различных ЕЯ. В данном случае наиболее важным является реализация русского и английского вариантов. На содержательном уровне эта возможность связана с особенностью цепочечной грамматики, которая позволяет унифицировать морфологический и синтаксический этапы обработки для различных ЕЯ. Поэтому переход на другой ЕЯ оставляет неизменными все основные структуры данных и алгоритмы.

ЗАКЛЮЧЕНИЕ ПО РАБОТЕ

Перечислим основные задачи, которые были поставлены и решены в диссертации.

1.Проанализированы различные методы организации чело-векомашинных интерфейсов.

2.Предложен подход к проектированию интерфейсных подсистем, призванный ликвидировать недостатки, присущие традиционным ЕЯ-интерфейсам, и объединить в себе преимущества таких интерфейсов и интерфейсов на основе меню.

3.Сформулированы и обоснованы требования к подмножеству ЕЯ, позволяющему применить для ввода запросов технику многооконного меню.

- 19 -

4.Сформулированы требования и приведены примеры ПС, для которых возможно построение интерфейсной подсистемы на основе предложенного подхода.

5. Предложен эвристический алгоритм построения подъязыка для класса ПС и способ его членения на естественноязыковые сегменты, предлагаемые в качестве альтернатив для выбора в многооконном меню.

6. Исследованы свойства и изобразительные возможности подъязыка, построенного для модельной ПС.

7.Разработан формальный механизм (цепочечная грамматика) для описания подмножества ЕЯ, опщ .к'дийся на разбиение подмножества на словосочетания и позволяющий в процессе ввода запроса строить структуру запроса, предсказывать возможные продолжения для введенного начала запроса, единообразно описывать подъязыки различных ЕЯ.

8.Разработан алгоритм перевода естественноязыковых запросов на язык предикатов первого порядка.

9.Осуществлена программная реализация интерфейсной подсистемы, основанной на перечисленыя . решениях. Эта реализация включает б себя разработку структур данных, создание вспомогательных утилит и обеспечивающих подпрограмм, создание подпрограмм, реализующих основные алгоритмы интерфейсной подсистемы.

10.Разработанная подсистема апробирована в хачестве интерфейса к ЭС по свойствам химических соединений

Основные результаты диссертации отражены в публикациях:

1.Радковский Г.Н. Диалог с экспертной системой типа ДСМ на основе многооконного меню //Семиотические аспекты Формализации интеллектуальной деятельности. Всесоюзная школа-семинар, г.Боржоми, 1988г.- И. - 1988. - С. 217-219.

2. Радковский Г.Н. Бстественноязыковый интерфейс с БД на основе многооконного меню.// 17 Всесоюзный научный семинар "Системные исследования ГАСНТИ" (г.Вильнюс,1989г.), часть 2. М.: ВИНИТИ, 1989. - С.51-53.

3. Радковский Г.Н. Естественноязыковые интерфейсы на основе многооконного мешо// Итоги науки и техн. Сер. Информатика ВИНИТИ. - 1990.- Т.15. - С. 170-190