Программная система конструирования лингвистических процессоров

Трапезников, Сергей Петрович

Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Программная система конструирования лингвистических процессоров

кандидата технических наук: Трапезников, Сергей Петрович
город: Новосибирск
год: 1990
специальность ВАК РФ: 05.13.11

Автореферат по информатике, вычислительной технике и управлению на тему «Программная система конструирования лингвистических процессоров»

Автореферат диссертации по теме "Программная система конструирования лингвистических процессоров"

АКАДЕМИЯ НАУК СССР

ордена Ленина Сибирское отделение Вычислительный центр

На правах рукописи

ТРАПЕЗНИКОВ Сергей Петрович

УДК 681. 3. Об

ПРОГРАММНАЯ СИСТЕМА КОНСТРУИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ ПРОЦЕССОРОВ

05. 13. 11 - матенатическое и программное обеспечение вычислительных машин, комплексов, систем и сетей

АВТОРЕФЕРАТ

диссертации иа соискание ученой степени кандидата технических наук

НОВОСИБИРСК - 1990

Работа выполнена в отделе систем информатики вычислительного центра СО АН СССР.

Научный руководитель - кандидат Физико-математических наук

А. С. Нариньяни

официальные оппоненты - доктор технические наук, профессор

Г. Д. Чшшн

Ведущая организация - Институт кибернетики АН ЭССР.

Защита состоится " 5 " июня 1990 г, в Ш30 часов на заседании специализированного совета К 002. 10. ог в Вычислительном центре СО АН СССР по адресу: 630090, г. Новосибирск, пр. Ак. Лаврентьева, б.

С диссертацией можно ознакомиться в читальном зале Отделения ГПНТБ (Новосибирск, пр. Ак. Лаврентьева, 6)

кандидат Физико-математических наук Г. Г. Степанов

Автореферат разослан

мая 1990 г.

Ученый секретарь специализированного кандидат физико-математических наук

! ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

I Актуальность дроблены

| Значительное расширение парка эрн в последние годы, проникновение компьютеров, в особенности персональных, практически во все сферы человеческой деятельности остро поставило вопрос о средствах и способе взаимодействия с ЭВН пользователя, не являющегося профессионалок в области вычислительной техники. Наряду с прикладными системами, обладающими развитым специализированным высокоуровневым интерфейсом, существует класс систем, в которых наиболее адекватным средством взаимодействия с пользователем является естественный язык (ЕЯ).

р связи с этим особую актуальность приобретает создание лингвистических процессоров (Л-процессоров), являющихся одним из важнейших компонентов ЕЯ-интерФейса. Л-цроцессор сложный, многопаранетрический программный комплекс, промышленная разработка, отладка и сопровождение которого является достаточно трудоемкой задачей. Ее решение практически невозможно без разработки технологии проектирования прикладных Л-процессоров, предназначенных для различных областей применения, а также создания инструментальных средств поддержки такой технологии.

Цель работы

Целью диссертационной цабота является разработка и реализация системы технологической поддержки конструирования Л-процессоров. Система включает в себя набор инструментальных средств для построения, отладки и сопровождения Л-процессоров, ориентированных на разные предмеэтше области (ПО) и различные естественные языки.

Научная новизна

Разработана и реализована система (программная Фабрика), предназначенная для производства Л-процессоров, которые могут быть использованы в качестве автономных интерфейсных модулей в различных прикладных системах.

Разработаны продукционные языки, предназначенные для

спеюиикащш этапов работы Л-процессора: лексического анализа, построения дерева разбора, генерации выходлого представления. Эти языки, являясь специализировапшгш, вместе с тем могут бить испоиъзовапы и для других целей, например, для организации логического синода в простак экспертных системах.

Предложен технологический цикл созд:.д «я Л-проиессора в рамках построенной Фабрики. Он включает в себя Формирование словаря, конпоновку Л-процессора, отладку и отторгепие готового продукта.

Создана серия Л-процессоров, предназначенных для различных ПО и инексдах различные выходные языки. Среди низ реляционный язык запросов к базе данных (БД), командный язык управления роботом, входной язык пакета прикладных программ, язык программирования, сформирована библиотека групп продукционных правил, соответствующих самостоятельным языковым явлениям - такие группы ногут быть использованы как строительные блоки при "сборке* лингвистического обеспечения очередного Л-процессора.

Практическая значимость

Фабрика реализована в полном объеме на языке Pascal в операционных системах ССР/Н-вб, KS-DOS, а также UHIX на 32-разрядноя ЭВМ LABTAH 3215. Ее разработка и реализация проводились по программе проекта СТАРТ, выполнявшегося по заказу ГКНТ и Президиума. АН ССОР (постановление Н 101/46 от 19. 03. 65). Система вошла в состав программного обеспечения, разработанного временным научно-техническим коллективом СТАРТ для макета системы "КЛРС", который был принят Межведомственной комиссией.

Фабрика используется в ряде организаций, в том числе ВЦ СОАЕ СССР (г.Новосибирск), ИЗиОПП СОАН СССР (г.Новосибирск), государственной научной Фирме "Интеллектуальная технология".

Для эксплуатации Фабрики не требуется программистской квалификации - в роли конструктора должен выступать специалист в конкретной ПО. Время разработки очередного Л-процессора зависит от сложности ПО и объема словаря: для подготовленного конструктора оно варьируется от одного дня до месяца.

Апробация работа и публикацгщ

Результаты работы докладывались на III всесоюзной конференции "Автоматизация производства систем программирования" (Таллинн, 1906), на Нездународноа рабочей конференции . по комплексным паучккм проектам кнп-1 и КНП-г (Сноленипе, 1986), на II Международной конференции AIHSA'86 (Варна, 1986), на Республиканской конференции "Цроблеино-ориентиро-ванные диалоговые системы" (Батуми, 1983), на I .Всесоюзной конференции по искусственному интеллекту (Переславль, 1903), на Всесоюзном семинаре "Модели общения-вв" (Паланга, 19вв), на семинаре ВЦ СОЛН СССР.

По теме диссертации опубликовано 11 печатных работ.

ООЪем работы

Диссертация состоит из 6 глав, введения, заключения, списка литературы, содержащего 77 наименований, и приложения. Общий объем работа - 99 страниц текста, включающего б рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выполненной работы. Рассматриваются различные подходы, применяемые к построению л-ироцессоров, я выделяется способ анализа текста для некоторой ограниченной По, при которой опора делается на семантику сообщения, а синтаксису отводится вспомогательная роль. Излагаются принципы, положенные в основу данного подхода:

- разделение Л-процессора на универсальную и адаптируемую части;

- использование семантически-ориентированного анализа;

- организация процесса анализа снизу-вверх. Обсуждаются вопросы построения Л-процессоров, в частности, подчеркивается необходимость создания технологии для массового производства Л-процессоров.

Данная работа является развитием проекта ЗАПСИБ, в рамках которого в лаборатории искусственного интеллекта ВЦ СОЛН

СССР ведутся исследования по созданию Л-процессоров.

Э первой главе представлена структура Л-процессора, состоящего из продукционного компонента и словаря. рассматриваются используемые продукционные языки и описываются продукционные программы, реализующие этапы работы Л-процессора. Кроме того, даются при* е^-ы л-процессоров, сконструированных с помошыо фабрика и декоястрирующих разнообразие входных языков и форм выходного представления.

Л-процессор ТЕЛЕ предназначен для обработки запросов к БД, содержащей информацию о телепередачах на текущую неделю. 3 набор атрибутов базы входят: название передачи, жанр, день, номер программы, время начала и выходной текст ответа о передаче. Л-процессор обрабатывает запросы, включающие:

- названия передач ("Зремя", "В субботу вечером");

- их жанр ("научно-популярная", "музыкальная");

- временные промежутки ("после 1Н часов до 7 вечера", "днем", "со вторника по пятницу", "по будням", "кроне среды");

- указания времени, апеллирующие к текущему дню или моменту времени ("сегодня", "два дня назад", "послезавтра", "через два часа").

База данных поддерживается с помощью системы программирования СЕТЛ. Л-процессор генерирует Фрагмент программы на языке программирования СЕТЛ. Этот Фрагмент подключается к телу стандартного модуля, при исполнении которого происходит обращение к базе и выдача ответа.

Примеры обрабатываемых запросов: "Какие спортивные передачи можно увидеть со вторника по субботу после программы "¡Время" до первой программе?", "В какие дни есть дневные музыкальные передачи для детей?".

Следующий пример демонстрирует применение подобных процессоров в САПР. В данном случае Л-процессор использован в качестве интерфейсного модуля в системе НИКРОШРИЗ, разработанной в Институте кибернетики АН ЭССР.

Одна иэ версий этой системы предназначена для автоматизации проектирования редукторных валов. В системе существует специальный модуль ННКРОЭКСПЕРТ, который в диалоговом режиме запрашивает у пользователя значения следующих параметров:

скорость вращения вала, его мощность, иарку стали, из которой вал изготовлен, наличие или отсутствие консольного конца, кол5{чество зуОчатых колес. После пзода этик параметров запускаются программы, рассчитавакхцие и рисугядие соответствующий вал.

В систему был добавлен модуль, который вместо обращения к НИКРОЭКСПЕРТУ вызывает Л-процессор, передавая ему задание по конструировании вала, сформулированное в произвольной ес-тественно-язиковой Форме. Л-процессор переводит это задание в Формальное представление, которое затек преобразуется к виду, необходимому для дальнейшей работы системы НИКРОПРИЗ. Кроме того, Л-процессор контролирует наличие в запросе всех необходимых параметров и в случае неполноты задания видает соответствующее предупреядение. Следующая Фраза сяуяит примером входного задания: "сконструировать вал, стоящий на двух подшипниках, имеющий скорость вращения Рооо об/кин, мощность 40 Квт. Вал без консольного конца с двумя зубчатыми колесами сделан из стали марки "40Х".

Выходным языком Jl-процессора РОБОТ является язык управления экспериментальной системой ROBOT, разработанной в Институте технической кибернетики (Братислава). Рассматриваемая По включает в себя:

- робота, который по указанию диспетчера иовет перемещать объекты и выдавать информацию о ште;

- объекты, например: контейнер, сумка, большая (зелезпая или деревянная) коробка, маленькая (черная, белая, зеленая) коробка;- —

- места размещения объектов: пункт --выдачи и приема, склад, в котором находятся полки, ящики и свободная площадка;

- отношения, связывающие кажды& объект с определенным местом, например: "сумка с полки", "коробка, расположенная в ящике".

В естественно-языковом задании-директиве для робота необходимо: а) идентифицировать объект, описание которого состоит либо из адЪективов ("большой", "черный"), либо из указания места ("лежащий на полке", "из ящика"), либо из совокупное™ этих средств ("большая коробка, которая лежит на

полке"); б) распознать перенекекие, которое нукно произвести ("возьми", "отнеси на площадку", "выдай"). Кроне директивы диспетчер иогет задавать вопросы о местоположении объектов ("Где стоит контейнер?"), о наличии объекта в указанной месте ("Что лежит па попке?", "КакоЛ предмет ти деркииь?", "Дернить ии ты сумку?"), о характеристик- объекта в указанном место ("Какого цвета коробка, на»:-;; яцаяся на складе?"). Ниае приводится пример директивы и соответствующего ей представления да объектном языке:

"Возьми большую иелезную коробку, левадую на полке!"

Аг (ерь\г1 :иа(ер£>у1, еи2) ) &И(ерЪу1) ! Типовой Л-процессор представляет собой совокупность продукционна модулей (см. рис. 1) и словарь.

ЕЯ-тексг

Рис. 1

В результате последовательной работы этих модулей входная фраза преобразуется к некоторому Формальному виду. Обеспечение совместимости входных и выходных данных различных продукционных модулей достигается за счет введения понятия "компонента" как универсального объекта всех используемых продукционных языков.

Компонент представляет собой структуру с поименованными полянн - характеристиками. Каждону компоненту приписан неко-

торый тип, определяющий конкретный набор характеристик. Характеристики используются для храпения семантических признаков компонента, для организации процесса обработки входного текста и, кроме того, для Формирования Фрагментов генерируемого формального представления. Работа продукционных кодулей состоит в преобразовании множества компонентов: порождении новых компонентов и удалении существующих, анализе значений характеристик и их модификации.

номенклатура компонентов и их структура зависит от области применения Л-процессора и его сложности. В то яе время существует базовый набор компонентов, используемый независимо от ПО для обработки регулярных конструкций естественного языка.

Продукционные модули соответствуют определенным этапан обработки входной Фразы:

- лексическому анализу,

- основному анализу,

- генерации.

Приведенный список этапов не является неизменным - их количество может варьироваться в зависимости от ПО и от сложности конструируемого процессора. Например, после лексического анализа может быть включен этап сборки словоконпдек-сов.

На этапе лексического анализа выполняется преобразование последовательности лексем входной Фразы в цепочку компонентов. Продукционное правило задает множества символов правого и левого контекста, а также множество символов, из которого формируется лексема. В зависимости от класса лексемы порождаемому компоненту приписывается соответствующий тип, указываемый в правой части правила.

Сборка словокомплексов, в отличие от других этапов, реализуется фиксированным модулем, не включающим настрояку с помощью правил. Информация о принадлежности некоторого слова словокомплексу, а также о семантических характеристиках самого словокомплекса находится в словаре. На этом этапе последовательность компонентов, содержащих лексемы, которые составляют словокомплекс, заменяется соответствующим компонентом из словаря.

На этапе основного ьпаяиза глаголилатся построение (сыи-зу-взерг) дерева разОора. Каждое продукционное правило про-граягы сркксгов:о к некоторой подцепочке, которая п случае исполнения правила уваляется, а на ее несто подставЯ5»лтся компонента, указанные в прасой части пр-^,.:1ла. крона такого "линейного" преобразования с понсцью слсг,.-.» *;ъной конструкции языка строится древесная струт-ура. Этап основного аиаяиза заканчивается, когда и я-почка компонентов сворачивается в один компонент, являеднася корней дерева.

При генерации выполняется "свертка" дерева от листьев к корн», Для некоторой вершам дерева, все сыновья которой является листьями, отыскивается правото, и результате применения которого листья оторасьшаотея, а остаз2;:ЯСЕ узел наследует некоторую информацию, хранившуюся в отброщенних верЕИ-пах. при этом формируются фрагменты результирующего Формального представления. Генерация закапчивается, когда все дерево "свернулось" в одну верншзу. одна из строковые характеристик этоа вершшы содержит выгодной текст, который и является результатом работы й-процессора.

Выделение генерации 8 самостоятельный этап обеспечивает необходимую гибкость в настройке Л-процессора на конкретный синтаксис выходного языка. Для одного I! того ке дерева разбора с помоцыо замены правил генерации ногут быть получены разнообразные Формальные представления исходного текста.

Для продукционных программ болыаое значение имеет порядок работы правил. Выбор конкретной дисциплины их применения определяется характером процессов, описываемых с помощью продукционных программ, а такхе соображениями эффективности. Выделяется поименованная структурная единица программы -группа правил, с точки зрения лингвиста, группы соответствуют самостоятельным языковым явлениям, с точки зрения программиста - поддерживают модульность продукционных программ. Существует двухуровневый порядок применения правил: последовательность исполнения на уровне групп и определенная дисциплина внутри группы (используется схема выбора правил в нормальных алгоритмах Маркова).

Во второй главе описываются возможности Фабрики Л-процессоров. Приводится технологический цикл кон-

струиговапия Л-процессора, состоящей из следуггщпя этапов: ;.ор»птровапия словаря, написания правил продукционного компонента, отладки и отторяения готового продукта. Все этапы фекттаяо поддерживаются средствами Фабрики.

фабрика, представленная па рис. г, состоит следукеэтз члстеЯ: продукционной подеистеки, словарной подсистезш, под-систеки отладки л монитора.

Рис. г

Продукционная подсистема, обеспечивггещая работу с несколькими продукционными языками, включает в себя экранный редактор для формирования продукционных программ, а такие компиляторы, переводящие эти программы во фрагменты на языке Pascal.

Словарная подсистема предназначена для создания и редактирования словаря. Элемент словаря представляет собой тройку: основу, ключ, словарную статью. Структура словарной статьи полностью совпадает со структурой компонента, фактически словарная статья - это компонент некоторого типа с определенными значениями характеристик.

Ключ - это пара целых чисел, указывающих минимальное и максимальное количество букв, которое может присоединять

данная основа. Такое представление позволяет компактно хранить больпое количество словоформ. В то же время для ограниченной по указанный способ разбиения слова не вызывает коллизий и в подавляющем большинстве случаев позволяет однозначно распознать лексему, не прибегая к традиционному морфологическому анализу.

Подсистема отладки включает в себя банк тестов и набор инструментальных отладочных средств. Банк тестов служит для отладки Л-процессора и демонстрации его работоспособности. Тесты должны, с одной стороны, хорошо представлять все возможные сочетания смыслов и их естественно-языковые способы реализации, с другой стороны, проверять не только каждую группу правил, но и как можно больше комбинаций правил. Во время тестирования Л-процессора конструктор может использовать различные отладочные режимы. Эти режимы позволяют отслеживать процесс обработки Фразы (с разной степенью детальности), сохранять результат запуска теста, распечатывать разнообразную отладочную информацию.

Нонитор поддерживает взаимодействие с конструктором по принципу иерархических "меио", обеспечивает связь различных компонентов фабрики, вызывает компиляторы для продукционных программ, инициирует формирование Л-процессора, управляет запуском тестов.

Для удобства конструирования введено понятие версии. .Версия представляет собой сочетание определенного набора продукционных правил, некоторого банка тестов и конкретного наполнения словаря. Каждая версия имеет идентифицирующее имя, указав которое, конструктор не заботится о реальных именах Физических Файлов, а оперирует содержательными терминами: "словарь", "правила лексического анализа" и т. п. При проведении экспериментов конструктор располагает возможностью порождать новые версии, перекачивая в них информацию из уже существующих версий и/или вводя ее заново. ^Версии могут Формироваться для различных Л-процессоров или отражать разные стадии конструирования одного Л-процессора.

Когда результата тестирования позволяют убедиться, что построенный Л-процессор удовлетворяет предъявляемым требованиям, конструктор вызывает директиву, обеспечивающую оттор-

жение Л-процессора. На основе соответствующей версии Формируется л-процессор, который уже не содержит специальных средств для обеспечения работы а отладочных режимах, что делает его более компактным и эффективным. Этот Л-процессор, состояли«! из продукционных модулей и словаря, и является конечным результатом работы конструктора.

В третьей главе на примере конкретного Л-процессора, обрабатывавшего запросы х реляционной базе данных, описываются основные ¡ааги и приемы конструирования. Вводится содеряательная трактовка компонентов и продукционных правил, показглзаются подходы к обработке различных языковых конструкций.

Обсуждаются вопросы составления словаря, рассматривается структура словарной статьи, приводятся примеры формирования словокомплексо"в.

В состав продукционной подсистемы Фабрики входит Библиотека правил, которая содержит группы правил, предназначенные для обработки как регулярных естественно-языковых конструкций , так и уникальных, нестандартных явления языка. Первые, так называемые "базовые" группы (они насчитывают 90-120 правил), включаются в каждый Л-процессор, вторые - "специальные" - используется при построении нового Л-процессора по мере необходимости.

В четвертой главе описывается специализированный вариант фабрики, предназначенный для автоматизированного построения ЕЯ-интерфейса с СУБД <fflASE III Plus. Это наглядная демонстрация того, как за счет сунення области применения универсального инструментария удается достичь значительного повышения уровня автоматизации.

Построение такого интерфейса к конкретной БД включает в себя следующие шаги:

- создание спецификации БД;

- настройку продукционного компонента Л-процессора;

- формирование словаря.

В спецификации фиксируется список Файлов, составляющих БД, связи между их атрибутами, а также - прагматика некоторых атрибутов.

Существуют универсальный "каркас" продукционного компо-

1 3

иента вместе со специализкрооапноа библиотекой групп правил, а также универсальный словарь, которые используются в качестве "заготовок" при построении конкретного Л-процессора.

"Каркас" включает в себя правшха в обобщенном виде без привязки к конкретным атрибутам, В результате настройки текста продукционных программ модифицируются таким образом, что в условия правил добавляются указания на атрибуты, для которых эти правила применимы.

Универсальный словарь содержит общеупотребимую лексику (отношения, отрицания, незначимые слова) и выступает в качестве начального наполнения словаря конструируемого Л-про-цессора. При этом некоторые словарные статьи (например, для слов, относящихся к Фиксированным семантическим гнездам: дата, стоимость, вес) являются параметрическими и конкретизируются на основе спецификации.

В результате автоматической "прокачки" базы данных и анализа ее содержимого выполняются следующие действия. Во-первых, уточняется спецификация БД, возможно, с привлечением дополнительного опроса конструктора. Во-вторых Формируются продукционные правила, отражающие специфику данной БД. Автоматически сгенерированные правила внесте с группами правил, выбираемыми из библиотеки на основе содержимого спецификации, добавляются к "каркасу*, таким образом продукционный компонент настраивается на данную ПО. в-третьих, программа автоматического пополнения словаря обнаруживает среди значений атрибутов слова и помещает их в словарь с соответс-твукядими словарными статьями, разбивая при этом на основы и Флексии (поскольку разбиение может быть неточный, предусмотрен режим ручной коррекции).

После этого конструктор приступает к ручной доводке словаря и тестированию.

При пополнении словаря конструктору предоставляется возможность ввода названий атрибутов, незначимых слов, сло-вокомплексов, а также синонимов к словам, уже находящимся в словаре.

Составляется список тестов для проверки корректности настройки продукционного компонента и полноты словаря. Тестирование выполняется в автономном режиме, в качестве ре-

зультата обработки теста пользователю предъявляется текст на специальном промежуточном языке. Этот язык, будучи существенно более высокого уровня, чем язык запросов dBASE, легко позволяет оценить правильность результата.

Для обработки ЕЯ-запросов к БД под управлением dBASE запускается построенный Л-процессор, генерирующий программу на языке 4BASE. Далее СУБД исполняет эту програнму и выдает желаемый ответ.

В пятой главе обсуждаются возможности использования средств Фабрики при создании экспертных систем. При этом рассматриваются несколько точек приложения.

Наиболее очевидная - обеспечение естественно-языкового интерфейса к экспертной систене. Имеется в виду не только возможность Формулирования запроса к экспертной системе на естественном языке с использованием соответствующего Л-про-цессора, но и выдача ответа и объяснений в естественно-языковой Форме (в этон случае решается задача синтеза текста).

Кроме того, Л-процессор может быть использован для ввода экспертных знаний на естественном языке. Результатом его работы являются продукционные правила, составляющие "начинку" экспертной систены.

Наконец, продукционные правила сами ногут быть носителями экспертных знания, и в этом случае продукционные модули Л-процессора служат для организации логического вывода. Если эти правила пополнить правилами, обеспечивающими распознавание текстов на естественном языке, то полученный Л-процессор решает две задачи: преобразует входной текст в некоторое внутреннее представление, а затем обрабатывает его на основе своих экспертных знаний.

Описывается реализация макета экспертной системы, с помощью которой решается задача диагностики отклонений от нормального технологического процесса, происходящего при плавке чугуна в доменной печи.

В шестой главе даны технические характеристики Фабрики и Л~процессоров, а также затронуты некоторые черты реализации.

Существование продукционных модулей в виде текстов программ на языке Pascal, локализация машинной зависимости,

а также кесткие ограничения, накладываемые на выбор употребляемых конструкций языка позволяют использовать Фабрику в качестве кросс-скстены: эти тексты переносятся на другую патину, имеющую Pascal-компилятор, и на ней генерируется работающий Л-цроцессор.

Словарь представляет собой набор файлов данных, созданных операторами ввода/вывода языка Pascal. В ряде случаев эти файлы оказываются совместимыми для различных ОС, как, например, дпя ССР/Н-86 и HS-DOS, в других - при переносе может потребоваться некоторая регулярная перекодировка.

Работа со словарем организована по принципу виртуальной памяти. Буфер словаря - это пространство оперативной памяти размером в несколько блоков словаря, выделенное для доступа к словарной информации.

количество памяти, занимаемой Л-процессорои во время работы, зависит от количества продукционных правил и от размера буфера словаря (увеличивая его, ны уменьшаем количество обменов, что значительно сказывается на быстродействии Л-ироцессора). Существующая архитектура системы рассчитана на л-процессоры, содержащие несколько сотен правил, со словарями в несколько тысяч слов.

ОбЪен исходных текстов составляет 38 ООО строк на языке Pascal. Для работы Фабрики необходимо 320 Кбайт оперативной памяти. Л-процессор требует от 160 Кбайт и выше в зависимости от количества правил. Быстродействие Л-процессора с 20О правилами и словарем в тысячу слов, работающего на IBM PC AT, - 1 секунда яа 3 слова входной фразы.

3 заключении сформулированы основные результаты, полученные в диссертации.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. разработана и реализована программная Фабрика, предназначенная для производства Л-процессоров. Сконструированный и отторгнутый Л-процессор является автономным программным модулем, который может быть использован для построения ЕЯ-интерФейса с некоторой прикладной системой.

2. Реализован набор продукционных языков, предназначен-

bus для исполнения последовательных преобразований структур патигх: преобразования текста в древесную структуру, манипулирования древеснини структурами, трансформации древесной структуры в текст, показаны способы применения зт'.хх языков для спецификации этапов работ« Л-процессора.

3. Разработана технология построения Л-процессоров средствами фабрики. Эта технология включает в себя конструирование, отладку, отторжение готового программного продукта, а также возможность последующей доработки изделия после опытной эксплуатации.

1. Реализована специализированная версия Фабрики для автоматизированного построения ЕЯ-интерфейсов с СУБД dBASE Ш Plus.

5. Проведена серия экспериментов по созданию различных Л-процессоров в райках фабрики. Практически выявлены преимущества и недостатки семантически-ориентированного подхода. Подтверждена целесообразность применения разработанной технологии для промышленного создания прикладных Л-процессоров.

ОПУБЛИКОВАННЫЕ РАБОТЫ ПО ТЕКЕ ДИССЕРТАЦИИ

1. Левина Е. Л. , Трапезников С. П. Подсистема морфологического анализа в системе слойАРЬ//Прикладные методы информатики. - Новосибирск, 1980. - С. 10Н-111.

Н. Трапезников С. П. ТОР - подсистема тестирования и отладки в развитой системе программирования//Автоматизированные рабочие места интеллектуальной деятельности. -Новосибирск, 1985. - С. 67-1СЮ.

3. Трапезников С. П. Система построения лингвистических про-

чее соров//Тез. докл. Международной конф. по КНП-1 и ' КНП-г. - Смоленице, Чехословакия, 1986. - с. 133-136.

4. Трапезников С. П. Система технологической поддержки кон-

струирования прикладных лингвистических процессоров //Тез. докл. Ill всесоюзн. конф. Автоматизация производства систем программирования. - Таллинн, 1986. - с. 139-1«.

5. TrapeznlKov S. P. The System For Тйе Development of

Linguistic Frocessors//Artificlal Intelligence II:

Methodology, systems, applications. - Amsteraam:North-Holland, 1967.- P. 33E-339.

6. Трапезников С. П. Об окном способе организации библиоте-

ки. - УСиН. - 1987. - Н 1. - С. 80-83.

7. Трапезников С. П. , Диненберг ф. Г. Система технологической

поддержки конструирования естественно-языковых интерфейсов //Тез. докл. I Эсесоюзн. конф. по ИИ. -Переславль, 198в. - Т. 3.- С. 194-199. а. Трапезников С. П. , якно Г. Н. ЗАПСИБ: от лингвистического процессора к конструктору экспертных систем // Тез. докл. I Всесоюзн. конф. по ИИ. - Переславль, 1988. -Т. г. - С. 527-531. 9. Диненберг ф. Г. , Трапезников С. П. Фабрика лингвистических процессоров//Технология интеллектуальных систем. -Новосибирск, 1988. - С. 63-76.

10. Трапезников С. П. , Яхно Т. Н. Технологический комплекс

ЗАПСИБ как основа построения конструктора экспертных систему/Технология интеллектуальных систем. - Новосибирск, 1988. - С. 77-85.

11. Диненберг <р. Г., Левин Д. Я. , Нариньяни А. С. , Трапезников С. П.

Средства построения лингвистических процессоров как элементов диалоговых систем // Проблемно - ориентированные диалоговые системы: Тез. докл. / Респ. конф. -Тбилиси, 1988. - С. 55-59.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00