автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Естественно-языковое взаимодействие с ЭВМ в расширяемой предметной области

кандидата технических наук
Галицкий, Борис Александрович
город
Москва
год
1993
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Естественно-языковое взаимодействие с ЭВМ в расширяемой предметной области»

Автореферат диссертации по теме "Естественно-языковое взаимодействие с ЭВМ в расширяемой предметной области"

Г I и УН

4 П М?Г<

I ь итл Ь^и

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ

На правах рукописи

Г&яицкий Борис Александрович

УДК 621. 391

ЕСТЕСТВЕННО-ЯЗЫКОВОЕ ВЗАИМОДЕЙСТВИЕ С ЭВМ В РАСШИРЯЕМОЙ ПРЕДМЕТНОЙ ОБЛАСТИ

Специальность 05.13.01 "Управление в технических системах"

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 1993

Работа выполнена в Институте проблем передачи информаци Российской Академии Наук

Научный руководитель: кандидат технических наук

Рубанов Л И.

Официальные оппоненты: доктор технических наук

Леонтьева Я Н.

кандидат технических наук Жожикашвили А. Е

Ведуцая организация: Всероссийский НИИ проблем

вычислительной техники и информатизации

Защита состоится "_"_1993 г. в _часов

на заседании специализированного совета Д. 003.29.01 в Институте проблем передачи информации РАН по адресу 101447, Москва, ГСП-4, ул. Ермоловой, 19

С диссертацией можно ознакомиться в библиотеке ИППИ РАЕ

Автореферат разослан "_"_1993г.

Ученый секретарь специализированного совета

доктор технических наук С. Н. Степанов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность темы. На сегодняшний день компьютерные системы (КС) работают не только в традиционной научно-технической сфере, но и в управленческих, медицинских, юридических и многих других областях, включая повседневный быт людей. Однако качественных изменений в характере взаимодействия с компьютером пока не наблюдается - большинство КС по-прежнему рассчитано на специально подготовленных пользователей. Поэтому конечные пользователи зачастую сами не обращаются с КС, а прибегают к посредничеству профессионалов - программистов.

Требования, касающиеся работы на формальном языке, предъявляемые к оператору ЭВМ и, в частности, к оператору АСУ, не всегда выполнимы. Традиционно считается, . что если человек и компьютер используют в своей деятельности различные языки, то человек, опираясь на врожденную способность к обучению, обязан освоить язык компьютера. При этом известно, что компьютерные знания, приобретаемые в дополнение к основной специальности, развиваются весьма динамично и быстро устаревают, что приводит к необходимости переучиваться, кроме этого, формальные средства обращения быстро забываются, особенно, если используются с перерывами.

В то же время недостаточно используется альтернативный подход, при котором не человек осваивает язык компьютера, а КС становится способной воспринимать обращения на языке человека, т. е. на свободном естественном языке (ЕЯ). Для тех случаев, когда человеко-машинное взаимодействие протекает в стационарной среде, задача понимания, как известно, может быть корректно поставлена и решена в рамках теории распознавания образов. Однако часто встречаются ситуации ( в частности, при управлении сложными технологическими процессами), в которых отличительной особенностью ЕЯ общения является гибкость и адаптация к предметной области (ПО) и ее пополнению. Это свойство не достигается ни путем применения сколь угодно развитой системой меню или мнемосхем, ни с помощью методов, предложенных для стационарной среды. Наряду с известными преимуществами ЕЯ взаимодействия, как то

1) ЕЯ взаимодействие с КС не требует от человека дополнительных усилий по переводу на специфический машинный язык,

2) ЕЯ не нувдается в специальном изучении и не забывается,

3) ЕЯ общение с КС органично соответствует природе человека, создает психологический комфорт, в расширяемой ПО взаимодействие на ЕЯ позволяет расширить внутренний мир системы адекватными для человека средствами.

Целями работы являются:

-анализ существующих принципов ЕЯ общения с компьютером в стационарных и расширяемых предметных областях;

-построение логической системы на языке, выразительность которого достаточна для представления и ПО, и ЕЯ обращения к работающей в ней КС;

-выработка концепции понимания вопроса и понимания определения как средства расширения предметной области;

-создание методов построения формализованной ПО; -разработка алгоритмов настройки ЕЯ-системы на ПО; -внедрение полученных результатов в реально действующе КС и изучение опыта их эксплуатации. Научная новизна

1) Развита методология решения задачи понимания ЕЯ в расширяемой ПО.

2) Построено многоуровневая логика на символьном пространстве в виде последовательности формальных метатеорий с топологическим представлением логического вывода. Она служит основанием концепции перевода как составной части понимания.

3) Обеспечена возможность введения определений новых понятий и объектов на ЕЯ.

4) На основе введенного формализма построен класс алгоритмов, сочетающих процедурные и декларативные методы, которые осуществляют перевод с ЕЯ на формальный и достижение совместности с ранее построенным представлением ПО.,

5) Разработаны методы формирования ПО путем интерпретации изображений.

6) Построены алгоритмы, осуществляющие самонастройку системы ЕЯ взаимодействия на стационарное ядро ПО.

7) Рассмотрены возможности реализации на нейроноподобных элементах разработанных алгоритмических принципов для работы в нестационарных средах.

Практическая ценность. Разработан класс методов понимания

ЕЯ обращений для ряда ПО, пополняемых новыми понятиями и объектами в процессе работы. Алгоритмы, сочетающие процедурные и декларативные принципы, ориентированы на работу как на персональных ЭВМ а составе АСУ, так и на специальных средствах с параллельной конфигурацией. Для IBM - совместимых компьютеров создана система UNLESA (понимание ЕЯ в расширяемой ПО).

Система понимания компилирующего типа осуществляет автоматическую настройку на широкий диапазон ПО, в т. ч. с возможностью сбора информации посредством применения системы технического зрения. UNLESA применяется в ряде учебных и научно-исследовательских организаций в учебном процессе при развитии навыков формального представления знаний. Осуществляется ЕЯ взаимодействие в таких ПО, как функционирование широкого спектра технологических схем и агрегатов химической технологии, что подтверждается актами о внедрении.

Автор защипает:

-метод машинного понимания ЕЯ обращений, основанный на переводе на формальный язык и достижении совместности с формализованной ПО (ОТО);

-метод понимания определений новых терминов и понятий, введенных на ЕЯ, в ходе взаимодействия с системой;

-методы формирования предметных областей для ЕЯ взаимодействия и самонастройки на них системы понимания;

-формализм, разработанный с использованием логических методов , который положен в основу концепции перевода и достижения совместности;

Апробация и публикация работы. Результаты, отраженные в диссертации, докладывались и обсуждались на семинарах "Расплывчатые категории в управлении'Ч Тбилиси, 1989), "Новые информационные технологии"(Тверь,1991), 3 Всесоюзной конференции по искусственному интеллекту (Тверь, 1992), Международном симпозиуме по нейроинформатике и нейрокомпьютерам (Ростов, 1992), конференции молодых ученых ИППИ РАН (Москва, 1989, 1990, 1991, 1992), а также на семинарах в различных лабораториях ИППИ РАН, ЦНИИКА, МГУ ,МИХМ и других организациях. Система UNLESA апробировалась в одной из исследуемых ПО совместно с лингвистическим процессором ЭТАП-3, разрабатываемым акад. Ю. Д. Апресяном с сотрудниками.

- ч -

По теме диссертации опубликовано 9 научных работ.

СОДЕРЖАНИЕ РАБОТЫ.

Во введении обоснована актуальность темы, сформулированы цели исследования, приведена аннотация результатов работы.

В главе 1 диссертации проанализированы принципы, лежащие в основе существующих подходов к решению проблемы ЕЯ взаимодействия с КС. Целевые установки могут порождать как лингвистический подход, состоящий в моделировании механизмов понимания ЕЯ текстов человеком, так и утилитарный подход, направленный на создание технических систем.

Большинство систем, использующих традиционный лингвистический аппарат, реализуют структуру систем понимания, вытекающую из модели "смысл-текст", включающую морфологический, лексический, синтаксический, семантический и прагматический уровни анализа. Предполагается, что в каждом тексте и именно в нем присутствует определенный "смысл", к нахождению которого и сводится задача понимания. За основу в работе выбран иной подход, более близкий ко второму.

В традиционной лингвистике отсутствует декларативное определение понятия "смысла", а попытки построить процедурное определеннее с использованием формальных грамматик, ролевых падежей, семантических сетей, концептуальных зависимостей и т. п.) не приводят к удовлетворительным результатам. Если система понимания не включает в себя знания о предметной области, корректная постановка задачи понимания оказывается невозможной.

Если, как в чисто утилитарном подходе, мы будем пренебрегать большей частью общеязыковых закономерностей, анализ текста станет эквивалентным полному рассмотрению представленных обучающей выборкой комбинаций значимых слов. В результате мы получаем отсутствие гибкости, трудоемкость внесения даже незначительных корректировок и добавлений в процессе работы и экспоненциальную сложность относительно увеличения числа ключевых понятий. Это допустимо лишь в стационарной среде, не требующей расширений. Внесение определений новых объектов и понятий в данных работах не рассматривалось.

Известны разработки, в которых требуемые качества КС с ЕЯ

обращением устанавливается за счет искусственных ограничений на лексику, фразеологию или стиль обращения. Но зачастую пользователи предпочитают формальные языки обращения ограниченному естественному из-за противоречия формальных ограничений устойчивым навыкам повседневного владения языком, а также из-за необходимости изучить и постоянно помнить "разрешенные" формы обращения.

Предлагается построение системы ЕЯ взаимодействия, лишенной указанных недостатков, на основе перевода на выразительный формальный язык процедурными средствами и достижения совместности с представлением ПО на этом языке декларативными средствами, что будет осуществлено в следующей главе.

Глава 2 посвящена принципам машинного пониманию ЕЯ в расширяющейся предметной области. Дается определение понимания в рамках концепции перевода и достижения совместности. За основу берется соответствие выразительности ЕЯ в решках ПО и выразительности создаваемого формального языка Ь. Если ПО формализована на языке , выразительность которого соответствует выразительности ЕЯ, то процесс понимания состоит из двух этапов:

A) Перевод обращения с ЕЯ на формальный язык Ь.

B) Достижение совместности формального предложения - результата перевода и ФПО посредством модификации формального предлош-ния . Результат понимания - вариант перевода ЕЯ обращения, совместный с ФПО и оптимальный в смысле определяемого ниже критерия (индекса обобщенности).

Перевод определяется как отображение символьной последовательности (возможно, с пробелами - разделителями слов) в символы формального языка. Рассматривается четыре типа результатов перевода слова или совокупности слов:

а) предикатный символ языка Ь.

б) константный символ языка и

в) вопросительное слово или словосочетание, которое идентифицирует цель обращения ( вопрос или определение ).

г) слова, не переводимые на язык Ь и используемые оператором в силу инерции межчеловеческого общения.

Для типов а) и б) система понимания или располагает прообразами символов, то есть словами-инвариантами относительно контекста (склонения или спряжения), или приобретает их в процессе адап-

тации к новым понятиям и объектам. Символы предикатов, предметных переменных и констант составляет формальный язык Ь, на который осуществляется перевод. Основное требование к языку Ь состоит в том, что он должен быть многоуровневым (иерархическим). Для того, чтобы ЕЯ предложение могло бьггь сведено к формальному, необходимо обеспечить Ь возможностью представлять как язык-объект, выражающий явную часть информации ЕЯ предложения, так и последовательность метаязыков, в которых содержатся ссылки на использование данных ФПО. Причем, в отличие от традиционных исчислений математической логики, метаязыки должны быть формальными.

Перевод (А) осуществляется процедурной компонентой системы и состоит из следующих шагов:

1) выявление последовательности предикатов , выраженных входящими в предложение словами;

2) нахождение в предложении предметных констант и подстановка на аргументные места предикатов;

3) определение контекста каждого из предикатов посредством выявления общих переменных. Синтаксический анализ ЕЯ предложения необходим для корректного осуществления второго этапа перевода

Задача перевода с ЕЯ на Ь состоит в синтезе многоуровневого предиката из одноуровневых атомарных предикатов языка I, соответствующих словам и их комбинациям, взятым без контекста из ЕЯ предложения. В такой постановке концепция понимания близка лингвистической. Контекст представляется посредством установления связей между предикатами и посредством идентификации переменных для зависимой пары предикатов (шаг 3). Необходимы специальные средства для реализации связок типа "тот..., который... " в качестве основного соотношения между предикатами предложения. Контекстную зависимость предикатов Р и 0, связь между ними, выраженную формулой Р(а,V....) & СХЬ,V,. ..), необходимо представить в форме предиката Р'(а, (}(Ь,...),...) , подчеркивая тот факт, что переменная V (точнее, константа, удовлетворяющая предикату при подстановке на аргументное место V) в явном виде отсутствует в ЕЯ предложении. Язык Ь, таким образом, должен обеспечивать возможность выполнимости предиката на предикате.

Этап В осуществляется декларативной компонентой системы . Процедурная система формирует текст декларативной программы , до-

обращением устанавливается за счет искусственных ограничений на лексику, фразеологию или стиль обращения. Но зачастую пользователи предпочитают формальные языки обращения ограниченному естественному из-за противоречия формальных ограничений устойчивым навыкам повседневного владения языком, а также из-за необходимости изучить и постоянно помнить "разрешенные" формы обращения.

Предлагается построение системы ЕЯ взаимодействия, лишенной указанных недостатков, на основе перевода на выразительный формальный.язык процедурными средствами и достижения совместности с представлением ПО на этом языке декларативными средствами, что будет осуществлено в следующей главе.

Глава 2 посвящена принципам машинного пониманию ЕЯ в расширяющейся предметной области. Дается определение понимания в рамках концепции перевода и достижения совместности. За основу берется соответствие выразительности ЕЯ в рамках ПО и выразительности создаваемого формального языка Ь. Если ПО формализована на языке , выразительность которого соответствует выразительности ЕЯ, то процесс понимания состоит из двух этапов:

A) Перевод обращения с ЕЯ на формальный язык Ь.

B) Достижение совместности формального предложения - результата перевода и ФПО посредством модификации формального предложения . Результат понимания - вариант перевода ЕЯ обращения, совместный с ОТО и оптимальный в смысле определяемого ниже критерия (индекса обобщенности).

Перевод определяется как отображение символьной последовательности (возможно, с пробелами - разделителями слов) в символы формального языка. Рассматривается четыре типа результатов перевода слова или совокупности слов:

а) предикатный символ языка Ь

б) константный символ языка Ь.

в) вопросительное слово или словосочетание, которое идентифицирует цель обращения ( вопрос или определение ).

г) слова, не переводимые на язык Ь и используемые оператором в силу инерции межчеловеческого общения.

Для типов а) и б) система понимания или располагает прообразами символов, то есть словами-инвариантами относительно контекста (склонения или спряжения), или приобретает их в процессе адап-

тации к новым понятиям и объектам. Символы предикатов, предметных переменных и констант составляет формальный язык Ц на который осуществляется перевод. Основное требование к языку состоит в том, что он должен быть многоуровневым (иерархическим). Для того, чтобы ЕЯ предложение могло быть сведено к формальному, необходимо обеспечить I возможностью представлять как язык-объект, выражающий явную часть информации ЕЯ предложения, так и последовательность метаязыков, в которых содержатся ссылки на использование данных ОТО. Причем, в отличие от традиционных исчислений математической логики, метаязыки должны быть формальными.

Перевод (А) осуществляется процедурной компонентой системы и состоит из следующих шагов:

1) выявление последовательности предикатов , выраженных входящими в предложение словами;

2) нахождение в предложении предметных констант и подстановка на аргументные места предикатов;

3) определение контекста каждого из предикатов посредством выявления общих переменных. Синтаксический анализ ЕЯ предложения необходим для корректного осуществления второго этапа перевода

Задача перевода с ЕЯ на Ь состоит в синтезе многоуровневого предиката из одноуровневых атомарных предикатов языка I, соответствующих словам и их комбинациям, взятым без контекста из ЕЯ предложения. В такой постановке концепция понимания близка лингвистической. Контекст представляется посредством установления связей между предикатами и посредством идентификации переменных для зависимой пары предикатов (шаг 3). Необходимы специальные средства для реализации связок типа "тот..., который... " в качестве основного соотношения между предикатами предложения. Контекстную зависимость предикатов Р и 0, связь между ними, выраженную формулой Р( а,V,...) & (X Ь,V,...), необходимо представить в форме предиката Р' (а, <3(Ь,...),...) , подчеркивая тот факт, что переменная V (точнее, константа, удовлетворяющая предикату при подстановке на аргументное место V) в явном виде отсутствует в ЕЯ предложении. Язык Ь, таким образом, должен обеспечивать возможность выполнимости предиката на предикате.

Этап В осуществляется декларативной компонентой системы . Процедурная система формирует текст декларативной программы , до-

бавляя к представлению ФПО перевод введенного ЕЯ предложения . Декларативная система осуществляет поиск значений переменных для предикатов переведенного предложения . Концепция понимания исходит из кооперативности человеко-машинного взаимодействия и потому предполагает наличие объектов, удовлетворяющих условию, выраженному введенным предложением. Критерием понимания служит индекс обобщенности (ИО): условное число ответов (наборов объектов) декларативной системы. Если ИО текущей версии перевода завышен или занижен относительно заданного для данной ПО , производится повторный перевод с модификацией шагов 2) и 3) в направлении, соответственно, уменьшения или увеличения числа связей между переменными различных предикатов и подстановок констант.

Экспериментально подтвержден следующий принцип монотонности понимания. При переходе к очередной версии перевода за счет модификации связей между предикатами (учета контекста) в направлении к требуемому ИО последний изменяется монотонно. Вероятность "скачка" к неправильному пониманию (пониманию другого предложения) мала. ИО устанавливается системой при настройке на ПО. Итак, работа процедурной и декларативной компонент осуществляется в направлении достижения заданной ПО.

В главе 3 разрабатывается формализм, удовлетворяющий требованиям, предъявленным в предыдущей главе. Строится многоуровневое исчисление как результат естественного процесса аксиоматизации. Для выявления дедуктивных свойств полученного исчисления вводится формализм символьного пространства - топологического представления символьной системы.

Глава начинается с решения следующей задачи. Имеется множество М и его описание, состоящее из набора атомарных предикатов , составляющих язык 1л . Необходимо получить описание М в аксиоматической форме и выделить из множества М универсум - подмножество Ми элементов М, разрешимых в рамках данного описания (иначе говоря, получить пространство признаков для М).

Предлагаемый канонический процесс аксиоматизации приводит нас к многоуровневому представлению в смысле последовательности теорий на метаязыках. Многоуровневая аксиоматизация определяется однозначно априорной расстановкой предикатов по п уровням.

Возникает необходимость в модификации определения выпол-

нимости предиката. Обычно выполнимость предиката (от ш переменных) на множестве-универсуме М - это отображение ш экземпляров М (декартова произведения ПМ) в {Ь.П- (истина, ложь). Назовем областью выполнимости предиката Р каждое множество {А1,... Аш> « М, такое, что Р(А1,...,Ат) истинно. Число аргументных мест предиката должно быть скорректировано соответствующим образом для обеспечения единственности подстановки в предикат каждого элемента И

Тогда выполнимость предиката на М - выделение подсистемы системы областей выполнимости из У, состоящих из ш элементов. Цри этом X может занять любое аргументное место предиката, ограниченное его областью определения. Выполнимость предиката Р арности ш на элементах Ы (или М-универсума) - это слияние (отождествление) т элементов каждой области выполнимости с любым элементом Р из нее, который назовем точкой Р « М. Новое -это возможность выполнимости предиката на предикате.

Процедура аксиоматизации состоит в стягивании областей выполнимости предикатов в последовательности, соответствующей уровням предикатов. Каждая область выполнимости стягивается к принадлежащим ей элементам областей выполнимости предикатов следующего уровня. Это выражается символами бинарных отношений зависимости (если стягиваемая область принадлежит стягивающей) или указуемости (в обратном случае ). В результате аксиоматизации мы получаем подмножество М, каждому элементу которого соответствует набор формул, состоящих из атомарных предикатов и символов отношений зависимости и указуемости. В дальнейшем результаты процедуры анализируются в зависимости от исходного распределения предикатов по уровням.

В разделе 3.2 выясняется, что описанный выше процесс аксиоматизации определенным образом "располагает" точки символьного универсума, задавая, тем самым, топологию на нем. Интересна возможность выявления дедуктивных свойств такого универсума, вложения семантики предикатов непосредственно в универсум, в подмножества соответствующего пространства.

Предикаты уровня 1 индуцируют на М топологию близости Тор<Р1>. Система областей выполнимости подмножества Ь множества Ы, порожденная семейством предикатов одного уровня Р1 - это

дизъюнктное объединение всех областей выполнимости всех предикатов: cL,Pi>M - <<L,P>M : Р < Pi}. Окружение подмножества L множества К - это объединение областей выполнимости, входящих в <L,Pi>m и не пересекающихся внутри него, без самого L. Подм-номэства М L и К близки, если или L пересекается с К, или пересекаются окружения L и К.

Семейство G-{ Top<Pi>, Dij, l.J <- N > - обратный спектр пространств Тор. Символьное пространство Ssp - это символьный универсум Mj, наделенный топологией G. Топология определена через предел обратного спектра топологических пространств, порожденных наборами одноуровневых предикатов Top<Pi>.

Ssp - lim Top<Pi>

Компактификации пространств Ssp(v), соответствующих распределению предикатов по уровням v позволяют топологически связать результаты "реальных" аксиоматизаций с "идеальным" символьным пространством Ssp_inv, предикаты которого склеены максимально возможным образом. Устанавливается соответствие между всеми близостями на Ssp_inv и всеми его компактификациями Ssp(v). Ssp_inv является инвариантом аксиоматизации относительно расстановок предикатов по уровням.

Далее устанавливается, что Ssp_inv локально компактно, а размерность dim (Ssp) не превышает уменьшенного на единицу числа «уровней описания n, dim (Ssp) - n-1 . Также выявляется критерий полноты: подмножество Ssp описуемо многоуровневой системой предикатов тогда и только тогда, когда оно замкнутое.

Методами теории моделей (ультрапроизведений) строится модель Ssp_inv, исходя из моделей Ssp(v), а также анализируются подпространства и расширения Ssp_inv.

Многоуровневое исчисление секвенций вводится в форме Генцена в разделе 3.4. Непротиворечивость логического выв г. да в его рамках равносильна условию непрерывности соответствующих отображений символьных пространств . В результате связь между многоуровневым и одноуровневыми исчислениями устанавливается следующим образом:

1) Утверждение о дедуктивной сводимости. Вывод в многоуровневой системе может быть на каждом шаге представлен как композиция выводов в стандартном одноуровневом смысле на фиксированных

уровнях.

2) Утверждение о языковой сводимости. Существует перевод с метаязыков каждого из уровней Li (L-U Li) на одноуровневый язык первого порядка Loi . Таким образом, выразительность многоуровневой системы повышается не посредством расширения языка (добавления к языку - объекту предикатов метаязыка), а за счет дедуктивных средств многоуровневого вывода.

На Ssp представлен специальный вид предикатов, выражающих интенсивность "проявления" других предикатов. Рассматриваются утверждения о существовании и единственности предикатов - интен-сивностей, об интенсивности предикатных формул и алгебраических операциях над интенсивностями. Предложена концепция решения уравнений в предикатах на Ssp как такого его преобразования, которое привело бы к односвяаному вхождению искомого предикатного символа как подмножества Ssp.

Таким образом, построен многоуровневый язык L, удовлетворяющий требованиям, сформулированным в главе 2.

Глава 4 посвящена алгоритмам понимания вопроса и определения. В терминах предыдущей главы процедура понимания, разбитая на два этапа, сводится к формированию представления вопроса как подпространства символьного пространства МО.

Расширение предметной области осуществляется за счет введения на ЕЯ предложений - определений, новых предикатов. Рассматривается такое предложение как определяемый предикат с комментирующими предикатами в левой части предложения и определяющими предикатами - в правой. Рассматриваются различные версии понимания до тех пор , пока не будет достигнут удовлетворительный с точки зрения ИО ответ на вопрос , состоящий из определяемого предиката .

Возможность введения ЕЯ определений является отличительной особенностью предлагаемого подхода , основанного на многоуровневом представлении понимаемого предложения . В терминологии глав 1 -3 подбор формального эквивалента ЕЯ предложения состоит в синтезе многоуровневого предиката исходя из атомарных предикатов и констант, соответствующих значимым словам .

В качестве примера рассмотрим определение нового для системы понятия "запуск насоса". "Запускается НАС5, реагент из кото-

- I i -

poro следует в теплообменник , если результат его превращения в АВС2 необходимо охладить. " Наиболее корректен перевод: ЗАПУСК НАС5,VI3,АБС2) : - РЕАГЕНТ (V01), СЛЕД( V01.HAC5,VII), ТЕПЛО-ОБМ(VII),ПРЕБР(V01,V13,АБС2),ОХЛА(V02,V13,VII). Следующий за определением запрос "что нагревается в теплообменнике , чна который влияет запуск НАС5" система переведет так: 3AnyCK(W20, HAC5.V23), ВЛИЯ(V02,НАС5,V20), ТЕПЛООБМ(V20), НАГР(VOO,VIO,V20).

Рассматривается утверждение о сводимости понимания в смысле главы 2 к пониманию в смысле концепции реагирования. И задача выбора реакции, и задача выбора правильной версии перевода в нашей концепции перевода представимы в терминах распознавания образов. В рассматриваемом случае распознавание происходит в пространстве признаков, синтезируемых системой из атомарных предикатов -инвариантов. Необходимость достижения совместности (обратная связь в процессе понимания) в стационарной среде теряет свою необходимость. Понимание в стационарной среде на основе концепции реагирования мы представляем формализмом теории групп, заданных образующими и соотношениями. Введение определений (модификация соотношений в свободной группе) не может быть реализовано в виде графа, представляющего данную группу - РАСПВ (расширенная сеть переходов с возвратами). Поэтому свойством пополнимости может обладать система, в которой сеть переходов индуцируется декларативным представлением информации,что и осуществлено в работе.

На основе описанной концепции понимания возможна автоматическая настройка системы на ФПО. ФПО представлена:

1)Пролог-файлом, в который входит база данных (предикаты с константами) и введенные определения предикатов;

2)Файлом - списком слов - предикатных инвариантов;

3)Файлом - списком констант каждого из предикатов.

В системе ЕЯ взаимодействия предусмотрен реж::м, при котором происходит создание списков предикатов и констант 2) и 3) на основе анализа исходного текста 1). Необходимо задать ФПО вопрос по каждой переменной каждого предиката и сформировать из ответов 3).

Глава 5 посвящена методологии формирования ПО. Получение ФПО из ПО, легко поддающейся формализации, тривиально. Формирование

- 1С -

ФПО в общем случае - самостоятельная проблема, ей посвящена методология создания экспертных систем и баз знаний. На примере решения проблемы анализа изображений с целью получения ФПО в ситуации, когда априорная информация о свойствах объектов на изображении чрезвычайно мала, показано, как ФПО создается автоматически.

В разделе 5.1 разрабатывается метод интерпретации несложной плоской сцены , когда создатель системы практически не располагает признаками объектов, параметры которых необходимо выявить .

Процесс интерпретации изображения с автоматическим синтезом распознающих предикатов мы разбиваем на три этапа:

1. Синтез первичных признаков: первый этап обучения (без учителя);

2. Распознавание в пространств сформированных признаков: второй этап обучения (с учителем);

3. Преобразование в аксиоматико-подобную форму: словесное описание сцены;

Системе априори должно быть известно число классов, к которым необходимо будет отнести узнанные объекты и определить параметры предметов из каждого класса Предполагается, что число классов не превышает 4. Наложены также ограничения на габариты объектов. Никакая иная информация системе недоступна

В качестве результата аксиоматизации рассматривается многоуровневое описание предикатами: переменные предикатов первого уровня : яркости в в точках, предикаты следующих уровней выполняются на предикатах предыдущего. Геометрические инварианты объектов выражаются в виде соотношений между предикатами разных уровней. Выполнимость канонических предикатов осуществляет нейронная сеть.

Формирование признаков воплощается в специфичности конфигурации связей в нейронной сети, представляющей изображение. Выполнимость предиката первого уровня Р1 как сравнение с порогом и взвешенной суммы значений его переменных , реализуемое нейроном 1

| Р1-$>и Бл | < и . j

Процедура обучения (образования связей ) такова В начале пере-

менные каждого предиката "сосредоточены" в его окрестности. Потенциалы калодого из нейронов равны предполагаемому фону изображения. Веса связей каждого нейрона не участвуют в процессе обучения и являются монотонными функциями расстояния до "тела" нейрона -предиката. На первом такте веса настраиваются так, чтобы представить изображение в предположении, что все переменные более не сдвинутся. В дальнейшем веса модифицируются лишь с учетом изменения расстояния до тела предиката На каждом такте предикат проверяет выполнимость сравнением со значением яркости в теле нейрона взвешенной суммы значений переменных, берущих значения освещенностей, соответствующих текущему положению на изображении. В случае невыполнимости предикат сдвигает каждую свою переменную по градиенту на изображении в направлении, соответствующем текущему улучшению выполнимости.

Таким образом, сеть работает, беря у изображения значения яркостей (тел предикатов) и направление вектора градиента. Роль предлагаемого способа модификации весов состоит в том, чтобы воспрепятствовать сети представить изображение слишком быстро, за слишком малое число тактов, дать нейронной сети возможность растянуть во времени процесс выполнимости предикатов достаточно, чтобы отразить специфику изображенных объектов.

Результатом обучения служит следующее. Во-первых, формируется семантика каждого из предикатов-нейронов: расстановка его переменных. Во-вторых, не исчерпана возможность дальнейшего обучения за счет пластичности весов связей - обучение нейронной сети классификации в среде сформированных признаков в обычном смысле (второй этап обучения в нашем случае). Это необходимо в задаче регистрации состояния интересующего объекта. Обучение примет естественный оттенок и поставит перед собой цель наискорейшего представления измененного изображения, исходя из уже имеющейся расстановки переменных - конфигурации сети. Модификация весо!;, например, по алгоритму обратного распространения ошибки представит информацию об объекте в форме канонических преобразований, исходя из начального положения объекта.

Но наиболее важно формирование канонического критерия - инварианта геометрических объектов: распределения элементов изображения объекта( предикатов) по числу тактов работы сети, по про-

шествии которых предикат достиг выполнимости. Именно по этому критерию проводится кластеризация объектов - второй этап обучения, проводимый с учителем: установка границ областей на пространстве признаков, сформированных на первом этапе.

Раздел 5.2 посвящен описанию того, как может происходить решение системой из нейроноподобных элементов задач глав 2,4,5 на основе формализмов, введенных в главе 3 .

Введение новых физических и архитектурных вычислительных принципов происходит одновременно с постижением особенностей переработки информации биологическими системами. Основное, что заимствуется у природы, это параллельность вычислений, пластичность и обучение. Концепция физического решателя, применяемая в моделировании работы нейронной сети и одиночного нейрона, может стать еще одной основой новой информационной технологии.

Анализируются класс нейронных сетей, выполняющих функции, отличные от генерации ритмов и колебаний различных частот, усиления, спектрального преобразования сигналов и их кластеризации, то есть функции аналоговых нейронных сетей. Задача аналоговых нейронных сетей, в общем случае, - это выделение областей на фазовом портрете физической системы взаимосвязанных нейронов. "Символьная" нейронная сеть, цель которой - реализация достаточно выразительного языка, работает следующим образом. Области на фазовом пространстве физической сйстемы решателя ( символы) перемешаются друг относительно друга за счет действия на решатель внешней физической системы - интерпретирующего устройства. Последнее интерпретирует взаимное положение областей фазового пространства в символьное предложение и назначает объектам физической системы - решателям новые параметры. Новые области на фазовом портрете системы с новыми заданными параметрами обозначают для устройства интерпретации новую расстановку символов. Один нейрон другому передает результаты промежуточного решения в виде канонического параметра физического символа решателя. Так нейронной сетью реализуется логический вывод на языке, выразительность которого зависит от физической сложности решателя .

Разработана информационная модель решателя - символьное пространство и сети из нейронов-решателей как параллельной Пролог-машины, ориентированной на реализацию ЕЯ процессора. Источ-

ник абстракции символьного пространства - "физический" символ, который в своих физических параметрах содержит всю информацию о своей возможной интерпретации. Положение каждого символа предиката - символьного подмножества, указывая на интерпретацию предиката, идентично вхождению предиката в формальное предложение.

В главе 6 рассматриваются вопросы практического использования исследованных автором теоретических положений. На примере следующих ПО проанализированы возможности системы 1ЖЕЗА по пониманию вопроса и усвоению определения:

1) Геометрические фигуры на плоскости, опознанные системой интерпретации. Ядро ФПО создается автоматически.

2) Изображение многофазного потока в аппарате химической технологии. ПО сформирована в результате анализа изображения в условиях высокой исходной неопределенности (этап пуска производства) системой интерпретации с автоматическим синтезом признаков.

3) Работа технологического узла.

4) Работа стадии химико-технологического процесса. Температурный режим.

6) Окружающий мир в восприятии земноводного животного.

7) Кадровый учет сотрудников предприятия.

В последнем случае была опробована совместная работа системы ШЬЕБА с синтаксическим анализатором лингвистического процессора ЭТАП-3. Для этого в состав системы 1ЖЕБА введены трансляторы семантических и синтаксических структур в формат Пролога

ГЬнимание вопроса происходит при абсолютно свободном ЕЯ обращении. В целом качество понимания определяется полнотой формализации ПО, тем, насколько доступно представлена информация в декларативной форме. Оценка качества понимания и степени стационарности среды посредством априорной учебной выборки затруднительна, так как осознанное ЕЯ обращение человека к компьютеру не может происходить столь же свободно, как к другому человеку, хотя явно ограничения не присутствуют. Более целесообразным оказалось модификация ФПО на начальном этапе эксплуатации. Она заключалась во введении определений необходимых понятий и объектов как формальными средствами (редактирование исходного Пролог-файла), так и добавлением ЕЯ определений. Последнее зарекомендовало себя с лучшей стороны по причине отсутствия ошибок в процессе де-

- 16 -

ятельности программиста или инженера-технолога.

Опыт эксплуатации показывает, что приспособление оператора к системе происходит за период не более, чем час работы с ней. Привыкание протекает вполне естественно, не требует весомых умственных нагрузок и протекает значительно проще, чем при работе с системами типа текстовых или графических редакторов.

Работа во всех без исключения рассмотренных ПО не могла обойтись без постоянной модификации и добавления используемых понятий и терминов, а также пополнения Сазы знаний о ПО. При введении некоторых вопросов оператору удобно предварительно ввести имя нового объекта или свойства, чтобы заданный вопрос выглядел более корректно. Таким образом, сам стиль работы оператора меняется при наличии возможности применения тех слов, которые по тем или иным причинам удобны для оператора в текущий момент.

Как показали эксперименты, понимание сообщений при введении определений новых объектов, обладающих свойствами, с которыми система уже знакома, легко обеспечивается оператором и происходит абсолютно надежно. Введение определений новых понятий и свойств, исходя из старых, требует от оператора некоторых усилий, направленных не на формализацию представления определения, а на ее содержательное осмысление. Система воспринимает канонизированные определения, в которых определяемые слова стоят в начале предложения, а определяющие - в конце. Такие ограничения незначительны и естественны. В АСУ ТП введение определений осуществляет переход по приказу оператора к новым алгоритмам управления.

Результаты работы ШЬЕБА представлены следующей таблицей.

N ПО режим создания Надежность Достоверность Успешное

ФПО понимания ответа на усвоение

вопроса вопрос определения

1 автоматически (75) 97 (60) 96 (40) 85

2 автоматически (82) 98 (82) 98 (58) 86

3 технологом (84) 96 (80) 95 (35) 75

4 технологом (75) 99 (75) 99 (84) 85

5 программистом (60) 89 (56) 92 (69) 78

6 программистом (78) 95 (61) 93 (81) 83

7 программистом (82) 88,98* (81) 99* -

ник абстракции символьного пространства - "физический" символ, который в своих физических параметрах содержит всю информацию о своей возможной интерпретации. Положение каждого символа предиката - символьного подмножества, указывая на интерпретацию предиката, идентично вхождению предиката в формальное предложение.

В главе 6 рассматриваются вопросы практического использования исследованных автором теоретических положений. На примере следующих ПО проанализированы возможности системы ШЬЕЗА по пониманию вопроса и усвоению определения:

1) Геометрические фигуры на плоскости, опознанные системой интерпретации. Ядро 4ЯЮ создается автоматически.

2) Изображение многофазного потока в аппарате химической технологии. ПО сформирована в результате анализа изображения в условиях высокой исходной неопределенности (этап пуска производства) системой интерпретации с автоматическим синтезом признаков.

3) Работа технологического узла

4) Работа стадии химико-технологического процесса Температурный режим.

6) Окружающий мир в восприятии земноводного животного.

7) Кадровый учет сотрудников предприятия.

В последнем случае была опробована совместная работа системы дои23А с синтаксическим анализатором лингвистического процессора ЭТАП-3. Для этого в состав системы ШЬЕБА введены трансляторы семантических и синтаксических структур в формат Пролога

Понимание вопроса происходит при абсолютно свободном ЕЯ обращении. В целом качество понимания определяется полнотой формализации ПО, тем, насколько доступно представлена информация в декларативной форме. Оценка качества понимания и степени стационарности среды посредством априорной учебной выборки затруднительна, так как осознанное ЕЯ обращение человека к компьютеру не может происходить столь же свободно, как к другому человеку, хотя явно ограничения не присутствуют. Более целесообразным оказалось модификация ФПО на начальном этапе эксплуатации. Она заключалась во введении определений необходимых понятий и объектов как формальными средствами (редактирование исходного Пролог-файла), так и добавлением ЕЯ определений. Последнее зарекомендовало себя с лучшей стороны по причине отсутствия ошибок в процессе де-

- 16 -

ятельности программиста или инженера-технолога.

Опыт эксплуатации показывает, что приспособление оператора к системе происходит за период не более, чем час работы с ней. Привыкание протекает вполне естественно, не требует весомых умственных нагрузок и протекает значительно проще, чем при работе с системами типа текстовых или графических редакторов.

Работа во всех без исключения рассмотренных ПО не могла обойтись без постоянной модификации и добавления используемых понятий и терминов, а также пополнения базы знаний о ПО. При введении некоторых вопросов оператору удобно предварительно ввести имя нового объекта или свойства, чтобы заданный вопрос выглядел более корректно. Таким образом, сам стиль работы оператора меняется при наличии возможности применения тех слов, которые по тем или иным причинам удобны для оператора в текущий момент.

Как показали эксперименты, понимание сообщений при введении определений новых объектов, обладающих свойствами, с которыми система уже знакома, легко обеспечивается оператором и происходит абсолютно надежно. Введение определений новых понятий и свойств, исходя из старых, требует от оператора некоторых усилий, направленных не на формализацию представления определения, а на ее содержательное осмысление. Система воспринимает канонизированные определения, в которых определяемые слова стоят в начале предложения, а определяющие - в конце. Такие ограничения незначительны и естественны. В АСУ ТП введение определений осуществляет переход по приказу оператора к новым алгоритмам управления.

Результаты работы 1ЖЕБА представлены следующей таблицей.

N ПО режим создания Надежность Достоверность Успешное

ОТО понимания ответа на усвоение

вопроса вопрос определения

1 автоматически (75) 97 (60) 96 (40) 85

2 автоматически (82) 98 (82) 98 (58) 86

3 технологом (84) 96 (80) 95 (35) 75

4 технологом (75) 99 (75) 99 (84) 85

5 программистом (60) 89 (56) 92 (69) 78

6 программистом (78) 95 (61) 93 (81) 83

7 программистом (82) 88,98* (81) 99* -

- If -

(число в скобках говорит о надежности работы системы до настройки ФПО (декларативной компоненты ), звездочка указывает на результаты работы с применением синтаксического анализа ЭТАП-3).

Таким образом, качество понимания вопроса превышает качество понимания определения. Качество понимания в целом обеспечивается адекватным и гибким представлением информации об объектах, что вполне достигается декларативными средствами и было осуществлено в исследуемых ПО.

Система компилирующего типа UNLESA ориентирована на работу в среде КБ DOS для IBM/PC AT, требует 1200 KB памяти на жестком диске (без учета ФПО-файлов) и 590 KB оперативной памяти. Ответ на вопрос или _усвоение определения занимает порядка 40 секунд, что согласуется с перерывами в работе с мнемосхемой или другой наглядной информацией.

ВЫВОДЫ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ.

1. Установлено наличие практически важных ПО, к которым в процессе ЕЯ взаимодействия необходимо добавление новых понятий и фактов. Предложена концепция расширения ПО посредством введения определений на ЕЯ.

2. Выявлена фундаментальная роль формализации ПО на формальном языке многоуровневой логики предикатов, достаточно выразительном по сравнению с ограниченным естественным (в рамках ПО).

3. Использован подход, сочетающий лингвистические и формально-логические методы, при котором задача понимания в расширяемой ПО допускает корректное процедурное определение в виде преобразования обращения из ЕЯ в последовательность формальных версий перевода с дальнейшим достижением совместности с ФПО.

4. Разработан формализм символьного пространства многоуровневой логики, на котором базируется концепция перевода с ЕЯ на формальный.

5. Построены модели символьных пространств, соответствующих пониманию вопроса, определения нового предиката и определения новой предметной константы, на основе которых созданы алгоритмы ЕЯ взаимодействия.

6. Предложен алгоритм достижения совместной непротиворечи-

вости ФПО и текущего варианта перевода за счет его пошаговой модификации.

7. Рассмотрены алгоритмы машинного формирования ПО на примере результата интерпретации изображения с автоматическим синтезом признаков.

8. Проанализированы возможности реализации алгоритма понимания, сочетающего процедурные и декларативные методы, на нейроно-подобных структурах.

9. Разработан алгоритм автоматической настройки системы понимания на ядро ФПО .

10. Созданная система проверена экспериментально на нескольких ПО: интерпретации изображений в химико-технологическом процессе и различные варианты стадий и узлов непрерывных технологий.

11. фактически реализована система понимания компилирующего типа на персональных компьютерах для применения в автоматизированном проектировании технологического процёсса и средств управления.

По теме диссертации опубликованы следующий работы:

1. Galitsky В. A. Symbol solver in single neuron and in network / Proc. of RNNS/IEEE Symposium on Neuroinformatics and Neuroconputers, Rostov, 1992, pp. 352-364.

2. Галицкий Б. А. Нейроноподобный компьютер: логический подход к интерпретации изображений / Труды 3 Всесоюзной Конференции по искусственному интеллекту. Тверь, 1992, т. 2, с. 145-150.

3. Цирлин А. М., Миронова Е А., Галицкий & А. Оптимизация регенеративного теплообменника / Труды МИХМ, 1985.

4. Галицкий Б. А. Многоуровневый подход в условиях неопределенности / Труды Всесоюзного Семинара по расплывчатым категориям в управлении, Тбилиси, 1989.

5. Галицкий Б. А. Внутринейронная переработка информации: принципы физического решателя / Труды Конференции Молодых ученых ИППИ АН СССР, М. ,1990.

6. Галицкий R А. Топологическая модель цитоскелета как устройства для реализации логического исчисления / Труды Конференции Молодых ученых ИППИ АН СССР, М. ,1990.

7. Галицкий Б. А. Выявление решателя в биосистеме / Труды Конференции Молодых ученых ИППИ АН СССР, М. ,1991.

1У -

8. Галицкий Б. А. Интенсивность предиката на символьном пространстве / Труды Конференции Молодых ученых ИППИ АН СССР. М. .1991.

9. Галицкий Б. А. Ультрапроизведения на символьном пространстве / Труды Конференции Молодых ученых ИППИ АН СССР, М. .1992.