автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Модель представления смысла текстовой информации

кандидата технических наук
Нагоев, Залимхан Вячеславович
город
Нальчик
год
2000
специальность ВАК РФ
05.13.16
Диссертация по информатике, вычислительной технике и управлению на тему «Модель представления смысла текстовой информации»

Автореферат диссертации по теме "Модель представления смысла текстовой информации"

РГи ОД

1 В О! 2ЛСЗ

На правах рукописи

Нагоев Залимхан Вячеславович

Модель представления смысла текстовой информации

Специальность 05.13.16 - "Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (технические науки)"

Автореферат диссертации на соискание ученой степени кандидата технических наук

Нальчик-2000

Диссертация выполнена в Институте информатики и проблем регионального управления Кабардино-Балкарского научного центра РАН

Научный руководитель:

доктор технических наук, профессор П. М. Иванов Официальные оппоненты:

- доктор технических наук, профессор А. В. Тимофеев

- доктор технических наук, профессор В. П. Карелин

Ведущая организация - Институт прикладной математики и автоматизации Кабардино-Балкарского научного центра РАН

Защита состоится 26 мая 2000 г. в 10:00 на заседании диссертационного совета Д 063.13.02 при Таганрогском государственном радиотехническом университете (347928, г. Таганрог, ГСП 17 А, пер. Некрасовский, 44)

С диссертацией можно ознакомиться в библиотеке университета

Автореферат разослан " 22 " апреля 2000 г.

Ученый секретарь диссертационного совета д.т.н, профессор

Общая характеристика работы

Актуальность темы. В диссертационной работе предлагаются модель и прикладная система, построенные на основе синтеза элементов систем: понимания естественного языка, виртуальной реальности, когнитивной графики, а также инженерии знаний, гомеостатики. Эти элементы рассматриваются во взаимосвязи, как единое целое для создания новых методов решения одной из ключевых проблем искусственного интеллекта - проблемы понимания текстов на естественном языке (ЕЯ).

Актуальность исследований по искусственному интеллекту (ИИ) вообше и исследований по пониманию естественного языка, в частности, в настоящее время общепризнана.

Предлагаемая в диссертации система ментального интерфейса (СМИ) - это модель коммуникации человек - компьютер, предназначенная для интерактивного представления смысла предложений естественного языка. Входные тексты преобразуются СМИ в наглядные трехмерные многомодальные модельные представления. Это дает пользователю возможность анализировать подобные представления смысла, корректировать их, быстро и эффективно строить трехмерные ситуации, описанные в исходном предложении, наблюдать за их развитием.

По мнению ряда ведущих исследователей в области ИИ при создании различных интеллектуальных систем проявляются ограничения традиционных формальных моделей. Поэтому на смену математическому моделированию, в основе которого всегда лежат те или иные формальные системы, должно прийти, прежде всего, семиотическое . моделирование, рассматривающее знак, как основу семантических построений - моделирующую сущность, обладающую референтной, денотативной и прагматической функциями.

Опираясь на принцип «семантического треугольника», СМИ рассматривает слова ЕЯ как знаки, обеспечивая средства для их интерпретации - семантически значимые денотаты.

Новым специфическим разделом интеллектуального программирования являются системы когнитивной графики, которые пытаются реализовать основную идею современного представления о мышлении как о синтезе визуальных и символьных представлений. В настоящее время с развитием когнитивной графики связывают большие надежды на повышение эффективности решения широкого круга задач различных областей, так как образное мышление пользователя может существенно ускорить процесс поиска решения и рождать новые пути его поиска. Одной из оригинальных возможностей, предоставляемых СМИ, явля-

ется обеспечение графического представления развития контекстов, описываемых в интерпретируемых текстах ЕЯ. Реализация такой функции СМИ в сочетании с единообразным подходом к обработке символьной, образной и денотативной информации с полным основанием дает право причислить СМИ к системам когнитивной графики.

Соединение в единое целое образной, символьной, слуховой, тактильной и т. п. информации, отражающей одну и ту же сущность реального мира, приводит к идее стандартного кода, позволяющего единообразным способом кодировать разнородную информацию. Очевидно, что объединяющим началом, могущим стать структурной и функциональной основой подобного кода, в СМИ служит топологическое пространственное единство многомодальных координат точек, входящих в предметы.

Вместе с тем, цели создания антропоморфного интерфейса, «очеловечивания» поведения роботов стимулируют, по мнению ведущих специалистов, интерес исследователей ИИ к системам виртуальной реальности.

Такие компоненты СМИ как виртуальное пространство и виртуальный мир по определению являются разновидностью системы виртуальной реальности, так как они моделируют трехмерный мир с поддержкой перемещений и многомодальных сенсорных координат (запах, цвет, вкус и т.п.).

Таким образом, актуальность создания гибридных систем понимания текста - на стыке нескольких современных направлений - подтверждается общей тенденцией современного развития этой области ИИ.

Объект и предмет, цели и задачи исследования. Объектом исследования является моделирование процессов, протекающих при понимании человеком текстов на ЕЯ. Предметом исследования является представление смысла текстов на ЕЯ, формирующееся у человека в процессе осмысления естественноязыкового высказывания.

При этом ставятся две главные цели исследования:

1. Изложение и обоснование новых принципов компьютерного понимания текстов;

2. Создание прикладной системы представления смысла текстов ЕЯ, являющейся необходимой компонентой для создания систем, опирающихся на новые принципы понимания и способных продемонстрировать адекватный уровень понимания текстов на ЕЯ.

Подобная композиция целей обусловлена, с одной стороны органической взаимозависимостью и иерархической структурированностью систем и способов представления смысла и систем понимания смысла, и, с другой стороны, - необходимостью

проведения относительно полного исследования, а также построения действующей прикладной системы, приближающей нас к решению задачи понимания текстов на ЕЯ.

Задачей исследования является разработка модели и прикладной системы, реализованной на основе описываемых и выводимых в работе принципов и способов представления смысла и способной представлять:

- смысл предложений, описывающих пространственные, временные и перцептуальные изменения предметов; смысл, неявно заданный в предложении;

смысл предложений, описывающих взаимодействие предметов.

При этом получаемые представления должны обладать свойствами наглядности, адекватности, многомодальности.

Методы исследования. При проведении исследования использовалось композиционное сочетание интроспекции, концептуального моделирование, имитационного моделирования и эксперимента.

Применяемый в работе алгоритм квантирования был оптимизирован по критерию минимума времени выполнения с применением алгебры алгоритмов.

Для генерации усредненных представлений семантики лексических единиц был применен математический аппарат нечетких множеств.

Условия, при которых получены результаты исследования. В качестве программной реализации модели СМИ была разработана система «Сосруко».

Программа СМИ «Сосруко« написана на компьютере с характеристиками Pentium/150/16/1 Gb/, на котором также проводились все эксперименты. Вследствие наличия небольшого объема оперативной памяти - 16 Mb - пришлось ограничить число точек виртуального пространства следующими значениями: 50x25x50, что в итоге дало модель из 62500 точек. Этого оказалось достаточным для представления смысла нескольких простых нераспространенных предложений, описывающих перемещения и изменения свойств предметов. Программа была написана и отлажена с помощью компилятора Visual С++ 5.0 фирмы Microsoft.

Новизна и достоверность результатов. Предлагаемая в работе СМИ обладает свойством наглядной адекватной интерпретации смыслов некоторых предложений на ЕЯ, а также достаточным потенциалом семантических построений для создания и поддержки «ментального» интерфейса с пользователем.

Архитектура СМИ интегрирует состав и свойства систем понимания ЕЯ, виртуальной реальности, когнитивной графики.

Новым результатом является создание топологической модели виртуальной реальности, базирующейся на концепции макроабстрагирования, оригинальном понимании времени и пространства, обладающей мощными средствами для описания перцептуальных свойств объектов, их взаимодействия.

Результаты, полученные в ходе экспериментов по интерпретации СМИ группы предложений ЕЯ, описывающих перемещения и изменения состояний предметов, в которых в прагматическом аспекте наличествуют различные значения «по умолчанию», подтвердили, что возможна не только символьная или образно-символьная коммуникация с компьютером, но и эффективная «ментальная» коммуникация. Отличие состоит в том, что в ней участвуют еще и денотаты - модельные представления концептов сознания, наделенные пространственной формой, физическими свойствами и вовлеченные в контексты, интерпретирующие смысл текстов на ЕЯ. При этом, эффективность достигается за счет «полномасштабного» моделирования в СМИ физических законов. Достаточно лишь задать ситуацию несколькими предложениями для того, чтобы увидеть ее развитие на дисплее компьютера. Таким образом, реализована своеобразная когнитивная реальность с естественноязыковым интерфейсом.

При осуществлении генерации усредненных представлений денотатов впервые для модели виртуального пространства (ВП) был успешно применен аппарат нечетких множеств. При этом показано, что последовательное применение операций над нечетким представлением денотатов в виртуальном пространстве приводит к закреплению наиболее характерных их свойств.

Созданы структуры данных, позволяющие для одного десигната хранить и по выбору применять как прагматическое представление -модель в ВП, так и образные представления - картинки, идиомы и т. д.

Теоретическая значимость результатов. В работе изложены новые принципы исследований в области компьютерного понимания текстов на ЕЯ, связанные с признанием необходимости моделирования субъекта понимания.

Применение СМИ усиливает способности человеческого рассуждения при решении широкого круга задач различных областей. Представляется вероятным в ближайшем будущем бурное развитие подобных систем - по типу экспертных, но с элементами виртуальной реальности и когнитивной графики. Типологически - это новый вид программных систем, который, в с илу своей практической направленности призван стать одним из массовых коммерческих направлений.

СМИ способна адекватно представлять и неаддитивно аккумулировать смыслы текстов на ЕЯ. Подобная способность реально приближает возможность создания естественноязыкового интерфейса и модели среды в будущих системах ИИ, построенных на принципах новой парадигмы. На основе этих результатов можно строить инструментальное окружение для редактирования «среды обитания» интеллектуального агента. При этом процессы интериоризации будут формализованы при помощи ВП и реально упрощены с помощью средств инструментальной среды. Это, в свою очередь, даст исследователям ИИ возможность сконцентрироваться на моделировании собственно процессов гомео-стазиса, мышления и социальных отношений человека.

С помощью ВП удается обеспечивать целостность (многомодаль-ность) представлений. Здесь интегрирующим свойством служит пространственное единство предметов.

Как уже подчеркивалось, ментальный интерфейс осуществляется благодаря тому, что при помощи средств, предоставляемых ВП, можно строить адекватные представления смыслов. При этом необходимо отметить важное в теоретическом плане достижение - десигнаты получают адекватные денотаты. На практике это означает, что пользователь видит на экране дисплея семантическую интерпретацию введенного им текста в виде наглядных, априорно узнаваемых и понятных образов (денотатов). При этом на каждом шаге он имеет возможность корректировки интерпретации, используя инструментальные средства ВП.

Подобный инструмент дает широкие возможности для психологического изучения процессов интериоризации и мышления. По существу, впервые человек получит возможность «увидеть невидимое» - процесс работы сознания. При этом подобное моделирование обладает перспективой скорого наращивания выразительных возможностей и качества реализации, а также - повышения адекватности.

Практическая значимость. Описан структурный состав СМИ, функции и пути реализации отдельных структурных компонент, типы их взаимодействия внутри модели.

Практическую значимость имеет предлагаемый в работе оригинальный алгоритм квантирования и поддержки функционирования физических законов в ВП. Для имитации синхронности явлений в ВП в этом алгоритме использован циклический поллинг всех точек ВП в такты, равные порогу чувствительности человека по времени. Приведена укрупненная блок-схема алгоритма квантирования, программно реализованная в СМИ «Сосруко».

Практическое приложение имеет также реализованный алгоритм генерации усредненных представлений денотатов при помощи аппара-

та нечетких множеств, в котором учитываются как образные, так и «прагматические» (в терминах ВП) представления.

Описаны структура и способы представления, функционирования и хранения слов естественного языка - операторов СМИ для классов «предмет», «явление», «качество», «образ действия» и др.

С целью экспериментального подтверждения гипотез разработана программа СМИ «Сосруко» на языке С++ и проведены эксперименты, подтверждающие возможность эффективной ментальной коммуникации в СМИ.

При работе над программой «Сосруко» с использованием технологии объектно-ориентированного программирования была разработана система типов данных и объектов для представления ВП и объектов ВП.

Указанные алгоритмы и типы данных могут быть использованы в дальнейших разработках программного обеспечения систем ментального интерфейса.

Реализация результатов. Программа «Сосруко» была внедрена в НИИ структурной методики преподавания языков при Кабардино-Балкарском государственном университете. Программа успешно использовалась в качестве модельной среды для создания представлений смыслов лексических единиц с целью нахождения и систематизации групп дифференцирующих признаков слов с близкими и пересекающимися значениями.

Пути дальнейшей реализации. Результаты работы могут быть применены при создании систем понимания речи и естественноязыковых интерфейсов. Программная система может быть использована в качестве инструментального средства для построения трехмерной многомодальной среды окружения интеллектуального агента в системах искусственного интеллекта. Теоретические результаты могут быть применены при создании семантических систем, в которых возникает задача представления и анализа смысла текстов на естественном языке.

Аппробация работы. Основные результаты диссертационной работы были представлены на следующих симпозиумах и конференциях:

III всероссийский симпозиум «Математическое моделирование и компьютерные технологии» (г. Кисловодск, 1999).

III международная научно-техническая конференция «Интерактивные системы: Проблемы человеко-компьютерного взаимодействия / ИС-99» (г. Ульяновск, 1999).

Международная научная конференция «Пользовательский интерфейс в современных компьютерных системах» (Орел, 1999).

Публикации. По материалам диссертации опубликовано 4 печатные работы.

На защиту выносятся следующие положения:

1. Впервые предложена концепция Системы ментального интерфейса - нового типа интерактивных систем, предназначенных для моделирования смысла текстов на естественном языке и его наглядной демонстрации.

2. Предложено виртуальное пространство (ВП) - модельная структура для представления смысла. Свойства ВП позволяют строить в ВП семантические представления слов, обозначающих предметы, так и явления (действия), и качества и т.д.

3. Экспериментально доказано, что ВП способно адекватно и наглядно представлять и неаддитивно аккумулировать смыслы естественноязыковых высказываний. В частности, ВП способно представлять:

— смысл предложений, описывающих пространственные, временные и перцептуальные изменения предметов;

— смысл, неявно заданный в предложении;

— смысл предложений, описывающих (явно или неявно) взаимодействие предметов.

4. Представления денотатов слов, получаемые СМИ, многомодальны. Модальности соответствуют перцептуальным способностям человека.

5. Показана возможность ментальной коммуникации. Выразительными средствами подобного типа коммуникации являются тексты, денотаты - модели внутреннего представления смысла, наделенные пространственной формой, физическими свойствами, а также образная и образно-символьная информация.

Объем и структура диссертации. Объем диссертационной работы -165 страниц. Работа состоит из введения, трех глав и заключения.

Содержание работы

Во введении определяются объект, предмет, цели и задачи диссертационного исследования, обосновывается актуальность выбранной темы и методов решения задач. С этой целью приводится краткий обзор направлений и достижений компьютерной лингвосемантики, делаются выводы о нерешенных проблемах в этой области. Далее приводятся сведения о применяемых методах исследования, структуре дис-

сертационной работы, сообщается, в чем, заключается теоретическая значимость и прикладная ценность полученных результатов.

В первой главе дается определение смысла текстовой информации с учетом новых принципов компьютерного понимания текста. Обрести разум система ИИ может, только повторяя протекание этого процесса у реального мыслящего индивида (человека), который в огромном количестве контактов со средой обитания, социумом, управляемый комплексной системой мотивации, приобретает разумные формы поведения и абстрактное мышление. Таким образом, первостепенное значение приобретает коммуникативная среда, обеспечивающая многомодальный обмен информацией между моделируемым интеллектом и социумом.

Важным компонентом подобной коммуникативной среды должна явиться система, формализующая вербальную коммуникацию или естественно-языковой интерфейс. Одной из функций подобного компонента должно стать обеспечение интериоризации - построения моделируемым интеллектом внутренней модели внешних процессов. Понимание текста при этом определяется как сопоставление внешних процессов и внутренним сигналам системы ИИ.

Далее в первой главе излагается концепция СМИ, которая позволяет моделировать процессы интериоризации.

Функцией СМИ является интерактивное моделирование смысла высказываний, или, иначе, моделирование смысла текстов естественного языка. Задачей функционирования СМИ является воссоздание по речевому сообщению модели ситуации реального мира (контекста), описываемой в этом сообщении. В данном случае делается попытка нахождения некоего промежуточного уровня представления коммуникативной информации, который отвечал бы условиям наглядности и адекватности семантической интерпретации исходного текста. При соблюдении этих двух принципов мы получим систему, способную интерпретировать смысл высказываний естественного языка в "форме мыслей", т. е. в форме "картинок" и иных способов представления, описывающих контекст и, несмотря на свою субъективную оформленность, могущих быть, в свою очередь, интерпретированными человеком как "мысли" компьютера о данной контекстной ситуации.

Таким образом, коммуникация устанавливается как на уровне речи, так и на уровне имитации образов мышления, образуя интерактивную систему ментального интерфейса. Предлагается, по сути, новый тип взаимодействия и интерфейса «человек-компьютер». Компьютерная система становится как бы «расширением сознания», снимающим с

него часть «вычислительной нагрузки», своеобразным «сопроцессором сознания».

Структурно СМИ состоит из виртуального пространства (ВП), виртуального мира (ВМ), системы понимания речи, которая, в свою очередь, включает в себя синтаксический анализатор, грамматический анализатор, словарь, содержащий семантические представления (денотаты) слов и механизм модификации этих представлений (рис. 1).

Во второй главе дается детальное описание структурных компонент системы, особенностей их функционирования, их взаимосвязей. Приводятся алгоритмы, типы данных, фрагменты программного кода.

Виртуальное пространство (ВП) - это модель части пространства реального мира, роль которой в СМИ приблизительно соответствует роли "оперативного мышления", или сознания, в момент осмысления какого-либо сообщения. ВП трехмерно и организовано таким образом, что в него можно помещать предметы, придавать предметам определенные свойства (цвет, запах, вкус и т.п.). ВП постоянно отображается на экране компьютера п снабжается средствами редактирования, при помощи которых можно изменять семантические представления отдельных слов. В ВП действует разделение времени, означающее, что на реализацию каждого явления, которое может иметь место в ВП выделяется квант времени. Это позволяет имитировать синхронность явлений реального мира, которая является неотъемлемой составляющей большинства контекстов коммуникации.

Структура системы ментального интерфейса

Рис. 1. Структурные компоненты системы ментального интерфейса

II

ВП описывается трехмерным массивом, элементы которого (точки) обладают определенными свойствами. Свойства точки ВП группируются в сенсорные (цвет, фактура, запах, вкус, звуковые и осязательные свойства) и физические (плотность, кинетическая энергия, потенциальная энергия, коэффициент квазиупругой силы и т.п.). В модели ВП эти свойства описываются действительными и целочисленными шкалами.

Сенсорные свойства служат для моделирования фактов мира, обладающих способностью непосредственно воздействовать на органы чувств (восприятие) человека. Физические свойства необходимы для построения модели физических законов, действующих в ВП, и большей частью представляют собой абстрактные данные (коэффициенты, значения и т. п.).

Потенциал семантических построений, заложенный в ВП, в своей основе имеет следующую интерпретацию. Трехмерный массив точек есть структура, описывающая трехмерное пространство. Точки ВП, располагаясь с равными шагами по координатным осям, образуют параллелепипед. Расстояния между точками меньше или равны минимальному порогу чувствительности человека по расстоянию, т. е. по определению, ничто не может располагаться между двумя соседними точками в ВП. В начальный момент времени точки имеют нулевые значения свойств. В этом случае они моделируют пустоту или вакуум. Любое непустое значение любой точки ВП есть признак материи.

В данном случае строгость физической интерпретации не принципиальна, так как точность модели равна порогам чувствительности человека. Таким образом, точки ВП могут быть пусты и могут описывать материю. Предметом в ВП считается совокупность точек, обладающих свойством не разрываемой протяженности, ограниченной в пространстве, и обладающих сходными (в пределах критического интервала) значениями свойств. При вводе информации о новом (не известном системе) слове, скажем, о новом предмете, задействуется специальная подсистема ввода нового слова, которая в отдельном окне выдает на редактирование участок ВП для инициализации его точек значениями параметров точек, образующих предмет.

Суть имитации физических законов в модели состоит в описании должного взаимодействия всех сенсорных и других полей, порождаемых соответствующими значениями параметров точек ВП. Обработка полей с учетом квантирования заключается в том, чтобы в каждый квант времени анализировать все значения свойств всех точек ВП и реагировать в соответствии с физическими законами, описывающими реакцию на данное значение сенсорного или др. поля структуры точки

ВП. Для того, чтобы учитывать взаимодействия предметов ВП анализируются точки, которые предмет должен занять в результате перемещения за 1 такт и рассматривается возможность перемещения предмета в эти точки. При этом если предмет можно переместить, - заполняемые точки не содержат других предметов, - то предмет перемещается, если содержат, то этот предмет определяется ("фиксируется") по приведенной выше схеме и процедура взаимодействия рассчитывается уже для него. После того, как рассчитано поведение очередного объекта, необходимо идти последовательно по ВП до того, как будет встречен новый объект и далее аналогично. Процедура заканчивается тогда, когда будет проверена последняя точка ВП. Далее происходит квантирование и процесс начинается с начала.

Время выполнения алгоритма квантирования оказалось слишком большим для соблюдения требований наглядности и адекватности представления смысловых контекстов. Поэтому встала задача оптимизации алгоритма по критерию минимума времени выполнения.

Для целей оптимизации алгоритма используются алгоритмические алгебры (АА). Алгоритм квантирования представляется в виде системы уравнений в АА:

(1)

где имеют вид X1 =а {АХ ^ V ВХ/2), (2)

А и В - последовательности операторов, X ц , X/2 - неизвестные в системе уравнений,7 =1,2,...,п, где п равняется количеству логических условий в заданном алгоритме и X^ , X,... есть один из X у .

Решение этой системы находится методом последовательного исключения символов XI из уравнений с использованием решения уравнения вида Х=а ¿У). Решением последнего уравнения является Х=а {5}

Полученное таким образом решение затем используется для оптимизации алгоритма квантирования путем эквивалентного преобразования выражения АА по критерию минимизации времени выполнения. Получаемый оптимальный алгоритм дает приемлемое время выполнения для виртуального пространства из 62500 точек. Этого количества точек оказалось достаточно для проведения основных экспериментов.

Помимо предметов реального мира, человек способен мыслить и явления, в которые эти предметы вовлечены. Виртуальное пространство также должно быть способно к моделированию этого процесса.

В нашей модели явление определяется как изменение любой сенсорной координаты любой точки ВП.

ВП способно представлять также свойства предметов и действий. Например, качество предметов.

Качеством предмета в ВП определяется как свойство предмета, целиком зависящее от свойств точек, образующих предмет и не зависящее от пространственной формы предмета. Исходя из этого определения, можно описывать различные качества предметов совокупностями значений свойств точек, образующих предметы в В П.

Таким образом, виртуальное пространство есть часть СМИ, которая, поддерживая структуры данных, непосредственно интерпретируемые как основные объекты восприятия человека, создает возможность моделирования интериоризации фактов внешнего мира.

Виртуальный мир (ВМ) - это база данных, хранящая результаты и являющаяся продуктом выполнения процедур построения контекстов естественного языка. Идея состоит в том, чтобы запоминать факты о мире в виде модели на основе ВП и представлений слов, добавлять их друг к другу в пространственно-временной сетке и таким образом формировать у машины представление о некоей виртуальной реальности, призванной выполнять роль субъективного отражения мира в будущем коммуникативном процессе.

Как мы уже говорили, СМИ ориентирована на интерактивность на естественном языке. Для этого в нее вводится подсистема понимания речи. Принципиальное отличие предлагаемой системы от подобных заключается в построении ее на базе ВП и ВМ, а, следовательно, в реализации возможности построения "материализованных" смыслов отдельных слов и контекстов. Система понимания речи, включает в себя синтаксический анализатор, грамматический анализатор, словарь, содержащий семантические представления (денотаты) слов и механизм модификации этих представлений.

Синтаксический и грамматический анализаторы необходимы для идентификации грамматических и синтаксических конструкций с целью построения адекватной реализации контекста предложения. Их конкретная реализация в рамках данной работы не рассматривалась. Для задач подобного типа существуют формализации и действующие системы, которые можно применить в СМИ.

Словарь СМИ включает в себя все лексические единицы, с которыми "сталкивалась" данная система, все слова, которые она "знает", и

организуется в виде нескольких баз данных. Каждое слово представляет собой одну или несколько записей, где помимо необходимой лексической, синтаксической и грамматической информации представлены еще и поля, содержащие так называемый семантический эффект (СЭ) слова. Семантический эффект - это такое изменение части ВП (появление нового предмета, описание изменения предметов - явление), которое моделируется как изменение в состоянии сознания (возникновение соответствующего образа) человека при упоминании данного слова вне контекста. При описании представления отдельного слова создается как бы модель слова вне дистрибуции, т.е., взятого отдельно, самого по себе, без описания каких-либо связей этого слова в предложении, или тексте. При этом подобное представление осуществляется таким образом, чтобы в дистрибуции данное слово могло "порождать" в ВП свой СЭ и чтобы, в сочетании с СЭ других членов предложения строился адекватный контекст.

В третьей главе описывается действующая реализация Системы ментального интерфейса - программа «Сосруко», приводятся ее тактико-технические данные. Также описывается ряд экспериментов, цель которых доказать способность системы адекватно представлять смысл некоторых классов предложений на естественном языке.

В частности, было показано, что СМИ способна адекватно интерпретировать предложения, описывающие пространственные, временные и перцептуальные изменения предметов, значения, неявно заданные в предложении, предложения, описывающие взаимодействие объектов.

В заключении сформулированы основные результаты, полученные в диссертационной работе.

Данная работа может послужить стимулированию интереса к проблеме совмещения модельных, образных и образно-символьных представлений в компьютерных лингвосемантических системах.

Главный смысл работы - в привлечении внимания к перспективам построения систем искусственного интеллекта на основе гомеостатиче-ской парадигмы и интерактивного многомодального информационного обмена человек-компьютер.

Библиографический список публикаций автора по теме диссертации

1. .Нагоев 3. В. Моделирование интерпретации сознанием человека информационного плана текстов на естественном языке. Сб. научных трудов «III всероссийского симпозиума «Математическое моделирование и компьютерные технологии», Кисловодск, КИЭП, 1999.

2. Нагоев 3. В. Генерация усредненных представлений семантики лексических единиц при помощи аппарата нечетких множеств. // Известия Кабардино-Балкарского научного центра РАН. Нальчик, 1999, №3.

3. Нагоев 3. В. Модель процессов интериоризации - основа модели семантики языка. В сб. научных трудов 3-ей международной научно-технической конференции «Интерактивные системы: Проблемы человеко-компьютерного взаимодействия/ИС-99»., Ульяновск, 1999.

4. Нагоев 3. В. Система ментального интерфейса. В сб. научных трудов международной научной конференции «Пользовательский интерфейс в современных компьютерных системах». Орел, 1999.

Оглавление автор диссертации — кандидата технических наук Нагоев, Залимхан Вячеславович

ВВЕДЕНИЕ.

ГЛАВА 1. НОВЫЕ ПРИНЦИПЫ КОМПЬЮТЕРНОГО ПОНИМАНИЯ ТЕКСТОВ НА ЕЯ И КОНЦЕПЦИЯ СИСТЕМЫ МЕНТАЛЬНОГО ИНТЕРФЕЙСА.

1.1. Новые принципы компьютерного понимания текстов на ЕЯ.

1.2. Концепция Системы ментального интерфейса.

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Нагоев, Залимхан Вячеславович

Искусственный интеллект (ИИ) - современная наука, характеризующаяся исключительным многообразием и динамизмом. Подобный характер развития этой области знаний, несомненно, связан с уникальностью объекта ее изучения - интеллекта, интеллектуальной деятельности человека. Недостаток знаний о предмете, как следствие - разбросанность концепций, отсутствие адекватных средств и методов формализации, вычислительные ограничения приводят к непрерывной генерации множества теорий, методов, формализмов и моделей, подчас имеющих мало общего, как в методологии, так и по охвату, и по содержанию. При этом, как справедливо отмечает ряд ведущих исследователей ИИ [25], отдельные фундаментальные дисциплины в его составе имеют относительно краткий цикл жизни, и в результате быстрого и насыщенного этапа теоретического развития и создания новых прикладных средств "сводятся к научному обслуживанию технологий" [25]. Многообразие научных школ, теоретических и прикладных направлений, динамизм, взаимодействие и взаимовлияние технологий и фундаментальных исследований - тенденции, лежащие сегодня в основе формирования парадигм ИИ.

В диссертационной работе предлагаются модель и прикладная система, построенные на основе синтеза элементов систем: понимания естественного языка (Speech Understanding Systems), виртуальной реальности, когнитивной графики, а также инженерии знаний, гомеостатики. Эти элементы рассматриваются во взаимосвязи, как единое целое для создания новых методов решения одной из ключевых проблем искусственного интеллекта - проблемы понимания текстов на естественном языке (ЕЯ).

Объектом диссертационного исследования является моделирование процессов, протекающих при понимании человеком текстов на ЕЯ.

Предметом исследования является представление смысла текстов на ЕЯ, формирующееся у человека в процессе осмысления естественноязыкового высказывания.

При этом ставятся две главные цели исследования: 1. изложение и обоснование новых принципов компьютерного понимания текстов, 2. создание модели и прикладной системы представления смысла текстов на ЕЯ, являющейся необходимой компонентой построения систем, опирающихся на новые принципы понимания и способных продемонстрировать адекватный уровень понимания текстов на ЕЯ.

Подобная композиция целей обусловлена, с одной стороны органической взаимозависимостью и иерархической структурированностью систем и способов представления смысла и систем понимания смысла, и, с другой - необходимостью проведения относительно полного исследования, а также построения прикладной системы, приближающей нас к решению задачи понимания текстов на ЕЯ.

Задачей исследования является разработка модели и прикладной системы, реализованной на основе описываемых и выводимых в работе принципов и способов представления смысла и способной представлять:

- смысл предложений, описывающих пространственные, временные и перцептуальные изменения предметов;

- смысл, неявно заданный в предложении;

- смысл предложений, описывающих взаимодействие предметов.

При этом получаемые представления должны обладать свойствами наглядности, адекватности, многомодальности. В задачу входит также проведение экспериментов по представлению смысла с использованием этой системы.

Вряд ли стоит сегодня убеждать любого ученого любой специальности в необходимости работ по ИИ. Так же вряд ли имеет смысл доказывать какому-либо члену мирового сообщества ученых ИИ актуальность исследований по пониманию естественного языка. В наши дни - это общепризнанные факты. Так, например, согласно [46], большинство (18 докладов) на 13-й европейской конференции по искусственному интеллекту - ЕСАГ98 было посвящено именно проблемам вычислительной лингвистики. Поэтому, учитывая многоаспектный, "полисинтетический" подход к предлагаемому решению проблемы понимания и представления смысла, хотелось бы далее изложить краткое обоснование актуальности постановки задачи и методов ее решения. Начнем с обзора основных направлений и достижений современной компьютерной лингвосемантики.

При подготовке и выполнении диссертационной работы автором использовались книги и монографии отечественных и зарубежных ученых и специалистов, периодические научные отечественные и иностранные издания, материалы российских, национальных и международных конференций, симпозиумов и семинаров, техническая документация и описания прикладных программ и систем, диссертации и авто5 рефераты, текстовые материалы и программы, полученные по сети Internet. Неоценимую помощь в работе над диссертацией автору оказали публикации научных статей ведущих российский ученых по ИИ в журнале Российской ассоциации ИИ "Новости ИИ".

Проблема семантической обработки естественно-языкового высказывания лежит на пересечении нескольких научных направлений [38]:

- изучения феноменологии естественного языка в традиционной и современной лингвистике;

- построения формальных языковых моделей в компьютерной лингвистике;

- представления смысла высказывания в логических и сетевых формализмах в области искусственного интеллекта.

Обратимся к вопросам построения формальных языковых моделей. По общему определению, формальная грамматика - это четверка Г=<8, А. В, Р>, в которой S - аксиома; А - множество нетерминальных символов; В - множество терминальных символов; Р - правила вывода. Объектами, с которыми работает формальная грамматика, являются цепочки, состоящие из терминальных и нетерминальных символов. Правила вывода имеют вид а->Ь, где а и Ь- цепочки символов. При этом а содержит хотя бы один нетерминальный символ. Функционирование формальной грамматики всегда начинается с цепочки, состоящей из единственного символа S. Применение правила а->Ъ к цепочке с заключается в замене всех вхождений (или только самого левого вхождения) а в с на Ъ.

Процесс заканчивается, когда ни одно из правил вывода к данной цепочке не применимо. Такие заключительные цепочки входят в язык, порождаемый данной формальной грамматикой. В синтаксически правильных формальных грамматиках в язык входят только те цепочки, которые состоят полностью из терминальных символов. В зависимости от ограничений, накладываемых на структуру правил вывода, выделяются различные типы формальных грамматик.

Одним из достижений компьютерной лингвистики, во многом определившим направление развития разработки формальных моделей языка явилась трансформационная грамматика, предложенная Н. Хомским.

Грамматика по Хомскому [63] представляется однородной математической системой, описываемой процессом порождения состояний. В этом случае грамматика 6 представляется как тройка:

1) (V.Z.F), где Z - конечное множество начальных цепочек; F - конечное множество правил - продукций вида: X->Y; Y - алфавит системы (словарь). Процесс "прохождения" состояний системой (^грамматикой Хомского) описывается деревом порождения (=деревом непосредственно составляющих (НС)). В зависимости от составляющих тройки (1) Хомский [63] выделяет три типа грамматики и, соответственно, описываемых ими языков:

- грамматики с конечным числом состояний, соответствующие описанию конечного автомата (—машины Тьюринга);

- контекстно-свободне грамматики, широко распространенные в компьютерной лингвистике;

- контекстно-связанные грамматики.

Контекстно-свободная грамматика, описанная Хомским, относится к типу трансформационных грамматик, так как все правила - продукции носят характер трансформации НС. На рис. .1 приведен пример дерева непосредственных составляющих для фразы из [29]. В одном из первоначальных вариантов грамматика Хомского состояла из базисного и трансформационного компонентов. Базисный компонент включал в себя: (а) ограниченный набор не терминальных категориальных символов, а именно - начальный символ S (предложение), символы NP (именная группа - noun phrase), VP (глагольная группа - verb phrase), N (имя), V (глагол), Det (детерминатив), Aux (вспомогательные нормативы времени и наклонения), а также неограниченное множество

2) "Искренность могла напугать этого мальчика"

3) (I) S -> NP+VP (IX) N -> мальчик

II) NP -> Det+NP (X) N -> искренность

III) NP -> NP+NP (XI) Det -> этот

IV) NP -> S (XII) Aux -> может

V) NP -> N (XIII) Aux -> -л (прош. Bp.)

VI) VP -> Aux+VP (XIV) V -> напугает

VII) VP -> VP+NP (XV)

VIII) VP ->V

Рис. 1. Дерево непосредственных составляющих для фразы: "Искренность могла напугать этого мальчика" 7 терминальных символов, то есть конкретных формативов: слов или грамматических морфем - мальчик, искренность, напугает, этот, может; б) набор правил, оперирующих с этими категориальными символами и имеющих вид подстановок (3), категориальных (I-VIII) или лексических (IX.).

На основе подобных правил из начального символа предложения (S) выводится бесчисленное множество цепочек (strings), состощих из лексико-грамматических формативов, причем к каждой цепочке оказывается присоединенной ее синтаксическая структура, или фразовый показатель.

Трансформационный компонент содержит различные операции перегруппировки Тгруп, объединения Тед, управления Тупр, согласования Тсогл, вставки Твст или опущения Топ, которые применяются к тем или иным фрагментам терминальной цепочки и преобразуют их таким образом, что эти цепочки получают вид хорошо оформленного предложения, например (2) из (3). В [29] отмечены свойства порождающего описания, которые объясняют популярность этого типа представления:

- многоаспектность;

- связность и иерархичность;

- эксплицитность;

- объяснительная сила;

- конкретность;

- дифференцированность.

В дальнейшем были предложены разнообразные варианты формальных грамматик Хомского.

Например, в формализме DCG (definite clause grammar) [68] используется идея Колмероэ и Ковальского о переходе от специального грамматического формализма к более общему формализму логики предикатов первого порядка. В DCG логический вывод применяется в качестве механизма грамматического разбора. Грамматика записывается в терминах правил Пролога, где нетерминальные символы описываются правилами, а терминальные - фактами. С использованием формализма DCG были реализованы грамматики различных национальных языков (прогамма LINGUIST) [87].

Категориальные грамматики представляют собой тип формализма грамматик зависимостей, в котором слово может быть замещено структурой, которой оно управляет. В основе категориальных грамматик лежит простой логический механизм построения категорий путем объединения других категорий, благодаря чему категориальные грамматики активно используются в исследованиях, связанных с логической семантикой. Примеры использования категориальных грамматик для обработки ес-тесственного языка даются в [66]. Другим примером реализации категориальной грамматики может служить исследовательская система SLG [87].

Унифицированные формализмы (PATR, FUG, LPG, GPSG, HPSG) - это грамматики, в основе которых лежит логическое исчисление и форма "атрибут - значение" [80]. Примерами систем, реализующих подобные формализмы могут служить AV parser [76], система QPATR [79], исследовательская система GULP (Graph Unification Logic programming) [64], UBS [87], TFS [102], CLE (Corel Language Engine) [54], CYC [65], CAT2 [93], Context Feature Structure System [60], Fergamed [78]. В [103] описывается способ расширения механизма построения категорий унификацией.

Формализм TAG (Tree-Adjoining Grammar) был предложен в середине 70-х годов для строгого описания структур ЕЯ [55]. Он предназначен для разделения двух типов данных, описывающих иерархическую структуру предложения: необходимых нерекурсивных линвистических структур, соответствующих видам фраз, и структур, способных рекурсивно разворачиваться. Известно несколько систем для разработки TAG-описаний [73, 94].

Несмотря на то, что грамматика конечных автоматов является достаточно эффективной в реализации, она обладает слишком ограниченными возможностями для анализа, по этой причине одним из широко используемых механизмов анализа является формализм расширенных сетей переходов (ATN). Формализм ATN расширяет грамматику конечных автоматов, вводя аппарат рекурсивного вызова новой подсети переходов (операция PUSH) и набор регистров, в которых хранятся текущие результаты разбора фразы, а также средства работы с ними. Значения регистров могут выступать как условия перехода по веткам (что обеспечивает частичную зависимость от контекста). Благодаря регистрам и операциям над значениями, которые там хранятся, ATN-формализм эквивалентен процедурному языку программирования, в котором можно описать анализ языка произвольной сложности. ATN-формализм был реализован в ряде систем: LINGOL [90], LIFER [75], DIAGRAM [92], PAKTUS [87]. 9

Несмотря на доминирующее положение формальных грамматик в современной компьютерной лингвистике, они обладают рядом ограничений, затрудняющих их использование для семантической обработки языка.

Во-первых, формализм, предложенный Хомским, - это синтаксически-ориентированная модель, не предназначенная для распознавания, хотя и синтаксически правильных, но абсолютно бессмысленных фраз языка.

Во-вторых, в основе формальных грамматик Хомского лежит однородный по своей математической природе формализм. Это преимущество оборачивается недостатком, так как в угоду математической строгости модели игнорируется целый ряд явлений, относящихся к области феноменологии языка, но лежащих за рамками возможностей применения математической теории. Арсенал математических средств для описания как структур языка, так и алгоритмов их обработки должен быть существенно расширен [11, 96].

В-третьих, дерево непосредственных составляющих как результат грамматического разбора (parsing) не содержит семантических связей, или содержит их в опосредованной форме. Дерево порождения - это структура, которая носит скорее процедурный, чем семантический характер.

Развитие формальных грамматик шло, в основном, по пути преодоления вышеперечисленных ограничений. Например, попытки описания синтаксической структуры предложения с помощью дерева зависимостей, получили развитие и математическое обоснование в теории деревьев синтаксического подчинения [11].

Функциональная грамматика (ФГ) [74] - другое направление в современной лингвистике - позволяет представлять смысл предложения и высказывания. Поясняя смысл термина ФГ, Холлидэй пишет: "Она {грамматика - 3. Н.) функциональна в трех различных, хотя и близко связанных смыслах: (1) в ее интерпретации текста; (2) в ее системе; (3) в элементах лингвистических структур. (1) Каждый текст, независимо от того, устный он, или письменный, связан в некотором контексте использования. Более того, именно эти использования языка в течении десятков тысяч поколений, сформировали эту систему. Язык предназначен удовлетворять человеческие нужды, и то, что он организован функционально, в соответствии с этими нуждами, - не подлежит сомнению. (2) Все языки организуются вокруг двух главных видов смысла, идеальных, или рефлексивных и межперсональных, или активных. Эти мета-функции являются в лингвистических системах выразителями двух общих целей, которые пронизывают все употребление языка: (1) понимать окружение и (2) взаимодейстовать с другими. (3) Каждый элемент языка объясняется ссылкой на его функцию в общей лингвистической системе, т. е., каждая его часть интерпретируется как функциональная в соответсвии с целым. В ФГ высказывание рассматривается:

- как информационное сообщение;

- как обмен (взаимодействие);

- как представление (смысла).

В ФГ вводятся следующие основные параметрические компоненты высказывания:

- слушатель и говорящий;

- тема и рема;

- субъект и действующие методы.

При рассмотрении высказывания как информационного сообщения основной упор делается на его актуальное членение, то есть на способы представления темы и ремы в английской фразе. При этом тема представляется как функция высказывания -сообщения.

В ФГ выделяются два основных типа отношений: дать и потребовать. Рассматривая высказывание как обмен (взаимодействие), Холлидэй выделяет два типа обмена: обмен информацией и обмен товарами и услугами. Комбинация этих двух признаков приводит к следующей таксономии высказываний [38]: предложение (offer), команда (command), утверждение (statement), вопрос (question).

Несмотря на то, что при рассмотрении функций реальных аспектов высказывания, Холлидэй очень близко подходит к структуре смысла высказывания, его подход имеет ряд недостатков:

- в ФГ нет логической формы для описания смысла высказывания;

- нет механизмов взаимодействия и увязки аспектов смысла между собой;

- нет четкого разделения: смысл предложения vs. смысл высказывания.

В работах Дж. Катца и Дж. Фодора [77] идея семантической интерпретации готовой синтаксической структуры уступила место идее синтеза предложения с заданным смыслом. В связи с этим на первый план выдвинулись вопросы о семантической глубинной структуре преложения» (с нынешней точки зрения - о семантическом представлении высказывания), о перекодировании глубинной структуры в поверхностную, о словарях, ориентированных на решение этой задачи и о семантическом анализе слова в таком словаре [3].

Исследование глубинной структуры текстов шло двумя путями. Одни лингвисты довольствовались принципиальной констатацией того, что для некоторых предложений с очень развитой поверхностной структурой по ряду причин приходится постулировать одну и ту же глубинную структуру, при этом никакого анализа для записи глубинной структуры не предлагалось. Другие исследователи сосредоточивались на записи глубинных структур и формах их фиксации [3].

Дж. Лаков [3] обратил внимание на то, что если считать перифразы предложения различными по своей структуре, то придется ввести два разных правила семантической интерпретации, которые приписывали бы им одно и то же значение. Между тем ряд фактов указывает на то, что различия между предложениями касаются только поверхностной синтаксической структуры; их глубинная структура идентична, и поэтому при их трансформационном порождении можно обойтись одним правилом семантической интерпретации.

Исследуя вслед за М. Холлидэем и Ч. Филмором отношения между каузативными и эргативными конструкциями, Дж. Лайонс интересным образом проанализировал предложения типа: 1) Иван прыгнул, 2) Иван пролетел метр и 3) Иван ударился о столб. Предложения первого типа - агентные: они описывают, что делает субъект. Предложения третьего типа - не агентные. Предложения второго типа допускают оба осмысления.

Предложения всех трех типов имеют сходную поверхностную синтаксическую структуру: имя предмета в них трактуется как подлежащее. Однако, как считает Дж. Лайонс, глубинная структура рассматриваемых предложений различна. В первом случае поверхностное подлежащее действительно обозначает субъект, в третьем же случае формальное подлежаще обозначает фактического реципиента действия. Действие в этом случае - всегда результат воздействия, именем которого является каузативный глагол.

В работах Дж. Лича представляют интерес наблюдения над семантической связью между кванторами всеобщности и существования, импликацией и родовидовыми значениями. Предложения типа Дети любят яблоки и Мальчики читают книгу на поверхностно-грамматическом уровне имеют одну и ту же структуру. Однако их семантические представления различны. В семантической записи первого предложения содержится квантор всеобщности (Все дети любят яблоки), а в семантической записи второго - квантор существования. Из предложений первого типа можно вывести предложения, в которых квантифицированное слово заменено видовым термином: Дети любят яблоки ->Малъчики любят яблоки (Дедуктивная импликация, соответствующая одной из форма аристотелевской логики). Из предложений второго типа можно вывести предложения, в которых квантифицированное слово заменяется родовым термином: Мальчики читают книгу->Дети читают книгу (индуктивная импликация) [3].

Большой вклад в данную область внесли работы [70, 3]. Ч. Филмор предложил язык для записи глубинной структуры и некоторые правила перевода глубинных структур в поверхностные. Ч. Филмор принял гипотезу компонентной структуры значения и идею последовательного разложения лексического значения каждого слова на более простые компоненты - вплоть до конечных (ultimate). Другим существенным элементом языка, с помощью которого описываются лексические значения, считался предикатно-аргументный синтаксис.

Ч. Филмор устанавливает следующие, так называемые глубинные падежи, или роли, аргументов: 1) агент - одушевленный инициатор событий, описываемых соответствующим глаголом, например, он говорит; 2) контрагент - сила, против которой направлено действие, например, сопротивляться кому-либо; 3) объект -вещь, которая передвигается или изменяется, положение или существование которой является предметом внимания, напрмер, разбить окно, осуждать кого-л. за о п о з дани е. Камень упал; 4) место (судя по примерам) - физическое тело, испытывающее непосредственное воздействие со стороны деятеля, задеть чей-л. нос - задеть кого-л. по носу; 5) адресат (goal) - лицо, в пользу или во вред которому совершается действие, например, осуждать кого-л., учить кого-л., продавать что-л. к о м у - л., покупать что-л. у к о г о - л.; 6) пациенс - вещь, которая испытывает эффекты действия, например, О н осуждает Петра, грабить кого-л., красть что-л.; 7) Результат - вещь, которая возникает в результате действия; 8) Инструмент - стимул или непосредственная причина события, например, ударить кого-л. кнутом, подняться на ноги; 9) Источник - место, от (из) которого что-л. направлено, например, О н преподает мне математику. О н продает книгу.

Между ролями - элементами глубинной структуры и аргументами -элементами поверхностной структуры нет взаимнооднозначного соответствия. Поэтому а) один аргумент может выполнять несколько ролей (в Он преподает мне математику подлежащее обозначает одновременно и агента и источник; б) аргумент может быть обязательным, а выполняемая им роль - факультативной (ср. Джон упал, где есть обязательный объект - тело Джона и факультативный агент - сам Джон, если он упал намеренно; если же Джон упал ненамеренно, то значение агента в рассматриваемом предложении не выражается); в) роль может быть обязательной, а аргумент -факультативным; г) роль может быть выражена имплицитно, без каких-либо поверхностных экспонентов: в подниматься (по лестнице) и целовать содержится имплицитное указание на инструмент (ноги и губы соответственно).

Второе нововведение Ч. Филмора состояло в том, что он предложил более тонкую, чем традиционная концепцию лексического значения. Традиционная концепция значения, связанная с именами Валли, Эрдмана, Огдена, Ричардса, Фирта, Вандриеса, Ульмана, Звегинцева [3], исходила из представления о том, что содержательная сторона языковых единиц многослойна. Помимо значения в собственном смысле слова (sens intellectuel, Begriffsinhalt, denotation) в нее включаются еще побочное значение, или оттенок значения (nuances, Nebensinn, contextual meaning в смысле Дж. Фирта), а также стилистические и эмоционально-экспрессивные элементы значения. Ч. Филмор идет дальше своих предшественников в том отношени, что расщепляет на две сущности прежде единое понятие собственно значения. Этими сущностями являются значение и пресуппозиция. При этом под пресуппозицией понимаются условия, которые должны быть удовлетворены, чтобы редложение могло функционировать как вопрос, приказ, утверждение и т.п.

Исследование ЕЯ-явлений, лежащих за рамками традиционной грамматики предложения и относящихся к ЕЯ-высказыванию, таких, как пресуппозиция, референция [6], фокус эмпатии, эмфаза [22] актуальное членение предложения, видо-временные отношения. [38] явилось одним из направлений описания феноменологии ЕЯ, сформировавшимся в 70-80-е годы.

В [36] и [37] было показано, что преодолеть смешение предложения и высказывания при описании семантики предложения можно путем эксплицитного рассмотрения предложения в контексте речевого акта: объектом, с которым должна иметь дело семантика предложения, является, в конечном итоге, не семантическое представление предложения, а семантико-прагматическое представление высказывания.

В теории высказвания выделяются следующие аспекты значения (смысла) высказывания:

- номинативный;

- коммуникативный;

- иллокутивный;

- референциалъный.

Уже в середине 60-х было обращено внимание на то, что любая фраза не только обозначает некое явление действительности, но и объединяет в себе три действия: локуцию - говорение как таковое, иллокуцию - действие при помощи говорения, перлокуцию - действие, которым говорящий пытается оказать некоторое воздействие на слушающего. Речевой акт определяется как состоящий из локутивного, иллокутивного и перлокутивного актов. [7, 33].

В своих работах Е. В. Падучева останавливается на референциальных аспектах высказывания. При этом выделяются понятия: пропозиция, денотативный статус, коассигнация, сфера действия кванторов, денотативная зависимость.

Наиболее важное с точки зрения соотношения смысла предложения и высказывания - это понятие пропозиции (Ср. пресуппозиция у Ч. Филлмора), которое определяется как общее содержание утверждений, суждений, обещаний, пожеланий, желаний, вопросов и ответов, т. е., того, что может быть возможным или вероятным. При этом, пропозиция сама не имеет истинности значения. Только употребление предложения, выражающее данную пропозицицю в высказывании, порождает то, что может быть истинным, или ложным, - утверждение, мнение и т. д. Смыслом предложения обычно является пропозициональная форма, содержащая прагматические переменные.

Семантические исследования Ч. Филмора завершились пересмотром обычной схемы словарной статьи в толковом словаре. Он предложил значительно расширить объем помещаемой в словаре информации и изменить форму ее подачи.

15

В целом полученная им схема имеет много общего с «моделью управления» -формой описания синтаксических свойств слова, которая используется в толково-комбинаторном словаре модели «Смысл <-> Текст».

Например, словарная статья: Чате 1. 'осуждать' - Речь (т.е. blame - не глагол речи) - Моменталъностъ аргументы: адежи (роли): редлоги:

X,Y,Z

Источник и Пациенс, Адресат, Объект by, on, for (by - предлог X в пассивной конструкции; on - предлог Y в конструкции blame something on somebody; for - предлог Z в конструкции blame somebody for something) ормальное подлежа- X {ее:

Ytuiu Z (т. e: осуждают либо лицо, либо его поступок) X— лицо Z - деятельность Z' или результат Z' X считает [Z' -плохо]

X считает [Y каузировал Z]

X (т.е. в случае неопределенного подлежащего оно может опусрямое дополнение: ресуппозиция: начение:

Факультативность ри неопределенности каться)

Большой интерес представляет семантический язык (lingua mentalis) для записи смысла высказываний, разработанный А. Вежбицкой [3]. Если для рассмотренных выше работ характерно стремление построить семантический язык как расширение логического языка исчисления предикатов, А. Вежбицка строит свой lingua mentalis как сужение естественного языка. Это - наиболее простая словарно и синтаксически часть естественного языка, а именно - его минимальный словарь и минимальный набор синтаксических конструкций, признаваемый достаточным для описания значений всех остальных лексических и грамматических средств языка. Словарь lingua mentalis состоит из нескольких десятков неопределяемых семантических элементов типа 'хотеть', 'не хотеть' (независимые друг от друга и равно сложные модальности), 'считать', 'делать' и немногих других. Главное же отличие lingua mentalis от других семантических языков этого типа лежит в синтаксической структуре его предложений.

Обычно двумя основными элементами семантического представления простого предложения считаются n-местный предикат и предметные переменные, обозначающие его аргументы. А. Вежбицка исходит из того, что в глубинной структуре все предикаты суть одноместные имена свойств и единственный аргумент каждого предиката -это субъект S, которому приписывается данное свойство Р: S есть Р. Однако эта формула не исчерпывает структуры высказывания. А. Вежбицка дополняет ее третьи элементом - модальной рамкой М (в некоторых работах фигурирует еще один элемент - обозначение времени, когда данное свойство характеризует данный предмет). В результате общая структура предложения на lingua mentalis приобретает следующий вид: М, что S есть Р. При переходе от lingua mentalis к естественному языку эта структура преобразуется по определенным правилам, включающим, в частности, правила снятия модальностей, lingua mentalis дополняется подробным анализом структуры каждого из приведенных элементов структуры предложения.

Необходимо отметить, что, несмотря на некоторые расхождения между представителями различных направлений и школ семантики, имется определенный минимум представлений, общий для них всех. В этот минимум входит представление о том, что семантика является компонентом полного лингвистического описания, мыслимого в виде модели, которая умеет: 1) строить правильные предложения естественного языка по заданным значениям или извлекать значения из заданных преложений, 2) перифразировать эти предложения, 3) оценивать их с точки зрения семантической связности и выполнять ряд других задач. Главным средством решения всех этих задач признается специальный семантический язык для записи содержания высказывания, а также словари и правила, с помощью которых устанавливается соответствие между переводящими друг друга предложениями естественного и семантического языков.

Семантическими [38] принято считать системы, в которых в процессе анализа содержания текста делаются попытки учесть не только лингвосемантические, но и логико-семантические отношения между языковыми объектами. Кроме того, контекст, определяющий лингвосемантические отношения и в обычных системах синтаксического анализа не выходящий за пределы предложения, в семантических системах распространяется на уровни дискурса и текста. Наконец, предполагается, что система семантического анализа должна учитывать как сведения о данной предметной области (ПО), так и ее связи с внешним миром в целом. Таким образом, в семантических системах делаются попытки осуществить глобальное понимание текстов на естественном языке (ЕЯ).

Традиция формального представления смысла фраз естественного языка берет начало от логики Аристотеля [5]. Однако метод представления смысла естественно-языковых фраз, предложенный в силлогистике Аристотеля и ее модификациях [41] применим к ограниченному классу высказываний кванторного типа, включающему четыре шаблона:

А: Всякий X есть 8.

В: Всякий X не есть 8.

I: Некоторый X не есть 8.

О: Некоторый X не есть 8.

Выражаясь современным языком, силлогистика Аристотеля ориентирована на формализацию умозаключений в системе когнитивных отношений "элемент-множество".

Появление исчисления высказываний, или "булевой алгебры", предоставило математический аппарат для определения значений истинности сложных утверждений на основании значений составляющи его простых компонентов, если они объединены с помощью логических связок И, ИЛИ, НЕ, импликации, тождества.

В логике термин высказывание и его синоним утверждение используются в смысле, отличном от понимания этих терминов в современной лингвистике. Так, например, даже часть естественно-языкового предложения может интерпретироваться в логике как высказывание, в то время как в лингвистике высказывание - это предложение, актуализированное в составе речевого акта.

В [10] отмечено, что, с одной стороны, для каждой из пяти логических связок, используемых в исчислении высказываний, имеется эквивалент в естественном языке. С другой стороны, естественный язык был бы сильно обеднен сокращением числа его связок до пяти. Напротив, исчисление высказываний не станет богаче, если ввести дополнительные связки. Исчисление высказываний бедно выразительными средствами и не позволяет описывать дедуктивные рассуждения всех типов [41], в частности, силлогистические рассуждения. Естественным развитием исчисления высказываний является исчисление предикатов [41, 10].

Стратегия определения семантических значений компонент и формул логики предикатов базируется на понятии интерпретации логической формулы. При этом задается семантическое значение для каждого базисного выражения. Затем вводятся правила вычисления семантических значений сложных логических формул по известным семантическим значениям компонент. Таким образом, приписываются семантические значения все более и более крупным составляющим логической формулы, и, в конце концов, семантическое значение будет приписано всей формуле. Этот процесс называется композиционным методом [10]. Композиционный метод гарантирует, что семантическое значение сложного выражения всегда является функцией его семантических составляющих и способа их комбинирования.

Опыты по обучению распознаванию смысла фраз успешно проводились в Институте кибернетики АН УССР [15]. В простейшем случае рассматривались фразы, состоящие из подлежащего и сказуемого. При фиксированном списке п глаголов, каждое существительное характеризовалось строкой сочетаемости с этим глаголом, имеющей длину п. На г-м месте этой строки стоит единица или нуль в соответствии с тем, осмысленно или неосмысленно сочетание рассматриваемого существительного с г'-м глаголом данного списка (/=1,2,.п). В задачу самосовершенствующейся системы входило предсказание как можно большего количества возможностей осмысленного сочетания существительного с различными глаголами на основе ограниченного опыта. Задача обучения в этом случае [13] трактовалась как задача воссоздания структуры унитарной машины для классификации свойств выбранных понятий. Для решения этой задачи организовывался процесс объединения понятий, сочетаемых с одними и теми же глаголами в классы, соответствующие новым, обобщенным понятиям, которых могло и не быть в исходном списке. Например, за счет объединения ряда понятий (скажем, «отец», «сын», «студент», «профессор» и др.) по признакам сочетаемости с глаголами «жить» и «думать» возникало понятие «человек». Для устанения возникающих ошибок вводился процесс самостоятельного составления машиной новых фраз за счет сочетания других (случайно выбираемых) понятий. Осмысленность (или бессмысленность) этих сочетаний должна была быть сообщена машине человеком-учителем.

Идея интерактивного обучения корректности смысла фраз и вообще правильности (синтаксической, семантической) языковых конструкций, на наш взгляд, очень перспективна. Достаточно вспомнить, как подобный процесс протекает у детей, осваивающих речь. В частности, описыванный механизм, практически без изменений, можно применять в любой (в том числе и в предлагаемой в данной работе) системе в качестве «грубого» семантического корректора.

Основной задачей представления знаний [10] является перевод неформальных выражений или описаний метаязыка (=естественного языка) в фразы объектного языка (=языка исчисления предикатов). При этом выбор предикатов, числа их аргументов, констант и переменных осуществляется аналитиком. Исчисление предикатов не представляет никаких возможностей обоснования этого выбора.

В обыденном языке часто говорят о-допустимости чего-либо, о гипотетических событиях, целях, которые можно пытаться достигнуть, догадках о будущем. Большая часть фраз языка может быть то истинной, то ложной в зависимости от обстоятельств, текущего момента, точки зрения каждого из нас. В естественном языке модальности "возможный", "необходимый", "допустимый" выражаются полувспомогательными глаголами, такими как "должен" и "могу". Для формального описания модальности были предложены модальные логики [31]. Название "модальная логика" происходит от того, что модальные логические системы вводят такие операторы над логическими формулами, которые позволяют модифицировать их интерпретацию. Возможность и необходимость называются алетическими модальностями или модальностями возможности. Логическая система, базирующаяся на операторах "возможно", "что" и "необходимо", "чтобы", называется логикой возможного, или алетической логикой.

Деонтическая логика вводит модальности разрешено, обязательно, реализующие языковые конструкции разрешается, надо, чтобы.

Эпистемическая логика, или логика знаний, исследует модальноси знания и веры, тогда как временная логика вводит модальности иногда и всегда (в будущем и прошлом) вместе с их отрицаниями часто и никогда.

В [86] высказаны основные предпосылки формализации семантики и частично прагматики с использованием средств интенциональной логики и алгебры. Дальнейшее развитие эти идеи получили в работах [30, 86].

Основная идея нечетких логик, теории нечетких множеств и других нечетких теорий [41] состояла в том, что человеческий способ рассуждений, опирающийся на естественный язык, не может быть описан в рамках традиционных математических формализмов. Этим формализама присуща строгая однозначность интрпретации, а все, что связано с использованием естественного языка, имеет многозначную интерпретацию. Последовательно проводя идею нечеткости, по мнению Заде [101], можно построить нечеткие аналогии всех основных математических понятий и создать необходимый формальный аппарат для моделирования человеческих рассуждений и человеческого способа решения задач.

Так же как и модальные логики, нечеткая логика заняла прочные позиции в области управления, принятия решений, представления знаний, однако широкого проникновения в область компьютерной лингвистики этих достижений современной логики пока не произошло. Неклассические логики можно сочетать с классическим исчислением предикатов. В свою очередь, исчисление предикатов можно комбинировать с такими сравнительно эффективными механизмами вывода, как резолюция [10]. Таким образом, логические формализмы представления знаний предоставляют математически строгое решение проблемы рассуждений.

Переход к уровню семантического представления влечет за собой введение новых формализмов. В отличие от синтаксических структур, имеющих вид дерева, семантическое представление часто имеет вид графа или квазиграфа. Недостаток логического формализма - его неструктурированнность: например, для сбора всей информации по одному объекту приходится пробегать все множество лоических формул некой базы данных. Графовые представления, о которых пойдет речь далее, служат глобализации и структурированию информации.

Идеи графового представления семантических и логических связей между объектами берут начало от работ Пирса [89] и в настоящее время графовые представления заняли прочное место в теории и практике ИИ [81]. Граф собирает вокруг одного узла всю информацию по некоторому объекту, поэтому графовые представления, такие как концептуальные графы [95] и семантические сети [100], позволяют визуализировать модель мира, которому принадлежит решаемая проблема. Концептуальные графы и семантические сети составляют графическую версию исчисления предикатов. Фреймы как объектное представление информации о предметной области можно получить как из логического представления, так и из сетевого [10]. В [81] отмечается, что в настоящее время существует восемь основных парадигм в области семантических сетей: концептуальные завистимости; концептуальные графы Совы; ЕСО; KL-ONE; сети с "путевым" механизмом вывода (path-based inheritance); семантики предпочтения; PSN; SnePS.

В [81] концептуальные графы рассматриваются как вид семантических сетей, напротив, в [10] концептуальные графы Совы рассматриваются как средство представления логических формул, в то время как семантические сети чувство гния интерпретируются сложные структуры, объединяющие концептуальные Мы в дальнейшем изложении будем придерживаться первой точки зрения.

Рис. 2. Часть семантической сети.

Части семантической сети соответствуют следующие формы в естественном языке (4-11).

4) Toby the hungry tiger follows his mother.

5) Toby, the son of the tigress he follows, is hungry.

6) The tiger is followed by her hungry son Toby.

7) Hunger grips Toby, son of the tigress leading him.

8) She who bore hungry tiger Toby is also by him followed.

9) Der Tiger Toby, der seiner Mutter folgt, hat Hunger.

10) Hungry Toby's relation to the tiger is one of mother-leading.

11) Голодный тигр Тоби следовал за своей мателъю

Пунктирными линиями на рис. 2 показаны отношения" элемент - множество. На этом примере можно отметить основные черты семантических сетей (=графовых представлений). Семантическая сеть представляет собой граф, узлами которого являются концепты, а дугами - отношения между концептами. Из этого примера также видно, что семантические сети подходят к предложению с точки зрения представления знаний. При этом целый ряд феноменологических аспектов, связанных с высказыванием, как формой естественно-языкового общения, остается не учтенным. Среди них такие, как коммуникативное строение фразы, заданное коммуникативными ролями участников ситуации, актуальное членение, фокус.

Различные разновидности семантических сетей отличаются своими целями и исходными предпосылками, формой представления отношений между объектами и используемым для этого формализмом, набором решаемых задач.

В основе теории концептуальных зависимостей (ТКЗ) [84, 38] лежат следующие положения:

- если два предложения имеют одинаковый смысл, они должны быть представлены одинаково, независимо от использования конкретных слов;

- информация, имплицитно находящаяся в предложении, должна быть представлена эксплицитно. Это значит, что любая информация, которая может быть выведена из того, что выражено явно, должна быть включена в это представление. Словарь концептуальных зависимостей включает:

- набор примитивов, используемый для представления действий в мире;

- набор состояний, используемый для представления предусловий и результатов действий;

- набор зависимостей, или возможных концептуальных отношений, которые могут существовать между примитивами, состояними и задействованными в них объектами

Модель КЗ в качестве семантической основы использует сеть концептул ций (пар семантических единиц, связанных соответствующими отношениями) яв ляющуюся квазиграфом. Отличие от графа состоит в том, что кроме бинарных рас сматриваются тернарные и кватернарные отношения и дуги квазиграфа связывают только вершины, но и другие дуги. Вводятся основные (примитивные) семантические категории - концепты и правила, на основе которых могут строиться новые концепть произвольной сложности, а также множество примитивных актов, к которым в х анализа можно свести все действия, описывающие поведение человека

1UBCKd> его намерения, взгляды, умозаключения, ощущения и т. п. Предлагается также механизм выво да новых умозаключений.

Множество примитвов варьировалось в процессе разработки теории КЗ он составляет приблизительно 10-12 предикатов:

PTRANS: изменение расположения объекта;

ATRANS: изменение владельца, обладания или контроля над объектом-MTRANS: обмен ментальной, информацией между объектами; MBUILD: порождение идеи или нововй информации агентом; ATTEND: акт фокусирования органа чувств на объекте; GRASP: захват объекта актором так, что им можно манипулировать; PROPEL: приложение физической силы к объекту; MOVE: перемещение части тела агента самим агентом;

INGEST: принятие внутрь объектов (пища, воздух, вода и т.д.) живым существом;

EXPEL: вывод наружу объектов из живого существа; SPEAK: акт производства звуков, включая некоммуникационные звуки. Каждый примитив имеет набор слотов, связанных с ним из набора концептуальных зависимостей. С каждым слотом связаны ограничения на сорт объектов, которые могут заменять этот слот.

Например, для PTRANS слоты следующие:

ACTOR: человек (или одушевленный объект), который инициирует PTRANS

OBJECT: физический объект, который перемещается FROM: место, с которого начинается PTRANS ТО: место, в котором кончается PTRANS

Концептуальные зависимости записываются графически, как показано на рис. 3 (Приводится по [38]). ТО

ACTOR □ PRIMITIVES OBJECT<=|

FROM

Рис. 3. Базовая форма графа концептуальной зависимости.

Пример графового представления приведен на рис. 4. |=> Магу Jhon □ ATRANS <= book <= | Jhon

Рис. 4. Графовое представление в ТКЗ для фразы John gave Mary a book.

Основным механизмом понимания текста на ЕЯ являются знания о внешнем мире в виде ожиданий - оисаний ситуаций, наиболее вероятных в ближайшем будущем. При этом с каждой ситуацией связывается множество действий, уместных в ожидаемой ситуации. Процесс понимания определяется как извлечение и идентификация концептуализаций, заключенных во входном тексте на ЕЯ.

В [95] отмечаются недостатки представления, принятого в ТКЗ:

- концептуальные зависимости носят аналитический характер, в то время, как многие отношения в естественном языке имеют синтетическую форму. При этом носитель языка не всегда мыслит на уровне примитивов аналитической формы.

- в ТКЗ нечетко проработан временной аспект отношений.

- специальная графовая форма, принятая для концептуальных зависимостей в ТКЗ, с успехом может быть заменена на общепринятую для семантических сетей или же на ее логический эквивалент.

Кроме концептуализаций, в рамках ТКЗ было предложено еще несколько мета-структур. Для того, чтобы решить проблему непрямого вывода, были предложены структуры, названные SCRIPT, подобные сценариям [59]. Структуры SCRIPT, представляют последовательность событий, связанных с какой-то типовой ситуацией, например, посещения ресторана. Другая мета- структура: МОР (Memory Organisation Packet) является развитием идеи SCRIPT, но лишена ее недостатков [84]. Для того, чтобы обеспечить возможность представления сложных каузальных отношений, была предложена нотация для записи целей и планов [38].

В [38] отмечено, что обилие нестандартных структур представленияя связей различного типа чрезвычайно осложняет работу по наполнению системы знаниями, делает ее неэффективной, так как требует собственных механизмов вывода для структуры каждого типа.

ТКЗ была первоначально разработана как теория представления знаний в процессе обработки языка, поэтому модель языкового анализа, которая с ней связана, сильно ориентирована на знания. Одной из центральных идей этой модели было то, что представление может порождать ожидания, которые затем могут играть ключевую роль в управлении процессом обработки последующих фрагментов текста.

Одним из подходов, который был включен в арсенал концептуального анализа, было использование запросов, или пар "текст-действие" для расшифровки знаний в процессе разбора (в системах WEB и BORIS для обозначения запросов использовался термин демоны). Запросы были впервые использованы в анализаторе MARGIE Рис-бека [91], причем хранились они в этом анализаторе главным образом в словаре. Метод разбора, основанный на запросах, использовался во многих других анализаторах: Conceptual Analizer [55], Integrated Partial Parser (IPP) [82], Word Expert Parser [38], BORIS [67], MORTRANS [84], DMAP [84].

Другой отличительной чертой в анализаторах, основанных на запросах, был отход от традиционного разделения анализа текста на морфологическую, синтаксическую, семантическую и прагматическую фазу. Это было сделано по двум соображениям:

- во-первых, необходимость синтаксической фазы подвергалась сомнению, так как целью концептуального анализа было построение представления смысла, а не синтаксический анализ;

- во-вторых, по мнению разработчиков семантика должна быть вовлечена в процесс разбора как можно раньше, так как семантическая и прагматическая информация могла иногда помочь разрешить неоднозначность.

Гипотеза интегральной обработки предполагает, что синтаксис и семантика должны быть полностью интегрированы в управляющей структуре, структурах представления и что большая часть базы знаний также должна быть интегрирована, хотя некоторая часть синтаксиса будет существовать отдельно [38].

При всей специфике представления информации в нотации ТКЗ, существует ряд положительных черт, которые могут быть заимствованы и использованы в системах обработки естественного языка

- комбинирование синтетической. и аналитической формы представления знаний;

- использование семантики на ранних стадиях грамматического разбора для разрешения неоднозначности.

Концептуальные графы [95, 10] - это универсальный формализм представления знаний, разработанный путем синтеза нескольких различных традиций. Первая из них - это семантические сети, вторая - техника унификации, основанная на логике, лямбда исчисление и экзистенциональные графы Петри. Третья - лингвистические исследования, основанные на графах Теньера [38] и на различных формах падежной грамматики и тематических отношений. Четвертая - это диаграммы потоков данных и сети Петри, которые обеспечивают вычислительный механизм связыванивая концептуальных графов с внешними процедурами и базами данных.

Целью разработки концептуальных графов (КГ) было предложить такой универсальный язык представления знаний, который бы сочетал экспрессивную мощь естественного языка с точностью символической логики.

Логические основы КГ заложены в работах философа и логика Пирса [89]. В 1883 г. Пирс впервые предложил линейную нотацию для логики первого порядка. С последующими изменениями Шредера, Пеано, Рассела она превратилась в современную систему исчисления предикатов.

Пример линейной нотации КГ Совы приведен на рис. 5.

12) PAST -> CAT <- AGNT <- CHASE -> PTNTN -> MOUSE

A CAT CHASED A MOUSE

13) (PAST) - > [[CAT]< - (AGNT)< - [CHASE]- >(PTNT)-[MOUSE]]

Рис. 5. Концептуальный граф для предложения A cat chased a mouse.

12) - графовое представление; (13) - линейная запись.

Достоинством КГ Совы по сравнению с ТКЗ является их строгое логическое обоснование. Кроме того, в нотацию КГ введено понятие коммуникативной роли (предикаты AGNT и PTNT). Более развиты по сравнению с ТКЗ средства представления темпоральных отношений. Однако, понятие семантической роли не выражено эксплицитно.

Существует много подходов к построению систем семантического анализа. В большинстве из них анализ основывается на особенностях рассматриваемых текстов и в то же время используется некоторе количество "сведений о внешнем мире", содержащихся в семантических словарях и таблицах. Последние строятся на основе универсального семантического алфавита, набора элементарных объектов и связывающих их отношений, так что значения языковых единиц можно представить с помощью абстрактных отношений между комбинациями объектов.

Значительная часть моделей семантического анализа (представления смысла) относится к моделям типа "Смысл-Текст". Среди них наиболее известны следующие.

Модель семантик предпочтения. В [99] сформулированы главные принципы формализма семантики предпочтения PS (Preference Semantics).

Принцип компьютерной семантики. Компьютерная семантика не разделяет область самих знаний и их формального представления: напротив, знания о языке и о мире неразделимы, точно так же, как это происходит в базах данных, которые называются словарями и энциклопедиями.

Принцип процедурной семантики. Процедуры могут интерпретировать кванторы и другие символы. В PS описания и механизмы, которые их генерируют, в идеале все процедурные и представление само по себе должно быть продуктом нескольких общих и автономных (не зависящих от содержания) процедур. Идея процедурной семантики следует лозунгу "значение как использование" Витгенштейна и операционному объяснению символов у Бриджмена [38] и является центральной в работах Винограда [8] и Вудса [100].

Принцип минимальных усилий. Процедуры должны составляться в соответствии с принципом минимальных усилий для понимания языка, в соответствии с которым те лингвистические формы, которые требуют чрезвычайных усилий по обработке, не могут и не должны быть поняты.

Принцип предпочтения. Подходящее представление должно быть выбрано для текста среди соревнующихся представлений. Конкретная структура представления может быть рассмотрена как более предпочтительная по сравнению с другими связанными структурами и общее представление для текста осуществляется путем удовлетворения максимального количесвтва требований.

Принцип семантического грамматического разбора. Этот принцип подобен тому, который используется в ТКЗ.

Принцип знаний. Анализ отношений, обнаруженных в тексте, и представление текста являются функцией знаний системы анализа.

Принцип уровня представления. Уровень представления, который требуется для понимания естественного языка, не фиксируется, но может быть любым подходящим уровнем, который позволяет схема представления.

Принцип семантического примитива. Представление основывается на множестве семантических примитивов различного типа (действия, категории, качества и т.д.), однако не утверждается, что этот набор универсальный. Можно предложить альтернативные множества для специальных задач, предметных областей и культур.

Принцип линейных границ языка. Представление базируется на линейных, а не рекурсивных свойствах языка: его структура, таким образом, основывается на линейных границах простых предложений и фраз (без специальной роли сложного предложения) как основы поверхностного представления, из которого постепенно сожет быть получено более глубокое представление посредством вывода.

Принцип отсутствия теоретической модели. Представление в Р8 не нуждается в модели теоретического типа, и классические проблемы квантификации и т.д. разрешаются с помощью специальных процедур.

Р8 содержит ряд типов для представления знаний и процессов. Для анализа языка в этой теории в ее современной виде используются следующие типы представления:

1) 80-100 семантических элементов или примитивов;

2) семантические формулы, которые представляют смысл слова;

3) линейные шаблоны, которые представляют основные "сообщения";

4) шаблоны, которые представляют простые предложения;

5) шаблоны для представления смысла предлогов;

6) правила вывода, основанные на здравом смысле, которые используются для обработки анафоры;

7) семантические блоки, которые представляют весь текст;

8) тезаурусная иерархическая структура;

9) псевдо-текст, который содержит структуры текста, факты, элементы "фреймовых структур".

Для анализа языка в РБ используется пять различных типов процессов:

1) расширение шаблонов, которые определяют выбор ограничений;

2) предпочтение, которое выбирает наиболее близкое семантическое содержание;

3) цепочки программ, которые применяют шаблоны для исправления структур, соответствующих фразам с предлогами;

4) процедуры экстракции, которые обрабатывают шаблоны, заполняя их падежные части и применяя правила здравого смысла;

5) правила проекций, которые пытаются интерпретировать метафоры.

Семантический анализ в рассматриваемой системе ведется по следующей схеме. Осуществляется фрагментация текста на ЕЯ, затем словам приписываются все их значения из словаря, и на анализируемый фрагмент текста поочередно накладываются простые шаблоны, известные системе. Далее, применяются специальные правила расширения, преобразующие простой образец в полный добавлением тех слов, которые не вошли в первый. После получения полных образцов для каждого фрагмента начинает работать процедура по установлению их семантической близости. В результате формируется окончательное представление входного текста на ЕЯ.

Формализм семантики предпочтения выгодно отличается от остальных формализмов семантических сетей тем, что они ориентированы на обработку языка во всех его проявлениях (анафора, метафора, многозначность). Заслуживает интереса ряд средств, введенных для этих целей в формализм Р8: шаблоны, правила здравого смысла, тезаурус, псевдо-тексты, предпочтения. Однако то, что семантика предпочтения не опирается на логический аппарат в представлении смысла (но крайней мере об этом явно нигде не сказано), не позволяет применять эти средства в других моделях без существенной доработки.

Исследования по действующим семантическим моделям возникли непосредственно в связи с разработкой алгоритмов машинного перевода и поэтому с самого начала были ориентированы на автоматическое моделирование двух операций, являющихся существенными составляющими речевой способности человека: моделирование понимания текстов (переход от заданного текста к содержащемуся в нем значению) и моделирование производства текстов (переход от заданного значения к выражающим его текстам. Модель "Смыл-Текст" [3] рассматривает семантическое представление связного фрагмента текста как состоящее из двух компонентов: семантического графа и сведений о коммуникативной организации смысла. Главная идея, выдвинутая А. К. Жолковским и И. А. Мельчуком состояла в том, что синонимия языковых выражений возникает не только за счет лексических синонимов в собственном смысле слова, но и за счет многих других средств языка. Лескически различные единицы могут быть 1) синтаксическими вариантами выражения одного и того же значения, например, Выдвигая проект, Англия поставила условие - Когда Англия выдвигала проект, она поставила условие', 2) лексически обусловленными вариантами выражения одного и того же значения, например, оказывать (влияние ), но производить (впечатление); 3) словами, по-разному ориентирующими описываемую ситуацию относительно ее участников, например, А имеет В - В принадлежит А, А несмотря на В - В, однако А; некоторыми типами производных, в том числе супплетивных, например, А принадлежит В - А - владелец В - В - собственность А. Наконец, было обращено внимание на то, что неравнозначные слова, в значении которых имеется большая общая часть (ср иметь - брать - получать - терять - сохранять), могут служить средством образования синонимичных высказываний при разном распределении значений между частями высказывания (Он сохранил присутствие духа - Он не потерял присутствия духа).

Для описания существа и степени семантического сходства лексически различных слов предложен язык семантических множителей, отличающийся высокой структурированностью значений. Существенно подчеркнуть, что значение слова понималось не как простая совокупность множителей, а как определенным образом организованная структура. Среди систем, построенных на базе модели "Смысл-Текст" можно выделить лингвистический процессор СМП ЭТАП-2 [4] и лингвистический процессор системы ПОЭТ, которую можно отнести к модели "Смысл-Текст-Действительность".

ECO (English Conversational System) - это семейство формализмов представления знаний, развивающееся с 1974 г. [82, 62], которое позволяет использовать логические связки, кванторы, дескрипторы, модальности, операторы и предикаты высокого порядка.

Семейство систем KL-ONE предназначено для описания таксономических связей объектов. При этом они могут автоматически классифицировать и встраивать новые концепты, основываясь на критериях терминологической категоризации.

PSN (Procedural Semantic Network) - это система, которая положила начало объединению формализмов семантических сетей и процедурного представления [11].

SnePS (the Semantic Network Processing System) была разработана как система представления знаний интеллектуального агента, использующего естественный язык.

Как уже упоминалось выше, значительное число исследований в области понимания текста на ЕЯ сконцентрировано на моделировании связного дискурса и диалога, особенно на прагматических аспектах, таких как структура события. [98], фокус, анаформа и т. д. Перспективными считаются различные схемы для объяснения семантики ЕЯ, основанные на получившей широкую поддержку теории ситуационной семантики [58]. Еще одно направление связано с построением практических ЕЯ -систем и прежде всего ЕЯ-интерфейсов для систем баз данных, подобных системам PLANES [97], ЗАПСИБ [34], DIID [88].

Системы понимания ЕЯ, как правило, ориентированы на определенную предметную область и в качестве средств понимания используют лингвистические знания в виде словарей и грамматик и знания о предметной области в виде структуры семантической сети, в которой фиксированы типовые ситуации. При этом предметная область ограничивается одним или несколькими сюжетами, а элементы знаний о ней образуют большую гамму переходов - от атомов смысла (словесные, текстовые и т. п. атомы) до крупных концептуальных единиц (гиперфреймы, планы, сценарии). В основе понимания тесктов на ЕЯ в одних случаях используется синтаксическая модель одного из рассмотренных ранее типов или его модификация, а схема предметной области представляет собой набор фильтров, уменьшающих неоднозначность синтаксического анализа, в других - основным средством понимания является семантическая сеть, а грамматические признаки и структуры привлекаются в качестве правил локального контекстного разбора [26]. В этой связи, для построения конкретных практических систем понимания текста на ЕЯ (индексирование, реферирование, перевод, общение с ЭВМ и т. д.) определенный интерес представляет информационная модель понимания текста, которая вводит понятие полного информационного представления текста в виде сложной структуры, включающей простые структуры, - отображения разных семантических подсистем (событийной, модельно-оценочной, временной, денотативно-реферативной и др.)- В таких системах происходит выборочный анализ и вследствие отказа от установки на полное понимание задача последнего становится разрешимой.

Почти все рассмотренные формализмы имеют общий недостаток: слабую лингвистическую ориентацию семантического представления. Они не делают различия на уровне представления между предложением, высказыванием, текстом и знанием. В них доминирует упрощенный подход, когда система "не замечает" коммуникативной направленности естественно-языковой формы. Другой особенностью рассмотренных формализмов является отсутствие четкого определения границ семантического примитива в модели смысла и его эквивалента в модели языка.

Реализованные методы анализа текста на ЕЯ продемонстрировали неадекватность моделей ЕЯ, ограниченных в основном структурой изолированного предложения. Основным источником неадекватности является их ориентация на языковый материал, семантику ЕЯ. Человек при формировании когнитивной структуры ориентируется прежде всего на прагматику, отражающую его функционирование в реальной среде. Эта идея частично реализована в экспериментальных системах [50,42].

Далее опишем проблемнуюя ситуацию, научные предпосылки ее разрешения, актуальность предлагаемого подхода

Понимание текста на ЕЯ - это воссоздание реальной ситуации действительности, о которой говорит текст. Описание всякой ситуации действительности требует построения некоторой познавательной структуры, в которой основным является выделение отношений между элементами действительности и указание тех познавательных ролей, в которых эти элементы находтся в связи с этими отношениями [43]. Совокупность ролей составляет остов, на котором строится полная познавательная структура, обеспечивающая понимание текста на ЕЯ. С точки зрения тенденций отхода от чисто лингвистического понимания проблемы и перехода к модели "Текст-Действительность" интерес представляет система SUSY [71] с ее BLR- и ELRформализмами, основанными на пропозициональном исчислении и учитывающими проблемы ссылок, времени, места, манеры для всего входного текста на ЕЯ; здесь же строится "взвешенное" представление текста в виде иерархической пропозициональной сети, которая учитывает значимость составляющих текста в засисимости от целей.

Проблемная ситуация характеризуется необходимостью создания системы, демонстрирующей адекватное понимание текстов на естественном языке. "Адекватно", в данном контексте означает "так, как это делал бы человек". Действительно, результаты, достигнутые за более чем тридцатилетнюю историю естественно-языковых систем удобно рассматривать и классифицировать с точки зрения "уровней понимания ". В [20] Д. А. Поспелов вводит - пять уровней понимания текста на ЕЯ.

При понимании на первом уровне естественноязыковая система формирует ответы на вопросы собеседника только на основе прямого содержания введенного текста. На втором - добавляются средства логического вывода, основанные на информации, содержащейся в тексте. На третьем - к средствам второго уровня добавляются правила пополнения текста знаниями системы о среде. Эти знания, как правило, носят логический характер и фиксируются в виде сценариев или процедур иного типа. На четвертом уровне используется расширенный текст, который порождается лишь при наличии нескольких каналов получения информации. По одному в систему передается текст, по другому - дополнительная информация, отсутствующая в тексте, например, - зрительная, тактильная. Для понимания текста на пятом уровне система использует информацию о конкретном субъекте, являющемся источником текста, и хранящуюся в системе общую информацию, относящуюся к коммуникации. Теория, соответствующая пятому уровню, - это, так называемая, теория речевых актов [20].

Существуют и другие интерпретации феномена понимания. Можно, например, оценивать уровень понимания по способности системы к объяснению полученного результата. Здесь возможен не только уровень объяснения, когда система объясняет, что она сделала, на основе введенного текста, но и уровень обоснования (аргументации), когда система обосновывает свой результат, показывая, что он не противоречит той системе знаний и данных, которыми она располагает. Кроме объяснения и обоснования возможна еще одна функция, связанная с пониманием текстов, - оправдание.

Оправдать нечто означает, что выводимые утверждения не противоречат той системе норм и ценностей, которые заложены в системе [27].

Нетрудно заметить, что в приведенной классификации степень понимания возрастает от уровня к уровню с введением в систему моделей функциональных возможностей и способностей человека - многомодального восприятия информации, формирования, накопления, модификации и манипулирования знаниями, целостного осознанного восприятия объектов реальности, их взаимосвязей, долгосрочных ценностных установок. Подобная тенденция указывает на неизбежный «гуманоидный» тип известного нам и моделируемого нами при помощи компьютера понимания естественного языка. Логичным, на наш взгляд, продолжением наметившейся линии развития концепций понимания может служить система, которая в дополнение к указанным выше способностям обладала бы еще и самовосприятием.

Действительно, воспринимая, думая, осознавая, мы всегда можем констатировать факт собственного существования в текущий момент. Уместно вспомнить хотя бы знаменитое декартовское « Я мыслю, следовательно - существую». То же самое и в отношении понимания. Понять что-либо для нас означает, прежде всего, осознанно или неосознанно изменить что-то (по крайней мере, состояние сознания, хотя в данном случае не важно, что именно) внутри нас самих. Факт наличия изменений, происходящих внутри понимающего субъекта, заставляет по-новому взглянуть на проблему моделирования понимания вообще и естественноязыкового понимания, в частности, указывает на необходимость акцентирования внимания не только на внешних, коммуникативных аспектах понимания, но и на исследованиях и построении адекватных моделей внутренних, субъективных механизмов понимания.

Действительно, каким образом, например, компьютер може понять предложение: «Пингвинам жарко летом» ? Конечно, он может интерпретировать эту информацию некоторым образом, основываясь на знаниях и зафиксировать ее как факт, возможно в некоторой внутренней нотации, возможно даже с построением ассоциаций по ключевым словам с использованием семантических представлений. Но у человека, понимающего указанное предложение, наверняка, ассоциативный поиск будет неосознанно начинаться с воспоминания собственных ощущений и опыта состояния, описываемого в предложении. Осознание, понимание и оценка ситуации будут в первую очередь зависеть от отношения субъекта к содержанию этой ситуации. Отсюда и различное понимание одних и тех же текстов разными людьми. Не говоря о метонимии и конотации. Сравним как, например, поймет предложение: «Из-за поломки электростанции света не будет до завтрашнего утра» приговоренный, ожидающий электрического стула вечером в 7 часов и фан национальной команды по футболу, который намеревался в 6 часов смотреть отборочный матч по телевизору ? Конечно, это нарочитый пример. Тем не менее, он служит хорошей иллюстрацией тому, что понять текст на естественном языке можно только опосредовано через ситуацию, в которой находится субъект по отношению к ситуации, описываемой в предложении. При этом, конечно же, речь идет об адекватном понимании в указанном смысле.

Таким образом, для адекватного моделирования понимания необходимо адекватное моделирование субъекта понимания. Конечно, существует целое направление, занимающееся разработкой интеллектуальных агентов, т. е., в некотором смысле, субъектов интеллектуальных операций. Однако, в данном случае, важен подход к определению субъекта как сложной многофункциональной системы, живущей, детерминированной и мотивированной биологически и социально.

Надо сказать, что сходные идеи изучаются в одном из направлений ИИ - го-меостатике. Мозг человека рассматривается как гомеостатическая система, представляющая собой совокупность противоборствующих (и сотрудничающих) подсистем, в результате функционирования которых обеспечивается нужное равновесие (устойчивость) всех систем в условиях постоянно меняющихся воздействий среды.

Актуальность подобного подхода, а также необходимость вытекающих из нее требования создания гибридных систем понимания текста - на стыке нескольких современных направлений - подтверждается общей тенденцией современного развития этой области ИИ. По мнению ряда ведущих исследователей в области ИИ при создании современных интеллектуальных систем проявляются ограничения традиционных формальных моделей. Вот, что пишет по этому поводу академик Д. А. Поспелов [35]: "Сейчас стала очевидной ограниченность моделей, используемых в системах ИИ и опирающихся лишь на те механизмы, которые присущи рассудку. Когнитивная психология, питающая модели такого рода, не исчерпывает всей психологии мышления. Когнитивная графика, виртуальная реальность, антропоморфный интерфейс, «очеловечивание» поведения роботов стимулируют интерес исследователей и продвижение за границу рассудочной деятельности.

Невербальная коммуникация {курсив наш - 3. Н.), механизмы эмоций и интуиции, феномен совести и свободы воли - вот те ориентиры, которые указывают дорогу «за ум». От моделирования механизмов рассудка мы постепенно переходим к тому, что можно назвать разумом. Триада: Рассудок - Ум - Разум символизирует тот путь, который надо пройти, чтобы наши системы стали полностью похожими на нас по своим возможностям."

Новым специфическим разделом интеллектуального программирования являются системы когнитивной графики, которые пытаются реализовать основную идею современного представления о мышлении как о синтезе визуальных и символьных представлений. В настоящее время с развитием когнитивной графики связывают большие надежды на повышение эффективности решения задач, так как образное мышление пользователя может существенно ускорить процесс поиска решения и рождать новые пути его поиска.

В данной работе предлагается модель системы ментального интерфейса (СМИ). СМИ - это модель коммуникации человек-компьютер, предназначенная для интерактивного представления смысла предложений естественного языка. Входные тексты преобразуются СМИ в наглядные трехмерные многомодальные модельные представления, которые показываются на экране компьютера. Это дает пользователю возможность анализировать подобные представления смысла, корректировать их, быстро и эффективно строить трехмерные ситуации, описанные в исходном предложении, наблюдать за их развитием. Одной из функций СМИ является обеспечение графического представления развития контекстов, описываемых в интерпретируемых текстах ЕЯ. Реализация указанного принципа в сочетании с единообразным подходом к обработке символьной, образной и денотативной информации с полным основанием дают право причислить СМИ к системам когнитивной графики.

Соединение в единое целое образной, символьной, слуховой, тактильной и т. п. информации, отражающей одну и ту же сущность реального мира, приводит к идее единого кода, позволяющего единообразным способом кодировать разнородную информацию. В полном объеме эта проблема не исследована. Разумеется, наша модель не претендует на полноту исследования этого вопроса. Однако, очевидно, что единообразным объединяющим началом, могущим стать структурной и функциональной основой подобного кода, в СМИ служит топологическое пространственное единство многомодальных координат точек, входящих в предметы.

В настоящее время интерес исследователей ИИ к данным областям современной компьютерной науки весьма высок. Так, например, в апреле - ноябре 1997 г. Российской ассоциацией искусственного интеллекта (РАИИ) был проведен семинар «Виртуальная реальность в психологии и ИИ» под руководством Д. А. Поспелова. В марте 1998 г. - «Отражение образного мышления и интуиции специалста в системах ИИ» под руководством Б. А. Кобринского.

Несмотря на то, что в настоящее время большое внимание уделяется таким важнейшим аспектам проблематики конструирования виртуальных сред, как реализация физических и пространственных взаимодействий в виртуальных средах, организация взаимодействия пользователя с объектами виртуальной среды, разработка интеллектуальных алгоритмов поведения виртуальных субъектов, «такое мощное направление как виртуальная реальность не имеет под собой никаких моделей вообще, .пока это . только развитие средств». [32]. Такие компоненты СМИ как виртуальное пространство и виртуальный мир «по определению» являются разновидностью системы виртуальной реальности, так как они моделируют трехмерный мир с поддержкой перемещений и многомодальных сенсорных координат (запах, цвет, вкус и т.п.). Однако, в отличие от традиционных систем виртуальной реальности, компоненты СМИ имеют в своей основе модель - трехмерную матрицу, дискретные элементы которой имитируют непрерывно воспринимаемые человеком фрагменты действительности.

К настоящему моменту с целью разрешения вопроса о том, какая форма коммуникации наиболее успешна в человеко-машинном взаимодействии, психологами проведено много исследований, где показано, что ни слова, ни картинки, не передают сами по себе весь смысл коммуникации. Поэтому интересными считаются разработки систем, в которых для решения задач одновременно используются различные формы представления информации (левополушарные и правополушарные), например, текстовая и графическая компоненты. Как уже упоминалось, СМИ за счет мощного средства представления значений - виртуального пространства единообразно (как образы и знаки) интерпретирует и символьную информацию.

Актуальность целостного подхода к моделированию представления смысла на глядно подтверждается следующим высказыванием Д. А. Поспелова [42]:

В настоящее время (курсив наш - Н. 3.) предпринимаются попытки разработки интерфейсов, использующих одновременно естественный язык и графику для передачи определенного содержания. Поэтому представляет интерес разработка семантических моделей для интерпретации графических выражений (а у нас - графическая модель непосредственно интерпретируется гуманоидом в наглядную семантику - Н. 3.). Эти модели, на наш взгляд, должны содержать различные пер-цептуальные характеристики, связанные с изображаемым объектом.» Возможность передачи перцептуальных или сенсорных характеристик реальности обеспечивается в нашей модели структурой точки виртуального пространства, содержащей поля для визуального, тактильного, вкусового, обонятельного и аудио представлений объектов.

В определенной степени могут соответствовать человеческому воображению «пространственные» когнитивные схемы или карты и если их рассматривать как картины мира того или иного уровня абстракции, которые можно описать и представить в базе знаний как самостоятельные единицы, а не только как элементарные семантические категории, то это позволило бы приблизится к видению мира человеком.

Именно «видение мира человеком» является, по мнению автора, прагматической основой моделирования работы сознания при осмыслении текстов на ЕЯ. Поэтому СМИ для представления смыслов использует именно пространственную модель, которая рассматривается именно как «картина мира», что, действительно, дает возможность представлять различного рода абстракции в терминах этой пространственной модели.

По мнению ряда ведущих российских ученых, на смену математическому моделированию, в основе которого всегда лежат те или иные формальные системы, должно прийти, прежде всего, семиотическое моделирование, рассматривающее знак, как основу семантических построений - моделирующую сущность, обладающую референтной, денотативной и прагматической функциями [25].

В докладе Д. А. Поспелова на Всероссийской конференции "Новые информационные технологии в исследовании дискретных структур" "Семиотическое моделирование в интеллектуальных системах". [39] были показаны ограничения традиционных формальных моделей, ярко проявляющиеся при создании различных интеллектуальных систем. По мысли докладчика, на смену математическому моделированию,

39 в основе которого всегда лежат те или иные формальные системы, должно прийти семиотическое моделирование. Такое моделирование опирается на модель семиотической системы, расширяющей идеи, лежащие в основе формальной системы. Составляющие формальной системы (базовые множества элементов, синтаксические правила, аксиомы и правила вывода) становятся переменными, что позволяет осуществлять переход от одной формальной системы к другой, рассматривать формальную систему как состояние семиотческой системы. Таким образом, семотическая система задается в виде динамической системы, определяемой правилами смены состояний, реализуемыми на множестве состояний (формальных систем). При этом правила смены состояний не фиксируются заранее, а вырабатываются в динамике в зависимости от накапливаемых результатов фактов, прецедентов, гипотез.

Прикладная семиотика изучает природу функционирования знаковых семиотических систем и способы управления ими. К системам подобного типа относятся вопросно-ответные и диалоговые системы, развитые интерфейсы и т. п. [35].

Опираясь на принцип «семантического треугольника», описываемая в данной работе Система ментального интерфейса рассматривает слова ЕЯ как знаки, обеспечивая средства для их интерпретации - семантически значимые денотаты. Как известно, денотатом называется реальный объект, процесс, явление, ситуация и т. п. в физическом мире, для которого есть специальное именующее выражение в некотором языке. Это именующее выражение является десигнатом для данного денотата.

При проведении исследования применялось композиционное сочетание интроспекции, концептуального моделирования, имитационного моделирования и эксперимента.

Применение этих методов оправдано как невозможностью "прямого» наблюдения за внутренними формами функционирования сознания, так и богатством и разнообразием концептуальной информации, генерируемой в результате.

Понятийные структуры носят имплицитный характер и не могут обсуждаться на вербальном уровне. Поэтому . важное место занимает моделирование. Необходимы средства, позволяющие моделировать понятийные структуры на основе косвенной информации", - пишет по этому поводу А. Ю. Терехина [49].

40

Имитационное моделирование являлось необходимым условием достижения: 1. образности, наглядности представлений смыслов, - что с позиций когнитивно-графического подхода представляется весьма важным, 2. создания действующей модели, где при помощи компьютера реально интегрировались бы все подсистемы СМИ.

Эксперименты, проводимые на действующей модели (программе) СМИ имели своей целью доказать возможность «ментальной» - сложной образно-символьной -коммуникации, возможность порождения подобной человеко-компьютерной системой достаточно точных, а также нетривиальных решений.

Применяемый в работе алгоритм квантирования был оптимизирован по критерию минимума времени выполнения с применением алгебры алгоритмов.

Для генерации усредненных представлений семантики лексических единиц был применен математический аппарат нечетких множеств.

Программа СМИ «Сосруко» была написана на компьютере с характеристиками Pentium/150/16/1Gb/. Все эксперименты также проводились на этом компьютере. Вследствие наличия небольшого объема оперативной памяти - 16 Mb - пришлось ограничить число точек виртуального пространства следующими значениями: 50x25x50, что в итоге дало модель из 62500 точек. Этого оказалось достаточным для представления смысла нескольких простых нераспространенных предложений, описывающих перемещения и изменения свойств предметов. Программа была написана и отлажена с помощью компиляторов Visual С++ 5.0 и Visual FoxPro 5.0 фирмы Microsoft.

Данная диссертационная работа состоит из введения, трех глав, заключения и библиографического списка. Во введении дан краткий обзор состояния исследований по проблеме понимания естественного языка, обоснована актуальность исследования, определены объект и предмет исследования, поставлены его цели и задачи. Также приведена характеристика использовавшихся методов, описаны условия, в которых проводилось исследование.

Заключение диссертация на тему "Модель представления смысла текстовой информации"

3.3. Выводы и рекомендации

Требования программной реализация СМИ к вычислительным ресурсам невысоки и соответствуют широко распространенным персональным системам. Увеличение размерности кубической матрицы ВП, а также наращивание количества свойств точек этой матрицы также не накладывают существенных ограничений на вычислительные ресурсы и время выполнения программы.

Эксперименты, проведенные с начальной версией программы, конкретизировали и доказали основные результаты предыдущих глав.

Так, например, было показано, что виртуальное пространство способно представлять СЭ слов, обозначающих отдельные предметы, действия и качества. Доказано, что СМИ способна к интерпретации:

- простых предложений в контексты, представляющие содержание, или смысл этих предложений;

- предложений, описывающих взаимодействие предметов;

- имплицитного содержания предложений, т.е. - отображения в ВП информации, заданной в предложении неявно.

Таким образом, результаты, полученные в ходе экспериментов с моделью, подтвердили, что возможна эффективная "ментальная" коммуникация, в которой участвуют наглядные модели концептов сознания, интерпретирующего смысл текстов на ЕЯ.

Необходимо также отметить, что все проведенные экперименты относятся лишь к начальной стадии изучения функционирования модели СМИ, связанной с начальной версией программы «Сосруко». Дальнейшее развитие модели позволит, в

153 частности, строить большие контекстные сцены, поддерживать диалоговое редакти рование семантических эффектов слов и предложений.

Заключение

Факты наглядной адекватной интерпретации СМИ смыслов некоторых предложений подтверждены экспериментально. В целом, эксперименты доказали, ччго СМИ обладает достаточным потенциалом семантических построений для создания и поддержки «ментального» интерфейса с пользователем.

Научная новизна проведенного исследования подтверждается следующими результатами.

1. Новой является архитектура СМИ, интегрирующая состав и свойства систем понимания ЕЯ, виртуальной реальности, когнитивной графики.

2. Новой является концепция моделирования семантики при помощи виртуального пространства - кубической матрицы, имитирующей интериоризированные данные восприятия. Этот механизм позволяет легко осуществлять любые преобразования с внутренними конструктами, например, дробить предметы до мельчайших частиц, описывать явления и качества, устанавливать ассоциации между объектами.

3. Можно говорить о создании топологической модели виртуальной реальности, базирующейся на концепции макроабстрагирования, оригинальном понимании времени и пространства, обладающей мощными средствами не только для описания перцептуальных свойств объектов, но и для описания их взаимодействия.

4. Результаты, полученные в ходе экспериментов с моделью подтвердили, что возможна не только символьная или образно-символьная коммуникация с компьютером, но и эффективная «ментальная» коммуникация, в которой еще участвуют денотаты - концепты сознания, наделенные пространственной формой, физическими свойствами и вовлеченные в контексты сознания, интерпретирующего смысл текстов на ЕЯ. При этом, эффективность достигается за счет «полномасштабного» моделирования в СМИ физических законов. Достаточно лишь задать ситуацию несколькими предложениями для того, чтобы увидеть ее развитие на дисплее компьютера. Таким образом, реализована своеобразная когнитивная реальность с естественноязыковым интерфейсом.

5. Основываясь на принципах развития сознания как механизма приспособительного мышления, подсистема имитации физических законов позволила, в частности, просто и эффективно интерпретировать группу предложений ЕЯ, описывающих перемещения и изменения состояний предметов, в которых в прагматическом аспекте наличествуют различные значения «по умолчанию».

6. При осуществлении генерации усредненных представлений денотатов впервые для модели виртуального пространства (ВП) был применен аппарат нечетких множеств. При этом показано, что последовательное применение операций над нечетким представлением денотатов в виртуальном пространстве приводит к закреплению наиболее характерных их свойств.

7. Созданы структуры данных, позволяющие для одного десигната хранить и по выбору применять как прагматическое представление - модель в ВП, так и образные представления - картинки, идиомы и т. д.

8. В работе изложены новые принципы компьютерного понимания текстов на ЕЯ, связанные с признанием необходимости моделирования субъекта понимания.

9. СМИ способна адекватно представлять и неаддитивно аккумулировать смыслы текстов на ЕЯ. Подобная способность реально приближает возможность создания естественноязыкового интерфейса и модели среды в будущих системах ИИ, построенных на новых принципах. На основе этих результатов можно строить инструментальную среду для редактирования «среды обитания» интеллектуального агента. При этом процессы интериоризации будут формализованы при помощи ВП и реально упрощены с помощью средств инструментальной среды. Это, в свою очередь, даст исследователям ИИ возможность сконцентрироваться на моделировании собственно процессов гомеостазиса, мышления и социальных отношений человека.

10. К новым результатам можно отнести также и то, что с помощью ВП удается обеспечивать целостность (многомодальность) представлений. Здесь интегрирующим свойством служит пространственное единство предметов. Перспектвность подобного решения хорошо иллюстрируется тем фактом, что в реальном мире мы также структурируем модальности (цвет, запах и т. д.) относительно предметов или явлений.

Как уже подчеркивалось, ментальный интерфейс осуществляется благодаря тому, что при помощи средств, предоставляемых ВП возможно строить адекватные представления смысла. При этом необходимо отметить важное в теоретическом плане достижение - десигнаты получают адекватные денотаты. На практике это означает, что пользователь видит на экране дисплея семантическую интерпретацию введенного им текста в виде наглядных, априорно узнаваемых и понятных образов (денотатов). При этом на каждом шаге он имеет возможность корректировки интерпретации, используя инструментальные средства ВП.

Предлагаемое деление слов ЕЯ на семантическим классы позволило строить смысловой план текстов с опорой на значения отдельных слов.

Программа «Сосруко» была внедрена в НИИ Структурной методики преподавания языков при Кабардино-Балкарском Государственном университете. Программа успешно использовалась в качестве модельной среды для создания представлений смыслов лексических единиц с целью нахождения и систематизации групп дифференцирующих признаков слов с близкими и пересекающимися значениями.

Практическую значимость имеет предлагаемый в работе оригинальный алгоритм квантирования и поддержки функционирования физических законов в ВП. Для имитации синхронности явлений в ВП в этом алгоритме использован циклический поллинг всех точек ВП в такты, равные порогу чувствительности человека по времени. Приведена укрупненная блок-схема алгоритма квантирования; программно он реализован в СМИ «Сосруко».

Практическое приложение имеет также реализованный реализованный алгоритм генерации усредненных представлений денотатов при помощи аппарата нечетких множеств, в котором учитываются как образные, так и «прагматические» (в терминах ВП) представления.

Описаны структура и способы представления, функционирования и хранения слов естественного языка - операторов СМИ для классов «предмет», «явление», «качество», «образ действия» и др.

При работе над программой «Сосруко» с использованием технологии объектно-ориентированного программирования была разработана система типов данных и объектов для представления ВП и объектов ВП.

Указанные алгоритмы и типы данных могут быть использованы в дальнейших разработках программного обеспечения систем ментального интерфейса.

Описан структурный состав СМИ, функции и пути реализации отдельных структурных компонент, типы их взаимодействия внутри модели.

Наибольшую научную ценность (и в этом заключается долгосрочная цель проведенного исследования) имеют открывающиеся возможности для построения на ос

157 нове СМИ модельной среды для создания, так называемого, интеллектуального агента. Естественноязыковой интерфейс позволит быстро и эффективно развивать трехмерное многомодальное окружение искусственного интеллекта. Это, соответственно создает базу для трехмерного многомодального обучения, для анализа и развития моделей мыслительных процессов.

Библиография Нагоев, Залимхан Вячеславович, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

1. Амосов Н.М. Моделирование мышления и психики., с. 3. Киев, «Наукова думка», 1963 г.

2. Ананьев Б. Г. О проблемах современного человекознания. М.: Наука, 1977.

3. Апресян Ю. Д. Лексическая семантика. Семиотические средства языка М.: Наука, 1974.

4. Апресян Ю. Д., Богуславский И. М., Иондин Л. Л. И др. Лингвистическое обееспечение в системе автоматического перевода третьего поколения. М.; АН СССР, 1978, - 295 с.

5. Аристотель. Собрание сочинений. М., 1978.

6. Борисова Е. Г. Категории коммуникативной организации информации в линейных и нелинейных сообщениях: Труды международного семинара "Диалог, 96" по компьютерной лингвистике и ее приложениям. Пущино, 4-9 мая, 1996. М.: 1996. -С.45-56.

7. Брунер Дж. Онтогенез речевых актов // Психолингвистика: Пер. с англ. М. Прогресс, 1984.-С. 21-49.

8. Виноград Т. Программа, понимающая естественный язык. М.: 1976. 294 с.

9. Гамильтон Дж., Смит Э., МакУильямс Г. и др. // Бизнес Уик (Business Week). 1993,-№ 1,-С. 28-36.

10. Гейз А., Грибанен П., Луи Ш. и др. Когнитивный подход к ИИ. 1. От классической логики к логическому программированию. М.: Мир, 1990.-132 с.

11. Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Радио и связь, 1990. - С. 95-103.

12. Глушков В. М. Введение в АСУ. Киев.: Техника, 1974.

13. Глушков В. М. Введение в кибернетику. Киев.: Издательство АН УССР,1963.

14. Глушков В. М. Гносеологическая природа информационного моделирования. //Кибернетика. Вопросы теории и практики. М.: Наука, 1986.

15. Глушков В. М., Грищенко Н.М., Стогний А. А. Алгоритм распознавания осмысленных предложений, в сб. «Принципы построения самообучающихся систем», Гостехиздат, К., 1962.

16. Грин Н., Стаут У., Тейлор Д. Биология, В 3-х томах. Том 1. М. «Мир»,1993.

17. Данилов К. К. Моделирование сознания разумного существа. Москва. Международная Гермес-академия, 1995.

18. Зенкин А. А. Знание-порождающие технологии когнитивной реальности. // Новости искусственного интеллекта. Журнал Российской ассоциации искусственного интеллекта. 1996. - № 2. - С. 72-81.

19. Иванов П. М. Алгебраическое моделирование сложных систем. М.: Наука. Физматлит, 1996. - 272 с.

20. Искусственный интеллект. В 3-х кн. Кн. 2. Модели и методы: Справочник //Под ред. Д. А. Поспелова. М.: Радио и связь, 1990. - 304 с.

21. Качалова К. Н., Израилевич Е. Е. Практическая грамматика английского языка., Юнвес-Лист, Москва, 1997.

22. Кибрик А. А. Механизмы устранения референциального конфликта. В кн. "Моделирование языковой деятельности в интеллектуальных системах. / Под ред. Е. А. Кибрика и А. С. Нариньяни. М.: Наука, 1987. - С. 128-145.

23. Кобринский Б. А., Казанцева Л. 3., Фельдман А. Е. и др. Автоматизированный генетический регистр и компьютерная поддержка диагностических решений врача//Генетика. 1993. - Т. 29. - № 10. - С. 1733-1740.

24. Круглый стол "Парадигмы искусственного интеллекта" // Новости искусственного интеллекта. 1996. - № 1. - С. 140-161.

25. Леонтьева Н. Н. Об информационной системе словарей машинного фонда русского языка. Идеи и суждения. М.: Наука, 1986.

26. Лурия А. Р. Язык и сознание. М.: МГУ, 1979. - 319 с.

27. Малышев Н.Г., Берштейн Л.С., Боженюк A.B. Нечеткие модели для экспертных систем в САПР. Москва, «Энергоатомиздат», 1991.

28. Мартемьянов Ю. С. Семантика в порождающей грамматике: проблемы ирезультаты. В кн.: Принципы и методы семантических исследований. / Отв. ред. В. Н. Ярцева. М.: Наука, 1976. - 374 с.

29. Мартынов В. В. Универсальный семантический код: УСК 3. - Минск: Наука и техника, 1984. - 132 с.

30. Модальные и интенсиональные логики и их применение к методологии науки. / Редколлегия: В. А. Смирнов, А. С. Карпенко, Е. А. Сидоренко. М.: Наука, 1984.

31. Модели мира. // Новости ИИ. Журнал Ассоциации ИИ. 1996, - № 3.

32. Моделирование языковой деятельности в интеллектуальных системах. М.: Наука, 1987.-279 с.

33. Нариньяни А. С. Проект ЗАПСИБ серия лингвистических процессоров для взаимодействия с базами данных // Вопросы разработки прикладных систем. -Новосибирск.: ВЦ СО АН СССР, 1979.

34. Новые информационные технологии в исследовании дискретных структур. // Новости ИИ. Журнал Ассоциации ИИ. 1996, - № 1.

35. Падучева Е.В. Референциальные аспекты высказывания (семантика и синтаксис местоименных слов): Автореф. дисс. д-ра филол. наук. (10.02.19) М.: АН СССР, Институт языкознания. - 1988. - 49 е.,

36. Падучева Е. В. Семантические исследования (семантика времени и вида в русском языке; семантика наречия). М.: Школа "Языки русской культуры", 1996,464 с.

37. Поляков В. Н. Синтез формальных моделей языка и смысла, как проблема семантической обработки естественного языка. // Новости искусственного интеллекта. 1997.-№ 1. - С. 7-51.

38. Поспелов Д. А. Семиотическое моделирование в интеллектуальных системах. // Новости искусственного интеллекта. Журнал Ассоциации ИИ. 1996, - № 3.

39. Поспелов Д. А. Метафора, образ и символ в познании мира. // Новости искусственного интеллекта. Журнал Российской ассоциации искусственного интеллекта. 1998.-№ 1.-С. 94-113.

40. Поспелов Д. А. Моделирование рассуждений. Опыт анализа мыслительных актов. М.: Радио и связь, 1989. - 184 с.

41. Д. А. Поспелов, Л. В. Литвинцева. Как совместить левое и правое ? // Ново161 ' сти искусственного интеллекта. Журнал Росиийской ассоциации искусственного интеллекта. 1996. - № 2. - С. 66-71.

42. Поспелов Д. А., Сильдмяэ И. Я. Ролевые структуры в представлении знаний и в диалоговых системах // Изв. АН СССР. Техн. кибернетика. 1985, - № 5. - С. 8389.

43. Прикладные нечеткие системы. Под ред. Т. Тэрано, К. Асаи, М. Сугэно. Москва. «Мир». 1993.

44. Рубинштейн С. J1. Основы общей психологии. Москва. 1989.

45. Стефанюк В. Л. Некоторые тенденции европейского искусственного интеллекта (по материалам 13-й европейской конференции по искусственному интеллекту -ЕСАГ98) // Новости ИИ. Журнал Российской ассоциации искусственного интеллекта. 1998. -№ 1.-С. 162-171.

46. Тарасов В. Б. Моделирование психических образов: как совместить дискретное и непрерывное ? // Новости искусственного интеллекта. Журнал Российской ассоциации искусственного интеллекта. 1998. - № 1. - С. 86-99.

47. Тебель М., Клименко С. В. Научная визуализация в виртуальном окружении // Программирование. 1994, - № 4. - С. 29-49.

48. Терехина А. Ю. Разработка методов многомерного шкалирования для представления знаний. Москва. -АН СССР. -1991. Автореферат на соиск. уч. степ, доктора техн. наук.

49. Файн В. С. Новые аспекты машинного понимания сообщений // Изв. АН СССР. Техн. кибернетика. 1985, - № 5 - С. 83-89.

50. Философия. Под. Редакцией профессора В. Н. Лавриненко. Юристь. Москва. 1996.

51. Фоминых И. Б. Интеграция логических и образных методов отражения информации в системах искусственного интеллекта. // Новости искусственного интеллекта. Журнал Российской ассоциации искусственного интеллекта. 1998. - № 1. - С. 76-85.

52. Языки описания BP сред. // Новости искусственного интеллекта. Журнал Российской ассоциации искусственного интеллекта. - 1998. - № 2. - С. 49-61.

53. Alghawi Н., Ivan Eijek. Logical Forms in the core Language Engine.: Proc.

54. Arawind K. Joshi. From strings to trees to strings to trees.: Proceedings of 32n<^

55. Annuel Meeting of the Association for Computational Linguistics, 27-30 June, 1994. Las Cruces, New Mexico, USA, P. 39.

56. Averkin A. N. Expert oriented fuzzy logics acquisition in soft computing systems // Тр. Междунар. Семинара «Мягкие вычисления 96». Казанский гос. технол. ун-т. -1996. С. 15-19.

57. Birnbaum and М. Selfridge. Conceptual Analysis of Natural Language.: In: Inside Computer Understanding. (Edited by R. Schank and C. Riesbeck) Lawrence Earl-baum Associates, Hillside, NJ, 1981.

58. Barwise J., Perry J. Situations and attitudes. Cambridge (Mass.): Bradford Books, 1983.

59. Bobrow D. And Norman D. Some principles of memory schemata.: In Representation and Understanding: Studies in cognitive science. (Edited by D. Bobrow and A. Collins). Academic Press, Ney York, 1975.

60. Boetcher M. Kocnykes-Toth. Non-Destinctive Unification of Distinctive Feature Struvtures by Constraint Sharing. In Proceedings of the Workshop 'Coping with Linguistic Ambiguity in Typed Feature Formalisms' (ECAI'92), Vienne, 1992.

61. Bootzin R., Bower G., Crocker J. Psychology Today. McGraw-Hill, Inc. New York. 1991.

62. Cercone N., Goebel R., J. De Horn and S. Schaffen. The ECO Family. In: Semantic Networks, Special issue of International Journal of Computers and Mathematics with Applications. V. 23, № 2-5, January-March, 1992. Part 1,- pp.95-132.

63. Chomsky N. Remarks on nominalization // Readings in English. Transfomational Grammar. Boston., 1970, - pp. 184-221.

64. Covington M. Graph Unification Logic Programming. Research Peport. AJ.-1989. 01, The Univercity of Georgia. URL: ftp://aisiml .ai.usa.edu/ai.reports., 1989.

65. CYC: A Mid-Term Report, AI Magazine, 11 (3): 32-59, Fall, 1990.

66. Dehrle, E. Bach, P. Wheelen. Categorial Grammar and Natural Language Structures. Pondrecht: Reidel, 1988.

67. Dyer M. G. Integration, unification, reconstruction, modification: an eternal parsing braid // Proc. 7- th IJCAI 1981. - pp. 37-42.

68. Fernando C. N., Pereira, Stuart M., Shieber. Prolog and Natural Language Analysis.: NCSLJ Lecture notes. 1987. - № 10. pp. 124-141.

69. Fillmore С. J. On a fully developed system of linguistic description//Feasibility study of fully automatic high quality translation. Tech. Report RADC.-TR-71-195.-Austin: Univ.of Texas.-1971.-pp. 77-94.

70. Fillmore C. J. The case for case reopened // Syntax and semantics. Vol. 8. Grammatical Relations. N.Y.: Academic Press. - 1977.

71. Fum D., Tasso C. A propositional language for text representation // Computational Models of Natural Language Processing. N. Y.: Elsevier Science Publishing Сотр. (NorthHolland) 1984,-pp. 121-150.

72. Gallistel C. R. Space and time // Animal hearing and cognition / Ed. N. G. Mackintosh. San Diego: Acad. Press. - 1994. - P. 379.:

73. Ghenima. Morpho-syntactic analisis of arabic language based on Tree Adjoining Grammar (TAG) formalism.: Труды международного семинара "Диалог, 96" по компьютерной лингвистике и ее приложениям. Пущино, 4-9 мая 1996, М.: 1996. - pp. 7382.

74. Halliday М. А. К. An Introduction to functional grammar // Edward, Arnold (Publishers), 1985. p. 315.

75. Hendrix G. G. LIFER: A natural language interface utility.: SIGART Newsletter. Vol. 61,- 1977.-pp. 25-26.

76. Johnson M. AV Parser. URL: ftp://Lx.cog.brown.eelypub/AVParser, 1994.

77. Katz J. Fodor J. (eds.) The structure of a semantic theory. N. Y.: Norton, 1955.

78. Kiefer В., Fettig T. URL: http://www.de.rolator.research.ec.org:80/lg=de/ re-sources/fergamed/index.m/html, 1995.

79. Killbury J. QPATR and Constraint Threading. Calling-90, Vol. 3, 1990.

80. Lazdar G., Mellish. Natural Language Processing in Prolog: An Introduction to Computational Linguistics. Addison-Wesley. Reading, Massachusetts, 1987.

81. Lehman F. W. Semantic Networks// Computers and Mathematics with applications. V. 23. N2-5, 1992.

82. Lehnert Wendy L., Dyer Michael G., Johnson Resor N., Yand C.J. and Harley Steve. Bris An Experimental in-depth Understanding of Narratives.// Artfificial Intelligence. Vol. 20, № 1, 1983. - pp. 15-62.

83. Lotta J. N., Oeberg P. J. A conceptual virtual relity model // IEEE Computer Graphics and Applications, January, - 1994. - pp. 23-29.

84. Lythinen L. The representation of knowledge in a multi-lingual integrated parser. Ph. D. Thesis. Department of Computer Science, Yale Univercity. Research Report # 340,1984.

85. Martin C. Pragmatic interpretation andambiguity.: In: Proceedings of the Eleventh Annual Conference of the Cognitive Science Society. Ann Arboor, MJ, August, 1983. -pp. 474-481.

86. Montague R. The proper treatment of quantification in ordinary English // Tho-mason T. H. (ed.) Formal philosophy. New Heaven: Yale Univ. Press, 1974. - p. 247-270.

87. Natural Language Software Registry. Version 3.0. DFKJ. Univercity of Saar-bruecken. URL: http://clwww.dfki.uni-sb.de, 1994.

88. Obermeier K. K., de Hilster D. DIID data - independent interface for data -bases: the AI perspective. // SPIE - Vol. 548. Applications of Artificial Intelligence 11,1985,-pp. 220-226.

89. Pierce. Collected Papers of Charles Sanders Pierce. Vol. 4. / C. Hartshorne, P. Weis and A. Burks, Eds. Belkner Press (Harvard Univercity Press), Cambridge, Mass., (1931-1958).

90. Pratt V.R. LINGOL: A Progress Report.: Proceedings of the 4th IJCAI. 1975. -pp.422-438.

91. Riesbeck C. K. Conceptual analysis // Conceptual Information Processing. Amsterdam: North-Holland, 1975.

92. Robinson J. J. DIAGRAMM: A grammar for dialoges communications of ACM. Vol. 25, № 1,-1981.-pp. 27-47.

93. Sharp R. CAT2 : An Experimental Eurotra Alternative // Machine Translation, № 6, 1991.-pp. 215-228.

94. Shebes Y., Paroubeck xTag a graphical workbench for tree adjoining gramrdmars.: Proc. Of the 3 conference on Applied Natural Language. Proceedings, 1992, pp. 216-223.

95. Sim J.F. Conceptual structures. Addison-Wesley, Reading, N/A, 1984.

96. Sowa J. F. Conceptual graph as a universal knowledge representation//In: Semntic networks in AI.: Spec. Issue of an International journal of computers & Mathematics with Applications. (Ed. F. Lehman). Vol. 23, Number 2-5, 1992, Part 1. pp. 75-95.

97. Waltz D. L. PLANES: an English language question answering system for a large165relational database. // CACM 1978, - Vol. 21, № 7. - pp. 526-539.

98. Wilensky R. Why John married Mary: understanding stories involving recurring goals // Cognitive Sci. 1978. - Vol. 2. - p. 235-265.

99. Willks Y. and Fass P. The Preference Semantics Family.: In: Semantic Networks in AI. Ed.: Fritz Lehman. Special issue of International Journal of Computers and Mathematics with applications. V. 23, № 2-5, January-March, 1992. Part 1. pp. 205-222.

100. Woeds W. A. What's in a link ? Foundation for semantic networks. An representation and Understanding: Studies in Cognitive Science. (Edited by D. G. Bobrow and A. Collins). Academic Press, New York? 1975. pp. 35-82.

101. Zade L. A. Fuzzy sets// Inform, Control. 1965. Vol. 8, № 3. P. 338-353.

102. Zajac R. Inheritances and Constraint Based Grammar Formalisms. Computa-tonal Linguistics. Vol. 18, № 2, 1992, pp. 159-180.

103. Zeevat M., Combining categorial gramar and unification Natural Language Parsing and Linguistic Theories. U. Reyle and C. Phoner (eds.) Reidel: Pordrecht, 1988, pp. 202-209.