автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка

кандидата технических наук
Поляков, Владимир Николаевич
город
Москва
год
1997
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка»

Автореферат диссертации по теме "Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка"

Г г'

од

На правах рукописи

2 0

1ЯЯ7

ПОЛЯКОВ Владимир Николаевич

МОДЕЛИ АЛГОРИТМИЧЕСКОГО ТИПА ДЛЯ РАСПОЗНАВАНИЯ СЕМАНТИЧЕСКИХ СВЯЗЕЙ В СИСТЕМАХ МАШИННОЙ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА

Специальность 05.13.16. - Применение вычислительной технихи,

математических методов и математического моделирования в научшлх исследованиях

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Москва 1997

Работа выполнена на кафедре АСУ Московского Государственного института стали и сплавов (Технологического университета)

11аучный руководитель:

академик М.А.И., доктор технических наук профессор А. Г. Дьячко

Официальные оппониггы:

доктор технических наук, профессор Н.Е.Емельянов кандидат экономических наук, доцеяг А.Е.Сатушша

Ведущая оргшшзация: Московский энергетический инсппуг (Технический университет)

Защтв состоится "21* (М&? 1997 г. в часов на заседании диссертационного совета Д.053.08.07 в Московском Государственном институте стали и сплавов (Технологическом университете) по адресу: 117936, г. Москва, Ленинский просп.,4] С,4

С диссертацией можно ознакомшъся в библиотеке Московского Государственного института стшш и сплавов (Технологического университета)

Автореферат разослан " "__ 1997 г.

Ученый секретарь диссертационного совета

к.т.п., доцент Е.А. Калашников

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы обуславливается потребностями, возникшими в области обработки естественно-языкового текста в связи с бурным развитием компьютерных средств коммуникации. Достижения последних лет в области современной логики, искусственного интеллекта и компьютерной лингвистики создали новые предпосылки для исследования природы семантических связей в естественном языке в целях построения формальных моделей для естественноязыковых форм: предложения, высказывания, текста. Прогресс в области информационных технологий обеспечил необходимые предпосылки для компьютерной реализации разработанных моделей.

Цель данной работы - исследование природы семантических связей в предложении и высказывании естественного языка, а также разработка алгоритмических моделей для автоматического построения логических выражений, описывающих их семантику (= смысл) с учетом перспективы дальнейшего использования в целом ряде прикладных компьютерных систем (системы машинного перевода, текстовые базы .данных, системы анализа текстов, естественно- языковой интерфейс к автоматизированным системам).

Достижению поставленной цели подчинено решение следующих более конкретных задач исследования:

• изучить полученные ранее и опубликованные в литературе результа.ы в области исследования предложения и высказывания как феноменов естественного языка; изучил, существующий опыт построения формальных моделей языка (=грамматик) и смысла естественно-языковых форм;

• исследовать механизмы взаимосвязи семантически эквивалентных друг другу языковых и логических структур с целью выявления семантических примитивов модели языка и модели смысла ; определить понятия семантический примитив модели языка и семантический примитив модели смысла; выявить семантические примитивы в составе логического представления смысла; изучил, их структуру, типы, свойства, внутренние и внешние семантические связи; выявил, их эквиваленты в естественно-языковых формах предложения и высказывания; изучить структуру, типы, свойства, признаки идентификации естественно-языковых эквивалентов семантических примитивов модели смысла, закономерности построения структурного представления предложения с использованием семантических примитивов модели языка, закономерности построения логического представления предложения и высказывания с использованием семантических примитивов модели смысла;

• построить грамматики и модели представления смысла для машинной обработки наиболее часто встречающихся в Научных и технических .текстах повествовательных предложений и высказываний утвердительного тала;

• разработать методы и алгоритмы машинного выявления семантических примитивов в языке и их использования для построения логического представления смысла предложения.

Научная новизна диссертации состоит в том, что автором:

• предлагается новый подход к разработке моделей для обработки естественноязыковых форм, который заключается в том, что разрабатываются одновремешю две согласованные модели: модель языка (грамматика) и модель смысла;

• в основе согласования моделей языка и смысла лежит идея автора о существовании эквивалентных семантических примитивов в моделях языка и смысла;

• последовательно разграничиваются модели для различных естественноязыковых форм: предложения и высказывания на основании феноменологических свойств этих форм в области 1« семантики; это обеспс-швает качественно новый уровень моделирования понимания текста за счет включения коммуникативно- функциональных составляющих в структуру, представления смысла;

• на основании обнаруженных закономерностей разработав алгоритмические модели для машинной обработки повествовательных предложений и высказываний утвердительного типа русского языка (Многоаспектная модель смысла и Грамматика элементов смысла).

Теоретическая значимость исследования заключается в том, что в

работе:

• выявлены языковые и логические структуры нового типа: эквивалентные друг другу семантические примитивы модели языка и модели смысла;

• исследованы их типы, состав, свойства, семантические связи;

• выявлены закономерности построения структурных представлений предложений на основе семантических примитивов языка,

• показана связь между семантическим примитивом модели языка и поверхностно-синтаксическим отношением в модели Смысл <-> Текст,

• выявлены закономерности построения логических представлений предложений и высказываний на основе семантических примитивов модели смысла;

• определены логические формулы для повествовательных предложений и высказываний утвердительного типа русского языка;

• показан универсальный характер обнаруженных закономерностей на примерах из русского и английского языков ;

• показаны ограничения в существующих моделях, которые можно преодолеть при использовании семантических примитивов в моделях языка и смысла.

Практическая ценность диссертации заключается в возможности использования результатов работы при разработке прикладных систем моделирования языковой способности - лингвистических процессоров различного назначения, при разработке автоматизированных систем извлечения из текстов данных и знаний. Обнаруженные закономерности могут быть использованы в методике преподавания русского языка как иностранного и иностранных языков. Результаты исследования метут найти применение в теоретических курсах по компьютерной лингвистике.

Предмет, материал и цель исследования определили используемые в работе методу:

При подборе, анализе и интерпретаций фактов естественного языка использовались описятепъ»п>-®швттнчеасйЙ и диетрибутивно-коитекотологический метода исследования, кадета (ентшй анализ. Построение формальных моделей языка и смысла потребовало привлечения методов структур» го-сема1ГТического и логико-математического моделирования. При разработке программного обеспечения использовались методы алгоритмического моделировав», метод макетирования и элемлггы структурного программирования. В работе использовался компьютерный эксперимент.

На защиту выносятся Многоаспектная модель смысла для предложения и высказывания, Грамматика элементов смысла, которые имеют следутопгче рсповпые положения:

1. Смысл предложит» и высказывания может быть представлен как логическая формула, состоящая из типовых структурных единиц - семантических примитивов модели смысла.

2. Для того, чтобы учитывать феноменологические особенности построения естественно-языкового высказывали, семантический примитип в модели смысла должен включать:

- вид отношения (действия, состояния) и его участников;

- значеим коммуникативной и семантической роли участников отношения;

- референциалыгое значение.

Поэтому он может быть описан в исчислении предикатов несимметричным предикатом с явным указаютем т индивидное и множественное значение термов. При этом порядок термов задает их коммуникативные роли, а множествешю-категориальное значение - семантические роли. Форма задают

индивидного и множественно- референциального значения терма определяет его референциальный тип. Такой семантический примитив получил название элемент субъект - отношение - атрибут или СОА-элемент. ,

3. СОА-элементу в составе предложения можно поставить в соответствие однозначно морфемно- семантическую, лексико-семантическую или структурно-семантическую единицу: семантический примитив языка, получивший название элемент смысла.

4. Элементы смысла, соединяясь, образуют структурное (= графовое) представление - дерево элементов смысла.

5. Дереву элементов смысла соответствует один из компонаггов логической формулы для смысла простого предложения.

6. Темпоральные отношения образуют второй компонент формулы для смысла простого предложения - сетевой граф.

7. Смысл сложного предложения в отличие от смысла простого предложения включает два дополнительных компонента, образованных сочинительными или подчинительными связями между его простыми предложениями - сеть сетей и дерево деревьев отношений.

8. На уровне высказывания, смысл предложения дополняется тремя компонентами: базовым коммуникативным компонентом, компонентом коммуникативной пресуппозиции, компонентом обстоятельств высказывания, которые, как правило задаются экстралингвистическими средствами.

9. Возможно построение компьютерной системы, которая при заданном типе высказывания будет автоматически выявлять элементы смысла на основании их признаков и составлять логическую формулу для предложения и высказывания соответствешю их смыслу.

Апробация работы. Основные положения работы нашли отражение в докладах на следующих научных семинарах и конференциях: "Экспертные и обучающие системы", Саратов, СГУ, 1991; "Логаческое управление с использованием ЭВМ", Владикавказ, 1991; "Искусственный интеллект в XXI веке", Калининград, 1995; . "Диалог'96: компьютерная лингвистика и ее приложения", Пущино, 1996 ; V Национальная конференция "Искусственный интеллект-96", Казань, 1996. Теоретические вопросы диссертации освещаются в 6 научных публикациях. Результаты работы послужили основой для создания исследовательской автоматизированной системы моделирования языковой способности "Недоросль".

Публикации. По теме диссертации опубликовано 6 работ.

Структура и объем диссертационной работы. Работа состоит из введения,

-четырех глав, заключения, двух приложений и списка литературы.

\ ■

включающего 269 наименовшшй. Основной текст занимает 163 машинописных страницы.

СОДЕРЖАНИЕ РАБОТЫ

Во введении рассматривается проблематика в области компьютерной обработки естественного языка.

В первой главе "Синтез формальных моделей языка и смысла как проблема семантической обработки естественного языка" рассматриваются основные проблемы в области построения формальных моделей предложения и высказывания естественного языка и их смысла; анализируются основные феноменологические особенности естественно-языкового предложения и высказывания и способы их отражения в формальных моделях языка и смысла; дается обзор работ по формальным моделям языка и системам представления знаний, методам когнитивного моделирования; формулируется используемый в дальнейшем подход к построению' согласованных между собой моделей: Многоаспектной модели смысла и Грамматики элементов смысла.

Показано, что настоящая работа касается проблемы семантической обработки естественно-языковых предложения и высказывания, которая оказывается на пересечении нескольких научных направлений:

• изучения феноменологии естественного языка в традиционной и современной лингвистике;

• построения формальных языковых моделей в компьютерной лингвистике;

• представления смысла высказывания с использованием логич. ских и сетевых формализмов в области искусственного интеллекта;

• построение баз энциклопедкчес.мх знаний в области искусствешюго интеллекта.

Проведенный анализ литературы позволяет сделать следующие выводы:

1 .Современная лингвистика различает понятия предложешю и высказывания на основе их семантического содержания, в то время как в моделях, связанных с компьютерной обработкой языка, это различие еше не утвердилось. В лингвистике накоплено достаточно фактического материала, для того чтобы построить эффективную модель семантической обработки естественного языка. При этом формальные модели языка, основанные на строгих математических формализмах типа модели Хомского, не учитывают

целого ряда феноменологических особенностей естественного языка, поэтому на современном этапе модель языка должна носить скорее алгоритмический, чем математический характер. Напротив, поверхностный синтаксис модели "Смысл<->Текст" может быть обогащен идеей семантического примитива и взят за основу алгоритмической модели обработай поверхностных связей языка.

2. Произошло разделение на модели языка и модели смысла: первые направлены на моделирование" поверхностных связей, т.е. языковой формы, вторые - на моделирование ее внутреннего смыслового содержания. Для эффективной семантической обработки естественного языка модели языка и смысла должны быть согласованы. Одним из механизмов согласований этих моделей может быть идея семантического примитива, выражающего отношение между концептами. Структура, свойства и нотация семантического • прими шва языка должны учитывать феноменологические особенности вписываемых им естественно- языковых форм. В лингвистических исследованиях по феноменологии языка утвфдшюсьйредставледае.об аспектах или проекциях смысла, которое не нашло отражение в моделях смысла.

3. Для описания семантики отношений в области математической логики и искусственного интеллекта Предложен набор логических и сетевых формализмов, которые, однако, не всегда ориентированы на особенности естественного языка. Логические формализмы являются наиболее предпочтительными Ддя описания Модели смысла, так как они дают надежную основу для умозаключения, охватывают широкий спектр логико- семантических отношений в естественном языке, позволяют достаточно естественно включать, в систему вывода различные когнитивные модели. Для успешного описания природы семантических связей в естественном языке логические формализмы должны быть по возможности объединены в рамках одной модели смысла. Однако это объединение должно осуществляться не механически, а с учетом фактического материала, накопленного в совремешюЙ лингвистике. Для использования арсенала средств по представлению 'смысла естественноязыковой формы, который предлагают различные сетевые формализмы, эти формализмы должны быть согласованы между собой и переработаны в логической нотации. Область исследований, связанных с описанием энциклопедических знаний, необходимых для семантической обработки естественного языка, находится еще в стадии формирования.

Комплексный анализ состояния исследований в областях, связанных с обработкой естественного языка, позволяет ставить вопрос о создании систем с элементами комш.кперпого моделирования языковой способности в узко

ограниченной прикладной сфере. При этом системы должны носить исследовательский характер и обладать возможностям настройки и корреклгровки моделей в процессе отладки.

Во второй главе "Семантические примитивы в модели представления смысла и грамматике языка" вводятся и обосновываются понятия семантический примитив модели смысла (СОА-элемеот) и семантический примитив модели языка (элемент смысла). В данной главе был предложен метод интерпретации естествегаю- языковых форм с использованием семантического примитива в модели смысла- элемента "субъект - отношение -атрибут" (СОА-элемента). Показана интерпретация СОА-элемента в логике предикатов как конъюнкции предиката, выражающего семантическое отношение коммуникативных ролей термов, семшгтических ролей термов, их референциальных знача шй. Так, например, предложение Петя купил книгу в эксплицитной логической нотации Многоаспектной модели смысла будет записано как:

(1) ЗхЗу /* Квшгторы

купить_что(х,у) /* Предикатная форма ' & БиШОО /* Комму! шкативная роль для х

& покупатель_и1(х) /* Семантическая роль для х & х:=Петя_а1 /* Референциальное значите для х

& АТШ (у). I* Коммуникативная роль для у

& покупка_и2(у) /* Семантическая роль для у & кпига_у1(у) /* Референциальное значите для у

На примерах форм русского и английского языков демонстрируется подход к интерпретации ЕЯ- форм, основанный на идее согласованных между собой семантических примитивов модели языка и модели смысла (Табл. 1).

На факпгческом материале исследуются и обосновываются базовые свойства элементов смысла. Предложенные примеры представления смысла для различных форм русского языка позволяют сформулировать общие закономерности структурного и семантического представлений предложений естественного языка.

Несмотря на внешние различия представленных форм (модель словообразования, лексически свободное словосочетание, модель управления' глагола, видовременная парадигма глагола, сложное предложение), каждой из Ш1Х можно поставить в соответствие в модели смысла типовую логическую структуру, названную СОА-элемент, или логическую композит опо из нескольких СОЛ- элементов. Это подтверждает тот факт, что семантические

связи, описываемые различными средствами языка, обладают единой природой. Таким образом, представление смысла предложения может базироваться на СОА-элеме1Гтах, которые выполняют роль семантических примитивов в модели смысла.

Таблица 1. Примеры интерпретации естественно-языковых форм

Пример 18.1. "парижанин"

Типы ЭлС: 1 ) кореньЩесто) - nul - суф(ан)

2) мэс -... nul... - суфГгаО

COA- эквивалент:

место_жительства ((место,ПАРИЖ), (объект,О i) &

обладать_свойотвом((объект,О i), (свойство,ПОЛ) & . иметъ_значение((свойство,ПОЛ), (значение,МУЖСКОЙ))) Примечание: корень(место)-корень, обозначающий место или

географическое название; cyi)j("an")-суффикс "an"; ■ _мэс- морфемный элемент смысла; су ф("ш/")-суффикс "ин"._

Пример 18.2. "комната сестры "

Тип ЭлС: <ис -... nul... - ис(рп)>

COA- эквивалент:

иметь_владельца((объект,КОХШАТА),(владелец,СЕСТРА)) Примечание: ис- имя существительное;

ис(рн)-имя существительное в родителыюм падеже; тип ЭлС имеет несколько омонимических значений, ср.:

"литрмолока", "час заката", "запах цветов", "решение задачи"_

Пример 18.3. "Поезд прибыл на вокзал."

Типы ЭлС: 1. ис(ип) -... nul... +*: гл

2. гл("прибыть" ) - ... предС"на" )... - ис(вн)

3. гл(пн.св') - null - null

СОА-эквивалент:

S1 =прибывать_куда((объект,ПОЕЗД),(место,ВОКЗАЛ))

& до((точ_ситуация,Б 1),(точ_ситуация,ТВВ)) Примечание: ис(ип)-имя существительное в именительном падеже; ис(рн)-нмя существительное в родительном надеже; гл( "приходить" )-глагол "приходить"; Гл(1ш,св) - глагол в прошедшем времени, совершенного вида. COA- эквивалент содержит две точечных ситуации: S i и "точку времени высказывания" (TÍ3D), связанные темпоральным отношением._

Примечание :

1 ) В нотации элемента смысла (ЭлС): подчеркиванием выделена опорная часть (ОЧ) ЭлС, курсивом - связующая часть (СЧЭлС), не выделена - зависимая часть (ЗЧЭлС).

2) nul -ЧЭлС отсутствует.

3) Угловые скобки "< >" означают возможность инверсии порядка ОЧ и 34.

4) Многоточие "..." означает возможность включений между частями ЭлС Частей от других ЭлС, знаки "+","*",":" -согласование ЧЭлС в числе, падеже и роде соответственно.

В структурном представлении рассмотренных языковых форм наблюдаются две закономерности.

• Во-первых, наличие трехчленной структуры в виде опорной, связующей и зависимой частей в составе внешнего (лексического и морфемного) описания. При этом присутствие всех трех компонентов в общем случае необязательно.

• Во-вторых, наличие переменного и постоянного компонентов в составе категориального (лекгико-стиггаксического) описания. При этом постоянный компонент выполняет роль типовой структуры и обладает табором формальных (категориальных) признаков, позволяющих его идентифидар ють с точностью до явления омонимии. Переменные компоненты являются элементами замещения.

Выявленные закономерности позволяют ввести универсальною структурную единицу в составе модели языка - элемент смысла', которьг! будет выполнять функцию семантического примитива в модели языка. Это создает основу для создания алгоритмической модели языка, базирующейся на идее элементов смысла: Грамматики элементов смысла.

Между семантическим примитивом в модели языка (элементом смысла) и семантическим примитивом в модели смысла (COA- элементом) наблюдается отношение типа один ко многим, то есть при семантической интерпретации элемента смысла ему ставится в соответствие логический эквивалент, представляющий собой композицию одного или более COA- элементов.

1 Другой термин для обозначения этой языковой единицы был предложен

3 M Шаляпиной: элементарная предикатная , тструкция.

^ В третьей главе: "Формальные модели языка и представления смысла"

> описывается модель подставления смысла ' естествешю- языкового ' предложения Многоаспектная модель смысла предложения (МАМС-П). Показана связь аспектов смысла и графовых структур в моделях языка и смысла. На примере одного типа высказывания, сообщения, сформулирована базовая модель для представления смысла высказывания "(МАМС-В), являющаяся расширением МАМС-П за с 1ет функциокально-коммушпеатшиплх аспектов смысла. В Многоаспектной модели смысла в целом (МАМС-П и МАМС-В) предусмотрены следующие механизмы учета феноменологии естественного языка:

• положение термов предикатов соответствует коомуникативной роли;

• введены отношения для описания семантических ролей;

• введены отношения для описания референциальных значений;

• введена функция актуализации для осуществления' композиции примитивов;

• типы термов соответствуют типам концептов (конкретный индивид; неопределенные и определенные множества; отношения и формулы.)',

• введено понятие статус значения истинности для учета модальности высказывания.

• введены компоненты МАМС-формулы для описания темпорального аспекта смысла предложений и смысла сложных предложений.

• введены компоненты для описания коммуникативных аспектов смысла высказывания.

Показано, что наиболее близкой к МАМС системой представления смысла среди известных теорий можно считать подход к описанию смысла ЕЯ-предложений, принятый в Теории концептуальных графов Совы 3. МАМС и теория концептуальных графов Совы (ТКГ), имеют в своей основе общий форлшлигм: теорию исчисления предикатов. Нотация в ТКГ более тяготеет к графовому тину представления, хотя автором предложен и формульный вариант. Однако, объектно-ролевая нотация, предложенная в МАМС, позволяет эксплицишо выразить ролевые значения концептов, поэтому она более

2 Вообще-то ТКГ декларируется как универсальный аппарат для . представлени знаний и представление смысла ЕЯ-феноменов рассматривается автором ТКГ, ка один и) видов приложений. Поэтому с МАМС сравнивается не ТКГ в целом, подход к представлению смысла ЕЯ- предложений с помощью ТКГ.

О

лингвистически ориентирована, чем ТКГ. Кроме того, МАМС когшгшвно ориетирована, так как одним из условий выбора предиката в СОА- элементе является наличие его в когнитивной модели интеллектуального агента. Однако, наиболее ярко отличия МАМС-В и подхода проявляются в области феноменологии. МАМС в отличие от ТКГ рассматривает не только предложения, но и высказывания, и при этом МАМС позволяет описывать такие свойства ЕЯ- высказывания, не отраженные в ТКГ, как:

• наличие семантического примитива в логическом и в структурном представлении смысла, учитывающего значение семантической роли в явном виде;

• коммуникативно- функциональные компоненты смысла высказывания;

• разный характер истинности высказывания и его составляющих с точки зрения модальности.

На примерах различных типов высказываний показаны репрезентативные возможности модели МАМС-В.

Далее в главе 3 описана алгоритмическая модель языка (Грамматика элементов смысла), разработанная на основе идей элементов смысла и взаимного соответствия семантических приштшон моделей языка и смысла. На основе предложенных моделей (ГЭлС и МАМС-П) разработана общая схема алгоритма фамматического разбора естественно-языкового предложения (Рис.1). Показано, что Грамматика элементов смысла родственна Модели Смысл<->Текст (МСТ) в часта поверхностного синтаксиса, однако отличается от поверхностного синтаксиса МСТ тем, что она семитически ориеигаровшт.

Четвертая глава "Моделирование языковой способности с помощью автоматизированной системы "Недоросль" носвящеии проблеме построения компьютерной системы обработай естественно-языковых предложений на основе формалшмои Грамматики элементов смысла и Многоаспектной модели смысла предложения. Были сформулированы цели и задачи, которые ставились при разработке исследовательской автоматизированной системы "Недоросль":

• апробация Грамматики члемоггон смысла;

• формирование и отладка базы лилгвистических знаний дня русского

языка;

• исследование поведения и оптимизация алгортмов 1рамматического разбора (=анализа);

• апробация Многоаспектной модели смысла;

• формирование и отладка базы энциклопедических знаний в ограниченном объеме, необходимом для функционирования базы лингвистических знаний.

8-ЕЯП 1

Операции над ЭлС

-идентификация ЭлС; -подстановка переменной части;

-выбор альтернатив; -композиция в граф.

ЭлС - элементы смысла, графовые представления

База данных ЭлС

М - логическая форма в МАМС-П

Рис. 1 Анализ ЕЯ-предложения в Грамматике элементов смысла (общац схема)

Описаны ее основные компоненты: функциональный состав, структура базы данных, пользовательский шггерфейс, алгоритм анализа и конкретные проектные решения, принятые в процессе разработки. Продемонстр1фовано, как система может использоваться в исследовательских целях. Показано, что «узким местом» алгоритма грамматического разбора является шаг идентификации частей элементов смысла (ЧЭлС) (Рис.2.).

Предложено 4 варианта алгоритма идентификации' ЧЭлС. Оценена вычислительная сложность каждого алгоритма идентификации ЧЭлС и сделан прогноз поведения этих алгоритмов на массивах реальной сложности. Показано, что наилучшие результаты показывает алгоритм идаггификации ЧЭлС с дополнительным массивом связи "ЧЭлС-морфоформа", который пригоден для решешш задачи грамматического' разбора в пакетном режиме. Для решения же задачи в режиме реального времени скорость его работы необходимо улучшить 1И един-два порядка. В процессе работы над системой "Недоросль" прошли апробацию идеи, положенные в основу Грамматики элементов смысла и Многоаспектной модели смысла предложения.

В заключении обобщаются полученные результаты и формулируются выводы.

В настоящей работе было проведено исследование природы семантических связей в предложении и высказывании естественного языка с целью построения алгоритмических моделей для их обработки. В ходе выполнения работы выяснилось, что существующие формальные модели языка не учитывают структурного членения естественно-языкового предложения на семшттические примитивы. Но этим соображениям, отправным пунктом семантического анализа смысла предложения была идея семантического примитива в модели языка и модели смысла. В работе были исследованы виды семантических примитивов в модели языка (=элемснтов смысла), их внутренняя структура, способы оргшш'щцш графовых структур. Был предложен семантический эквивалент для семантического примитива в модели смысла: :элемент типа субъект-отношение-атрибут. , Кроме того, было обнаружено, что существующие модели представления знаний при построении формального содержания не полностью учитывают феноменологические особенности естественно-языкового предложения. Поэтому, была предложена модель смысла предложения, учитывающая следующие феноменологические аспекты предложения: семантическую и коммуникативную роль участников отношений, темпоральный аспект смысла, механизм референции, связь с когнитивными моделями агента, статус значения истинности. Полученная модель смысла предложения была обобщена на уровень высказывания.

Согласованная разработка грамматики языка и модели смысла позволила построить и реализовать в виде компьютерной программы алгоритмическую модель для процесса анализа естественно-языкового предложения.

' Выполненная работа позволяет сделать следующие выводы:

1.В составе естественно-языкового предложения можно выделить ссмантнчсскис. примитивы, обладающие минимальным семантическим предикатным значением: элсмиггы смысла. Критерием выбора таких элементов смысла является наличие отношения в его семантическом эквиваленте.

2.Элемс1пы смысла в языке можно выделить на различных уровнях представлешю: на морфемном, на лексическом, на структурном. Элемент смысла имеет постоянный и переменный компоненты. Постоянный компонент элемента смысла, названный типом элемента смысла, имеет набор признаков, позволяющих его идентифицировать в составе предложения. В целях алгоритмической обработки элемент смысла удобно описывать в виде композиции трех частей: опорной, связующей и зависимой. Элементы смысла образ)ют структурнос представлешю для предложения: дерево элементов смысла.

3.Семантическим эквивалентом для элемента смысла является структура вида: субъект- отношешю- атрибут (СОА-элеменг), описываемая композицией предиката, описывающее отношение с коммуникативно-ролевыми, семшгтико-ролсвыми и референциальными значениями термов.

4.Смыслу предложения в Многоаспектной модели смысла соответствует логическая формула, построенная как композиция аспектов смысла. Каждому аспекту смысла соответствует свой тип структурного (графового) представления. Компонент формулы, соответствующий отдельному аспекту смысла, строится на основе композиции СОА- элементов с помощью механизма объектно-ролевого взаимодействия. Смысл высказывания является расширением над смыслом предложения за счет компонентов, дающих коммуникативную направленность. Использование механизма статусов значений истинности позволяет комбинировать в составе одной логической формулы компоненты, имеющие различную модальность.

5.Грамматика элементов смысла является развитием поверхностного синтаксиса модели " С мы сл<->Текст" с помощью идеи семантического примитива. Многоаспектная модель смысла высказывания является развитием подхода к представлению смысла предложения, используемого в теории

концептуальных графов за счет учета феноменологии ЕЯ- высказывания.

[

Г

Рис. 2 Алгоритм идентификации частей элементов смысла в ЕЯ-предложении

6.Алгоритмическая модель для когнитивной процедуры "Анализ ЕЯП", основанная да Грамматике элементов смысла и Многоаспектной модели смысла, может быть построена как комбинация алгоритмов, описывающих отдельные операции над элементами смысла и СОА-злементами: идентификация ЧЭлС, идентификация ЭлС, подстановка переменной части, выбор альтернатив, композиция ЭлС в графовое представление, связывание СОА- элементов, интерпретация в логическую форму. «Узким местом» алгоритма грамматического разбора является шаг идентификации частей элементов смысла. Предложенный алгоритм идентификации частей элементов смысла может быть использован для решения задачи грамматического разбора на существующей вычислительной технике при работе в пакетном режиме.

7. Данное исследование было сосредоточенр на ключевых вопросах, связанных с семантическим анализом естественно-языковых форм. Разработанная в рамках выполненной работы система моделирования языковой способности "Недоросль" носит исследовательский характер. Однако полученные теоретические результаты, предложенный формальный аппарат и инструментарий могут быть положены в основу разработки и оптимизации эксплуатационных характеристик автоматизированного рабочего места лингвиста и инженера но знаниям при создашы лингвистического процессора для семантической обработки научно-технических текстов реальной сложности при решении задач мапшнного перевода, поиска в текстовых базах данных, приобретения знаний из текстов.

Основные публикации по теме диссертационной работы:

1.А.Г.Дьячко, В.Н.Поляков. Моделирование интеллектуального интерфейса "пользователь-автоматизированная система" с помощью теории конечных автоматов. Тезисы докладов XIV Всесоюзного симпозиума "Логическое управление с использованием ЭВМ", Владикавказ, сентябрь,1991 г.

2.В.Н.Поляков. Модель и процессор ' полиязычной семантической сети. Материалы Всесоюзного семинара "Экспертные и обучающие системы", Вып.13, Саратов, СГУ, 1991.

3.В.Н.Поляков. Многоаспектная модель смысла естественноязыкового предложения. Деп.ВИНИТИ N 2431-В94, 1994,27 с.

4.В.Н.Поляков. Представление смысла высказывания-сообщения в Многоаспектной модели. Труды Международного семинара Диалог'96 по компьютерной лингвистике и ее приложениям. Пущино,' 4-9 мая, 1996. , с.214-2'21.

5.В.Н.Поля ков. Программа "Недоросль": когнитивный подход к исследованию . природы семантических связей естественного языка. Тезисы ■ пятой национальной конференции по Искусственному интеллекту(КИИ-96),Казань,1996., с 98-101.

6.В.Н.Поляков. Грамматика элементов смысла повествовательного предложения изъявительного наклонения; Деп.ВИНИТИ Ы 1951-В96, 1996, 26 с.