автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математическое моделирование процесса анализа близости предикатов семантических отношений

кандидата технических наук
Корнышов, Александр Николаевич
город
Великий Новгород
год
2007
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Математическое моделирование процесса анализа близости предикатов семантических отношений»

Автореферат диссертации по теме "Математическое моделирование процесса анализа близости предикатов семантических отношений"

003064521

На правах рукописи

КОРНЫШОВ АЛЕКСАНДР НИКОЛАЕВИЧ

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССА АНАЛИЗА БЛИЗОСТИ ПРЕДИКАТОВ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ

Специальность 05.13 18 — «Математическое моделирование, численные методы и комплексы программ»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

1 6 А В Г 2007

Великий Новгород - 2007

003064521

Работа выполнена на кафедре Программного обеспечения вычислительной техники и автоматизированных систем Государственного образовательного учреждения "Новгородский государственный университет им Ярослава Мудрого"

Научный руководитель:

Официальные оппоненты:

доктор технических наук, профессор Емельянов Геннадий Мартинович

доктор технических наук, профессор Немирко Анатолий Павлович

кандидат технических наук, доцент Макаров Владимир Алексеевич

Ведущая организация: Государственное учреждение

«Научно-исследовательский институт прикладной математики и кибернетики Нижегородского

государственного университета им Н. И. Лобачевского Министерства образования Российской Федерации»

Защита состоится "07" сентября 2007 г в 16 часов на заседании диссертационного совета Д 212 168.04 в Новгородском государственном университете им Ярослава Мудрого (173003, Россия, г Великий Новгород, ул Б Санкт-Петербургская, 41)

С диссертацией можно ознакомиться в библиотеке университета

Автореферат разослан¿Jj' июля 2007 г

/Ученый секретарь диссертационного совета Д 212 168 04

Доктор физико-математических наук, профессор—--Эминов С И

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Обработка Естественного Языка (ЕЯ) является одним из приоритетных направлений в области развития Искусственного Интеллекта Настоящая диссертационная работа посвящена решению проблемы использования существующих в ЕЯ закономерностей для автоматизации накопления и систематизации Семантических Знаний в Интеллектуальных Системах (ИС)

Актуальность работы. Следует выделить две группы затруднений технического характера, которые мешают применению в информационных системах интеллектуально-коммуникативных технологий, предполагающих взаимодействие человека и ЭВМ на ЕЯ

Первая группа затруднений состоит в необходимости предварительного ввода в ЭВМ всей полноты Знаний о ЕЯ Объем Семантических Знаний велик, и поэтому их ввод требует огромных затрат труда множества квалифицированных специалистов, в том числе для предварительной формализации и систематизации этих Знаний При традиционном подходе не учитывается возможность неполноты и противоречивости самих Знаний о ЕЯ, относительность представления как о ЕЯ, так и ситуациях его использования, а также потребность в постоянном изменении введенных Семантических Знаний Если для некоторых областей применения на коротком временном промежутке функционирования ИС изменениями в ЕЯ можно пренебречь, то в целом изменчивость - глубинное и универсальное свойство как естественных, так и искусственных языков, и его необходимо учитывать.

Причина чрезмерной трудоёмкости — отсутствие на настоящий момент методов предметно-адаптивной формализации и автоматической систематизации Знаний о ЕЯ Как следствие этого, при использовании существующих подходов к формализации Знаний о ЕЯ для каждого языка и тематического подмножества требуется производить заново как формализацию, так и ввод Семантических Знаний, что увеличивает затраты труда на разработку ИС Разработка математической модели процесс а ввода и систематизации информации о ЕЯ с помощью автоматического выявления и применения машиной закономерностей каждого ЕЯ позволила бы решить задачу автоматического накопления и систематизации ИС Знаний об используемом ЕЯ. Здесь можно выделить задачу интеллектуализации процесса пополнения Семантических Знаний, которая заключается в автоматическом построении машиной части модели ЕЯ, и задачу интеллектуализации самого процесса ввода - человеко-машинного общения, который, чтобы избавить от рутинной деятельности человека-оператора, необходимо осуществлять на ЕЯ В дапном случае предмет общепия как раз ЕЯ, и логично и удобно было бы организовать работу оператора по вводу с использованием самого ЕЯ Оператору, которому в этом случае уже не нужно быть экспертом-лингвистом, а только носителем языка, достаточно ввести в ЭВМ обучающее множество прецедентов Смысловой Эквивалентности (СЭ) высказываний на ЕЯ

Вторая группа затруднений состоит в том, что в реализованных на практике методах Обработки ЕЯ присутствует противоречие между скоростью

обработки, которая достигается при применении простых правил преобразований, и универсальностью представления ЕЯ-преобразований Универсальность позволяет более полно описывать ЕЯ с помощью сочетания сложных правил Как следствие уменьшается трудоемкость описания ЕЯ, но увеличивается вычислительная сложность алгоритмов анализа, которые воспроизводят полноту и непротиворечивость языкового описания путем согласования множества правил. При автоматическом накоплении и систематизации ИС Знаний о ЕЯ неполнота и противоречивость Знаний, вводимых оператором в простой, но универсальной форме, устраняются на этапе обучения ИС, и их не требуется восполнять вычислениями на этапе анализа и преобразований ЕЯ-высказываний, причём каждый раз делать это заново

Объект исследований — Предикаты Семантических Отношений (СО) Конструкций ЕЯ, с помощью которых в модели ЕЯ представляются Семантические Знания Систематизация Семантических Знаний на основе присутствующих в них закономерностей является процессом обобщения Предикатов СО

Предметом исследований является процесс анализа близости Предикатов СО Определение меры близости Семантических Знаний с помощью сравнения Предикатов СО использует закономерности, которые выявлены в ЕЯ в процессе обобщения Предикатов Возможности как процесса анализа близости, так и процесса обобщения Предикатов ограничены уровнем автоматического выявления закономерностей в ЕЯ алгоритмом обобщения Поэтому за исключением предельного случая - автоматического построения машиной полной модели ЕЯ, для процесса обобщения Предикатов возможна лишь частичная автоматизация, тогда как процесс анализа близости Предикатов СО, используя готовые результаты процесса обобщения Предикатов, допускает полностью автоматическое выполнение

Актуальность исследований обоснована отсутствием в настоящий момент научно обоснованных методов обобщения Предикатов применительно к описанию СО в ЕЯ, а также методов анализа близости Предикатов СО в той мере, в какой возможно автоматическое обобщение Предикатов.

Цель и задачи работы. Целью настоящей диссертационной работы является разработка методов количественной оценки близости Предикатов в процессе их обобщения в ходе машинного обучения распознаванию СО Конструкций ЕЯ Для достижения поставленной цели в работе решаются следующие задачи

1 Разработка концептуальной модели процесса обобщения Предикатов в ходе машинного обучения распознаванию СО Конструкций ЕЯ,

2 Построение и исследование свойств формального аппарата математического моделирования процесса обобщения Предикатов СО с использованием количественной оценки меры близости Предикатов в ходе машинного обучения распознаванию СО Конструкций ЕЯ,

3 Исследование свойств сложных систем Предикатов СО и моделирование с их помощью различных видов синонимических

преобразований, известных из лингвистики, в том числе проблемных, а также решение практической задачи морфологической, сортовой, родовидовой классификации лексики,

4 Разработка алгоритмов нахождения количественной оценки близости Предикатов в общем виде с учетом возможных методов оценивания и оптимизация этих алгоритмов для сравнения сложных, иерархизированных систем Предикатов СО Использование количественной оценки близости для трансформации систем Предикатов СО в процессе обобщения Предикатов

Методы исследований. При проведении исследований в работе использовались методы математической логики и теории множеств, основные положения теоретической и когнитивной лингвистики, системпой типологии языков и когнитологии, теории формальных языков, а также прикладных методов анализа даппых и знаний

Научная новизна. В ходе решения поставленных задач получены следующие результаты, являющиеся новыми в данной области исследований

1. Предложен комплексный подход к решению ряда задач компьютерной Обработки ЕЯ Показано, что задача распознавания СЭ ЕЯ-высказываний сводится к задаче сравнения систем Предикатов СО и нахождения количественной оценки их близости. Последняя задача решается теми же методами, что и задача обобщения систем Предикатов для предварительного машинного обучения ИС распознаванию СО Конструкций ЕЯ

2 Разработана модель ЕЯ, которая позволяет универсальным образом представить СО в ЕЯ с помощью Наборов Правил Преобразований (НЛП) и модели ситуаций ЕЯ-употребления На основе модели можно проводить машинное обучение распознаванию произвольных СО Конструкций ЕЯ.

3 Предложен алгоритм распознавания СО ЕЯ-высказываний с помощью процесса обобщения систем Предикатов СО, который объединяет в один процессы анализа Конструкций ЕЯ и сравнения Смыслов ЕЯ-высказываний

4 Доказаны теоремы о том, что вычислительная сложность процесса обобщения Предикатов СО линейно зависит от количества Предикатов в системе НЛП, которая является результатом обобщения исходной, а вычислительная сложность процесса распознавания СЭ ЕЯ-высказываний не экспоненциально, как в существующих алгоритмах синонимического перифразирования, а линейно зависит от количества уровней синонимии в иерархизированной системе.

Практическая значимость и внедрение. Областью непосредственного практического применения теоретических результатов настоящей работы является автоматизация обучения, автоматический контроль знаний с помощью тестирования на ЕЯ путем машинного анализа СЭ между ответами учащихся и эталонами, заданными педагогом, поскольку при данном применении знания учащихся, фиксируемые в текстах ЕЯ, постоянно измеряются/оцениваются экспертом-педагогом в приложении к стабильному ситуационному контексту вопросов и предмета

Разработанные в диссертации методы решения задач Обработки ЕЯ доведены до реализации. Разработанные в диссертации методы и алгоритмы

количественной оценки близости Предикатов СО, таксономии Конструкций ЕЯ, логического вывода усложнением вариантов нашли практическое воплощение в программном комплексе, который в дальнейшем планируется использовать для решения задач автоматизации составления тезаурусов по дисциплинам специальности "Программное обеспечение вычислительной техники и автоматизированных систем" в учебном процессе Новгородского государственного университета (имеются акты о внедрении)

Результаты проведенных исследований использовались в работе по гранту РФФИ № 06-01-00028

Достоверность и эффективность. Достоверность полученных теоретических результатов подтверждается корректностью доказательств теорем об алгоритмической разрешимости и вычислительной сложности процесса распознавания СО Конструкциях ЕЯ и процесса обобщения систем Предикатов СО Конструкций ЕЯ Также достоверность подтверждается соответствием модели Семантики Конструкций ЕЯ формальным критериям, сформулированным при постановке задачи

Эффективность предложенных алгоритмов распознавания СЭ ЕЯ-высказываний в сравнении с известными на сегодняшний день алгоритмами синонимического перифразирования подтверждается теоремами, иллюстрацией работы алгоритмов являются примеры, приведенные в приложении Также показано, что система НПП позволяет промоделировать проблемные и сложные синонимические преобразования, известные из лингвистики

Апробация работы и публикации. Основные положения и полученные результаты диссертационной работы апробированы в докладах на конференциях. XVIII международной научно-методической конференции "Математика в вузе" (Великий Новгород, 2005), 6-й международной научной конференции «Интеллектуализация обработки информации» (ИОИ-2006) (Крым, Алушта, 2006), в докладах на научных конференциях и семинарах в рамках Дней Науки в Новгородском государственном университете имени Ярослава Мудрого (Великий Новгород, 2005-2007) и опубликованы в 6 работах, список которых приводится в конце автореферата

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы, включающего 91 наименование, а также двух приложений Основная часть работы изложена на 126 страницах, содержит 8 рисунков и 1 таблицу

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выбранной темы, формулируется цель и содержание поставленных задач, а также объект и предмет исследования, сообщается теоретическая значимость и прикладная ценность полученных результатов.

В первой главе диссертационной работы формулируются требования к моделированию процесса обобщения Предикатов СО с использованием количественной оценки близости Предикатов в ходе машинного обучения

распознаванию СО Конструкций ЕЯ, а также выбираются теоретический подход к моделированию ЕЯ, модель представления Знаний о СО Конструкций ЕЯ и методы, подходящие для оценивания близости Семантических Знаний в этой модели

В параграфе 1.1 на основе объединения формального и функционального подходов дано определение ЕЯ как сложной Знаковой Системы (ЗС), основной функцией которой является использование в качестве средства общения, абстрактная модель которой задается формальным механизмом порождения всех возможных высказываний в этой ЗС, а также формальным механизмом установления соответствия между Смыслами высказываний Перечислены конкретизирующие условия постановки и решения задачи установления СЭ высказываний на ЕЯ внешние условия, называемые Семантическими Знаниями (какая информация из текста высказывания или из тезауруса учитывается, какие подсмыслы включаются, какие Знания используются, на каком уровне представления ЕЯ-высказываний производится сравнение), операция сравнения (любую операцию сравнения Смыслов можно свести к СЭ путем добавления функции к Смыслам), тип значения результата сравнения (логический, непрерывный числовой или какой-то еще, например, ранг оценки близости)

Под Предикатом понимается функция, которая устанавливает СЭ для определенных Конструкций ЕЯ с учетом внешних условий, которые задаются Семантическими Знаниями, типа операции, который задается Смысловой функцией, а также типа значения результата операции сравнения Семантические Знания могут быть заданы как набор Предикатов Семантические Знания учитывают особый вид отношения СЭ — совокупность СЭ, которая обозначается обобщающим термином СО Приблизительность результата и зависимость его от тезауруса заставляют переформулировать задачу установления СЭ высказываний на ЕЯ как более общую задачу распознавания СО высказываний на ЕЯ

Распознавание требует наличия предварительно сформированных Семантических Знаний Задача машинного обучения автоматическому распознаванию СО Конструкций ЕЯ с помощью количественной оценки близости Предикатов СО, задающих в совокупности Знания о СО Конструкций ЕЯ, состоит в выработке по прецедентам СЭ Конструкций ЕЯ таких Знаний о СО, которые позволяют распознавать как можно большее число СО Конструкций ЕЯ как можно точнее

В параграфе 1.2 описаны наиболее общие функциональные и структурные свойства ЕЯ, которым должна удовлетворять модель Семантики Конструкций ЕЯ Сформулированы требования, которые можно использовать в качестве критериев адекватности при оценке разработанных в работе моделей

Рассмотрены общие функциональные свойства ЕЯ1 гибкость ЕЯ -возможность выражения одной и той же информации множеством различных способов в зависимости от наличествующих возможностей, потребностей и обстоятельств речевого акта, нестрогость ЕЯ — возможность включения и исключения подсмыслов, что меняет СЭ для одних и тех же Конструкций ЕЯ,

устойчивость ЕЯ - возможность изменения Семантических Знаний во времени с постепенной коррекцией ошибок и снятием возникающих противоречий

Наиболее общие структурные свойства Конструкций ЕЯ для всех известных ЕЯ: парадигматика - способность некоторого признака принимать одно из множества альтернативных значений по некоторой шкале, синтагматика — возможность позиционного или ролевого комбинирования нескольких альтернативных признаков каким-либо зависимым образом, предикация - зависимость как интерпретации, так и генерации отдельных высказываний от языкового и ситуационного контекста, разделимость -возможность независимого оперирования частями высказывания на ЕЯ, то есть установления СЭ ЕЯ-высказываний по частям

В параграфе 1.3 проанализированы существующие модели Семантики Конструкций ЕЯ и методы моделирования Знаний в применении к Семантике, выявлены их достоинства и недостатки с целью поиска сочетания модели и методов, которые наиболее подходят для машинного обучения распознаванию СО Конструкций ЕЯ Такая модель Семантики Конструкций ЕЯ должна

■ Учитывать многозначность как отдельных слов, так и групп слов,

■ Устанавливать Смысл и для фраз с пропущенными словами,

■ Учитывать синтаксические связи в предложениях и структурные связи в тексте,

" Быть универсальна для представления любых ЕЯ-преобразований,

" Позволять обучение с учетом регулярности синонимии в ЕЯ,

■ Допускать сравнение Смыслов фраз без порождения всех возможных инвариантных по Смыслу фраз

Для моделирования Знаний о многозначности слов и Смысла фраз с пропущенными словами подходит применение стандартных, статистических методов и нейросетей, эти методы предполагают возможность обобщения вероятностных данных Для моделирования сложных структур, синонимии по частям и регулярности подходят используемые в общем случае методы анализа закономерностей в данных и знаниях, для которых необходимо адаптировать модель Семантических Знаний Методы анализа закономерностей в данных и знаниях выбраны в качестве основных в дальнейших исследованиях

В параграфе 1.4 в качестве модели Семантики Конструкций ЕЯ, которая наиболее приемлема для целей моделирования, выбрана предложенная автором настоящей диссертации модель ситуаций употребления ЕЯ, дополненная механизмом построения Концептуальных Знаний о ЕЯ путем анализа ЕЯ-закономерностей Такая дополненная модель, названная концептуально-ситуационной, удовлетворяет всем вышеперечисленным требованиям

Ситуации языкового употребления, представляются с помощью тройки

5=(0,Р,У), где (1)

51 - ситуация, фиксирующая однозначный ЕЯ-контекст; О — множество подразумеваемых в этой ситуации объектов, которые соответствуют в конкретной ситуации ЕЯ-употребления денотатам, а в прототипе ситуации становятся концептами; Р - множество реляционных отношений между объектами О Заданные отношения и используемые объекты соответствуют

всевозможным событиям, связям и логическим условиям существования данной ситуации Отношения Р носят вероятностный характер, а выражаемые через них логические условия могут быть противоречивы V — множество альтернативных форм поверхностного выражения ситуации 5, то есть фиксации Смысла данной ситуации 5 с помощью Конструкций ЕЯ Выбор тех или иных форм из V для поверхностного выражения Смысла ситуации £ также носит вероятностный характер, причем коррелируется их использование в разных ситуациях, что учитывается с помощью в - отдельного механизма согласования Семантических Знаний о ситуациях ЕЯ-употребления

Модель (1) достаточно универсальна для представления любых Семантических Знаний о ЕЯ, поскольку отношения Р могут быть любого вида Это позволяет моделировать с ее помощью любые ЕЯ-преобразования Также не определен конкретный вид Конструкций ЕЯ для альтернативных форм поверхностного V выражения ситуации ЕЯ-употребления 8, он может быть заимствован из различных моделей Семантики Конструкций ЕЯ, например, это могут быть шаблоны или помеченные деревья

В параграфе 1.5 разработана концептуальная модель процесса обобщения Предикатов в ходе машинного обучения распознаванию СО Конструкций ЕЯ, включающая в качестве объектов моделирования

■ Представление ЕЯ как системы ситуаций ЕЯ-употребления,

■ Модель представления Знаний о Семантике Конструкций ЕЯ с помощью множества прецедентов и соответствующих им Семантических Знаний в форме Предикатов СО;

■ Процесс машинного обучения распознаванию СО Конструкций ЕЯ,

■ Методы количественной оценки близости Семантических Знаний в форме Предикатов СО,

■ Механизм установления ЕЯ-закономерностей путем обобщения Предикатов СО в ходе Концептуального Анализа Семантических Знаний Моделирование установления соответствия между Смыслами

высказываний на ЕЯ основывается не на формальном механизме порождении всех возможных высказываний в ЗС ЕЯ, а на основной функции ЕЯ, которая заключается в использовании ЕЯ в качестве средства общения Именно потому, что мощность множества Смыслов превосходит мощность множества правил синонимических преобразований, можно выявлять лишь закономерности в использовании правил для выражения Смыслов ЕЯ £ представляет собой множество ситуаций ЕЯ-употребления Механизм установления

соответствия между Смыслами высказываний на Ь можно представить с помощью Предикатов СО которые определяют в заданной ситуации 5е {£}£ степень СЭ любой пары высказываний из как отображение

• О,, —> £ Здесь К/, - множество возможных высказываний на некотором ЕЯ Ь, £>£ = VI х Уь, Е — множество вещественных чисел от 0 до 1 В случае строгости ЕЯ £• Е = {0,1} и СЭ заданы однозначно £5 = Ду, где £>5 с £>д Модель Семантики Конструкций ЕЯ Ь как системы ситуаций ЕЯ-употребления-{5}, = ({ЬУ/ь Gl.NL), где (2)

El = {Es) /, - система Семантических Знаний в форме Предикатов СО, через Nl . Fl->E заданы нормы ЕЯ, механизм Gi {{О, Р)};, VL используется для согласования Семантических Знаний о ситуациях ЕЯ-употребления (здесь {(О, P)}l - множество возможных концепций ЕЯ L)

Механизм формирования Семантических Знаний по прецедентам К, называемый Концептуальным Анализом, сопоставляет любому произвольному множеству текущих Семантических Знаний Е' D'—>E (D'czDL) множество экстраполированных на все высказывания на ЕЯ L Концептуальных Знаний К' Dl-^E Обозначив множество всех возможных отображений типа Е' через Е* = {Е'} , а типа К' через К = {К'}, получим

К.Е'-^К' (3)

Концептуальные Знания К/ — К(Е;) составлены на основе множества уже известных ИС фактов СЭ Е} Di-^E (Dj cz DL, E] с EL), Точность e Знаний К, относительно расширяющего Еj множества Е2 еще неизвестных (Е/ аЕ2с. EL и при этом Е2 D2 —» E,Di C.D2 cz D£) можно определить как

-'- § w (4)

где d, е D2, a Ki(d,) - прогноз E2(d,), полученный путем экстраполирования закономерностей, выявленных Концептуальным Анализом на множестве Е] В качестве критерия адекватности модели К (при соблюдении условий случайности и статистической значимости выборок D/ и D2) можно потребовать достаточно высокую точность прогноза при значительном, экспоненциальном соотношении размеров множеств D/ и Дг

1п|£У

1^Г>>2 <5>

Во второй главе формализован механизм Концептуального Анализа и построен формальный аппарат математического моделирования процесса обобщения Предикатов СО с использованием количественной оценки меры близости Предикатов.

В параграфе 2.1 исследованы принципы таксономии прецедентов СО Конструкций ЕЯ механизмом Концептуального Анализа и установлено, что такая таксономия представима с помощью Предикатов в форме НПП над множествами структурированных значений аргументов СО

В параграфе 2.2 с учетом требований к модели Семантических Знаний, сформулированных в первой главе, формализовано представление Предикатов СО Конструкций ЕЯ в форме НПП, которая наиболее подходит для организации процесса обобщения Предикатов Каждый НПП р

Fp К/О О V„, где (6)

Fp - Смысл преобразований над множеством структурированных значений аргументов Предиката СО ( V/, V2, , V„ ), который задается с помощью данного НПП, V, - одна из форм поверхностного выражения Смысла Fp .

V, = (Х„. Хй, Х1т), где (7)

Ху - либо переменная, у которой значение может изменяться (в этом случае Ху е Хр - множеству переменных данного НПП р), либо константа для данного ^р (Ху = сп где символ сг е С, то есть алфавиту ЗС ЕЯ) На изменяемых переменных может быть установлено отношение Ех Смыслового равенства вида Хц О Хи, которое можно представить как отображение

Ех ХрхХр-+{0,1} (8)

причем Ех= 1 для тех пар переменных, для которых задано равенство, и 0 в противном случае В общем случае V, и Рр — предикаты на множестве всех возможных векторов-констант С = {(с/, с2, сг, Сд)}, где сг с С - любой допустимый в ЗС С данного ЕЯ символ (набор знаков или их заменитель)

V, С* ->{0,1},7> С* -> {0,1} (9)

Более сложные НПП могут быть частично или полностью выражаться через более простые Под сложностью Предиката СО Рр понимаются размеры |Ср| подмножества СрсС , на котором данный Предикат всегда истинен Рр (Ср) =1 В случае статистической истинности (учитывая ошибки и то, что закономерности могут носить вероятностный характер) более простого Предиката СО на подмножестве переменных более сложного Предиката Рр2 (|СР1| < |СР2|, СР2 с: СР1 С ) можно говорить о статистической выражаемости Рр2 через Рр) Рр2 => Рр\ (считаем, что соотносимые в Предикатах переменные располагаются на одних и тех же местах в векторах-константах) Таким образом система Предикатов НПП может быть иерархизирована по сложности более сложные Предикаты СО будут представляться с помощью более простых НПП, которые будут располагаться на более низких уровнях иерархии Сочетание произвольной синонимии с регулярными преобразованиями позволяет задавать сложные комбинации СЭ с учетом возможных исключений В процессе обобщения Предикатов СО используется два вида гипотез 1) о выражении Предиката через комбинацию простых (РСЛажн => Рпрост ПРИ том> что |Спрост| < |Сслюкн() и 2) о существовании Предиката, обобщающего группу близких НПП Выражение через комбинацию Рс.,ож„ Р/ х Р2 х х Рмакс позволяет экстраполировать, то есть дополнить левую часть до правой с учетом исключений и статистической значимости такой замены на комбинацию НПП (Р/ х Р2х . х Р„рост) => Рсяожн Тем самым приходим ко второму случаю, когда для обобщающего Предиката Ро6о5 верно, что каждый Предикат из группы {Рг,.тж} близких НПП Рвпшк => Робов (при том, что |СПл„,к| < |Со6об|)4

Пусть РИС1 = {Р„гх} - произвольное подмножество, с: Р - множества всех возможных систем Предикатов СО Процесс обобщения Предикатов

Побоб Р —► Р

есть поиск на пространстве Р* для исходной системы НПП Р„„ такого его компактного представления Ртт с Р*, для которого для е Ри„ всегда

ЭР с Ртш, такое что Рисх => Р (произведение /^^х/^х. хр,х . Ря, где любой Р, е Г), при том, что С„„ с CF Размер искомого множества минимален

|F/| + . . + |F,| + . + \F4\ = min, (F, e Fmm) При этом пространство поиска F* ограничено пределами моделируемой части ЕЯ так, что всегда Fmin => Ds (в противном случае происходило бы уже обобщение самого Ds до одного единственного Предиката, тождественного 1)

Теорема 2 1 Процесс обобщения Предикатов СО Побоб F —» F (10) алгоритмически разрешим Доказательство процесс конечен, так как конечно множество всех возможных систем Предикатов СО F„„ cz F , которые можно построить из элементов FHCX так, чтобы сумма размеров Предикатов построенной системы НПП не превышала суммы размеров Предикатов F„c, За конечное число шагов поиска на пространстве F„c% может быть найдено компактное представление Fra,„ с минимальным размером среди множеств с допустимой точностью £< Smax представления Семантических Знаний Ds

В параграфе 2.3 выявлено, что процесс распознавания СЭ линейных структур ЕЯ-высказываний является частным случаем процесса сравнения систем Предикатов СО, результатом которого является вычисление количественной оценки меры близости систем Предикатов Процесс сравнения систем Предикатов СО может быть осуществлен теми же методами, что и процесс обобщения Предикатов в ходе обучения распознаванию СО

С использованием построенного аппарата описан процесс распознавания СО Конструкций ЕЯ, и установлено, что в ходе данного процесса порождение Конструкций ЕЯ, инвариантных по Смыслу, не приводит к экспоненциальному росту времени перебора с увеличением числа уровней иерархии и количества Предикатов за счет снятия неоднозначности, возникающей на начальных уровнях, при преобразовании на последующих, а также объединения в один процессов анализа Конструкций ЕЯ и сравнения Смыслов ЕЯ-высказываний

Теорема 2 2 Процесс распознавания СЭ ЕЯ-высказываний v А В в заданной системе НПП F алгоритмически разрешим Это следует из конечности множества истинности CV(F), которое построено для Предикатов и их комбинаций в системе F при условии, что размер векторов-констант из CV(F) не превышает размера v Если v принадлежит CV(F), установлена точная СЭ А vi В, в противном случае ищется комбинация векторов-констант из CV(F), наиболее приближающая v. Если оценка достоверности такого приблизительного представления превышает допустимый предел, то установлена приблизительная СЭ А и В

В параграфе 2.4 разработаны и исследованы различные способы и методы вычисления количественной оценки близости Предикатов СО Сравнение методов позволило установить, что методы дают тем более схожие результаты, чем больше насыщенность Концептуальных Знаний, поэтому необходимо нормировать оценку близости Предикатов, полученную с помощью выбранных методов, на точностьКонцептуальных Знаний, вычисленную теми же методами

Формула точности в = 1 — R(K2, Kj) Концептуальных Знаний

r^^fmzm по

«1 I Л2 I

Ki относительно базового множества Знаний К2 Под R(K2, К{) понимается расстояние между Знаниями К2 П Kj и К2, нормированное на размер базового множества Знаний \К2\ В качестве базовых Знаний может быть выбран один из сравниваемых Предикатов Пj и П2, тогда размер общего множества истинности \С(П, П П2)\ = IQOQI = \С(Л, Л П2)\ = Я(П,, П2) |С,| = Я(П2,77,) |С2| Оценить информативность Концепции Я/ при добавлении ее на очередном шаге обучения к текущим Концептуальным Знаниям П2 можно как Я(П2, П/), так как часто предполагается, что |С2| » |Ci|, то есть Концептуальные Знания значительно информативнее Концепции А вот 7?(77/, П2) будет количественной оценкой известности для ИС новой Концепции 77/ Если R(IJi, II2) = 1, то Концепция 77; может быть полностью распознана на основе текущих Концептуальных Знаний П2 Если оценка известности только близка к единице, то предполагается приблизительная Смысловая выразимость преобразований П, через П2 nt => П2

В качестве базовых Знаний может использоваться обобщающий Предикат П,и2 = 77, и 772 В этом случае |С(Я, П П2)\ = В(П2, П,) |С(/7, и П2)\ Нормированная количественная оценка меры близости Предикатов 77/ и П2 Б(П2, П/) = R{nlu2, П,) + RWiv2, Щ - 1 выражает количественно отношение множества истинности пересечения Смыслов (информации) Предикатов 77/ и П2 к множеству истинности их общей Смысловой информативности Получить Предикат IJiu2 можно просто логическим сложением множеств истинности объединяемых Предикатов |С(77/ и П2)\ = |Ci и Ci|. При втором подходе Ihu2 рассматривается как результат процесса обобщения Предикатов 77/ и П2

Мера близости е Концептуальных Знаний К/ и К2 относительно моделируемых Семантических Знаний El может быть выражена через их точности с/ = \-R(El, К/), s2 = \-R(EL, K2) и взаимную меру близости Б(К2, Ki)

е= Е,+е2_ (12)

1 + Б(К2, К,)

В третьей главе диссертационной работы показано, что построенный во второй главе аппарат Предикатов СО в форме НПП в полной мере удовлетворяет требованиям к моделированию Семантики Конструкций ЕЯ, сформулированным в первой главе

В параграфе 3.1 исследуются свойства сложных систем Предикатов СО Выяснено, что иерархизация упрощает построение сложных систем Предикатов СО- процесс распознавания СО и процесс обобщения Предикатов в ходе обучения ИС распознаванию СО Конструкций ЕЯ Упорядоченность последовательности применения НПП от простого к сложному уровням синонимии в процедуре порождения вариантов перифразирования приводит к тому, что вычислительная сложность данной процедуры линейно зависит только от количества уровней синонимии и даже в маловероятном для реального ЕЯ случае неоднозначности распознавания ЕЯ-высказывания на всех уровнях синонимии оказывается ограничена сверху количеством НПП в системе Предикатов СО

Теорема 3 1. Вычислительная сложность процесса обобщения Предикатов СО исходной системы Hi III F„CI линейно зависит от количества к Предикатов в конечной системе HI 11 1 FK01I = П0юв(Р„сх), которая является результатом обобщения исходной. В доказательстве рассматривается C(F„„) с заданным отношением следования векторов-констант Для установления статистической истинности нужна группа прецедентов размером ггр Количество подвыражений не может быть больше числа переменных в F„ то есть ограничено rnpeá Верхний предел вычислительной сложности к ггр гпреЛ, где ггр и гпред — максимальные

Теорема 3 2 Вычислительная сложность процесса распознавания СЭ ЕЯ-высказываний v,A<¿>B в заданной системе НПП F линейно зависит от количества уровней синонимии кур в этой системе и в худшем случае от количества НПП к в этой системе. В доказательстве сравниваются части v с выражениями Предикатов некоторого уровня, начиная с первичного, доказывается их выводимость Верхний предел вычислительной сложности кур г"еод ¡"пред, причем куР гиеод < к, где г„еоА - максимальное количество неоднозначностей или вариантов возникающих на одном уровне.

В параграфе 3.2 показано, что с помощью аппарата Предикатов СО в форме НПП возможно промоделировать различные виды синонимических преобразований, известные из лингвистики. Преимущества в том, что использование системы НПП позволяет классифицировать виды замен синонимов и представить их в регулярной форме, а также учитывать изменения Смысла зависимых лексем - фразем

В параграфе 3.3 показано, как предлагаемый аппарат моделирования разрешает затруднения моделей Семантики Конструкций ЕЯ, которые основаны на перифразировании (проблему распределения адъюнктов расщепляемого элемента и затрудненность конверсивных преобразований при наличии во фразе синкатегорематических обстоятельств, вложенных или пресуппозиционных Конструкций), а также позволяет моделировать преобразования, которые учитывают различные уровни синонимий (благодаря замене строгого порядка в иерархии пребразований на упорядоченность, когда более простые преобразования могут быть подвыражениями преобразований сколь угодно сложных уровней), и сложные виды синонимических преобразований выходящие за пределы простого предложения и за рамки регулярной Лексико-Функциональной синонимии

В параграфе 3.4 на основе анализа пересечения выделенных классов стандартными методами Концептуального Анализа, которыми реализуется процесс обобщения системы Предикатов СО, решаются задачи морфологической, сортовой, родовидовой классификации лексики, задача установления базовых Семантических Значений Моделей Управления слов ЕЯ.

В четвертой главе описаны алгоритмы нахождения количественной оценки близости для систем Предикатов СО в общем виде с учетом возможных методов оценивания, алгоритм распознавания СЭ ЕЯ-высказываний в системе НПП и алгоритм сравнения систем НПП, которые задают Предикаты СО Алгоритмы оптимизированы для сравнения сложных, иерархизированных систем НПП с помощью механизма логического вывода путем постепенного

усложнения вариантов, более эффективного, чем методы стандартного логического вывода перебором пространства состояний в глубину и в ширину.

В параграфе 4.1 приводятся алгоритмы с пояснениями к ним В алгоритме нахождения количественной оценки меры близости систем Предикатов СО используется процедура fl(F/, Fi) сравнения двух НШ1F; и F2 из разных систем НПП, которая в результате формирует НИИ пересечения множеств истинности этих Предикатов FI'H>F2 и два остаточных НПП-Fiocm ~ Fi — F;OF2 и F2ocm = F2-F1&F2 Связи этих НПП в иерархиях систем сохраняются с учетом того, что старые НПП (F/ и F2) являются суммами пересечения (F;OF2) и одного из остатков (F,ocm или F2ocn) H(F/, F2) = (Fi^>F2, Flocm, F2ocm) Функция g(F,) дает оценку размера множества истинности Предиката F, за вычетом размеров множеств истинности его подвыражений Последнее необходимо во избежание повторов при подсчете

АЛГОРИТМ СРАВНЕНИЯ СИСТЕМ ПРЕДИКАТОВ СО В ФОРМЕ НПП Вход F^ F2 - сравниваемые системы НПП, задающих Предикаты СО Выход G - количественная оценка меры близости Fi и F2 НАЧАЛО

G = 0, nG = О, {F,} = FivjF2, // Логическое объединение множеств НПП FTeK = c{F,} | подвыражения(Р,)=0, II НПП первичного уровня из{Р,} ЦИКЛ ПОКА (FTeK * 0) НЦ

ЦИКЛ ДЛЯ КАЖДОЙ пары НПП F,e Fn и F2cF21 FfcFTeK ИЛИ F2e FxeK Вычислить H(F,, F2) = (Р,«Р2=Обобщение(Р,, F2, U), F)ocm, F2ocm), //Допустимый уровень обобщения подвыражений ограничен U // При U=0 никакого обобщения Ff и F2 не производится FTeK = с{F,} | подвыражения(Р,)с.Ртек, II возможные НПП след уровня КЦ

ЦИКЛ ДЛЯ КАЖДОГО F, ИЗ {F,} ЕСЛИ F, имеет вид F(OFy ТО G = G+g(F,) ИНАЧЕ nG = nG+g(F,), // g(F,) вычисляется с учетом д(подвыражений{Р,)) G = G/(G+nG), II нормировка оценки в диапазон от 0 до 1 КОНЕЦ

В параграфе 4.2 рассмотрено применение оценки близости систем Предикатов СО для трансформации систем НПП в процессе обобщения Предикатов в ходе машинного обучения ИС распознаванию СО Конструкций ЕЯ Разработанные алгоритмы могут совместно применяться для поиска вариантов выражений сложных Предикатов через комбинацию простых и для обобщения близких Предикатов СО или групп прецедентов В этом случае формирование сложных систем НПП путем динамической иерархической таксономии Знаний требует организации такого обучения с участием эксперта, координирующего процессы обучения Алгоритмы можно модифицировать, разрешив согласование фрагментов и вычисление пересечения множеств истинности Предикатов выполнять не только для структурированных значений

аргументов СО целиком, но и для частей аргументов Работа эксперта в этом случае сведется к корректировке процесса обучения

Алгоритмы позволяют оценить известность и информативность для ИС Концепций СЭ ЕЯ-высказываний и принять на основе такой оценки решение об останове процесса обобщения Предикатов СО Установив в алгоритмах соответствующий уровень допустимости обобщения подвыражений, можно получить количественную оценку структурных изменений в Концептуальных Знаниях

Рисунок 1 Стадии и варианты процесса обучения распознаванию СО

В параграфе 4.3 даны практические рекомендации по использованию разработанных методов и алгоритмов. Выделение СО может производится по текстам ЕЯ без формирования обучающей выборки прецедентов СЭ ЕЯ-высказываний Порождение множества прецедентов СЭ ЕЯ-высказываний, которое отвечает условиям гарантированного формирования структуры Концептуальных Знаний, возможно при организации обучения ИС по схеме «Ученики - Учителя» Использование методов динамической и иерархической таксономии в Концептуальном Анализе позволяет естественным образом разделить этапы и уровни обучения, распараллелить процесс машинного обучения распознаванию СО Конструкций ЕЯ Алгоритмы обучения распознаванию СО Конструкций ЕЯ могут быть значительно оптимизированы для использования при такой организации машинного обучения

В заключении сформулированы основные научные и практические результаты диссертации и предложены возможные направления дальнейших исследований, связанные с разработкой общеязыковой модели ЕЯ

Основные результаты диссертационной работы

1 Выявлены наиболее общие функциональные и структурные свойства ЕЯ, на основе чего предложена модель ЕЯ как множества ситуаций ЕЯ-употребления с механизмом проверки ЕЯ-высказываний па допустимость в речи и механизмом согласования употребления форм поверхностного выражения Смысла в разных ситуациях ЕЯ-употребления,

2 Разработана формальная концептуальная модель обучения распознаванию СО Конструкций ЕЯ с помощью обобщения Семантических Знаний, которые представлены Предикатами СО, механизмом Концептуального Анализа, который выявляет закономерности в ЕЯ-употреблении,

3 Установлено, что таксономия множества прецедентов СО механизмом Концептуального Анализа представима с помощью Предикатов в форме Ш111 над множествами структурированных значений аргументов СО, на основе чего построен формальный аппарат математического моделирования процесса обобщения Предикатов СО в форме НПП,

4 С использованием построенного аппарата решена задача распознавания СО Конструкций ЕЯ путем сравнения систем Предикатов СО в форме НПП, результатом которого является вычисление количественной оценки близости систем Предикатов СО,

5 Доказаны теоремы о алгоритмической разрешимости процесса обобщения Предикатов СО и Процесс распознавания СЭ ЕЯ-высказываний Также доказаны теорема о том, что вычислительная сложность процесса обобщения Предикатов СО исходной системы НПП линейно зависит от количества Предикатов в конечной системе НПП, которая является результатом обобщения исходной, и теорема о том, что вычислительная сложность процесса распознавания СЭ ЕЯ-высказываний заданной системе НПП линейно зависит от количества уровней синонимии в этой системе и в худшем случае от количества НПП в этой системе,

6 Показано, что с помощью количественной оценки близости систем Предикатов СО может быть проведена иерархизация сложных систем Предикатов СО, иерархизация позволяет реализовать алгоритм распознавания СО Конструкций ЕЯ, вычислительная сложность которого не экспоненциально, а линейно растет с увеличением числа уровней иерархии синонимии и количества Предикатов,Промоделировано множество синонимических преобразований, известных из лингвистики, включая учитывающие различные уровни синонимий, и сложные виды синонимических преобразований выходящие за пределы простого предложения и за рамки регулярной Лексико-Функциональной синонимии, при этом разрешены проблемы моделей Семантики Конструкций ЕЯ, основанных на перифразировании, решена задача морфологической, сортовой, родовидовой классификации лексики,

8 Разработаны алгоритмы нахождения количественной оценки близости Предикатов в общем виде с учетом возможных методов оценивания,

оптимизированные для сравнения сложных, иерархизированных систем Предикатов СО; показано применение этих алгоритмов для трансформации систем НПП в процессе обобщения Предикатов СО

Список опубликованных работ по теме диссертации

1 Емельянов Г М, Корнышов А Н, Михайлов Д В Концептуально-ситуационное моделирование процесса перифразирования высказываний естественного языка как обучение на основе прецедентов // Искусственный интеллект, №2 - Донецк, 2006 - С 72-75

2 Емельянов Г М., Корнышов А Н, Михайлов Д В Концептуально-ситуационное моделирование процесса перифразирования высказываний естественного языка как обучение на основе прецедентов // Интеллектуализация обработки информации Тезисы докладов Международной научной конференции / Крымский научный центр НАН Украины - Симферополь, 2006 - С 78-79

3 Корнышов А Н Обучение на основе прецедентов в задаче распознавания смысловой эквивалентности // Сборник тезисов докладов аспирантов, соискателей, студентов XIII научной конференции преподавателей, аспирантов и студентов НовГУ 3-8 апреля 2006 г - Великий Новгород, 2006 -С 136

4 Корнышов А. Н, Михайлов Д В Концептуальный уровень и его использование в задаче моделирования синонимических преобразований высказываний естественного языка // Материалы XVIII международной научно-методической конференции "Математика в вузе". - Великий Новгород, 2005. - С 118-120

5 Корнышов А. Н, Михайлов Д В. Предикаты семантических отношений в задаче моделирования системы концептуальных зависимостей в тезаурусе предметной области // Тезисы докладов аспирантов, соискателей, студентов XIV научной конференции преподавателей, аспирантов и студентов НовГУ Великий Новгород, 2-7 апреля 2007 г (В печати)

В издании, рекомендуемом ВАК РФ :

6 Корнышов А. Н, Михайлов Д В. Концептуально-ситуационное моделирование высказываний естественного языка в задаче анализа их смысловой эквивалентности // Вестник Новгородского государственного университета имени Ярослава Мудрого, серия "Технические науки", №34. -Великий Новгород, 2005 -С 76-80

Автор /Корнышов АН/

Используемые в автореферате сокращения

ЕЯ — Естественный Язык

ИС - Интеллектуальные Системы

СЭ - Смысловая Эквивалентность

ЗС - Знаковая Система

СО - Семантические Отношения

нпп - Набор Правил Преобразований

Изд лиц ЛР № 020815 от 21 09 98

Подписано в печать 16 07 2007 Бумага офсетная Формат 60x84 1/16 Гарнитура Times New Roman Печать офсетная Уел печ л 1,2 Уч-изд л 1,3 Тираж 100 экз Заказ №47 Издательско-полиграфический центр Новгородского государственного университета им Ярослава Мудрого 173003, Великий Новгород, ул Б Санкт-Петербургская, 41 Отпечатано в ИПЦ НовГУ 173003, Великий Новгород, ул Б Санкт-Петербургская, 41

Оглавление автор диссертации — кандидата технических наук Корнышов, Александр Николаевич

ВВЕДЕНИЕ.

1. МОДЕЛИРОВАНИЕ ПРОЦЕССА ОБОБЩЕНИЯ ПРЕДИКАТОВ В ХОДЕ МАШИННОГО ОБУЧЕНИЯ РАСПОЗНАВАНИЮ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ. ПОСТАНОВКА ЗАДАЧИ.

1.1. Функциональная постановка задачи количественной оценки близости Предикатов Семантический Отношений.

1.2. Свойства Естественного Языка как критерии адекватности моделирования Семантики Конструкций Естественного Языка.

1.3. Анализ существующих методов моделирования Семантики Конструкций Естественного Языка и методов моделирования Знаний о Семантике.

1.4. Выбор методов моделирования.

1.5. Концептуальная модель процесса обобщения Предикатов в ходе машинного обучения распознаванию Семантических Отношений.

1.6. Выводы.

2. ПОСТРОЕНИЕ ФОРМАЛЬНОГО АППАРАТА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРОЦЕССА ОБОБЩЕНИЯ ПРЕДИКАТОВ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ И ИССЛЕДОВАНИЕ СВОЙСТВ ПРЕДЛОЖЕННОГО АППАРАТА.

2.1. Исследование принципов таксономии прецедентов Семантических Отношений.

2.2. Математическая модель процесса обобщения Предикатов Семантических Отношений и ее свойства.

2.3. Мера близости Семантических Знаний и ее использование для распознавания Семантических Отношений.

2.4. Способы вычисления количественной оценки близости Предикатов Семантических Отношений.

2.5. Выводы.

3. ПОСТРОЕНИЕ СИСТЕМ ПРЕДИКАТОВ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ.

3.1. Иерархизация Предикатов Семантических Отношений и ее интерпретация в рамках концептуальной модели процесса обобщения Предикатов.

3.2. Система Предикатов Семантических Отношений как основа представления Семантических Знаний.

3.3. Примеры использования механизма обобщения Предикатов Семантических Отношений для решения проблем моделирования Конструкций Естественного Языка.

3.4. Применение системы Предикатов Семантических Отношений в задаче моделирования сортовой и родовидовой классификации лексики.

3.5. Выводы.

4. АЛГОРИТМИЗАЦИЯ МЕТОДОВ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ БЛИЗОСТИ ПРЕДИКАТОВ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ.

4.1. Алгоритмы нахождения количественной оценки близости Предикатов Семантических Отношений.

4.2. Использование оценки близости систем Предикатов Семантических Отношений для их трансформаций.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Корнышов, Александр Николаевич

Целью создания Искусственного Интеллекта (ИИ) является формализация различных форм интеллектуальной деятельности человека. Попытки перенести часть знаний человека в область работы вычислительной техники имеют целью облегчить деятельность человека, осуществляемую с применением этой техники, в том числе и интеллектуальную. Облегчение взаимодействия между человеком и машиной открывает путь для более широкого и интенсивного использования человеком базовых вычислительных возможностей ЭВМ, таких как обработка больших объемов данных, сложные математические вычисления над ними и основанный на последних анализ данных, по скорости и безошибочности выполнения которых вычислительная техника намного превосходит человека.

В настоящий момент одним из приоритетных направлений в области развития ИИ является облегчение взаимодействия между человеком и вычислительной техникой с помощью Естественного Языка (ЕЯ) [66]. Именно ЕЯ люди используют в своей повседневной деятельности, и поэтому было бы удобно использовать ЕЯ и для общения человека с различными Интеллектуальными Системами (ИС). Разработка ИС, способных понимать ЕЯ, некоторыми специалистами вообще считается основной целью исследований в области ИИ [74]. ЕЯ служит человеку для выражения собственных мыслей и понимания мыслей других людей, и, таким образом, вполне подходит для сохранения и передачи некоторых знаний при общении с машиной.

Несмотря на успехи в исследовании методов и разработке с их помощью систем по Обработке ЕЯ (Natural Language Processing) [41] и даже успешное использование таких ИС в отдельных областях применения, ряд вопросов данного направления всё ещё остаётся малоисследованным, а для полноценного функционирования ИС Обработки ЕЯ возникают технические препятствия.

Среди множества затруднений технического характера, мешающих применению в информационных системах интеллектуально-коммуникативных технологий, предполагающих взаимодействие человека и ЭВМ на ЕЯ, выделим две следующих группы.

Первая группа технических затруднений состоит в необходимости предварительного ввода в ЭВМ всей полноты Знаний о ЕЯ, которые используются для общения между носителями данного языка. Объем этих Знаний велик, и поэтому их ввод требует огромных затрат труда множества квалифицированных специалистов, в том числе для предварительной формализации и систематизации этих Знаний. При традиционном подходе не учитывается возможность неполноты и противоречивости самих Знаний о ЕЯ, относительность представления как о ЕЯ, так и ситуациях его использования, а также потребность в постоянном изменении введённых Знаний. Если для некоторых областей применения на коротком временном промежутке функционирования ИС изменениями в ЕЯ можно пренебречь, то в целом изменчивость - глубинное и универсальное свойство как естественных, так и искусственных языков [16], и его необходимо учитывать.

Причина чрезмерной трудоёмкости - отсутствие на настоящий момент методов предметно-адаптивной формализации и автоматической систематизации Знаний о ЕЯ. Как следствие этого, при использовании существующих подходов к формализации Знаний о ЕЯ для каждого языка и тематического подмножества требуется производить заново как формализацию, так и ввод Знаний, что увеличивает затраты труда на разработку ИС. Разработка математической модели процесса ввода и систематизации информации о ЕЯ с помощью автоматического выявления и применения машиной закономерностей каждого ЕЯ позволила бы решить задачу автоматического накопления и систематизации ИС Знаний об используемом ЕЯ. Здесь можно выделить задачу интеллектуализации процесса пополнения Знаний, которая заключается в автоматическом построении машиной части модели ЕЯ, и задачу интеллектуализации самого процесса ввода - человеко-машинного общения, который, чтобы избавить от рутинной деятельности человека-оператора, необходимо осуществлять на ЕЯ. В данном случае предмет общения как раз ЕЯ, и логично и удобно было бы организовать работу оператора по вводу с использованием самого ЕЯ. Подобно тому, как выполняет роль педагога на ЕЯ автоматизированная обучающая система [72], только наоборот. Оператору, которому в этом случае уже не нужно быть экспертом-лингвистом, а только носителем языка, достаточно ввести в ЭВМ обучающее ИС множество прецедентов Смысловой Эквивалентности (СЭ) высказываний на ЕЯ.

Вторая группа технических затруднений в области Обработки ЕЯ заключается в значительной вычислительной сложности анализа и необходимых для него преобразований высказываний на ЕЯ. В реализованных на практике методах Обработки ЕЯ присутствует противоречие между скоростью обработки, которая является следствием применения простых правил преобразований, и универсальностью представления ЕЯ-преобразований, которая позволяет более полно описывать ЕЯ с помощью сочетания сложных правил. В последнем случае уменьшается трудоёмкость описания ЕЯ, но увеличивается вычислительная сложность алгоритмов анализа, воспроизводящего полноту и непротиворечивость языкового описания путём согласования множества правил. Анализ и преобразования на основе сложных формализмов моделей приводят к комбинаторному взрыву, лингвистическими причинами которого являются омонимия и синонимия в ЕЯ, сочетание подчинительных и сочинительных связей, что накладывается на линейную структуру предложений и тем самым увеличивает длины связей между словами и количество возможных вариантов комбинирования связей. При автоматическом накоплении и систематизации ИС Знаний о ЕЯ неполнота и противоречивость Знаний, вводимых оператором в простой, но универсальной форме, устраняются на этапе обучения ИС, и их не требуется восполнять вычислениями на этапе анализа и преобразований, причём каждый раз делать это заново.

Настоящая диссертационная работа посвящена использованию существующих в ЕЯ закономерностей для автоматизации накопления и систематизации ИС Знаний об этом ЕЯ. Для решения данной проблемы в диссертации ставится задача разработки модели процесса ввода и систематизации Семантических Знаний о ЕЯ в ЭВМ путем машинного обучения ИС по прецедентам СЭ высказываний на ЕЯ и использования накапливаемых таким способом Семантических Знаний в задачах анализа семантической эквивалентности ЕЯ-высказываний, таких как задача распознавания Семантических Отношений (СО) Конструкций ЕЯ [35], задача количественной оценки накапливаемых Семантических Знаний, задача построения морфологической, сортовой, родовидовой классификации лексики. Таким образом, решаемая проблема ориентирована на практическую реализацию в ИС Обработки ЕЯ.

Накопление и систематизация Семантических Знаний ИС предполагает процесс обобщения Знаний. Объект настоящих исследований - Предикаты СО Конструкций ЕЯ, с помощью которых в модели ЕЯ представляются Семантические Знания. Систематизация ИС Семантических Знаний на основе присутствующих в них закономерностей является процессом обобщения Предикатов СО.

Предметом исследований является процесс анализа близости Предикатов СО. Определение меры близости Семантических Знаний с помощью сравнения Предикатов СО использует закономерности, которые выявлены в ЕЯ в процессе обобщения Предикатов. Возможности как процесса анализа близости, так и процесса обобщения Предикатов ограничены уровнем автоматического выявления закономерностей в ЕЯ алгоритмом обобщения. Поэтому, за исключением предельного случая - автоматического построения машиной полной модели ЕЯ, для процесса обобщения Предикатов возможна лишь частичная автоматизация, тогда как процесс анализа близости Предикатов СО, используя готовые результаты процесса обобщения Предикатов, допускает полностью автоматическое выполнение.

Актуальность исследований обоснована отсутствием в настоящий момент научно обоснованных методов обобщения Предикатов применительно к описанию СО в ЕЯ, а также методов анализа близости Предикатов СО в той мере, в какой возможно автоматическое обобщение Предикатов.

Сформулируем главную цель работы следующим образом: разработка методов количественной оценки близости Предикатов в прог{ессе их обобщения в ходе машинного обучения распознаванию СО Конструкций ЕЯ.

Областью непосредственного практического применения теоретических результатов настоящей работы является автоматизация обучения [72], автоматический контроль знаний с помощью тестирования на ЕЯ путем машинного анализа СЭ между ответами учащихся и эталонами, заданными педагогом, поскольку при данном применении знания учащихся, фиксируемые в Текстах ЕЯ, постоянно измеряются/оцениваются экспертом-педагогом в приложении к стабильному ситуационному контексту вопросов и предмета. В качестве прикладных областей для применения данной модели можно также назвать диалоговые и экспертные системы, автоматическое реферирование и обработку документов и информации, а также связанную с этим задачу поиска необходимой информации.

Диссертационная работа состоит из введения, четырех глав, заключения, двух приложений, списка используемых сокращений и библиографического списка.

Заключение диссертация на тему "Математическое моделирование процесса анализа близости предикатов семантических отношений"

Результаты работы имеют не только научную, но и практическую значимость. Построенный формальный аппарат математического моделирования процесса обобщения Предикатов СО в форме НПП можно применить для практической реализации механизма автоматического накопления и систематизации Семантических Знаний на основе выявляемых в ЕЯ закономерностей. Оператору-человеку, которому не нужно быть экспертом-лингвистом, а только носителем языка, достаточно ввести в ЭВМ обучающее множество прецедентов СЭ ЕЯ-высказываний, это может быть сделано с помощью диалога оператора с ИС на ЕЯ.

Такое свойство сложных систем Предикатов СО как иерархизация упрощает процесс распознавания СО и процесс обобщения Предикатов в ходе обучения ИС распознаванию СО Конструкций ЕЯ. Упорядоченность последовательности применения НПП от простого к сложному уровням синонимии в процедуре порождения вариантов перифразирования ЕЯ-высказывания приводит к тому, что вычислительная сложность данной процедуры линейно зависит только от количества уровней синонимии и даже в маловероятном для реального ЕЯ случае неоднозначности распознавания ЕЯ-высказывания на всех уровнях синонимии оказывается ограничена сверху количеством НПП в системе Предикатов СО. Разработанные алгоритмы оптимизированы для сравнения сложных, иерархизированных систем НПП с помощью механизма нестандартного логического вывода УВ, что позволяет эффективно проводить распознавание СО Конструкций ЕЯ.

Устранено присутствующее в реализованных на практике методах Обработки ЕЯ противоречие между скоростью обработки, которая является следствием применения простых правил преобразований, и универсальностью представления ЕЯ-преобразований, которая позволяет более полно описывать ЕЯ с помощью сочетания сложных правил, что уменьшает трудоёмкость описания ЕЯ, но увеличивает вычислительную сложность алгоритмов анализа, воспроизводящего полноту и непротиворечивость языкового описания путём согласования множества правил. При автоматическом накоплении и систематизации ИС Знаний о ЕЯ неполнота и противоречивость Знаний, вводимых оператором в простой, но универсальной форме, устраняются на этапе обучения ИС, и их не требуется восполнять вычислениями на этапе анализа и преобразований, причём каждый раз делать это заново.

Практическое применение модели обучения распознаванию СО Конструкций ЕЯ возможно в самых разных областях: перевод, синтез ЕЯ-высказываний, Смысловая обработка Текстов на ЕЯ. Основной областью применения является автоматизация обучения, автоматический контроль знаний с помощью тестирования на ЕЯ путем машинного анализа СЭ между ответами учащихся и эталонами, которые заданны педагогом. При данном применении знания учащихся, фиксируемые в Текстах ЕЯ, постоянно измеряются/оцениваются экспертом-педагогом в приложении к стабильному ситуационному контексту вопросов и предмета. В качестве прикладных областей для применения данной модели можно также назвать диалоговые и экспертные системы, автоматическое реферирование и обработку документов и информации, а также связанную с этим задачу поиска необходимой информации.

Материалы работы основаны на публикациях [33-34, 46-49], из них 5 опубликованы, 1 в печати. Полученные результаты апробированы в докладах на конференциях: XVIII международной научно-методической конференции "Математика в вузе" (Великий Новгород, 2005), 6-й международной научной конференции «Интеллектуализация обработки информации» (ИОИ-2006) (Крым, Алушта, 2006), в докладах на научных конференциях в рамках Дней Науки в Новгородском государственном университете имени Ярослава Мудрого (Великий Новгород, 2005), (Великий Новгород, 2006), (Великий Новгород, 2007).

Все научные и практические результаты получены автором самостоятельно. Достоверность полученных теоретических результатов подтверждается корректностью доказательств теорем об алгоритмической разрешимости и вычислительной сложности процесса распознавания СО Конструкциях ЕЯ и процесса обобщения систем Предикатов СО Конструкций ЕЯ. Также достоверность подтверждается соответствием модели Семантики Конструкций ЕЯ формальным критериям, сформулированным при постановке задачи.

Разработанные методы решения задач Обработки ЕЯ доведены до реализации. Эффективность предложенных алгоритмов распознавания СЭ ЕЯ-высказываний в сравнении с известными на сегодняшний день алгоритмами синонимического перифразирования подтверждается теоремами; иллюстрацией работы алгоритмов являются примеры, приведенные в приложении А. В работе промоделировано множество синонимических преобразований, известных из лингвистики, при этом разрешены проблемы моделей Семантики Конструкций ЕЯ, которые основаны на перифразировании. С помощью системы Предикатов СО в форме Н1111 возможно учитывать различные уровни синонимий и представить проблемные и сложные виды синонимических преобразований, произвести автоматическую классификацию ЛЗ.

Разработанные в диссертации методы и алгоритмы количественной оценки близости Предикатов СО, таксономии Конструкций ЕЯ, логического вывода усложнением вариантов нашли практическое воплощение в программном комплексе, который в дальнейшем планируется использовать для решения задач автоматизации составления тезаурусов по дисциплинам специальности "Программное обеспечение вычислительной техники и автоматизированных систем" в учебном процессе Новгородского государственного университета.

Возможные направления дальнейших исследований заключаются в решении с помощью разработанных методов количественной оценки близости Предикатов СО в ходе машинного обучения распознаванию СО Конструкций ЕЯ общей задачи интеллектуализации процесса пополнения Знаний о СО Конструкций ЕЯ, которая заключается в автоматическом построении ЭВМ части или полной модели любого ЕЯ путем диалога на ЕЯ с носителем данного языка, что также подразумевает задачу построения универсальной, общеязыковой модели Концептуальных ЕЯ-Знаний. Для этого путем анализа пересечения выделенных классов ЛЗ необходимо найти базовые Семантических Значений МУ слов в каждом ЕЯ, которые затем подвергнуть сравнению и обобщению на уровне множества ЕЯ.

ЗАКЛЮЧЕНИЕ

В заключении приведем положения, которые определяют научные и практические результаты настоящей диссертационной работы. Главные научные результаты состоят в следующем:

Выявлены наиболее общие функциональные и структурные свойства ЕЯ, на основе чего предложена модель ЕЯ как множества ситуаций ЕЯ-употребления с механизмом проверки ЕЯ-высказываний на допустимость в речи и механизмом согласования употребления форм поверхностного выражения Смысла в разных ситуациях ЕЯ-употребления;

Разработана формальная концептуальная модель обучения распознаванию СО Конструкций ЕЯ с помощью обобщения Семантических Знаний, которые представлены Предикатами СО, механизмом Концептуального Анализа, который выявляет закономерности в ЕЯ-употреблении;

Установлено, что таксономия множества прецедентов СО механизмом Концептуального Анализа представима с помощью Предикатов в форме Н1111 над множествами структурированных значений аргументов СО, на основе чего построен формальный аппарат математического моделирования процесса обобщения Предикатов СО в форме НПП;

С использованием построенного аппарата решена задача распознавания СО Конструкций ЕЯ путем сравнения систем Предикатов СО в форме НПП, результатом которого является вычисление количественной оценки близости систем Предикатов СО;

Доказаны теоремы о алгоритмической разрешимости процесса обобщения Предикатов СО и процесса распознавания СЭ ЕЯ-высказываний.

Показано, что с помощью количественной оценки близости систем Предикатов СО может быть проведена иерархизация сложных систем Предикатов СО; иерархизация позволяет реализовать алгоритм распознавания СО Конструкций ЕЯ, вычислительная сложность которого не экспоненциально, а линейно растет с увеличением числа уровней иерархии синонимии и количества Предикатов;

Доказаны: теорема о том, что вычислительная сложность процесса обобщения Предикатов СО исходной системы Hi 111 линейно зависит от количества Предикатов в конечной системе Hi 111, которая является результатом обобщения исходной, и теорема о том, что вычислительная сложность процесса распознавания СЭ ЕЯ-высказываний в заданной системе НПП линейно зависит от количества уровней синонимии в этой системе и в худшем случае от количества НПП в этой системе;

Также показано, что системой НПП может быть промоделировано множество синонимических преобразований, известных из лингвистики, включая те, которые учитывают различные уровни синонимий, и сложные виды синонимических преобразований: выходящие за пределы простого предложения и за рамки регулярной ЛФ-синонимии; при этом разрешены проблемы моделей Семантики Конструкций ЕЯ, которые основаны на перифразировании; решена задача морфологической, сортовой, родовидовой классификации лексики.

Разработаны алгоритмы нахождения количественной оценки близости Предикатов в общем виде с учетом возможных методов оценивания, оптимизированные для сравнения сложных, иерархизированных систем Предикатов СО; показано применение этих алгоритмов для трансформации систем НПП в процессе обобщения Предикатов СО.

В настоящей диссертационной работе впервые предложен комплексный подход к решению ряда задач компьютерной Обработки ЕЯ. Так, показано, что задача распознавания СЭ ЕЯ-высказываний сводится к задаче сравнения систем Предикатов СО и нахождения количественной оценки их близости. Последняя задача решается теми же методами, что и задача обобщения систем Предикатов для предварительного машинного обучения ИС распознаванию СО Конструкций ЕЯ. Разработанная модель ЕЯ позволяет универсальным образом представить СО в ЕЯ с помощью Hi 111 и модели ситуаций ЕЯ-употребления. На основе модели можно проводить машинное обучение распознаванию произвольных СО Конструкций ЕЯ. Предложенный алгоритм распознавания СО ЕЯ-высказываний с помощью процесса обобщения систем Предикатов СО объединяет в одно целое процессы анализа Конструкций ЕЯ и сравнения Смыслов ЕЯ-высказываний.

Библиография Корнышов, Александр Николаевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Аде Ф. Г., Бондарев В. Н., Искусственный интеллект: Учебное пособие для вузов. Севастополь: СевНТУ, 2002. - 615 с.

2. Апресян Ю. Д. Дейксис в лексике и грамматике и наивная модель мира // Семиотика и информатика, вып 35. М.: Языки русской культуры: Русские словари, 1997. - 396 с. - С. 272-298.

3. Апресян Ю. Д. Лексическая семантика: Синонимические средства языка. -М.: Наука, 1974.-367 с.

4. Апресян Ю. Д. О регулярной многозначности. // Известия АН СССР. Отделение литературы и языка. Т. XXX, вып. 6. М., 1971. - С. 509-523.

5. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. - 488 с.

6. Батыршин И. 3., Хабибуллин Р. Ф. Разработка алгоритмов когнитивного кластерного анализа // Обработка текста и когнитивные технологии, вып.З / Под ред. В. Д. Соловьева. Пущино, 1999. - С. 43-47.

7. Бауман Е. В., Дорофеюк 10. А., Москаленко А. С. Размытая упорядоченная классификация // Искусственный интеллект, №2. -Донецк, 2006. С.50-52.

8. Белоногов Г. Г., Богатырев В.И. Автоматизированные информационные системы. М.: Сов. радио, 1973. - 328 с.

9. Белоногов Г. Г., Котов Р. Г. Автоматизированные информационно-поисковые системы М.: Сов. радио, 1968. - 182 с.

10. Белоногов Г. Г., Новоселов А. П. Автоматизация процессов накопления, поиска и обобщения информации. М.: Наука, 1979. - 256 с.

11. Болотов А. Е., Бочаров В. А., Горчаков и др. Пусть докажет компьютер, серия "Логика и компьютер", вып. №5. М.: Наука, 2004. - 207 с.

12. Боровков А. А. Математическая статистика. Новосибирск: Наука, 1997. -772 с.

13. Борщев В. Б. Естественный язык наивная математика для описания наивной картины мира // Московский лингвистический альманах, вып. 1. -М., 1996.-С. 203-225.

14. Борщев В. Б., Кнорина Л. В. Типы реалий и их языковое восприятие // Вопросы кибернетики. Язык логики и логика языка / Под ред. В.В. Иванова.-М., 1990.-С. 106-134.

15. Борщев В. Б., Парти Б. X. Семантика генитивной конструкции: разные подходы к формализации // Типология и теория языка: от описания к объяснению / Под ред. Е. В. Рахилиной и Я. Г. Тестельца. М.: "Языки русской культуры", 1999.-С. 159-172.

16. Бурлак С. А., Старостин С. А. Введение в лингвистическую компаративистику. М.: Эдиториал УРСС, 2001. - 270 с.

17. Вагин В. Н. Дедукция и обобщение в системах принятия решений. М.: Наука, 1988.-384 с.

18. Ващенко Н. Д. Формирование понятий в семантической сети // Кибернетика, №2. Киев, 1983. - С. 101 -107.

19. Виноград Т. Программа, понимающая естественный язык: Пер. с англ. -М.: Мир, 1976.-296 с.

20. Винцюк Т. К. Распознавание слов устной речи методами динамического программирования // Кибернетика, №1. Киев, 1968. - С. 81-88.

21. Волошин Г. Я. Об использовании языковой избыточности для повышения надежности автоматического распознавания речевых сигналов // Вычислительные системы, вып. 37. Новосибирск, 1969. - С. 44-47.

22. Гаек П., Гавранек Т. Автоматическое образование гипотез: математические основы общей теории. -М.: Наука, 1984.-280 с.

23. Герасимова И. А. Формальная грамматика и интенсиональная логика. -М.: Ин-т философии, 2000. 156 с.

24. Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общения. Серия: Проблемы искусственного интеллекта. М.: Наука., 1985. - 144 с.

25. Гладун В. П. Планирование решений. Киев: Наук.думка, 1987. - 168 с.

26. Гожий А. П., Коваленко А. Д. Реализация текстологических методов извлечения знаний с помощью СОМ-технологии // Искусственный интеллект, №2. Донецк, 2006. - С.321-324.

27. Девятков В. В. Системы искусственного интеллекта: Учеб. пособие для вузов. М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. - 352 с.

28. Демьянков В. 3. Основы теории интерпретации и ее приложения в вычислительной лингвистике. М.: Изд-во Моск. ун-та, 1985. - 76 с.

29. Демьянков В. 3. Специальные теории интерпретации в вычислительной лингвистике. М.: Изд-во Моск. ун-та, 1988. - 87 с.

30. Емельянов Г. М., Корнышов А. Н., Михайлов Д. В. Концептуально-ситуационное моделирование процесса перифразирования высказываний естественного языка как обучение на основе прецедентов // Искусственный интеллект, №2. Донецк, 2006. - С.72-75.

31. Загоруйко Н. Г. Гипотезы компактности и (-компактности в методах анализа данных // Сиб. журн. индустр. математики, Т. 1, №1. -Новосибирск, 1988.- С. 114-126.

32. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. -Новосибирск: Изд-во Ин-та математики, 1999. 270 с.

33. Загоруйко Н. Г., Бушуев М. В. Меры расстояния в пространстве знаний // Анализ данных в экспертных системах. Вып. 117: Вычислительные системы. Новосибирск, 1986. - С. 24-35.

34. Загоруйко Н. Г., Пичуева А. Г. Сравнение иерархических структур // Искусственный интеллект и экспертные системы. Вып. 157: Вычислительные системы. Новосибирск, 1996. - С. 101-111.

35. Загоруйко Н. Г., Свириденко Д. И. Формализация процесса углубления понимания // Эмпирическое предсказание и распознавание образов. Вып. 67: Вычислительные системы. Новосибирск, 1976. - С. 87-92.

36. Искусственный интеллект: В 3-х кн., Кн.1. Системы общения и экспертные системы: Справочник / Под ред. Э. В. Попова. М.: Радио и связь, 1990.-464 с.

37. Искусственный интеллект: В 3-х кн., Кн.2. Модели и методы: Справочник / Под ред. Д. А. Поспелова. М.: Радио и связь, 1990. - 304 с.

38. Искусственный интеллект: В 3-х кн., Кн.З. Программные и аппаратные средства: Справочник / Под ред. В.Н. Захарова, В.Ф. Хорошевского. -М.: Радио и связь, 1990. 368 с.

39. Кибрик А. Е. Очерки по общим и прикладным вопросам языкознания. Серия: "Лингвистическое наследие XX века". М.: КомКнига, 2005. -336 с.

40. Кондратов А. М. Звуки и знаки. М.: Знание, 1978. - 208 с.

41. Кравцов А. А., Липницкий С. Ф., Насуро Д. Р. Синтез рефератов текстовых документов на основе ситуативно-синтагматической сети // Искусственный интеллект, №2. Донецк, 2006. - С.172-175.

42. Кубрякова Е. С. О тексте и критериях его определения // Текст. Структура и семантика. Т. 1. М., 2001. - С. 72-81.

43. Кубрякова Е. С., Шахнарович А. М., Сахарный Л. В. Человеческий фактор в языке: Язык и порождение речи / АН СССР. Ин-т языкознания; Отв. ред. Е. С. Кубрякова. М.: Наука, 1991. - 239 с.

44. Кубрякова Е. Язык и знание. Серия "Язык. Семиотика. Культура". М: Изд. "Языки славянской культуры", 2004 г. - 560 с.

45. Леман Э. Проверка статистических гипотез. М.: Наука, 1979. - 408 с.

46. Лорьер Ж.-Л. Системы искусственного интеллекта: Пер. с франц. М.: Мир, 1991.-568 с.

47. Любарский Ю. Я. Интеллектуальные информационные системы. М.: Наука, 1990.-232 с.

48. Манохин А. Н. Методы распознавания, основанные на логических решающих функциях // Эмпирическое предсказание и распознавание образов. Вып. 67: Вычислительные системы. Новосибирск, 1976. - С. 42-53.

49. Мельников Г. П. Системная типология языков: Принципы, методы, модели. М.: Наука, 2003. - 395 с.

50. Мельчук И. А. Опыт теории лингвистических моделей "Смысл О Текст". Семантика, синтаксис. М.: Языки русской культуры, 1999. - 345 с.

51. Нариньяни А. С., Кентавр по имени ТЕОН: Тезаурус + Онтология. // Труды международного семинара Диалог'2001 по компьютерной лингвистике и ее приложениям, Т.1. Аксаково, 2001. - С. 184-188.

52. Насуро Д. Р. Алгоритмы и программы визуализации информативных предложений в системе автоматического реферирования текстовыхдокументов // Искусственный интеллект, №2. Донецк, 2006. - С.416-419.

53. Нейрокомпьютеры и интеллектуальные роботы / Под ред. Н. М. Амосова. Киев: Наукова думка, 1991. - 272 с.

54. Немытикова JI. А. Методы сравнения символьных последовательностей // Методы обработки символьных последовательностей и сигналов. Вып. 132: Вычислительные системы. Новосибирск, 1989. - С. 1-34.

55. Никитина С. Е. О концептуальном анализе в народной культуре // Логический анализ языка: Культурные концепты, Вып. 4. М., 1991. -160 с.-С. 117-123.

56. Павиленис Р. Й. Проблема смысла. Современный логико-философский анализ языка. М.: Мысль, 1983. - 286 с. - С. 279-280.

57. Попов Э. В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. -360 с.

58. Попов Э. В., Фирдман Г. Р. Алгоритмические основы интеллектуальных роботов и ИИ. М.: Наука, 1976. - 455 с.

59. Поспелов Д. А. Ситуационное управление: теория и практика. М.: Наука, 1986.-288 с.

60. Представление и использование знаний: Пер. с япон. / Под ред. X. Уэно, М. Исидзука. М.: Мир, 1989. - 220 с.

61. Прим 3. Л. Кратчайшие связывающие сети и некоторые обобщения // Кибернетический сб., №2. -М., 1961. С. 95-107.

62. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных системах. М.: Наука, 1989. - 192 с.

63. Савельев А. Я. Проблемы автоматизации обучения // Вопросы психологии, №2. М., 1986. - С. 11-20.

64. Селезнев К. Обработка текстов на естественном языке // Открытые Системы, № 12. М., 2003. - С. 48-54.

65. Симоне Дж. ЭВМ пятого поколения: компьютеры 90-х годов. М: Финансы и статистика, 1985. - 173 с.

66. Соловьев В. Д. Кластерный анализ многофакторных лингвистических понятий // Труды межд. семинара "Диалог 2000". М., 2000. - С. 512515.

67. Таханов Р. С. Предикативное описание множеств отображений и максимальные предикатные пары // Искусственный интеллект, №2. -Донецк, 2006. С.242-246.

68. Тейз А., Грибомон П., Луи Ж. и др. Логический подход к искусственному интеллекту: от классической логики к логическому программированию: Пер. с франц. -М.: Мир, 1990.-432 с.

69. Тестелец Я. Г. Введение в общий синтаксис. М., РГГУ, 2001. - 800 с.

70. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. Пер. с англ. М.: Мир, 1992. - 240 с.

71. Фомичев В. А. Математические основы представления смысла текстов для разработки лингвистических информационных технологий. Часть I. Модель системы первичных единиц концептуального уровня // Информационные технологии, № 10. -М., 2002. -С. 16-25.

72. Хоменко Л. В. Методы параллельного формирования понятий на основе пирамидальных сетей // Экспертные системы и распознавание образов. Вып. 126: Вычислительные системы. Новосибирск, 1988. - С. 24-25.

73. Хомский Н. Формальные свойства грамматик // Кибернетический сб., №2. М., 1961. -С.121-130.

74. Хомский H. Язык и мышление. Пер. с англ. М.: Изд. Моск. Ун-та, 1972. -122 с.

75. Черный JI. Б. Порождение мер связи между объектами с помощью мер связи между признаками // Проблемы анализа дискретной информации. -Новосибирск: изд. ИЭиОПП СО АН СССР, 1975. С. 167-174.

76. Шенк Р. Обработка концептуальной информации: Пер. с англ. М.: Энергия, 1980.-361 с.

77. Эндрю А. Искусственный интеллект. М.: Мир, 1985. - 264 с.

78. Emelyanov G. M., Krechetova T. V., Kurashova E. P. Tree Grammars in the Problems of Searching for Images by their Verbal Descriptions // Pattern Recognition and Image Analysis. 2000. Vol. 10, № 4. P. 520-526.

79. U. Priss, Classification of Meronymy by Methods of Relational Concept Analysis. Online Proceedings of the 1996 Midwest Artificial Intelligence Conference, Bloomington, Indiana.

80. U. Priss, Linguistic Applications of Formal Concept Analysis. Proceedings of ICFCA 2003: Springer-Verlag, 2003.