автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Диалоговая интеллектуальная система с естественно-языковым интерфейсом

кандидата технических наук
Никонов, Владимир Олегович
город
Краснодар
год
2007
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Диалоговая интеллектуальная система с естественно-языковым интерфейсом»

Автореферат диссертации по теме "Диалоговая интеллектуальная система с естественно-языковым интерфейсом"

На правах рукописи

НИКОНОВ Владимир Олегович

Д ИАЛОГОВАЯ ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА С ЕСТЕСТВЕННО-ЯЗЫКОВЫМ ИНТЕРФЕЙСОМ

Специальность: 05 13 01 - Системный анализ, управление и обработка информации (информационные и технические системы)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

ООЗОВ1Б1 I

Краснодар — 2007

003061611

Работа выполнена в Кубанском государственном технологическом университете

Научный руководитель. кандидат технических наук, профессор

Частиков Аркадий Петрович

Официальные оппоненты, доктор физико-математических наук, профессор

Лежнев Виктор Григорьевич, Кубанский государственный университет

Защита диссертации состоится 26 сентября 2007 г. в 14 часов на заседании диссертационного совета Д 212 100.04 в Кубанском государственном технологическом университете по адресу 350072, г. Краснодар, ул. Московская 2, корпус А, конференц-зал

С диссертацией можно ознакомиться в библиотеке Кубанского государственного технологического университета

Автореферат разослан 14 августа 2007 г. Ученый секретарь

диссертационного совета Д 212.100 04,

кандидат технических наук, доцент Варламова Жанна Николаевна, Новороссийская государственная морская академия

Ведущая организация- Кубанский государственный аграрный

университет (г. Краснодар)

канд техн наук, доцент

Власенко А.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность исследования. Количество информации и пользователей в сети Интернет неуклонно возрастает. К октябрю 2006 года количество сайтов, работающих в сети превысило 100 миллионов, а количество пользователей русскоязычного интернета к началу 2007 году составляло 28 миллионов человек

В связи с быстрым развитием сети Интернет, знания в которой представляются, главным образом, в текстовом виде, их автоматизированное извлечение из текста приобретает особую актуальность и становится одной из центральных задач искусственного интеллекта

Поиск знаний, в отличии от простого поиска информации, при котором не учитывается семантика запросов, должен предоставлять пользователю только действительно актуальную информацию, наиболее точно соответствующую его потребностям и адекватную исходному запросу Если при обычном поиске пользователь знает, что он может получить, то при поиске знаний он должен получить нечто до сих пор неизвестное и познать его

О сложности получения знаний в сети Интернет говорит ряд исследований, согласно которым, люди тратят слишком много времени, пытаясь найти нужную информацию.

Пользователи сети Интернет обращаются к поисковым системам и форумам в поисках ответов на свои вопросы. Интернет уже содержит ответы на большинство вопросов, проблема состоит в том, что доступ к ним связан с большими временными затратами

Для решения указанных проблем разработан и исследован новый тип системы, работающией в сети Интернет - диалоговая интеллектуальная система с естественно-языковым интерфейсом

Диссертационная работа посвящена разработке принципов функционирования, методике и технологии создания диалоговой интеллектуальной системы с естественно-языковым интерфейсом (диалоговая ИС с ея-интерфейсом), способной распознавать запросы пользователей с учетом семантики и прово-

дить консультации в диалоговом режиме в сети Интернет.

Цель работы. Целью диссертационной работы является теоретическое обоснование и разработка основных принципов и методики создания диалоговой интеллектуальной системы с естественно-языковым интерфейсом, экспериментальное исследование предложенных методов на практике Задачи исследования:

- обобщить опыт создания систем автоматической обработки текста, выявить их недостатки и преимущества,

- проанализировать системы получения знаний в сети Интернет, выявить их недостатки и предложить пути их устранения,

- разработать естественно-языковой интерфейс для интеллектуального поиска по базе знаний диалоговой И С,

- разработать метод обработки запросов пользователя,

- разработать метод построения диалоговой ИС на базе интеллект-карт,

- осуществить на основе разработанного метода программную реализацию диалоговой ИС с ея-интерфесом,

- провести экспериментальную проверку применимости предложенного метода для решения задачи поиска ответов на вопросы в сети Интернет, определить эффективность работы системы в реальных производственных условиях

Методы исследования. Поставленные задачи решены с применением компьютерной лингвистики, системного анализа, теории графов, методов инженерии знаний

Научная новизна. В соответствии с целью работы и задачами исследования в диссертационной работе были получены следующие научные результаты

- разработана структура диалоговой ИС с ея-интерфейсом, алгоритмы функционирования основных ее компонентов,

- предложен новый подход к созданию диалоговых систем на базе интеллект-карт,

- разработан метод консультирования в сети Интернет на базе диалоговой ИС с ея-интерфейсом,

- создан алгоритм выделения ключевых слов в запросе пользователя;

- решены практические вопросы разработки и создания диалоговой ИС с ея-интерфейсом;

- спроектирована и реализована диалоговая ИС с ея-интерфейсом для

торговых предприятий, занимающихся продажей алкогольной продукции.

Практическая значимость работы. Прикладная ценность полученных результатов заключается в создании диалоговой интеллектуальной системы с естественно-языковым интерфейсом, позволяющей повысить эффективность получения ответов на вопросы в сети Интернет.

Разработанная система прошла апробацию в ЗАО АФ «Мысхако» и ООО «Южный регион» Апробация работы продемонстрировала эффективность применения предложенной методики объединения диалоговой системы и естественно-языкового интерфейса

Система может быть интегрирована в структуру любого сайта предприятия, превратив его из обычного представительства в сети Интернет в инструмент торговли, снабдив Интернет-магазин предприятия мощным консультационным обеспечением, что в свою очередь позволит существенно увеличить и упростить продажи через Интернет Система также может быть использована для обучения персонала предприятия и повышения квалификации сотрудников

Основные положения, выносимые на защиту.

1 Сравнительный анализ существующих методов автоматизированного извлечения знаний из текста

2 Принципы построения и архитектура диалоговой интеллектуальной системы с естественно-языковым интерфейсом

3 Метод создания диалоговой ИС на базе интеллект-карт

4 Алгоритм определения ключевых слова запроса

5 Принципы построения и структура ея-интерфейса

6 Критерии оценки эффективности работы системы

7 Результаты оценки эффективности и работоспособности диалоговой ИС с ея-интерфейсом

Апробация результатов исследования Основные положения диссертационной работы докладывались и обсуждались на 2 Всероссийских научных конференциях

- II Всероссийской научной конференции молодых ученных и студентов «Современное состояние и приоритеты развития фундаментальных наук в регионах», г Анапа, 2005 г,

- III Всероссийской научной конференции молодых ученных и студентов «Современное состояние и приоритеты развития фундаментальных наук в регионах», г. Анапа, 2006 г, по итогам которой работа «Интеллектуальная поисковая система с ея-интерфейсом» заняла второе место Реализация и внедрение результатов работы. Основные методы и алгоритмы функционирования диалоговой интеллектуальной системы с естественно-языковым интерфейсом реализованы на базе программных продуктов свободно распространяемых в сети Интернет Такой подход позволяет создать систему с минимальными финансовыми затратами и проверить ее эффективность на практике

Разработанная система внедрена в ЗАО АФ «Мысхако» и ООО «Южный регион»,

Публикации по теме диссертации. Материалы диссертации опубликованы в 6 печатных работах В том числе, 2 статьи и 4 тезиса доклада

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы (78 наименований), изложенных на 136 страницах и 1 приложения

СОДЕРЖАНИЕ РАБОТЫ Во введении обосновывается актуальность темы диссертации - разработка диалоговой ИС с ея-интерфейсом

Формулируются цель работы и задачи, описываются применяемые методы исследования, научная новизна, практическая значимость работы и основные положения, выносимые на защиту

В первой главе диссертации проведен анализ интернет-источников, отечественной и зарубежной литературы, направленный на исследование подходов к обработке текстов и построения диалоговых интеллектуальных систем. Рассмотрены современные разработки в области создания систем консультации в сети Интернет Выявлены и исследованы недостатки существующих подходов к получению знаний в сети Интернет, осуществлена постановка задачи и предложен новый метод создания диалоговых ИС с ея-интерфейсом. Результаты анализа, проведенного в первой главе, показали

1 Современное состояние дел в области разработки диалоговых интеллектуальных систем в целом может быть охарактеризовано следующим образом- уровень теоретических исследований и существующие модели языков не

позволяют удовлетворительно реализовать двухсторонне активный диалог, предусматривающий смену ролей пользователя и системы в ходе общения,

— наиболее изученным, развитым и представленным в литературе является режим, когда вопросы задает пользователь, а система отвечает на них

2 Анализ исследований и разработанных систем, ориентированных на за-просно-ответный диалог, показал, что каждая из них реализует следующую

общую схему воспринимает сообщение пользователя как запрос и формирует соответствующий ответ на основе имеющихся знаний

Систем, учитывающих в совокупности морфологию, синтаксис и семантику запросов на естественном языке - нет Несмотря на большой объем работ, проведенных в области обработки естественно-языковых текстов, к настоящему моменту не предложено механизмов практического их применения для поиска информации

3 Естественно-языковый интерфейс рассмотренных систем не предполагает использование сложных предложений естественного языка в запросе пользователя Запрос пользователя к системе является простым предложением, но тем не менее для его распознавания необходимо использовать лингвистический анализатор, состоящий из трех уровней пофразного представления текста -морфологического, синтаксического и семантического

4 Анализ лингвистических моделей показал, что они способны

- извлекать знания из заданного текста и строить правильные предложения естественного языка по заданным значениям смысла;

- перефразировать эти предложения,

- оценивать их с точки зрения связности и выполнять ряд других задач Анализ показал, что разработанные модели имеют достоинства, но и не

лишены недостатков Многие из них в основном ориентированы на анализ, в них слабо продуман процесс преобразования смысла входного высказывания на знания системы, что может привести к некорректным умозаключениям Также выделяется класс моделей, в которых отсутствует или слабо реализован блок морфологического или синтаксического анализов, что оказывает существенное влияние на качество анализа текста

Во второй главе диссертационной работы приводятся структурные и функциональные основы разработанной диалоговой ИС с ея-интерфейсом

На основе анализа литературных источников сделан вывод, что для достижения приемлемого качества обработки естественно-языковых запросов необходимо выделять наиболее информативные единицы текста - ключевые слова Наиболее подходящей моделью лингвистического анализатора для реализации является модель контекстного фрагментирования, обеспечивающая возможность отображения естественно-языкового текста на формальный язык представления знаний

Основу модели контекстного фрагментирования составляет трехуровневая система лингвистическая модель, базовые механизмы обработки предложений и ассоциированные процедуры

Систему общения с базой знаний можно представить в виде г = <М,В,К>, (1)

где М -лингвистическая модель, В - базовые механизмы обработки предложений, К- ассоциированные процедуры

Лингвистическая модель М содержит информацию о морфологии, синтаксисе и семантике естественного языка

Базовые механизмы В реализуют четыре основных отображения. 4/1 Т-+Х (морфологический анализ), Х-+0 (синтаксический анализ), у/3- О—(семантический анализ), 4/4 S-*Q (трансляция), где Т - текст естественного языка в виде множества лексем, X - множество лексем с морфологической информацией, в - дерево зависимостей, в вершинах которого располагаются лексемы, а дуги отображают связи, 5 - семантический граф, <3 — SQL-запрос в виде цепочки ключевых слов

Под ассоциированными процедурами К понимается разбиение предложения на лексемы, а также все процедуры, реализующие функции, необходимые для выполнения отображений

Архитектура диалоговой ИС с ея-интерфейсом представлена на рисунке I

Рисунок 1 - Архитектура диалоговой ИС с ея-интерфейсом

Графемематический компонент выполняет начальный анализ естественного текста На его вход подается исходный текст На выходе анализатор строит таблицу, состоящую из двух столбцов

Например, из текста "Иван работал" будет построена таблица

Таблица 1- Графематический анализ

Часть входного текста Графематические дескрипторы

Иван ЛЕ Бб ПРД1

- РЗД ПРБ

работал ЛЕ бб ПРД2

В первом столбце стоит часть входного текста, во втором столбце графе-матические дескрипторы, характеризующие этот текст

Графематический анализ выполняет задачи разделение входного текста на слова и разделители, сборка слов, написанных в разрядку, выделение устой-

чивых оборотов, ФИО, электронных адресов и имен файлов

После графематического анализа в работу вступает морфологический компонент, который приписывает лексемам морфологическую информацию и производит их лемматизацию

Для каждого слова морфологический анализатор выдает множество морфологических интерпретаций следующего вида лемма, морфологическая часть речи, множество наборов граммем

Таблица 2 - Морфологический анализ

Diet ID Lemma Grammems

но СТЕКЛО С, ср,вн,им,ед

нп,св СТЕЧЬ Г, дст,прш,ср,ед

Результаты морфологического анализа представлены в виде множества пар <х„У,> , где х, - лексема естественно-языкового запроса, V, - вектор морфологической информации х, лексемы. Они являются исходными данными для проведения фрагментационного анализа текста

Цель фрагментационного анализа - деление предложения на неразрывные фрагменты и установление иерархии между ними В результате фрагментационного анализа будут сформированы два множества новое исходное множество лексем Хя Ь — множество групп связанных лексем

Задачей синтаксического анализа является выявление синтаксической связи между двумя лексемами множества X и множества Ь, разбиение лексем на множество главных слов 1,! и множество зависимых слов Ьг, причем Ь; П Ь2 0 и формирование множества сочетаемых пар лексем В = {х^х, \ х, £ Ь), х; £ £?} Для нахождения вершины необходимо

1) объединить множества Ь; н £.3 = ЬМЬ^.

2) найти разности множеств 13 и Ь2: ¿4 = Ь3\ Ь2, где Ь4 - одноэлементное множество корневых вершин Таким образом, формируется граф зависимостей й=<Х, 0>, где Х~ множество вершин графа в, которое составляет множество лексем Х={х, 11=1,п), а Б -множество дуг

В результате синтаксического анализа должны быть однозначно определены все синтаксические конструкции естественно-языкового предложения, в которых их элементы объединены синтаксическими связями

_ииф_

Как восстановить информацию из зашифрованного файла ?

После синтаксического анализа проводится семантический анализ В ходе анализа текста строится его семантическое представление, которое представляет собою связный ориентированный граф, состоящий из семантических узлов и отношений между ними

[ЗАШИФРОВАННОГО 1 Рисунок 3 - Семантическая структура предложения Семантический анализ основан на русском общесемантическом словаре (РОСС)

В словаре для каждой лексемы указаны разные характеристики слова

- семантический класс лексемы,

- грамматический класс лексемы,

- валентная структура лексемы,

- семантические и грамматические ограничения на выражение каждого актанта из валентной структуры

пг

прямдоп

прия^оущ

Рисунок 2 - Синтаксический анализ

I ВОССТАНОВИТЬ]

SF

R53IR 3 F ""AL

- I LaSL.SIT

= 1 СУШИГ

= ед

= 1 SO ( зашитгать )

« AGEHT r Ы , С OBJ , A2 , С C-HSSETT , A3 , С

SF1 S i*-^.

EGF1{1)

= 1 :<_доп . I

= i ЙК1М

= 1 -

= i к_дап P

= 1 К_ЯОП OSfJ-P

~ 1 5XXUAX

ЗГ2 SF3

= Operl служить Bod. : надежный Gperl обесггечизагь Oper2 • находиться под-^Т IncepOperl , бргзгь пад-'-В

Рисунок 4 - Пример записи в словаре РОСС слова «защита»

Для записи семантики используется специальный информационный язык-посредник Элементарное высказывание на этом языке фиксирует семантическое отношение между двумя семантическими узлами, и имеет вид формулы R(A,B), в которой R - имя отношения, а А и В - семантические узлы

Семантическое отношение - это универсальная связь, усматриваемая носителем языка в тексте Эта связь бинарна, она идет от одного семантического узла к другому узлу.

Семантическое отношение формирует и организует текст Практически любые связи между частями текста, которые необходимо выявить при анализе текста, можно выразить семантическим отношением или их композицией

После построения семантического представления запроса в работу вступает алгоритм определения ключевых слов, которые несут основную смысловую нагрузку в предложении Ключевыми словам являются (в порядке убывания значимости)

- существительное, связанное с глаголом, связями OBJ (объект), SUB (субъект), CONTEN (содержание) — полученное слово является главным словом запроса,

- прилагательное или существительное, связанное с главным словом связями РЯОРЕИТ (свойство) юга ВЕ1Л^Ю (принадлежать),

- глагол - вершина графа,

- обстоятельства

В результате работы в предложении будет выделена цепочка слов, по которой будет произведен поисковый запрос в базу знаний

База знаний построена на основе интеллект-карт Интеллект-карты -техника представления процесса мышления или структурирования информации в визуальной форме

В работе рассмотрены два типа интеллект-карт (карта запроса и карта диалога), которые необходимо создать эксперту для успешного функционирования диалоговой ИС Определена их структура и алгоритм создания

Карта первого типа - «карта запроса» представляет собой описание пути к сценариям диалогов, хранимым в системе. По картам запросов происходит поиск сценариев диалогов и их запуск Целью создания карт первого типа является выделение ключевых слов запроса и порядка их поиска в системе Карты запросов служат графическим представлением базы знаний системы

Карты запросов создаются экспертами после получения ими вопроса на форуме, проведения консультации с пользователем и создании сценария диалога Карта строится с опорой на семантический граф предложения, построенный ея-интерфейсом при анализе запроса пользователя.

Карта запроса представляет собой интеллект-карту в центре которой размещено слово-существительное (устойчивое словосочетание) — главное слово

От главного слова отходят ветви, соединяющие его с узлами-действиями, представленными глаголами Данные узлы обозначают действия (вопросы), которые можно произвести с главным словом

|печатать р

^ 0 ПОЧИНИТЬ }

. - i

i заправить Ь ■ ;

" \ \ / продать

¿азв^ный^ - >-

sresfiKbisUei .> Принтер ; мосюа.

матричнмй_ ------ 4 г - *---------------ч Ёкатеринбщг

/ П купить V-J 1 Краснодар

выбрать

I '<! установить

■( настроить

Рисунок 5 - Карта запроса «Принтер» От глаголов отходят ветви, соединяющие их с уточняющими членами предложения

Карты второго типа - «карты диалогов» Карта диалога представляет собой последовательность вопросов, которые будут заданы пользователю с целью выяснить детали его запроса и дать ответ на поставленный вопрос

В каком положении находится

J Да, индикатор \ питания»--------

j ошибки f

] Интерфейсный кабель

подключен к портам

1 да принтера и компьютера

ü Можно напечатать j

~ ~ ( тестовую страницу? I Вкпкиже-выкпючит«

(, мррлк чп"г......ьрпь'и VHI ............" "" " "" I принтер Попробуйте

сообщении вб ошибке? , ' | распечатать Проблема „

(НвтРошвиа? . _ ^

Какое сообщение об ошибке Да, сообщение ¿бГ^ПИВПЯвтся н? экРане компьютера? ^ ошибке на экране j

Рисунок 6 - Карта диалога «Не печатает принтер»

Преимущество создания диалогов с помощью интеллект-карт состоит в простоте их разработке. Эксперту не требуется знаний программирования, чтобы создать сценарий диалога Он просто «рисует» диалог в визуальном редакторе После создания карты диалога - она компилируются в программу, которая, впоследствии, осуществляет диалог с пользователем

Если в ходе работы с диалоговой И С пользователь не получит ответ на заданный вопрос, то он отключается от режима диалога и инициирует запрос к эксперту на форуме

Эксперт на форуме выясняет у пользователя в чем возникло затруднение при работе с системой, и почему она не дала ответ на его вопрос Он самостоятельно отвечает на вопрос пользователя на форуме, а потом вносит уточнения в карту диалога, чтобы в следующий раз пользователь получил ответ от системы без его вмешательства

Использование ея-интерфейса для определения ключевых слов запроса и использования их для поиска позволяет точно находить и включать сценарии диалогов, в независимости от формулировки запроса пользователя

В третьей главе диссертационной работы представлена программная реализация всех составляющих компонентов диалоговой интеллектуальной системы с естественно-языковым интерфейсом

-блок естественно-языкового интерфейса, включающий процессоры (гра-фематический, морфологический, синтаксический, семантический) и словари (русский морфологический, русский общесемантический),

- форум,

- среда разработки сценариев диалогов

Обоснован выбор инструментальных средств для разработки системы Для реализации диалога экспертов с пользователями, в качестве среды общения, выбран форум «РЬрВВ» Достоинствами которого являются легкость инсталляции, поддержка СУБД, безопасность, русскоязычный интерфейс

В качестие онлайн редактора диалогов выбран «KibcrryScenario», обладающий следующими Положительными качествами; платформенная независим мость, открытость, надежность, доступность. Редактор диалогов написан на языке Java.

Рисунок 7 - Редактор сценариев диалогов

Разработка сценария диалога по требует особых знаний и осуществляется посредством манипуляции абстрактными графическими объектами в среде редактора.

Для анализа естественно-языковых запросов выбран и доработан программный комплекс «Диалинг». Достоинствами, определившим его выбор, является его завершенность: программная реализация доведена до уровня промышленного использования.

13 состав системы «Диалинг» входят лингвистические процессоры: гра-фематический, морфологический, фрагментационный, синтаксический, семантический.

Графематический, синтаксический и семантический процессоры реализован],I на языке С. Взаимодействие между модулями в программе организовано через стандартный СОМ интерфейс.

Основным компонентом морфологического анализа является русский

морфологический словарь Словарь включает 161 тыс лемм

Структура словаря представлена в виде реляционной схемы

FormNo PrefixStr FtewaStr Ancode

FlextaModelld

Ancode

PartOKpeech

Grammems

BaseStr FtexaMotfeUd AccentModettd PrefixSetld

FlexiaStr

— Ancode

U"

Actentffodelld FormNo

AccentedCharNo

PrefixSetld PresixStr

Рисунок 8 - Структура морфологического словаря

Таблица Lemmata содержит перечень всех лемм данного словаря, для каждой леммы даны ее свойства Таблица FlexlaModels содержит перечень возможных окончаний всех лемм. Таблица AccentModels содержит перечень возможных номеров ударных гласных для словоформ Таблица Ancodes содержит все возможные морфологические интерпретации

Словарь может хранить информацию о словах, возможных окончаниях, возможных приставках, которые могут присоединяться к словоформам

В третьей главе диссертации определены требования к аппаратному и программному обеспечению системы Произведен выбор средств на базе которых работает система

В четвертой главе приведены результаты экспериментальных исследований работоспособности и эффективности диалоговой интеллектуальной системы с естественно-языковым интерфейсом-

1 Осуществлен выбор и обоснование предметной области использования диалоговой интеллектуальной системы Консультационная диалоговая система разработана для торговых предприятий, занимающихся оптовой и розничной продажей алкогольной продукции.

2 Определены критерии качества работы естественно-языкового интерфейса и рассмотрены результаты его тестирования

Рисунок 9 - Иерархия качественных характеристик ея-интерфейса

Под надежностью понимается способность ея-интерфейса правильно понимать намерения пользователя по получению информации из источника, при условии, что пользователь корректно выразил потребности в виде ея-запроса Надежность отражает правильность принципов, лежащих в методе ея-анализа, а также корректность построения ея-интерфейса

Разработанный ея-интерфейс имеет некоторое пространство правильно понимаемых запросов Чем больше это пространство, тем большей полнотой он обладает. Полнота - характеристика, тесно связанная с гибкостью интерфейса Гибкость - показатель того, насколько разнообразные типы запросов может понимать ея-интерфейс

Другой важной характеристикой является дружественность интерфейса, которую можно определить как меру того, насколько ея-интерфейс удобен в работе, насколько корректно он может сообщать о проблемах понимания, может ли он помогать в переформулировке неберущихся запросов

В ходе тестирование ея-интерфейса специалистом были сформулированы вопросы для проверки работоспособности системы

В результате тестирования блоком ея-интерфейса были корректно распознаны большинство запросов Некорректно распознанные запросы были связаны, во-первых, с отсутствием специфических слов в словаре РОСС, во-вторых, со сложной формулировкой запроса, которые были представлены не в виде простого предложения

Результаты тестирования показали, что блок ея-интерфейса корректно выделил ключевые слова в предложенных вопросах

Для оценки гибкости ея-интерфейса - показателя того, насколько разнообразные типы запросов может понимать ея-интерфейс Были выбраны несколько запросов и переформулированы.

Ниже приведены различные формулировки одного и того же по смыслу запроса и результаты их анализа блоком ея-интерфейса

иок

щщ

ва \8RC-PNT

ж........

I

[зоРЕет

Рисунок 10 - «Где купить сухое вино в Краснодаре'»

1Я|

0Ш ч

ия и

У \SRC-PNT

ТиОРЕЯТ

ив

Рисунок 12 - «Сухие вина в Краснодаре купить»

Рисунок 11 - «В Краснодаре вино купить сухое»

Во всех результатах анализа запросов, несмотря на их различную формулировку, ея-ннтсрфсйс выделил одну и ту же цепочку ключевых слов: «пино -сухой — купить — Краснодар».

Результаты тестирования показали правильность принципов, лежащих в работе ея-интерфейса, а также корректность его построения.

Дли увеличения гибкости системы предусмотрена настройка ее словарей и установление дополнительных правил обработки семантическою графа запроса.

3, Проведен сравнительный анализ и показаны преимущества разработанной системы перед существующими средствами получения знаний в сети Интернет.

Тестирование проводилось среди поисковых систем, форумов и разработанной диалоговой ИС с ея-интерфейсом. Главный показателем эффективности является время затрачиваемое пользователем на поиск ответа с помощью вышеуказанных систем.

Методика тестирования состояла в том, что предварительно экспертом было подготовлено 50 вопросов по предметной области работы. Было проверено, что на эти вопросы можно найти ответы с помощью тестируемых систем.

Измерялось время в секундах от момента нажатия на кнопку «Поиск» в исследуемой системе до получения испытуемым ответа на поставленный вопрос.

На рисунке 13 приведены средние временные показатели поиска ответов на вопросы с помощью поисковых систем, форумов и блока ея-интерфейса диалоговой системы

Использование для поиска ея-интерфейса позволяет сократить время поиска ответа в 2-3 раза по сравнению с используемыми в настоящий момент поисковыми системами и форумами.

4 Рассмотрены результаты тестирования диалоговой ИС с ея-интерфейсом на примере выбора вина по классификациям для агрофирмы «Мысхако» Полученные результаты подтвердили работоспособность системы и оптимальность выдаваемых ею рекомендаций.

5. Приведено обоснование экономической эффективности разработки и внедрения системы Ожидаемый минимальный экономический эффект от внедрения на торговом предприятии агрофирмы «Мысхако» составляет 50000 руб. в год

В заключении отражены основные выводы и результаты диссертации, подтверждена ее практическая значимость.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В процессе исследования получены следующие результаты

1. Обосновано создание диалоговой ИС с ея-интерфейсом для получения знаний в сети Интернет.

2. Проведен анализ лингвистических моделей и средств обработки текстов в диалоговых системах

3 Исследована структура лингвистического анализатора

4. Разработаны принципы построения и структура диалоговой ИС с ея-

интерфейсом

5 Предложен метод создания диалоговых систем на базе интеллект-карт

6 Разработан метод анализа и преобразования запроса на естественном языке к форме, позволяющей достичь эффективных результатов поиска.

7. Предложен алгоритм выделения ключевых слов запроса пользователя.

8 Решены практические вопросы разработки и создания диалоговой ИС с ея-ингерфейсом.

9 Создана и протестирована диалоговая ИС с ея-интерфейсом для торговых предприятий, занимающихся продажей алкогольной продукции

10. Разработанная система внедрена на предприятиях ЗАО АФ «Мысхако» и ООО «Южный регион»

Основные положения диссертации опубликованы в следующих работах:

1. Частиков А.П, Никонов В.О. Проблемы разработки ея-интерфейсов // Труды Кубанского государственного технологического университета. Серия «Информатика и управление». Том XXV, вып 3 - Краснодар 2005

2. Никонов В.О. Использование естественно- языкового интерфейса для решения информационных задач // Труды II Всероссийской научной конференция молодых ученых и студентов Том 2 Краснодар- Просвещение-Юг, 2005 с. 129.

3. Никонов В О Критерии качества при построении естественно - языкового интерфейса. // Труды II Всероссийской научной конференция молодых ученых и студентов Том 2. Краснодар Просвещение-Юг, 2005 с 130.

4. Никонов ВО Интеллектуальная поисковая система с ЕЯ-икгерфейсом. // Труды III Всероссийской научной конференции молодых ученых и студентов Краснодар Просвещение-Юг, 2006 с. 205-206.

5 Никонов В О Виртуальные компьютеры в учебном процессе // Труды III Всероссийской научной конференции молодых ученых и студентов Краснодар- Просвещение-Юг, 2006. с. 207.

6 Никонов В О Динамические экспертные системы с естественно-языковым интерфейсом // Известия высших учебных заведений. Северо-Кавказский регион, 2006 , Приложение №10, с 13-15.

Подписано в печать 13.08.07. Печать трафаретная. Формат 60x84 1/16. Уч.-изд л 1,36 Тираж 100 экз. Заказ № 36.

ООО «Издательский Дом-ЮГ» 350072, г. Краснодар, ул Московская 2, корп «В», оф В-120 тел /факс (861) 274-68-37

Оглавление автор диссертации — кандидата технических наук Никонов, Владимир Олегович

ВВЕДЕНИЕ.

1 ИССЛЕДОВАНИЕ И АНАЛИЗ ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ.

1.1 ОБЩИЕ СВЕДЕНИЯ. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ.

1.2 ОБЗОР СРЕДСТВ ОБРАБОТКИ ЕЯ-ТЕКСТОВ В ДИАЛОГОВЫХ СИСТЕМАХ.

1.2.1 Подходы к обработке естественно-языковых текстов.

• 1.2.2 Вопросно-ответные системы.

1.3 МЕТОДЫ И ПОДХОДЫ К ПОСТРОЕНИЮ ЛИНГВИСТИЧЕСКОГО АНАЛИЗАТОРА.

1.3.1 Структура лингвистического анализатора.

1.3.2 Обзор методов морфологического анализа.

1.3.3 Обзор методов синтаксического анализа.

9 1.3.4 Обзор методов семантического анализа.

1.4 АНАЛИЗ ЛИНГВИСТИЧЕСКИХ МОДЕЛЕЙ.

1.4.1 Компонентный анализ.

1.4.2 Семантические падежи.

1.4.3 Модель «семантик предпочтения».

1.4.4 Модель концептуальной зависимости.

1.4.5 Модель «смысл - текст».

1.4.6 Модель контекстного фрагментирования.

1.5 ВЫВОДЫ.

2 СТРУКТУРНЫЕ И ФУНКЦИОНАЛЬНЫЕ ОСНОВЫ ДИАЛОГОВОЙ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ С ЕЯ-ИНТЕРФЕЙСОМ.

2.1 СТРУКТУРА И ПРИНЦИП ФУНКЦИОНИРОВАНИЯ СИСТЕМЫ.

2.1.1 Основные компоненты.

2.1.2 Принцип функционирования диалоговой интеллектуальной системы.

2.2 УСТРОЙСТВО ФОРУМА.

2.3 СТРУКТУРА И ФУНКЦИОНИРОВАНИЕ ЕСТЕСТВЕННО-ЯЗЫКОВОГО ИНТЕРФЕЙСА.

2.3.1 Основные компоненты ея-интерфейса.

2.3.2 Общая схема анализа предложения.

2.3.3 Графематический анализ предложения.

2.3.4 Морфологический анализ словоформ.

• 2.3.5 Фрагментационный анализ предложения.

2.3.6 Синтаксический анализ предложения.

2.3.7 Семантический анализ предложения.

2.4 АРХИТЕКТУРА ДИАЛОГОВОЙ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ

2.4.1 Интеллект-карты.

2.4.2 Представление знаний в диалоговой ИС.

• 2.4.3 Взаимодействие ея-интерфейса и диалоговой ИС.

2.5 ВЫВОДЫ.

3 ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ДИАЛОГОВОЙ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ С ЕЯ-ИНТЕРФЕЙСОМ.

3.1 ОБЩИЕ СВЕДЕНИЯ.

3.2 ВЫБОР И ОБОСНОВАНИЕ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ РАЗРАБОТКИ.

3.3 ФОРУМ РНРВВ.

3.4 РЕДАКТОР СЦЕНАРИЕВ ДИАЛОГОВ «КШЕЯЛУ».

3.5 СИСТЕМА «ДИАЛИНГ».

3.5.1 Графематический анализ.

3.5.2 Русский морфологический словарь.

3.5.3 Синтаксический анализ.

3.5.4 Русский общесемантический словарь.

3.5.5 Дополнительные словари.

3.6 Требования к программному и аппаратному обеспечению.

3.7 ВЫВОДЫ.

4 ЭКСПЕРИМЕТАЛЬНЫЕ ИССЛЕДОВАНИЯ РАБОТОСПОСОБНОСТИ И ЭФФЕКТИВНОСТИ СИСТЕМЫ.

4.1 ВЫБОР И ОБОСНОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ.

4.2 ТЕСТИРОВАНИЕ ДИАЛОГОВОЙ ИС С ЕЯ-ИНТЕРФЕЙСОМ.

4.2.1 Тестирование программного комплекса.

4.2.2 Тестирование ея-интерфейса.

4.2.3 Методика оценки эффективности.

4.3 ОЦЕНКА И РАСЧЕТ ЭКОНОМИЧЕСКОГО ЭФФЕКТА

ОТ ВНЕДРЕНИЯ.

4.3.1 Экономическая целесообразность системы и ее применение.

4.3.2 Методика оценки и расчет экономического эффекта от внедрения.

4.4 ВЫВОДЫ.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Никонов, Владимир Олегович

В современном мире сеть Интернет является одним из основных источников получения знаний. Получить знания (ответы на свои вопросы) можно не только с помощью данных, хранимых во всемирной сети, но и с помощью миллионов людей, подключенных к сети Интернет.

В первом случае, для получения ответов на свои вопросы необходимо самостоятельно анализировать и искать уже существующую в сети информацию с помощью поисковых систем. Пользователь формирует запрос, поисковая система обрабатывает его и выдает перечень найденных документов, отсортированных по степени релевантности запросу.

Недостаток этого метода состоит в том, что на выходе пользователь получает не ответ на свой вопрос, а перечень содержащих слова его запроса документов, которые он должен дальше самостоятельно анализировать.

Более оптимальным способом получения знаний являются консультации с людьми-экспертами на специализированных сайтах - форумах. Ответ на вопрос проще и быстрее получить от знающего человека, нежели самостоятельно извлекать знания из текста.

Для того, чтобы получить ответ на свой вопрос от экспертов, пользователь оставляет свой вопрос на форуме, заполняя соответствующую форму на сайте.

Другие пользователи сайта просматривают оставленные сообщения с вопросами и, если они знают ответ, то отвечают на них.

Сообщения на форумах объединены в темы. Когда человек отвечает в форуме на чье-то сообщение, его ответ будет "привязан" к исходному сообщению. Сообщения, отправленные в форум, могут храниться неограниченно долго, и ответ может быть дан не в тот же день, когда появился вопрос.

Преимущество форумов состоит в том, что, во-первых, пользователи получают конкретный ответ на поставленный вопрос, во-вторых, есть возможность диалога, что позволяет эксперту в беседе уточнить все детали вопроса и дать точный ответ. Под экспертами на форуме мы понимаем людей, которые обладают знаниями по заданному вопросу и могут дать ответ на него.

Но и у форумов есть недостатки. Знания на форуме представлены в неструктурированной форме, как записи бесед между пользователями и экспертами. Они могут быть полезны посетителям, не участвовавшим в обсуждении темы вопроса, только в том случае, если рассматриваемая тема вопроса совпадет с их потребностями.

Пользователи могут ознакомиться с сохраненным диалогом на форуме и извлечь из него необходимые для себя знания. Если в сохранившемся диалоге они не находят ответов на свои вопросы, то они могут инициировать продолжение беседы с экспертом на форуме в этой же теме или создать новую тему для обсуждения.

Люди, в большинстве своем, задают одни и те же вопросы в определенной предметной области. Эксперты отвечают на них, но слабая система поиска на форуме и неструктурированность записи знаний не позволяют использовать сохраненные знания повторно.

Пользователям форума проще спросить, создав новую тему для обсуждения, чем самостоятельно искать ответ в списках заданных вопросов. При таком подходе на экспертов ложится дополнительная нагрузка, так как они должны каждый раз заново отвечать на одни и те же вопросы.

Рассмотрим на примере трудности, возникающие при работе с форумом.

Пользователь создает запрос в форум: «Не могу установить программу Google Earth». Эксперт начинает на форуме диалог с пользователем, уточняя у него источник проблемы.

В нашем примере эксперт выяснил, что пользователь не смог установить программу Google Earth по причине повреждения установочного файла. Эксперт дает рекомендацию по устранению этой проблемы и на этом диалог на форуме завершается.

С течением времени другой пользователь может обратиться на форум с аналогичным по смыслу, но отличным по формулировке запросом: «Программа Google Earth не устанавливается».

Несмотря на то, что данная тема уже была рассмотрена на форуме и на нее получен ответ, все равно может потребоваться подключение эксперта. Эксперт может начать консультацию с «нуля» так как у нового посетителя, во-первых, причина, по которой программа не устанавливается, может быть иная и ее нужно выяснить заново; во-вторых, посетитель не смог ознакомиться с уже существующей темой по этому запросу, так как не искал ее или искал, но не нашел.

Причина, по которой пользователь мог не найти тему на форуме, состоит в том, что он сформулировал свой запрос иначе: «Программа Google Earth не устанавливается», тогда как в базе форума сохранен запрос: «Не могу установить программу Google Earth».

Системы поиска, встроенные в форум, при таком запросе произвели бы поиск по совпадающим словам: «программа», «Google», «Earth» - и вывели все темы, где они содержатся. При большем объеме базы данных форума количество релевантных документов для такого запроса может быть очень большим, и пользователь не сможет найти среди них нужный.

Для решения рассмотренных проблем вместо консультирования пользователей на форумах предлагается использовать диалоговую интеллектуальную систему (ИС) с естественно-языковым интерфейсом (ея-интерфейсом).

Стоит отметить, что на сегодняшний момент подобных систем, работающих в русскоязычном Интернете, практически нет.

Сложность использования таких систем в Интернет состоит в трудоемкости их создания и отсутствии необходимых компонентов для реализации их работы в режиме онлайн.

Разрабатываемая диалоговая ИС с ея-интерфейсом должна решить существующие проблемы в области получения знаний с помощью сети Интернет и стать новым этапом в развитии интернет-технологий.

Подробный принцип и устройство диалоговой ИС с ея-интерфейсом рассматриваются во второй главе.

АКТУАЛЬНОСТЬ РАБОТЫ

Количество информации и пользователей в сети Интернет неуклонно возрастает. К октябрю 2006 года количество сайтов, работающих в сети превысило 100 миллионов, а количество пользователей русскоязычного интернета к началу 2007 году составляло 28 миллионов человек.

Динамика активности пользования Интернетом Россия, млн. чел. (нарастающим итогом)

В Осень ЯШ □Зиял а002-2003 Овес«а20Ш ЯЛего200Э

В Осень 2003 □Зина2003-20» пВесна2004 яПетогоек Осень 2004 О Зиял 20М.2СЮ5 □ Ва сна 2005 П Лат о 2005 Осень □ Зля л 2005-2000 ПВи'ш ЖС □ Лето 2006

ВОоень2йСС ■ Зниа2000 2Ш7

ЗН

Чг

ОЗГ

Й:

2 пм

25 иУ*

Пользовались Интернетом хотя бы раз за последние „ суши недеяо месяц три месяца полгода суточнаяаудитория^ (недельнаяаудитория) (месящая аудитория) (трекмесячная аудитория) (полугодовая аудитория)

Диаграмма 1.1 - Динамика активности пользования Интернетом в России

В связи с быстрым развитием сети Интернет, знания в которой представляются, главным образом, в текстовом виде, автоматизированное извлечение знаний из текста и естественно-языковое взаимодействие системы с пользователем приобретает особую актуальность и становится одной из центральных задач искусственного интеллекта.

ЦЕЛЬ РАБОТЫ

Целью настоящей работы является теоретическое обоснование и разработка метода построения диалоговой интеллектуальной системы с естественноязыковым интерфейсом и реализация ее на практике. ЗАДАЧИ ИССЛЕДОВАНИЯ

1. Обобщить опыт создания систем автоматической обработки текста, выявить их недостатки и преимущества.

2. Проанализировать существующие системы получения знаний в сети Интернет, выявить их недостатки и предложить пути их устранения.

3. Разработать метод построения диалоговой ИС для осуществления консультаций пользователей в сети Интернет.

4. Разработать блок естественно-языкового интерфейса для интеллектуального поиска по базе знаний диалоговой ИС.

5. На основе разработанного метода осуществить программную реализацию диалоговой ИС с ея-интерфесом.

6. Провести экспериментальную проверку применимости предложенного метода для решения задачи поиска ответов на вопросы в сети Интернет, определить эффективность работы системы в реальных производственных условиях.

МЕТОДЫ ИССЛЕДОВАНИЯ

Поставленные задачи решены с применением компьютерной лингвистики, системного анализа, теории графов, методов инженерии знаний и построения диалоговых интеллектуальных систем. НАУЧНАЯ НОВИЗНА

Теоретическая значимость выполненных в диссертационной работе исследований заключается в разработке метода создания диалоговой ИС с ея-интерфейсом и состоит в следующем:

1. Осуществлена постановка задачи создания систем консультаций на базе диалоговых систем с ея-интерфейсом.

2. Предложен метод консультирования в сети Интернет на базе диалоговой ИС с ея-интерфейсом.

3. Разработан новый подход к созданию диалоговых систем на базе интеллект-карт.

4. Разработан метод анализа и преобразования запроса на естественном языке к форме, позволяющей достичь эффективных результатов поиска.

5. Разработан блок естественно-языкового интерфейса для интеллектуального поиска по базе знаний системы.

6. Сформулированы принципы организации и построения диалоговых ИС с ея-интерфейсом.

ПРАКТИЧЕСКАЯ ЦЕННОСТЬ

Прикладная ценность полученных результатов заключается в создании диалоговой ИС с ея-интерфейсом, позволяющей значительно повысить эффективность получения ответов на вопросы в сети Интернет.

Испытания показали, что созданная система может быть использована в сети Интернет с большей эффективностью, чем существующие системы консультаций. Разработанная система может быть установлена на любой сайт в сети Интернет и на ее основе каждый пользователь может создать систему консультирования по своей предметной области.

РЕАЛИЗАЦИЯ РЕЗУЛЬТАТОВ РАБОТЫ

В настоящее время разработанная диалоговая ИС с ея-интерфейсом реализована на базе свободно доступных в сети Интернет компонентов и используется в следующих организациях:

- ЗАО АФ «Мысхако»;

- ООО «Южный регион».

Акты, подтверждающие внедрение результатов диссертационной работы в производство, приведены в Приложении 1.

АПРОБАЦИЯ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Результаты работы докладывались и обсуждались на: -II Всероссийской научной конференции молодых ученых и студентов «Современное состояние и приоритеты развития фундаментальных наук в регионах» (г. Анапа, 2005 г.)

-III Всероссийской научной конференции молодых ученых и студентов «Современное состояние и приоритеты развития фундаментальных наук в регионах» (г. Анапа, 2006 г.) ПУБЛИКАЦИИ

По теме диссертации опубликовано 7 печатных работ. Из них, 1 учебное пособие, 2 статьи и 4 тезиса докладов на вышеперечисленных конференциях.

По итогам III Всероссийской научной конференции молодых ученых и студентов «Современное состояние и приоритеты развития фундаментальных наук в регионах» работа «Интеллектуальная поисковая система с ея-интерфейсом» заняла второе место.

ОСНОВНЫЕ ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ -результаты сравнительного анализа существующих систем обработки ЕЯ-текстов и систем консультирования в сети Интернет;

-принцип построения и структура диалоговой ИС с естественно-языковым интерфейсом;

-метод создания диалоговой ИС а на базе интеллект-карт; -принцип построения и структура блока ея-интерфейса; -архитектура диалоговой ИС; -критерии оценки эффективности работы системы;

-результаты оценки прямого экономического эффекта от внедрения в производство системы.

СТРУКТУРА И ОБЪЕМ РАБОТЫ

Диссертационная работа состоит из введения, четырех глав и заключения, изложенных на 136 страницах.

Заключение диссертация на тему "Диалоговая интеллектуальная система с естественно-языковым интерфейсом"

4.4 ВЫВОДЫ

В четвертой главе приведены результаты экспериментальных исследований работоспособности и эффективности диалоговой интеллектуальной системы с естественно-языковым интерфейсом:

1. Произведен выбор и обоснование предметной области использования диалоговой интеллектуальной системы. Консультационная диалоговая система, разработана для торговых предприятий, занимающихся оптовой и розничной продажей алкогольной продукции.

2. Определены критерии качества работы блока естественно-языкового интерфейса и рассмотрены результаты его тестирования.

3. Проведен сравнительный анализ и показаны преимущества разработанной системы перед существующими средствами получения знаний в сети Интернет.

4. Рассмотрены результаты тестирования диалоговой ИС с ея-интерфейсом на примере выбора вина по классификациям для агрофирмы «Мысхако» . Полученные результаты подтвердили работоспособность системы и оптимальность выдаваемых ею рекомендаций.

5. Приведено обоснование экономической эффективности разработки и внедрения системы. Ожидаемый минимальный экономический эффект от внедрения на торговом предприятии агрофирмы «Мысхако» составляет 50000 руб.

ЗАКЛЮЧЕНИЕ

Основным научным результатом диссертационной работы является исследование и разработка диалоговой интеллектуальной системы с естественноязыковым интерфейсом.

Основные теоретические и практические результаты заключаются в следующем:

1. Обосновано создание диалоговой ИС с ея-интерфейсом для получения знаний в сети Интернет.

2. Проведен анализ лингвистических моделей и средств обработки текстов в диалоговых системах.

3. Исследована структура лингвистического анализатора - ключевого элемента ея-интерфейса разработанной системы.

4. Разработаны принципы построения и структура диалоговой ИС с ея-интерфейсом.

5. Предложен алгоритм выделения ключевых слов запроса пользователя для формирования поискового запроса и точного поиска в базе знаний.

6. Предложен метод создания диалоговых систем на базе интеллект-карт.

7. Разработан метод анализа и преобразования запроса на естественном языке к форме, позволяющей достичь эффективных результатов поиска.

8. Решены практические вопросы разработки и создания диалоговой ИС с ея-интерфейсом.

9. Создана и протестирована диалоговая ИС с ея-интерфейсом для торговых предприятий, занимающихся продажей алкогольной продукции.

10. Разработанная система внедрена на предприятиях ЗАО АФ «Мысхако» и ООО «Южный регион».

Библиография Никонов, Владимир Олегович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Андреева A.M., Березкин Д.В., Смирнов A.M. Об одном способе построения синтаксического анализатора текстов на естественном языке. // Изв. Вузов // Приборостроение. 1977,- Т. 40.- №5. - С. 34-42.

2. Азарова И. В., Митрофанова О. А., Синопальникова A.A. Компьютерный тезаурус русского языка типа WordNet // Компьютерная лингвистика и интеллектуальные технологии. Труды Международной конференции Диалог 2003, с. 43-50.

3. Азарова И. В. Морфологическая разметка текстов на русском языке с использованием формальной грамматики AGFL // Труды международной конференции Диалог 2003.

4. Андрусенко Т.Б. Лингвистические структуры в компьютерных учебных средах. -Киев: Наукова Думка, 1994. -160 с.

5. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л. и др. Лингвистический процессор для сложных информационных систем. -М.: Наука, 1992. 256 с.

6. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л. и др. Лингвистическое обеспечение системы Этап-3. -М.: Наука, 1989.

7. Ахматова И.Х. Структурно-семантические модели простого предложения в современном карачаево-балкарском языке. Нальчик, 1983. С.90-92

8. Ахо A.B. Индексные грамматики расширение контекстно-свободных грамматик // Кибернетический сборник. - М., 1962. - Вып.5. - С.15-21.

9. Ахо A.B., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Т.1. Синтаксический анализ.- М.: Мир, 1978. 612 с.

10. Бейлин Дж. Краткая история генеративной грамматики. В сб. обзоров: Фундаментальные направления современной американской лингвистики/ Под ред. А.А.Кибрика, И.М.Кобозевой и И.А.Секериной. М.: Изд-во МГУ, 1997. -С.13-57.

11. Белоногов Г. Г., Котов Р. Г. Автоматические информационно-поисковые системы. -М: Сов. радио, 1968,- 415 с.

12. Белоногов Г.Г., КузнецовБ.А.Языковыесредстваавтоматизированных информационных систем. М.: Наука, 1983.- 380 с.

13. Бельнап Н., Стал Т. Логика вопросов и ответов. Пер. с англ. Г.Е.Крейдлина -М.: «Прогресс». -1981. -288 с.

14. Бидер И.Г., БольшаковИ. А., Еськова Н. А.Формальнаямодель русской морфологии. Ч. 1-2. М, : Изд-во ИРЯ, Вып. 111-112,1978.

15. Богданов С. И. Форма слова и морфологическая форма .- СПб.: Изд-во С.-Петерб. ун-та, 1997.-204 с.

16. Брябин В.М., Любарский ЮЛ., Микулич Л.И. и др. Диалоговые системы в АСУ // Под ред. Д.А. Поспелова. М: Энергоатомиздат, 1983. - С. 85120.

17. Бухараев Р.Г., Сулейманов Д.Ш. Семантический анализ в вопросно-ответных системах. Казань: Изд. КГУ. - 1990. 124 с.

18. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения (Вступительная статья)// Новое в зарубежной литературе. М.: «Прогресс». Вып. XXIV. Компьютерная лингвистика. Под ред. Городецкого Б.Ю. С. 5-31.

19. Денинг В., Эссиг Г., Маас С. Диалоговые системы «Человек-ЭВМ». Адаптация к требованиям пользователя. Пер. Котова Ю.Б., под ред. Мартынюка В.В. М.: Мир, 1984. 112 с.

20. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных. -М.: Радио и связь, 1988. -288 с.

21. Ермаков А. Е., Плешко В. В. Синтаксический разбор в системах статистического анализа текста. // Информационные технологии, №7, 2002.

22. Ермаков А. Е. Этапы лингвистического анализа текста в программных продуктах RCO // Русский язык: исторические судьбы и современность. II Международный конгресс исследователей русского языка. Труды и материалы. Москва, МГУ, 2004.

23. Искусственный интеллект: Применение в интегрированных производственных системах / Под ред. А.И. Дашенко, Е.В. Левнера. М.: Машиностроение, 1991, —539 с.

24. Искусственный интеллект: В 3 кн. Кн.1. Системы общения и экспертные системы: Справочник / Под ред. Э.В. Попова. М.: Радио и связь, 1990. -464 с.

25. Искусственный интеллект: В 3 кн. Кн.2. Модели и методы: Справочник/Под ред. Д.АЛоспелова. М.: Наука, 1990. - 472 с.

26. Карпова Г. Д., Пирогова 10. К., Кобзарева Т. КХ, Микаэлян Е. В. Компьютерный синтаксический анализ: описание моделей и направлений разработок. Итоги науки и техники. Серия: Вычислительные науки. Т.6. М.: ВИНИТИ, 1991.

27. Кузин Л.Т. Основы кибернетики. -М., 1979. -Т.2. -585 с.

28. Кузин Л.Т., Преображенский А.Б., Хорошевский и др. Разработка и исследованиеметодовпостроенияинтеллектуальныхвопрос-ответных систем (проект МИВОС). Отчет о НИР. -М.: МИФИ, 1977. -291 с.

29. Левин ЦЛ, Нариньяни A.C. Экспериментальный минипроцессор: семантически ориентированный анализ // Взаимодействие с ЭВМ на естественном языке. -Новосибирск, 1978.

30. Леонтьева H.H. Русский общесемантический словарь (РОСС): структура, наполнение.//НГИ. Сер. 2. 1997.N 12.-С.5-20.

31. Мальковский М.Г. Диалог с системой искусственного интеллекта. -М.: Изд-во МГУ, 1985.-214 с.

32. Мальковский М.Г. TULIPS -обучаемый решатель задач, понимающий ЕЯ // Труды IV Международной конференции по искусственному интеллекту. -М., 1975. -Т.6. С.117-126.

33. Мальковский М.Г. Программно-информационное обеспечение адаптивных систем общения с ЭВМ на естественном языке. -М.: МГУ/Автореферат дисс. на соискание уч. степ, доктора физико-математических наук. 1990 г. - 34

34. Мельчук И.А. Опыт теории лингвистических моделей Смысл-Текст. -М.: Наука, 1974,314 с.

35. Нариньяни A.C. Автоматическое понимание текста новая перспектива. В сб. Трудов Международного семинара Диалог-97 по компьютерной лингвистике и ее приложениям, Ясная Поляна, 10-15 июня, 1997 г.Под ред. А.С.Нариньяни. - С. 203-208.

36. Нариньяни A.C. Искусственный интеллект: стагнация или новая перспектива? -Пущино: РАИИ / В сб. Трудов в 3-х томах Шестой национальной конференции по искусственному интеллекту с международным участием 5-11 октября, Пущино, Россия. Т.1. -1998. -С.15-29.

37. Нариньяни A.C. Модель или алгоритм: новая парадигма информационной технологии //Информационные Технологии, 1997, с. 11-16.

38. Невзорова O.A. Машинное обучение и задачи обработки естественного языка. В журнале Новости ИИ, М.: 1998, N1. С.5

39. Попов Э.В.Общение с ЭВМ на естественном языке.-М., Наука. Главная редакция физико-математической литературы, 1982. -360 с.

40. Попов Э.В. Естественно-языковые системы: прошлое, настоящее и будущее. VI национальная конференция ИИ-2000, Переславль-Залесский, 24-27 октября 2000. М.: ИФМЛ, 2000.-С. 17.

41. Попов Э.В. Экспертные системы: решение неформализованных задач в диалоге с ЭВМ. М.: Наука, Гл. ред. физ, -мат. лит., 1987. - 288 с.

42. Сборник научных трудов в трех томах. 5-я национальная конференция с Международным участием «Искусственный интеллект-96», Казань, 5-11 октября, 1996г. Том 1. Компьютерная лингвистика: С. 93-158.

43. Степанов Ю.С. Имена, предикаты, предложения (семиологическая грамматика). 2-е изд.- М.: Изд-во: Едиториал УРСС, 2002.- 360 с.

44. Труды V национальной конференции с международным участием «Искусственный интеллект» КИИ-96. Казань, 5-11 октября 1996 года. В 3-х томах. -Казань. -1996. -530 с.

45. Труды Шестой национальной конференции по искусственному интеллекту с Международным участием КИИ-98 в трех томах (3-й том переводы). Пущино, Россия, 5-11 октября 1998г. 726 с.

46. Труды Международного семинара Диалог-95 по компьютерной лингвистике и ее приложениям. Казань, 31 мая 4 июня 1995 г. Под ред. Бухараева Р.Г., Нариньяни A.C., Соловьева В.Д.Казань: 1995. -362 с.

47. Труды Международного семинара Диалог-96по компьютерной лингвистике и ее приложениям. Пущино, 4-9 мая, 1996г. Под ред. А.С.Нариньяни. М.: 1996. -305 с.

48. Труды Международного семинара Диалог-97 по компьютерной лингвистике и ее приложениям. Ясная Поляна, 10-15 июня, 1997г. Под ред. А.С.Нариньяни. М.: 1997. -315 с.

49. Труды Международного семинара Диалог-98 по компьютерной лингвистике и ее приложениям. В двух томах. Торуса, 1-6 октября, 1998г. Под ред. А.С.Нариньяни. Казань.: 1998. -885 с.

50. Тузов В. А. Компьютерная лингвистика: опыт построения компьютерных словарей. В печати (изд-во СПбГУ).

51. Тузов В. А. Языки представления знаний. СПб, изд-во СПбГУ, 1990.

52. Фаин B.C. Распознавание образов и машинное понимание естественного языка. -М.: Наука, 1987.

53. Филлмор Ч. Дело о падеже.// В кн.: Новое в зарубежной лнгвистике. Вып. Х.М. Лингвистическая семантика: Прогресс. 1981.

54. Харин Н.П. INTER-ЗРЕЬЬМногоязычная программа автоматической проверки правописаниятекстов. Документация. Пакет программ.

55. Хомский Н. Три модели описания языка // Кибернетический сборник. -1961. -ВЫП.2.-С.81-92.

56. Шабанов-Кушнаренко Ю.П.Теория интеллекта. Математические средства. Харьков: Вища школа, 1984. - 143 с.

57. Шаров С.А. Средства компьютерного представления лингвистической информации. Обзор. URL: http://nl-web/

58. Швецов И.Е., Нестеренко Т.В., Старовит С.А. ТАО технология активных объектов для разработки многоагентных систем // Информационные технологии и вычислительные системы. - 1998. -N 1. - С. 35-44.

59. Шенк Р. Обработка концептуальной информации. -М.: Энергия, 1980. -361 с.

60. Al-Halimi R. et al. WordNet: An Electronic Lexical Database. The MIT1. Press, 1998.

61. Cole Ronald A., Mariani Joseph, Uszkoreit Hans, et al (editors). Survey of the State of the Art Human Language Technology, 1995/ftp: //speech.cse.ogi.edu/pub/docs/HLT/.

62. Cooper R. J., Riiger S. M. A Simple Question Answering System // Imperial College of Science, Technology and Medicine, England, 2000.

63. Dear B.L. AI and the Authoring Process // IEEEExpert Magazine, Summer, 1987.-P. 17-23.

64. Expert system saves 20 million L on pipeline management. C&I July, 1994, p.3L

65. Grinberg D., Lafferty J., Sleator D. A robust parsing algorithm for link grammars // Proceedings of the Fourth International Workshop on Parsing Technologies, Prague, September, 1995.

66. Hasling D.W., ClanceyW.J., Rennels G.Strategic explanationsfordiagnos-ticconsultationsystem // International Journal on the Man-Machine Studies. 1984. -V.20. -N 1. -P.3-19.

67. InterBASE система конструирования ЕЯ-интерфейсов к базам данных. Версия 1.3.Документация. Пакет программ. -Москва-Новосибирск, 1992. -163 с.

68. Joshi А.К., Schabes Y. Tree-adjoining grammars and lexicalized grammars. In Tree Automata and LGS. Elsevier Science, Amsterdam. -1992.

69. Karttunen L. Radical lexicalism.// In Baltin M. And Kroch A. Editors, Alternative Conceptions of Phrase Structure. The University of Chicago Press, Chicago. 1989.

70. Moldovan D. et al. Lasso: A Tool for Surfing the Answer Net // TREC-8, pp 175-183,1999.

71. Netter Klaus.Constraint-Based Grammar Models//. In Proceedings of the Eigh Eurepean Summer School in Logic, Language and Information ESSLLI-96. August 12-23,1996, Prague, Czech Republic. P.l-10.

72. Scott S., Gaizauskas R. QA-LaSIE: A Natural Language Question Answering System // Proceedings of the 14th Biennial Conference of the Canadian Society on Computational Studies of Intelligence

73. Oflazer Kemal. Two-level Description of Turkish Morphology// Literary and Linguistic Computing. Vol. 9, No.2, 1994

74. Уинстон П. Искусственный интеллект. -М., 1980. -580 с.

75. Предполагаемый ожидаемый экономический эффект от внедрения результатов диссертационной работы, связанный с экономией рабочего времени сотрудников, составит, ориентировочно, 50000 руб. в год.1. Антошевская Е.В.

76. ООО «Южный регион» И1111 2310091435 КПП 231001001 350901 г.Краснодар ул.Российская, 30 р/с 40702810000000004788 к/с 30101810400000000713

77. БИК 040349713 в ОАО АКБ «УРАЛСИБ-ЮГ БАНК»1. АКТо внедрении результатов диссертационной работы Никонова Владимира Олеговича «Диалоговая интеллектуальная система с естественно-языковым интерфейсом»

78. Генеральный директор I ООО «Южный регион»к

79. Толмачева О.И. КудиноваЮ.В.^1. ■