автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка и анализ интеллектуальных программ информационного поиска в вычислительных сетях на основе универсальных алгебр

кандидата технических наук
Крошилин, Александр Викторович
город
Рязань
год
2003
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и анализ интеллектуальных программ информационного поиска в вычислительных сетях на основе универсальных алгебр»

Автореферат диссертации по теме "Разработка и анализ интеллектуальных программ информационного поиска в вычислительных сетях на основе универсальных алгебр"

На правах рукописи

КРОШИЛИН Александр Викторович

РАЗРАБОТКА И АНАЛИЗ ИНТЕЛЛЕКТУАЛЬНЫХ ПРОГРАММ ИНФОРМАЦИОННОГО ПОИСКА В ВЫЧИСЛИТЕЛЬНЫХ СЕТЯХ НА ОСНОВЕ УНИВЕРСАЛЬНЫХ АЛГЕБР

Специальность 05.13.11 - "Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей"

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Рязань 2003

Работа выполнена на кафедре вычислительной и прикладной математики Рязанской государственной радиотехнической академии

Научный руководитель: доктор технических наук, профессор Каширин И. Ю.

Официальные оппоненты: доктор технических наук, профессор Еремеев В. В.

кандидат технических наук Новиков Г. А.

Ведущая организация: Московская государственная академия

Защита состоится 1 октября 2003 г. в 14 часов на заседании диссертационного совета Д212.211.01 в Рязанской государственной радиотехнической академии по адресу:

390005, г. Рязань, ул. Гагарина, 59/1.

С диссертацией можно ознакомиться в библиотеке Рязанской государственной радиотехнической академии.

Автореферат разослан 20 августа 2003 г.

Ученый секретарь диссертационного совета Д212.211.01

приборостроения и информатики

кандидат технических наук, доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы. В настоящее время глобальные сети включают в себя большой объем динамически изменяющейся информации и развиваются весьма бурными темпами. Для того чтобы как-то упорядочить этот непрерывный поток данных, а самое главное, дать возможность пользователям сети находить нужную информацию, были созданы специальные поисковые системы. Развитие данных систем идет по пути автоматизации информационного поиска, и главным критерием при этом является увеличение релевантности найденной информации. Релевантность -мера соответствия результатов поиска задаче, поставленной в запросе.

На современном этапе к ряду проблем поиска информации в вычислительных сетях можно отнести следующие.

•Временные затраты. В результате автоматизированного поиска в сети согласно запросу пользователь получает большое количество ссылок, просмотр которых занимает много времени, когда даже простой выбор необходимой информации зачастую представляет собой нелегкую задачу. •Экономические затраты. Большие временные затраты невыгодны с экономической точки зрения для пользователей. Кроме того, некачественная связь также затрудняет работу и увеличивает трафик. •Низкая эффективность поиска. При работе группы пользователей, осуществляющих поиск информации по одинаковой тематике, каждому из них приходится просматривать и анализировать одну и ту же информацию, при этом затрачивается время для работы в сети.

•Трудности при составлении запросов. Пользователь часто не может строго определить цель поиска и применяет нечетко определенные понятия.

В диссертации была проанализирована работа следующих поисковых систем: Megaputer's Text Analyst, Copernic, Okapi Basic Search System, Savvy Search, MetaCrawler, FireExpert, Серверный Следопыт и др. К общим недостаткам рассмотренных систем можно отнести:

• относительно низкую релевантность результатов поиска для конкретного пользователя (релевантность - понятие субъективное, в то время как существующие поисковые системы предполагают собственные подходы к оценке релевантности);

• системы не могут настраиваться пользователем по его запросам (отсутствует модель пользователя);

• системы не являются обучаемыми (не могут подстраиваться под требования пользователя после оценки результатов их работы);

• возникают трудности при составлении сложных запросов (перечень большого количества понятий и установка логических операций над ними);

• отсутствует связь между полученными знаниями и знаниями пользователя (связь предметной области (ПО) и модели пользователя);

• существующие системы не ориентированы на одновременную работу группы пользователей (найденный документ ^ге аналивдр^йКД ь

для нескольких пользователей); i библиотека i

I Sjttm

• системы не ориентированы на поиск информации в узкой ПО пользователем-экспертом, которого интересует информация по аналогичным запросам через определенные интервалы времени (необходимость заново составлять запросы);

• существующие поисковые системы используют абстракции низкого уровня для представлении информации - уровня данных, то есть практически отсутствует уровень понятий, в частности, система понятий ПО, в ко- I торой осуществляется поиск.

Таким образом, использование формального подхода к построению модели ПО для информационного поиска и описание ПО с помощью тем |

являются малоизученной проблемой. Решение этой проблемы позволит не только упростить идентификацию свойств модели ПО, но и облегчить процесс обработки и поиска информации, необходимой пользователю.

Цель работы. Целью диссертационной работы являются: разработка и анализ интеллектуальных программ информационного поиска в вычислительных сетях на основе универсальных алгебр, теории семантических сетей и объектно-ориентированного подхода.

Задачи исследования формулируются следующим образом.

• Определение формальной модели построения предметной области с применением темы для поиска, используемой при создании интеллектуальной поисковой системы.

• Создание моделей пользователей, применяемых для поиска информации, и их анализ.

• Описание новых механизмов логического вывода, используемых при поиске информации в вычислительных сетях.

• Создание методики извлечения знаний для формирования персональной модели знаний пользователя с целью повышения релевантности поиска.

• Формирование проектных решений по программной реализации компонентов интеллектуальной поисковой системы.

Методы исследований. Исследования осуществлялись на основе теории универсальных алгебр, теории множеств, теории нечетких множеств, теории принятии решений, методов структурного и объектно-ориентированного программирования.

Научная новизна работы заключается в следующем.

1) Предложена принципиально новая концепция генерации возможных альтернатив выбора документов. В основе данной концепции используется гипотеза о подобии, заключающаяся в поиске документов и тем, базовые понятия которых наиболее близки по смыслу понятиям заданной темы.

2) Показана эффективность использования универсальной алгебры и нечетких множеств для обработки неопределенности и приблизительных рассуждений при формализации представления модели знаний.

3) Построена оригинальная семантическая сеть информационно-поисковой базы знаний с использованием универсальной алгебры и нечет-

ких множеств, позволяющая установить взаимосвязи между различными темами для поиска в модели предметной области и понятиями, включенными в данные темы, а также дающая возможность создавать модели предметных областей, описываемые в терминах семантической сети.

4) Предложена новая архитектура модели пользователя и модели действий пользователя для интеллектуальной информационной поисковой системы и новый механизм логического вывода, основанный на теории принятия решений, позволяющий определять согласно запросу пользователя множество наиболее релевантных документов.

Основные положения, выносимые на защиту:

1) методика построения модели предметной области на основе семантической сети информационно-документальной базы знаний и темы поиска;

2) основные принципы построения механизма логического вывода для выбора информации согласно запросу пользователя, основанного на теории принятия решений;

3) методология поиска информации в базе знаний и методология пополнения этой базы из вычислительной сети;

4) алгоритм индексации найденного документа согласно ключевым понятиям из предметной области;

5) механизм извлечения знаний эксперта, основанный на многослойных репертуарных решетках Келли.

Практическая ценность работы. Результаты работы являются основой для проектирования интеллектуальных информационно-поисковых систем (ИИПС), применяемых для поиска информации в вычислительных сетях. Предложенные в диссертации формализм и методы позволяют описать предметную область поиска, модель знаний пользователя и модель поведения пользователя, в результате чего повышается релевантность поиска. Результаты диссертации нашли отражение в реальной программе ИИПС "AnNet" v.1.03, применяемой для интеллектуального поиска информации в вычислительной сети в соответствии с предметной областью и темой поиска. Разработанные методы и средства могут быть приняты за основу при создании интеллектуальных поисковых систем, машин поиска, машин поиска каталогового типа и систем управления знаниями, используемых для поиска информации в распределенных информационных системах, глобальных и локальных сетях типа Internet и Intranet.

Достоверность основных положений и полученных результатов диссертационной работы подтверждается корректным использованием математического аппарата, моделированием на ЭВМ, разработкой действующей программы и внедрением полученных результатов.

Реализация и внедрение. В рамках диссертационной работы был разработан и внедрен программный продукт - «Интеллектуальная информационно-поисковая система "AnNet" v.1.03» (ИИПС "A®Net" v.1.03), который имеет свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ. Научные и практические результаты диссертационной работы использованы в НИР №11-03 «Анализ элементов программно-

математического обеспечения комплекса навигации для авионики пятого поколения» и внедрены:

• в Рязанском центре научно-технической информации,

• компьютерной фирме ЗАО «Рязань Онлайн»,

• учебном процессе Рязанской государственной радиотехнической академии (для студентов специальностей 220400 «Программное обеспечение вычислительной техники и автоматизированных систем» при изучении дисциплин, связанных с информационными технологиями в экономике).

Апробация работы. Основные результаты работы докладывались и обсуждались на следующих конференциях: 16-й всероссийской научной конференции молодых ученых и студентов «Реформы в России и проблемы управления», Москва, Государственный университет управления, 2000 г.; 10-й международной научно-технической конференции "Проблемы передачи и обработки информации в сетях и системах телекоммуникации", Рязань, РГРТА, 2001 г.; 7-й Всероссийской научно-технической конференции студентов, молодых ученых и специалистов, посвященной 50-летию РГРТА, Рязань, РГРТА, 2001 г.; международной научно-технической конференции "Математические методы и информационные технологии в экономике, социологии и образовании", Пенза, Приволжский дом знаний, 2001 г.; 9-й всероссийской межвузовской научно-технической конференции "Микроэлектроника и информатика 2002", МИЭТ, Москва, 2002 г.; международной научно-практической конференции "Инновационные процессы в управлении предприятиями и организациями", Пенза, Приволжский дом знаний, 2002 г.; 11-й международной научно-технической конференции "Проблемы передачи и обработки информации в сетях и системах телекоммуникации", Рязань, РГРТА, 2002 г.

Публикации по теме диссертации. По теме диссертации опубликовано 13 печатных работ, среди которых 5 статьи, 7 тезисов докладов на международных и всероссийской научно-технических конференциях и свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованной литературы, изложенных на 140 е., а также приложений на 26 с. Список использованной литературы включает 152 наименования. Текст диссертации содержит 4 таблицы и 34 рисунка.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении дается обоснование актуальности темы работы, кратко излагается содержание диссертации и сформулированы цели исследований.

Первая глава посвящена анализу проблем поиска информации, поисковым системам и способам их построения. Общей характеристикой существующих систем поиска и анализа информации являются отсутствие уровня понятий, в частности системы понятий ПО, в которой осуществляется поиск. Основной целью современных исследований является превра-

щение неструктурированных массивов данных в вычислительных сетях в знания и создание средств и сред работы с ними. В настоящее время в работе специалистов из разных областей все чаще используются удаленные информационные ресурсы. В связи с этим выделился класс пользователей, которые ищут информацию по одной или нескольким темам, где они (пользователи) являются экспертами и могут достаточно четко описать концептуализацию ПО и определить ее модель. Пользователям-экспертам для работы нужна такая система поиска в узкой ПО, в которой должны присутствовать средства создания модели ПО и ее редактирования; средства построения запросов к системе и их обработке; средства накопления результатов поиска и средства работы с результатами.

Для осуществления поиска информации в вычислительных сетях используются многочисленные поисковые системы (ПС). В работе проведен анализ существующих поисковых систем, выделены их недостатки и преимущества, которые необходимо учесть при построении новых систем. Найденную пользователем информацию требуется распознать, правильно классифицировать и попытаться определить, в чем смысл найденных данных, то есть осуществлять интеллектуальный поиск. Для построения такой ПС в диссертации рассмотрены современные направления интеллектуального поиска информации, такие как интеллектуальные агенты, базы знаний, открытые знания, онтологии и экспертные системы, которые играют важную роль в системах поиска информации.

В последнее время серьезное развитие получила парадигма, с точки зрения которой вычислительные сети рассматриваются как потенциальная база знаний. Для работы со знаниями в сети необходимы специальные методы представления и обработки знаний, интерпретации запросов и т.д. В рамках такого подхода знания представляются ПО, в которой осуществляется поиск. Рассмотренный в диссертации тип систем относится к классу ИИПС. Одним из преимуществ таких систем является возможность использования наработанных в искусственном интеллекте (ИИ) технологий работы с базами знаний. При построении ПО можно сразу же учитывать семантику составляющих ее понятий с точки зрения конкретного пользователя или группы пользователей.

При работе ИИПС необходимо использовать информацию из большого количества различных источников. Система предназначена для поиска необходимой информации пользователю и тем самым создает для него новое знание, преобразовывая информацию в доступное знание для индивидуального использования. Это требует разделения и сборки знания в форме, которая может быть сгенерирована и многократно использована в дальнейшем. При поиске информации система должна определять знания, которые являются необходимыми или желательными для пользователя.

ИИПС позволяют облегчить связь- между инженером по знаниям и пользователями, которым необходима экспертная информация. Построение ИИПС основывается на развитой концепции создания экспертных систем. В большинстве ЭС при представлении знаний используют фреймы и

сети. Считается, что получение знаний — это нетривиальное извлечение неявной, предварительно неизвестной и потенциально полезной информации из данных. При построении ИИПС необходима модель представлений знаний.

Во второй главе были проанализированы следующие модели представления знаний: логические модели, семантические сети, фреймы, продукционные системы, нейронные сети, выявлены их преимущества и недостатки. Был сделан вывод, что наиболее универсальной является модель представления знаний в виде семантической сети. Для описания модели знаний предлагается использовать универсальную алгебру и нечеткие множества. Для создания ИИПС наиболее подходит объектно-ориентированный подход, при котором вся информация и процедуры ее обработки содержатся в одном объекте. Используя нечеткие множества, можно описать нечеткие объекты - это стандартные объекты, расширенные для неопределенных данных и моделей.

Для определения необходимой пользователю информации надо располагать знаниями, являющимися отображением содержания запроса пользователя. На основе знаний строится гипотеза о необходимой пользователю информации и формируется запрос на ее получение. Семантическая сеть, отражающая смысловую взаимосвязь тем поиска, а точнее понятий, включенных в них, с найденной информацией в документах, построена на основе концептуальных графов. Она используется для синтаксического и семантического анализа текстов естественного языка. Модель понимания смысла слов (Teachable Language Comprehender: доступный механизм понимания языка), предложенную Куиллианом, будем использовать в качестве структурной модели долговременной памяти. В работе использована сетевая структура как способ представления семантических отношений между концептами. Основу данной модели составляют описание значений класса, которому принадлежит объект, его прототип и связи, установленные со словами, отображающими свойства объекта. Концептуальные объекты представляются ассоциативными сетями, состоящими из вершин, показывающих концепты, и дуг, показывающих отношения между концептами.

Для описания ПО в ИИПС используется семантическая сеть, в основе которой лежит универсальная алгебра, описанная тройкой: /4=<S,0,R>, где S— множество семантических сетей, представляющих модели ПО; О-множество операций на S; R- множество отношений на S. Далее представим методику построения ПО поиска на основе семантической сети.

В разрабатываемой ИИПС семантическая сеть, соответствующая модели ПО, задается как двойка следующего вида: S = {G, U}, где G — множество объектов ПО (темы для поиска и документы); U - множество дуг, связывающих объекты ПО. Каждая дуга показывает взаимосвязь тем или отношений между темами, а также взаимосвязь тем и документов из ПО (рис.1). В реальной ПО отношения между объектами осуществляются с помощью различных степеней зависимости. Типы градуируемых связей

рассматриваются как нечеткие объектные связи. Пусть даны два нечетких объекта: А = {х„цх(х1)|х1 еу.Д< 1 <п} и В = {у1,ц8(у,)|у1 е1|/2Д<!<т}.

Тогда можно определить отношение нечетких объектов следующим образом: Лг(-В) = ((х,,уДцг(хз)(х„уЛ, где (х.^еу, х у2(\|/-модель ПО).

Функция принадлежности й)(х, у) представляет степень ассоциации между атрибутами двух объектов модели ПО. Данный формализм можно обобщить для случая п-арных связей, включающих п нечетких объектов. Обозначим множество объектов Л:

Л = {А„А2,А3,...,А11},где

Рис. 1. Семантическая сеть А, = {х, ц,х (х)|х е у, ,1 < 1 < п}.

Функция отношения для п объектов следующая:

а'гС5,Л) = Iх.>ХД ^ - 4

(Аь А2, Аз, ..., А„) - группа объектов, коллективные характеристики которых представляют единый суперобъект О. В нечетком окружении О представляется нечетким объектом: О = (А1,цх(А1]|А1 € Г2Д <1 <п где

£1 = и^ и \|/,--некоторая модель ПО: А, = {х,цх(х)|х е ц/,Д <1 <п}.

Объект в: семантической сети представляется следующим образом (рис.2): в; = {I, Р, и^, Т}, где I - название объекта ПО (заголовок темы для поиска или документа); Р - множество понятий, входящих или связанных с объектом; ио!={ и®Р} - множество отношений между понятиями Р и названием объекта I, представляет собой Рис.2. Пример внутреннего нечеткое подмножество, которое представления темы и документа показывает степень зависимости между объектом и понятием (степень зависимости определяет близость понятия и объекта ПО); Т - тип объекта, определяет два вида объекта ПО: Т={1ь 12}, где 11 - объект ПО - тема поиска, \2 - объект ПО - документ.

и®р определяется как ¡у* = (ц[7(, (р,,/)]^ е Р,1ев,), ] = 1...П, где Pj -

•понятие, принадлежащее объекту в;, п — количество' понятий в объекте. Таким образом, объект ПО в; соответствует объекту 5, с неопределенными и фиксированными атрибутами и можно записать:

= .....Р„,1р1,...Л,>и,(1.'Р').....-"о.Мп)}}. гДе Ъ

информационная часть ¡-ого объекта, Р,- - множество понятий, принадлежащих ¡-му объекту, Ц - тип объекта ПО, (I,, Р,) - отношение

близости понятия Р| и названия объекта I;.

Зависимость между узлами будет строиться на основе взаимосвязи между понятиями объектов ПО. Далее введем нечеткое отношение ирц=Цз(Р;, определяющее меру близости понятий между собой.

На его основе формируется нечеткое подмножество 11р:

ир = {Рь Р], |Л5(Р,-, Р^) I Р|бР, Р;€Р, ¡0 = 1 ...И}, где N - количество понятий в ПО интеллектуальной информационно-поисковой системе. При формировании отношений между понятиями выделяем три свойства:

1) синонимичность: УР;е8, цв(Р» Р:) = 1,

2) симметричность: УР^Б, УР2е8, ^(Р,, Рг) = Цб(Р2, Р0,

3) положительные значения: УР^Б, \/Р2еЗ, ц8(Рь Рг) ^ 0.

Соотношения между темами, а также между темой и документами и

вычисляются с использованием зависимости между отдельными понятиями, принадлежащими темам и документам (и={Ц,}).

1 и , " <

11ц = —, где Цщ - среднее отношение близости между понял/И /,, 4,т

тиями, принадлежащими 1 и ] объекту ПО, п - количество понятий в ¡-м объекте ПО, т - количество понятий в >м объекте ПО. При выборе необходимой темы для поиска из ИИПС используются отношения близости между понятиями (и) и отношения близости между понятиями, принадлежащими теме, и информационной частью темы (иур). В свою очередь документы из ПО группируются согласно выбранной теме для их дальнейшего анализа.

ИИПС работает с несколькими моделями ПО, взаимосвязанными или не связанными между собой, причем каждая модель строится на основе отдельной семантической сети. Для универсальной алгебры во второй главе определены множество операций и множество отношений между семантическими сетями и между элементами семантической сети.

В третьей главе представлена структура ИИПС, в которой имеются следующие блоки: база знаний, модель пользователя, модель действий пользователя, механизм логического вывода, модуль приобретения знаний, интерфейс пользователя, интерфейс инженера по знаниям.

Механизм логического вывода строится на основе анализа экспертной информации и теории принятия решений. Принятие решения о выдаче пользователю информации (документов) состоит из следующих этапов: генерация возможных вариантов и их оценка; согласование решений; анализ динамики развития ситуации; выбор решения. В диссертации применен метод выбора по отношениям предпочтения. Он определяется содержательным представлением о понятии «предпочтения» выбора из двух объектов. G¡>Gj при в;, Gj е Бда содержательно интерпретируется как «ва-

риант Gj предпочтительнее, чем вариант Gj>>. Построим функцию отношения предпочтения. С использованием этой функции и критериально-экстремизационных механизмов выбора определяется последовательность выдачи документов пользователю.

Сначала определим функцию предпочтения S,(k, Г). Для характеристики меры близости объекта Gk к G/ используется функция близости f,(k,/), определяющая степень близости документа Gk по отношению к документу G/. Функция указывает степень уверенности в том, что Gk ближе к теме Gj, чем G;. Для формирования отношения предпочтения введем три пороговых значения и определим относительно i-й темы следующее:

• |-ijk > цу + tiP - показывает, что Gk ближе G/, где tp - порог предпочтения;

• (jjk > цу + tj1 - Gk по крайней мере не ближе G/, где t1 -порог безразличия;

• > цу + t;v - Gk значительно ближе G;, где tv - порог запрещения, Hik - значение отношения близости i-й темы к k-му документу.

Отношение предпочтения на паре альтернатив (Gk, G/) определим

j

следующим соотношением: S,{k,l) = Y_,wjgJ(kj), где wj - весовой коэффици-

1-1

ент, определяющий значимость j-ro понятия для i-й темы, gj - функция предпочтения по j-критерию для пары альтернатив (Gk, Gj), которая определяется соотношением: £,(&,/)= <) еСШ >

[0 в противном случае,

где |jjk, (Jj; являются близостью к j-му понятию k-го и /-го документа соответственно и вычисляются следующим образом:

= — £ (wm, Pm )), где M — количество понятий, принадлежа-

M m-I

щих k-му документу, HS(P,, Рт)_ отношение близости между j-м и m-м понятиями, wm - весовой коэффициент, определяющий значимость ш-го понятия для k-го документа.

В процессе работы пользователя с системой происходит формирование модели пользователя (МП) и создание его модели действий. Под МП понимают знания ИИПС о пользователе, необходимые для организации процесса выборки и выдачи ему информации. МП представляет собой сетевую модель - граф, узлы которого соответствуют понятиям, а дуги - отношениям между ними. МП описывается семантической сетью, структура которой изоморфна структуре семантической сети ПО. Первоначально модель пользователя представляет собой тему для поиска и множество понятий с весовыми коэффициентами, определяющими важность (значимость) указанного понятия для пользователя:

МП = < G', U' >, где G' — множество объектов модели пользователя, U' - множество дуг, связывающих объекты модели пользователя. Когда пользователя интересует следующая тема для поиска, происходит изменение модели пользователя: МП = МП„ © Gb где МПп - модель пользователя на предыдущем шаге, Gi - объект предметной области выбранный

пользователем, операция ® означает добавление вершины в семантическую сеть. Значение веса понятия в МП вычисляется как среднее значение близости понятия пользователю \уп| на предыдущем шаге и близости понятия к информационной части объекта : \у;=(\уП1+ )/2. Объект, выбранный пользователем, исключается из дальнейшего рассмотрения. Аналогичные изменения с моделью пользователя происходят, когда найден документ согласно запросу пользователя. Далее на основе понятий, принадлежащих модели пользователя, формируются отношения имп! между темами для поиска, документами семантической сети ПО и моделью пользователя.

Модель действий пользователя представляется упорядоченной последовательностью вида титг,...,тк,...,тп,ъ которой каждый элемент тк есть модель пользователя, изменяющаяся в зависимости от действий пользователя. Возможны две интерпретации модели поведения пользователя: древовидная структура при поиске документов и линейная упорядоченная последовательность при ознакомлении пользователя с ПО.

Для поиска документа ИИПС использует критериально-экстремизационный механизм выбора. При этом на основе сформированной функции предпочтения строится числовая ось ф, на которой отображается множество найденных документов. Оценка фмп(Ск) определяет меру

близости найденного документа к запросу пользователя:

.11 . .

Рмп^к)-^™^™^.Лр,'ру)> гДе -I _ количество понятий, принадлежащих

модели пользователя, I - количество понятий, принадлежащих документу С3ь - значимость понятия в модели пользователя, - значимость понятия в документе, ц§(Рь Р]) - близость ¡-го понятия к .¡-му. Чем больше значение фмп(Ск), тем документ ближе к запросу и тем больше значимость документа для пользователя. Приписанное документу число фмп(Ск) назовем его критериальной оценкой, а полученную шкалу - критериальной.

Множество документов, удовлетворяющих условию тах (р{Ок) и

имеющих максимальную критериальную оценку при сравнении со всеми другими вариантами документов, принадлежащих модели ПО, включается в список найденных документов. Оценочную функцию Фмп(С) можно использовать двумя способами. При расширенном поиске для целевого списка понятий устанавливается коэффициент аь а для остальных — а2. Значение коэффициента а2 = 1-а,, а] изменяется в пределе от 0 до 1 и задается пользователем во время расширенного поиска:

{Э|, если /-ей _/' - е понятия принадлежат целевому списку понятий; а2, если / — ей ] — е понятия не принадлежат целевому списку понятий. При ординарном поиске рассматриваются понятия только из списка

П ы

понятий темы поиска. Документы, не содержащие понятия из темы, исключаются из рассмотрения (см. рис. 3).

{1, если г—е и ]—е понятия принадлежат целевому списку понятий;

л

О, если 1-е и ]—е понятия не принадлежат целевому списку понятии.

Используя оценочную функцию Фмп(Ок), из последовательности найденных документов в можно выделить группу документов, удовлетворяющих запросу пользователя. Максимальное значение оценочной функции (фпих) будет у темы поиска. При вьщелении группы документов используем порог безразличия ^ и сформируем интервал [фтюН'.Фпмх], на основе которого определим множество документов [Х^, в^] для предоставления их пользователю. В ПО существует несколько тем для поиска, согласно им происходит группирование документов.

Алгоритм выбора документов в пространстве семантической сети ИИПС следующий: 1) модель ПО разбивается инженером по знаниям на

темы поиска; 2) с использованием функции оценки Ф создается группа документов, близких к заданной теме; 3) центром каждой образованной группы является тема поиска, с ней идет сравнение документов из группы. В качестве характеристики "отклонение документа" в группе используем среднюю сумму квадратов отклонений от темы поиска:

ЛГ.-1

Поиск ira теме G2, целевые понзггтг Рь Р4, Р,

- - ординарный поиск документ G, не

------- расширенный поиск документ G3 анализируется "

1 ■> 1 f

J 1-1 )

где £ - среднее отклонение документов в группах от темы поиска, .1 - количество тем поиска в модели

Рис.3. Пример представления семантической сети ИИПС с использованием списка целевых понятий

ПО, ^ - количество документов в уй теме, срп(С;) - нормализованная оценочная функция близости документов к теме поиска.

Iм 1 ' ( \ (рг ) = —У ус/—У и>„иДР,, Р ), где М - количество понятий в теме поиска, М Т

Lt

Ь - количество понятий в документе Ок.

Пользователь определяет значимость найденного документа. Удовлетворительный ответ увеличивает значимость понятий в модели пользователя, отрицательный - уменьшает:

и», =— (и-, +а-/лс(/, Р,)), где wi - значимость 1-го понятия для пользователя, Цо(1, Р;) - близость понятия к найденному документу, а=1 - документ соответствует запросу пользователя, а=0 - документ не соответствует запросу.

Изменение модели пользователя в процессе работы с ИИПС. Использование критериально-экстремизационных механизмов выбора и группирования документов согласно темам поиска позволит для конкретного пользователя выбрать из базы знаний множество наиболее релевантных документов.

В четвертой главе приводится практическая программная реализация ИИПС. В качестве примера использования результатов диссертационного моделирования ПО была спроектирована ИИПС «АпИеЪ), в состав которой входит три подсистемы: подсистема поиска информации в вычислительной сети; подсистема приобретения знаний; подсистема поиска информации в базе данных.

Подсистемы поиска информации в вычислительной сети. Процесс поиска протекает автоматизировано, без участия пользователя или инженера по знаниям, что выгодно отличает данную систему от аналогичных. Каждый документ из набора найденных в сети частично индексируется и записывается в базу знаний.

Алгоритм индексации документа:

1)В индексируемом документе подсчитывается общее количество слов (Мело«)- Подсчитывается сумма слов, исключая стоп-слова. Стоп-слова - это предлоги, союзы, частицы, междометия и т.п. (например: в, на, а, но, ли).

2) Затем для индексации берутся те понятия, которые входят в предметную область, перечень которых закладывает эксперт (в базе знаний помимо самого понятия хранится нормализованная основа слова [42]).

3) Подсчитывается количество повторений каждого понятия, встречающегося в индексируемом документе (N0. Для этого каждое слово в документе, исключая стоп-слова, приводится к нормализованной основе и сравнивается со списком понятий ПО (для нормализации основы слова используется готовая программа).

4) Далее вес каждого понятия Pi= N1 / Ысл0В в индексируемом документе, полный путь к документу, название, текущая дата записываются в БД. Этот подход сокращает размеры БД и увеличивает скорость получения искомых документов пользователем.

Подсистема приобретение знаний. В ИИПС задача инженера по знаниям сводится к описанию ПО посредством составления иерархии тем поиска. Основная задача интерфейса инженера по знаниям — это определение отношений близости между заданными понятиями в различных темах поиска ПО, а также определение отношений близости между темами поиска. Система позволяет проводить интервьюирование инженера по знаниям, структурировать и формализировать знания, заполнять базу знаний, а также учитывать неформальные аспекты инженерии знаний.

В диссертации предложена модификация классической методики сопоставления объектов, примененная в оценочной решетке Келли, где используется геометрическая модель шкалирования. На плоскости, заданной граничными условиями, размещаются образцы понятий, и на основе анализа их расположения строятся взаимоотношения между ними. При создании модели ПО могут оказаться несравниваемые понятия, которые нельзя располагать на одной плоскости. Избавиться от этого недостатка позволяет введение дополнительных плоскостей на основе формирования многослойной оценочной решетки Келли. Понятия, не поддающиеся сравнению, размещаются на различных слоях решетки. Используя различные слои и граничные условия, можно более точно определить близость понятий. Для расчета близости понятий Р] и Р2, расположенных в многослойной решетке Келли с координатами (хь у,) и (х2, у2) соответственно, использовались следующие формулы и обозначения:

• если х( = х2 и у) = у2, то Цв(Рь Р2)= 1 - понятия совпадают по смыслу;

• если Х( * х2 или у| ^ у2 и понятия Р| и Р2 принадлежат одному слою, то

, где Хщах и Ушах - максимальное значение ко-

ординат репертуарной решетки;

• если XI * х2 или у! * у2 и понятия Р1 и Р2 не принадлежат одному слою, то |д.з(Рь Рг) =0 - понятия противоположны по значению или несравнимые;

• если XI х2 или у! ^ у2 и понятия Р1 и Р2 принадлежат не одному слою,

то ц5 (Р,, Р2) = — . Р2) > где п _ количество слоев репертуарной решет-

п м

ки с Р] и Р2, ^.(Рь Р2) -отношение близости понятий 1-го слоя решетки.

Подсистема поиска информации в базе данных. Поиск информации осуществляется после выбора существующей модели пользователя или создания модели нового пользователя. После определения этой модели формируется запрос на выбор рабочей модели ПО и модели ПО для конкретного пользователя. Затем осуществляются выбор темы для поиска и определение множества понятий, входящих в данную тему. Пользователь может ввести набор интересующих его понятий для поиска, тогда система предоставит ему наиболее подходящие темы поиска. Система предоставляет ранжированный список найденных документов, хранящихся в базе знаний, а также близкие по смыслу темы поиска. Выбранный документ удаляется из модели ПО и включается в модель пользователя. В зависимости от результата выбора меняются значимости понятий для пользователя.

С помощью ИИПС «Ап№Ь> можно создавать, изменять и тестировать информационно-поисковые базы знаний, основанные на семантической сети. Информационно-поисковая база знаний может быть использована для поиска информации-в' вычислительных сетях, в локальных сетях и в массивах данных (библиотечный учет), а также для построения систем объяснения (помощь к программным системам), обучающих и консультирующих систем (справочник, энциклопедия).

Пользователь

Архитектура ИИПС, построенная с учетом архитектуры систем управления знаниями и архитектур поисковых систем, применяемых в вычислительных сетях, представлена на рис.4.

Результаты опытного внедрения показали, что разработанная интеллектуальная информационно-поисковая система "Ап№1" позволяет эффективнее и качественнее находить информацию, необходимую пользователям, что подтверждает достоверность проведенных теоретических исследований и практике. 4. Архитектура ИИПС ческую значимость работы.

В заключении проводится обобщение основных результатов диссертационной работы.

В приложениях приводятся таблица сравнительных характеристик поисковых систем, описание структуры базы знаний, результаты практической реализации ИИПС, а также представлены копии актов о внедрении результатов диссертации и копия свидетельства об официальной регистрации разработанной программы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1) Исследованы характеристики современных поисковых систем и систем управления знаниями. Описаны проблемы построения систем поиска информации на основе использования систем управления знаниями. Рассмотрены значение экспертных систем при разработке систем управления знаниями и основные способы построения экспертных систем как элемента системы управления знаниями. Выявлены их достоинства и недостатки.

2) Рассмотрены современные направления искусственного интеллекта в области поиска информации, а также особенности работы интеллектуальных поисковых систем и их недостатки. Сформулированы основные требования к системам этого типа.

3) Проанализированы составляющие основных моделей представления знаний, используемых при построении систем управления знаниями, выявлены их достоинства и недостатки для использования в информационном поиске. Дано определение универсальной алгебры, используемой для формализации представления модели знаний. Показана эффективность "нечетких множеств, используемых для обработки неопределенности и приблизительных рассуждений при создании модели знаний. Описаны достоинства использования нечетких множеств в обработке модели знаний для информационного поиска.

4) Построена оригинальная семантическая сеть информационно-поисковой базы знаний с использованием универсальной алгебры и нечетких множеств, позволяющая установить взаимосвязи между различными темами для поиска в модели предметной области и понятиями, включенными в данные темы. Определены отношения и операции над семантическими сетями информационно-поисковой базы знаний, дающие возможность создавать модели предметных областей, описываемые в терминах семантической сети, а также позволяющие разбивать и объединять построенные модели предметных областей.

5) Разработан новый механизм логического вывода, используемый для поиска информации, позволяющий определять на основе модели пользователя и модели действий пользователя множество наиболее релевантных документов для конкретного пользователя.

6) Проанализированы основные виды архитектур моделей пользователя, выявлены их достоинства и недостатки, предложена новая архитектура модели пользователя для интеллектуальной информационной поисковой системы, описаны ее основные положительные свойства.

7) Предложен механизм построения модели действий пользователя для интеллектуальной информационной поисковой системы, описаны принципы ее построения, в частности формирование древовидной структуры для пользователя. Получена модель действий пользователя, позволяющая увеличить эффективность поиска информации для пользователя.

8) Разработаны способы поиска информации с использованием модели пользователя на основе применения критериально-экстремизационных механизмов выбора, позволяющие с высокой достоверностью определять наиболее релевантные из найденных документов, а также применять расширенный поиск. Разработан алгоритм группировки документов согласно теме поиска, выбранной пользователем.

9) Описана новая методика извлечения знаний на основе многослойных репертуарных решеток Келли, позволяющая наиболее адекватно представить отношения понятий в предметной области интеллектуальной информационной поисковой системы. Разработана ИИПС "AnNet" v.l.03, реализующая поиск информации в вычислительной сети согласно запросу пользователя.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Крошилин A.B. Некоторые аспекты задачи построения автоматизированной поисковой системы// Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 10-й Международной науч.-техн. конф. Рязань: РГРТА, 2001. С.195-196.

2. Крошилин A.B. Основные механизмы поиска в информационных сетях// Микроэлектроника и информатика 2002: Сборник тезисов докладов 9-й Всероссийской межвуз. науч.-техн. конф. М.: МИЭТ, 2002. С.428.

3. Крошилин A.B. Основные механизмы поиска в информационных сетях// Новые информационные технологии в научных исследованиях и в образовании: Сборник тезисов докладов 7-й Всероссийской науч.-техн.

конф. студентов, молодых ученых и специалистов. Рязань, 2002. С.22-23

4. Крошилин A.B. Принципы построения интеллектуальных поисковых программ в информационных системах управления// Реформы в России и проблемы управления: Сборник тезисов докладов 16-й Всероссийской научной конференции молодых ученых и студентов. М.: ГУУ, 2001. С.68.

5. Крошилин A.B. Проблемы поиска информации при использовании интеллектуальных поисковых программ// Новые информационные технологии: Сб. научн. тр. Рязань: РГРТА, 2001. С.85-89.

6. Крошилин A.B., Крошилин C.B. Интеллектуальные агенты как средство поиска в глобальных сетях// Математическое и программное обеспечение вычислительных систем: Межвуз. сб. научн. тр. Рязань: РГРТА, 2001. С.107-110.

7. Крошилин A.B., Крошилин C.B. Исследование проблем поиска информации машинами поиска// Математические методы и информационные технологии в экономике, социологии и образовании: Сб. материалов международной науч.-техн. конф. В 2 частях. Часть 1. Пенза: Приволжский дом знаний, 2001. С.78-80.

8. Крошилин AB. Некоторые аспекты построения запроса пользователя в интеллектуальной поисковой системе// Новые информационные технологии: Межвуз. сб. науч. трудов. Рязань: РГРТА, 2002. С.117-119.

9. Крошилин A.B. Построение интеллектуальной поисковой системы с применением семантической сети, основанной на универсальной алгебре// Инновационные процессы в управлении предприятиями и организациями: Сб. статей международной науч.-практ. конф. - Приволжский дом знаний, 2002. С.434-436.

Ю.Крошилин A.B., Крошилин C.B. Преимущества и недостатки существующих поисковых систем// Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. тр. Рязань: РГРТА, 2002. С.52-55.

11.Крошилин A.B. Применение семантической сети для описания предметной области в интеллектуальной поисковой системе// Проблемы передачи и обработки информации в сетях и системах телекоммуникации: Материалы 11-й Международной науч.-техн. конф. Рязань: РГРТА, 2002. С. 126-129.

12.Крошилин A.B. Интеллектуальная информационно-поисковая система "AnNet"» (ИИПС "AnNet") / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, №2003611163 от 19.05.2003.

13.Крошилин C.B., Крошилин A.B. Маркетинговые информационные системы// Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. тр. Рязань: РГРТА, 2002. С.46-52.

КРОШИЛИН Александр Викторович

РАЗРАБОТКА И АНАЛИЗ ИНТЕЛЛЕКТУАЛЬНЫХ ПРОГРАММ ИНФОРМАЦИОННОГО ПОИСКА В ВЫЧИСЛИТЕЛЬНЫХ СЕТЯХ НА ОСНОВЕ УНИВЕРСАЛЬНЫХ АЛГЕБР

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано в печать 27.06.03. Формат бумаги 60x84 1/16. Бумага газета. Печать трафаретная. Усл. печ. л. 1,0. Уч.-изд. Л. 1,0. Тираж 100 экз.

Рязанская государственная радиотехническая академия. 390005, Рязань, ул. Гагарина, 59/1.

« 1593 3

Оглавление автор диссертации — кандидата технических наук Крошилин, Александр Викторович

ВВЕДЕНИЕ.

ГЛАВА 1. СИСТЕМЫ ПОИСКА ИНФОРМАЦИИ.

1.1. Поиск информации в вычислительных сетях.

1.1.1. Основные понятия поиска информации.

1.1.2. Проблемы и задачи поиска информации.

1.1.3. Этапы поискового процесса.

1.1.4. Общая архитектура и механизм поиска.

1.2. Анализ существующих поисковых систем.

1.2.1. Поисковые системы, базирующиеся на запросах.

1.2.2. Поисковые системы, базирующиеся на классификационных списках.

1.2.3. Мета-поисковые системы.

1.2.4. Недостатки существующих поисковых систем.

1.3. Интеллектуальные информационно-поисковые системы.

1.3.1. Развитие направлений интеллектуального поиска.

1.3.2. Применение интеллектуальных информационных поисковых систем для поиска информации.

1.3.3. Функции экспертной системы в интеллектуальных поисковых системах.

1.3.4. Общая архитектура экспертной системы.

Основные результаты.

ГЛАВА 2. ИНТЕЛЛЕКТУАЛЬНАЯ ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА, ОСНОВАННАЯ

НА СЕМАНТИЧЕСКИХ СЕТЯХ.

2.1. Модели представления знаний.

2.1.1. Логические модели. ь 2.1.2. Семантические сети.

2.1.3. Фреймы.

2.1.4. Продукционные системы.

2.1.5. Нейронные сети.

2.2. Универсальная алгебра описания предметной области.

2.2.1. Определение универсальной алгебры.

2.2.2. Нечеткие множества.

2.2.3. Нечеткие объекты.

2.3. Применение семантической сети для описания предметной области.

2.3.1. Описание семантической сети.

2.3.2. Определение операций на множестве элементов семантической сети.

2.3.3. Определение операций над семантическими сетями.

2.3.4. Определение отношений между элементами семантической Щ сети.

2.3.5. Определение отношений на семантических сетях.

Основные результаты.

ГЛАВА 3. ПОИСК ИНФОРМАЦИИ В ИНТЕЛЛЕКТУАЛЬНОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ.

3.1. Механизм логического вывода.

3.1.1. Генерация возможных вариантов и их оценка.

3.1.2. Согласование решений.

3.1.3. Анализ динамики развития ситуации.

3.1.4. Выбор решения.

3.2. Модель пользователя.

3.2.1. Понятие модели пользователя вИИПС.

3.2-2. Формирование модели пользователя.

3.2.3. Сетевая модель пользователя в ИПС.

3.2.4. Типы моделей пользователя интеллектуальной информационно-поисковой системы.

3.3. Модель действий пользователя.

3.3.1. Поиск документов.

3.3.2. Знакомство с предметной областью.

3.4. Применение модели пользователя для поиска информации

3.4.1. Оценочная функция.

3.4.2. Расширенный поиск.

3.4.3. Ординарный поиск.

3.4.4. Распределение документов в пространстве ПО.

Основные результаты.

ГЛАВА 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЫ.

4.1. Основные задачи, реализуемые программным пакетом.

4.1.1. Проектирование системы поиска информации.

4.1.2. Проектирование подсистемы поиска информации в вычислительной сети.

4.1.3. Проектирование подсистемы приобретения знаний.

4.1.4. Технические и программные средства для создания и функционирования ИИПС.

4.2. Описание реализации ИИПС.

4.2.1. Способ построения подсистемы поиска информации в вычислительной сети.

4.2.2. Особенности работы ИИПС в сети со стандартными поисковыми машинами. Ill

4.2.3. Описание базы данных.

4.2.4. Проектирование подсистемы приобретения знаний.

4.3. Принципы функционирования ИИПС.

4.3.1. Определение наименования модели предметной области.

4.3.2. Выделение и ввод понятий с отношениями между ними.

4.3.3. Ввод тем для поиска и определение принадлежащих им понятий.

4.3.4. Поиск информации интеллектуальной поисковой системой 121 Основные результаты.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Крошилин, Александр Викторович

Актуальность проблемы

В настоящее время глобальные сети включают в себя большой объем динамически изменяющейся информации и развиваются весьма бурными темпами. Для того чтобы как-то упорядочить этот непрерывный поток данных, а самое главное дать возможность пользователям сети находить нужную информацию, были созданы специальные поисковые системы. Развитие данных систем идет по пути автоматизации информационного поиска, и главным критерием при этом является увеличение релевантности найденной информации.

На современном этапе к ряду проблем поиска информации в вычислительных сетях можно отнести следующие.

• Временные затраты: в результате автоматизированного поиска в сети, согласно запросу, пользователь получает большое количество ссылок, просмотр которых занимает много времени, и даже простой выбор необходимой информации зачастую представляет собой нелегкую задачу.

• Экономические затраты: большие временные затраты невыгодны с экономической точки зрения для пользователей, подключенных в лимитном режиме. Кроме того, некачественные связь и линии также затрудняют работу и увеличивают трафик.

• Неэффективность поиска при работе группы пользователей, осуществляющих поиск информации по одинаковой тематике: каждому приходиться просматривать и анализировать одну и ту же информацию, при этом затрачивается время для работы в сети.

• Нерациональность и непоследовательность действий пользователей при поиске информации.

• Трудности при составлении запросов: пользователь часто не может строго определить цель поиска и использует нечетко определенные понятия.

Вместе с тем, следует отметить недостатки существующих поисковых систем.

• Относительно низкая релевантность поиска в результате неучета в системах взаимодействия элементов информации между собой и отношения пользователя к знанию.

• Неспособность к самообучению (неумение системы адаптироваться к потребностям пользователя и стилю его работы).

Пользователю во время процедуры поиска информации необходимо определиться с темой для поиска, согласно которой затем выявить ключевые понятия поиска и их значимость.

В рассматриваемой области можно использовать наиболее известные результаты: концепции построения поисковых систем (особенно гибридные системы поиска информации, такие как «порталы»), теоретические концепции моделей представления знаний, построения экспертных систем, универсальных алгебр, нечетких множеств и применения теории выбора. Эти вопросы освещены, в частности, в работах Поспелова Г.С., Поспелова Д.А., Мальцева А.И., Кона П., Попова Э. В., Минского М. Л., Айзермана М.А., Нильсона Н., Глуш-кова В.М., Саати Т., Заде Л., Кофмана А. и др. Теория поиска информации представлена в работах Крейнеса М.Г., Дубинского А. Г., Кузнецова С.В., Се-мененко А.В., Осикова Г.С и др.

Использование формального подхода к построению модели предметней области для информационного поиска и описание предметной области (ПО) с помощью тем являются малоизученной проблемой. Решение этой проблемы позволит не только упростить идентификацию свойств модели предметной области, но и облегчить процесс обработки и поиска информации, необходимой пользователю. Математическим аппаратом автоматизации решения упомянутых проблем являются семантические сети, универсальные алгебры и нечеткие множества, позволяющие автоматизировать процесс поиска информации, а также процесс построения и обработки модели предметной области.

В диссертации предлагаются новый подход к построению и обработке модели предметной области для систем обработки знаний, ориентированных на поиск информации, а также новый подход к созданию интеллектуальных поисковых систем в вычислительных сетях.

Целью работы являются разработка и анализ интеллектуальных поисковых программ в вычислительных сетях на основе универсальных алгебр.

С учетом цели, в работе поставлены следующие задачи исследования:

• определение формальной модели построения предметной области с применением темы для поиска, используемой при создании интеллектуальной поисковой системы;

• создание моделей пользователей, применяемых при поиске информации, и их анализ;

• описание новых механизмов логического вывода, используемых при поиске информации в вычислительных сетях;

• создание методики извлечения знаний для формирования персональной модели знаний пользователя с целью повышения релевантности поиска;

• формирование проектных решений по программной реализации компонентов интеллектуальной поисковой системы.

Методы исследования. Исследования осуществлялись на основе теории универсальных алгебр, теории множеств, теории нечетких множеств, теории принятии решений, методов структурного и объектно-ориентированного программирования.

Научная новизна. Предложена принципиально новая концепция генерации возможных альтернатив выбора документов. В основе данной концепции используется гипотеза о подобии, заключающаяся в поиске документов и тем, базовые понятия которых наиболее близки по смыслу понятиям заданной темы.

Основу предложенной концепции составили:

1) методика построения модели предметной области на основе семантической сети информационно-документальной базы знаний и темы поиска;

2) основные принципы построения механизма логического вывода для выбора информации согласно запросу пользователя, основанного на теории принятия решений;

3) методология поиска информации, необходимой пользователю в базе знаний, и методология пополнения этой базы из вычислительной сети;

4) алгоритм индексации найденного документа согласно ключевым понятиям из предметной области;

5) механизм извлечения знаний эксперта, основанный на многослойных репертуарных решетках Келли.

Практическая ценность. Результаты работы являются основой для проектирования интеллектуальных поисковых систем. Предложенные в диссертации формализм и методы позволяют производить поиск документов согласно запросу пользователя и представлять их в виде ранжированного списка по степени релевантности с осуществлением индексации документа.

Результаты диссертации нашли отражение в реальной программной системе "AnNet" v.1.03, предназначенной для поиска информации в вычислительных сетях.

Разработанные средства могут быть приняты за основу при создании интеллектуальных поисковых систем, машин поиска, машин поиска каталогового типа и систем управления знаниями, используемых для поиска информации в распределенных информационных системах, глобальных и локальных сетях типа Internet и Intranet.

Внедрение результатов. Теоретические и практические результаты диссертационной работы внедрены (приложение 5):

• в Рязанском центре научно-технической информации,

• компьютерной фирме ЗАО «Рязань Онлайн»,

• учебном процессе Рязанской государственной радиотехнической академии.

Программный продукт имеет свидетельство об официальной регистрации программы для ЭВМ №2003613612, Россия. Интеллектуальная информационно-поисковая система "AnNet" (ИИПС "AnNet"). Зарегистрировано в РОСПАТЕНТ 22.05.2003, заявка №2003613612.

Структура диссертационной работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы и приложений.

Заключение диссертация на тему "Разработка и анализ интеллектуальных программ информационного поиска в вычислительных сетях на основе универсальных алгебр"

Основные результаты работы состоят в следующем.

1. Исследованы характеристики современных поисковых систем и систем управления знаниями. Описаны проблемы построения систем поиска информации на основе использования систем управления знаниями. Рассмотрено значение экспертных систем при разработке систем управления знаниями и основные способы построения экспертных систем как элемента системы управления знаниями. Выявлены их достоинства и недостатки.

2. Рассмотрены современные направления искусственного интеллекта в области поиска информации, а также особенности работы интеллектуальных поисковых систем и их недостатки. Сформулированы основные требования к системам этого типа.

3. Проанализированы составляющие основных моделей представления знаний, используемых при построении систем управления знаниями, выявлены их достоинства и недостатки для использования в информационном поиске. Дано определение универсальной алгебры, используемой для формализации представления модели знаний. Показана эффективность нечетких множеств, используемых для обработки неопределенности и приблизительных рассуждений при создании модели знаний. Описаны достоинства использования нечетких множеств в обработке модели знаний для информационного поиска.

4. Построена оригинальная семантическая сеть информационно-поисковой базы знаний с использованием универсальной алгебры и нечетких множеств, позволяющая установить взаимосвязи между различными темами для поиска в модели предметной области и понятиями, включенными в данные темы. Определены отношения и операции над семантическими сетями информационно-поисковой базы знаний, дающие возможность создавать модели предметных областей, описываемые в терминах семантической сети, а также позволяющие разбивать и объединять построенные модели предметных областей.

5. Разработан новый механизм логического вывода, используемый для поиска информации, позволяющий определять на основе модели пользователя и модели действий пользователя множество наиболее релевантных документов для конкретного пользователя.

6. Проанализированы основные виды архитектур моделей пользователя, выявлены их достоинства и недостатки, предложена новая архитектура модели пользователя для интеллектуальной информационной поисковой системы, описаны ее основные положительные свойства.

7. Предложен механизм построения модели действий пользователя для интеллектуальной информационной поисковой системы, описаны принципы ее построения, в частности формирование древовидной структуры для пользователя. Получена модель действий пользователя, позволяющая увеличить эффективность поиска информации для пользователя.

8. Разработаны способы поиска информации с использованием модели пользователя на основе применения критериально-экстремизационных механизмов выбора, позволяющие с высокой достоверностью определять наиболее релевантные из найденных документов, а также использовать расширенный поиск. Разработан алгоритм группировки документов согласно теме поиска, выбранной пользователем.

9. Описана новая методика извлечения знаний на основе многослойных репертуарных решеток Келли, позволяющая наиболее адекватно представить отношения понятий в предметной области интеллектуальной информационной поисковой системы. Разработана ИИПС "AnNet" v. 1.03, реализующая поиск информации в вычислительной сети согласно запросу пользователя.

Основные обозначения и сокращения

• БД - база данных;

• ИИ - искусственный интеллект;

• ИИПС - интеллектуальная информационно-поисковая система;

• ИИС - интеллектуальная информационная система;

• ИС - инструментальные средства;

• ПО - предметная область;

• ПС - поисковая система;

• СУЗ - системы управления знаниями;

• ЭС - экспертные системы.

Заключение

Выполненная диссертационная работа включает исследования, направленные на разработку математического и программного обеспечения для систем управления знаниями на основе семантических сетей для построения интеллектуальных информационных поисковых систем.

Библиография Крошилин, Александр Викторович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Benett J., Engelmore R. Experience Using EMYCIN// Rule-Based Expert Systems, Reading. Addison-Wesley (Mass.), 1984.

2. Adamo J.-M. Data mining for association rules and sequential patterns: sequential and parallel algorithms. N.Y.; Berlin; Heidelberg: Springer, 2002.

3. Cohen Gideon David. Intelligent information retrieval system// Vigil, №2, 2000.

4. Daniel E. O'Leary. Knowledge-Management Systems: Converting and Connecting// IEEE Intelligent systems. 1998. №3. P. 30- 33.

5. Daniel E. O'Leary. Using AI in Knowledge Management: Knowledge Bases and Ontologies// IEEE Intelligent systems. 1998. №3. P. 34 39.

6. David J. Skyrme Valuing Knowledge: Is It Worth It?// Managing Information. №2. 1998. P. 24-26.

7. Denning S. What is knowledge management? A background document to the World Development Report, The World Bank: 1998. 19 p.

8. Didier Dubois & Henri Prade Fuzzy Set Modelling in Case-Based reasoning// International Journal of intelligent systems. 1998. Vol. 13/ P. 345 373.

9. Dieter F. Ontology-Based Knowledge Management// IEEE Computer Society. 2002. №11.

10. Han J., Chen-Chuan Chang K. Data Minning for Web Intelligence// IEEE Computer Society. 2002. №8.

11. Highland F. Embedded AI// IEEE Expert. 1994. №3. P. 18 20.

12. James R. Natural language method and system for searching for and ranking relevant documents from a computer database// Univ. № 5. 2000.

13. James R. System for searching relevant documents // Univ. № 2. 2001.

14. Khoroshevsky V.F., Maikevich N.V. Intelligent Processing Of Web-Resources: Ontology-Based Approach and Multiagent Support, Accepted to

15. CEEMAS'99, St.-Peterburg, June 1999.

16. Marianne Broadbent. Phenomenon of Knowledge Management: What Does It Mean To The Information Profession?// Information Outlook. Vol.5. №5, 1998. P. 23-36.

17. Missikoff M., Velardi P. Integrated Approach to Web Ontology Learning and Engineering// IEEE Computer Society. 2002. №9.

18. Muller В., Reinhardt J. Neural networks. Springer-Verlag. 1990. 267 p.

19. Newell A. Heuristic Programming: Ill-Structured Problems// Progress in operation research, New York, Wiley & Sons. V.3, 1969. P. 362-414.

20. Ohkubo Masaaki, Sugizaki Masayuki, Inoue Takafumi, Tanaka Kazuo. Information associating apparatus and method// Nippon Telegraph and Telephone Corp. № 9 2000.

21. Ronald R.Y. Database Discovery Using Fuzzy Sets// International journal of intelligent systems. 1996. Vol. 11, P. 697 712.

22. S. Chakrabarti, B. Dom, D. Gibson, J. Kleinberg, S.R. Kumar, P. Raghavan, S. Rajagopalan, A. Tomkins. Hypersearching the Web // Scientific American 2000. June.

23. Sleeman D., Brown J.S. Assessing aspects of competence in basic algebra/ Intelligent Tutoring Systems. N.Y.: Academic press, 1982. P. 185 199.

24. Sullivan D. Document warehousing and text mining. N.Y.; Weinheim: Wiley, 2002.

25. Wynne-Jones М. Node splitting: A constructive algorithm for feed-forward neural networks// Neural Computing and Applications. V.l. No. 1. 1993. P.17-22.

26. Айзерман M.A., Алексеров Ф.Т. Выбор вариантов: основы теории. М.: Наука. 1990. 240 с.

27. Александров В.В., Булкин Г.А., Поляков А.О. Автоматизированная обработка информации на языке предикатов. М.: Наука, 1982.

28. Анил К. Джейн, Жианчанг Мао, Моиуддин К. М. Введение в искусственные нейронные сети// Открытые системы. 1997. №4. С. 16 24.

29. Антонов А.В., Курзинер Е.С. Автоматическое определение тематики большого необработанного текстового массива// Научно-техническая информация. 2002. №11. 31 е.

30. Асаи К, Ватада Д., Иваи С. и др. Прикладные нечеткие системы: пер. с япон. -М.: Мир, 1993. 386 с.

31. Бадекин Б.И. Абстрактная машина открытого типа: принцип устройства, логика предикатов, примеры задач. М.: Моск. гос. инж.-физ. ин-т (Техн. ун-т), 1997. 154 с.

32. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. СПб.: Питер, 2001.

33. Богданов А.В. Система конструирования интеллектуальных программ -СКИП// Региональная информатика 96: Тез. докл. 5-й С.-Петербург, междунар. конф. С.-Петербург, 1996. С. 76.

34. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М.: Мир, 1983. 228 с.

35. Болдырева В.Е., Гальченко B.C., Любимский Э.З. Концепция документной информационной системы, основанной на объектно-ориентированной модели предметной области// Техническая кибернетика. 1994. №2. С. 25-32.

36. Булюков Б.М., Грищенко С.Г., Евхаритская Е.С. Дополнительные механизмы представления знаний в семантическом блоке// Методы и системы принятия решений. Системы, основанные на знаниях. Рига: Риж. политехи. ин-т, 1989.

37. Буч Г. Объектно-ориентированное проектирование с примерами применения. М.: Конкорд, 1992. 519 с.

38. Быков В.А., Дудин Е.Б., Мельникова М.М. Принцип составления списков основных ключевых слов по различным отраслям науки и техники// Научно-техническая информация. 2002. №12. 20 с.

39. Вагин В.Н. Дедукция и обобщение в системах принятия решений. М.: Наука, 1988. 384 с.

40. Вагин В.Н. Параллельная дедукция на семантических сетях// Изв. АН СССР. Техн. кибернетика. 1986. №5. С. 51 61.

41. Вагин В.Н., Кикнадзе В.Г. Дедуктивный вывод на семантических сетях всистеме принятия решений// Изв. АН СССР. Техн. кибернетика. 1984. №5. С. 128- 134.

42. Ватлин С.И., Мороз С.М. Концептуальная кластеризация понятийный подход к анализу и представлению данных. Минск: ВИНИТИ, 1989. 19 с.

43. Ващенко Н.Д. Формирование понятий в семантических се-тях//Кибернетика. 1983. №2. С.

44. Вейшедл P.M. Представление знаний и обработка естественных язы-ков//ТИИЭР. 1986. Т.74. №7.

45. Воинов В.А., Гаврилова Т.А. Инженерия знаний и психосемантика: об одном подходе к выявлению глубинных знаний// Техническая кибернетика. 1994. №5. С. 5- 13.

46. Вольфенгаген В.Э., Яцук В .Я. Алгебра на фреймах для манипулирования знаниями// Изв. АН СССР. Техн. кибернетика. 1984. №5. С. 4 14.

47. Вопросы кибернетики: Логика рассуждений и моделирование/ Под ред. Д.А. Поспелова М.: Научный совет по комплексной проблеме «Кибернетика» АН СССР, 1983. 171 с.

48. Гаврилова Т.А., Зудилова Е.В. Концептуальное проектирование интерфейсов для систем приобретения знаний// Техническая кибернетика. 1994.№2. С.З- 11.

49. Танеев P.M. Проектирование интерактивных Web-приложений: Учебное пособие. М.:Горячая линия-Телеком,2001. 272 с.

50. Глушков В.М., Цейтлин Г.Е., Ющенко E.J1. Алгебра. Языки. Программирование /Институт кибернетики АН УССР. Киев: Наук, думка, 1989. 376 с.

51. Головина Е.Ю. Объектно-ориентированный подход к моделированию предметной области// Техническая кибернетика. 1994. №2. С. 43 47.

52. Гречко В.О., Капитонова Ю.В., Погребинский С.Б. Инструментальный комплекс сетевых семантических баз данных и знаний// Управляющиесистемы и машины. 1993. №3. С. 68 76.

53. Джексон Г. Проектирование реляционных баз данных для использования с микроЭВМ; Пер. с англ. М.: Мир, 1991. 252 с.

54. Дородницын А.А. Информатика: предмет и задачи// Кибернетика. Становление информатики. М.: Наука, 1985. С. 22-28.

55. Дубинский А. Г. Структура автоматизированной системы поиска информации в сети Интернет // Тезисы доклада на международной научно-методической конференции "Компьютерное моделирование". Днепродзержинск. 1999.

56. Дюран Б., Оделл П. Кластерный анализ / Пер. с англ. Е.З. Демиденко. Под. ред. А .Я. Боярского. М.: Статистика, 1977. 128 с.

57. Епифанов М.Е. Индуктивное обобщение в ассоциативных сетях// Изв. АН СССР. Техн. кибернетика. 1984. №5. С. 132 145.

58. Ефимова С.М., Суворов Е.В. Модель П-графов для представления знаний и способ ее аппаратной реализации на основе метода МЗ// Изв. АН СССР. Техн. кибернетика. 1986. №2. С. 32 47.

59. Забежайло М.И. Финн В.К. Интеллектуальные информационные системы// Междунар. форум по инф. и док. 1996. №2. С. 11 17.

60. Заде J1. Понятие лингвистической переменной и его применение к принятию приближенных решений/ Пер. с англ. Н.И. Ринго. М.: Мир, 1976. 168 с.

61. Змитрович А.И. Интеллектуальные информационные системы. Минск: ТетраСистемс, 1997. 368 с.

62. Искандеров Ю.М. Использование семантических графов для построения информационной модели предметной области// Региональная информатика 96: Тез. докл. 5-й С.-Петербург, междунар. конф. С.-Петербург, 1996. С. 51.

63. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертныесистемы: Справочник/ Под ред. Э. В. Попова. М.: Радио и связь, 1990. 464 с.

64. Искусственный интеллект: В 3 кн. Кн. 2. Модели и методы: Справочник/ Под ред. ДА. Поспелова. М.: Радио и связь, 1990. 304 с.

65. Каширин И.Ю. Формальные программные машины для исследования автоматизированных продукционных систем // Вычислительные машины, комплексы и сети: Межвуз. сб. научн. тр. Рязань: РГРТА, 1999. С. 100102.

66. Каширин И.Ю. Формальный анализ эвристических программ // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 9-й Международной науч.-техн. конференции. Рязань: РГРТА, 2000. 125-127 с.

67. Каширин И.Ю., Коричнев Л.П. Основы формального анализа интеллектуальных программных систем. М.: Радио и связь, 1997. 160 с.

68. Каширин И.Ю. Объектно-ориентированное проектирование программ в среде С++. Вопросы практики и теории/ Под ред. Л.П.Коричнева. М.: Госкомвуз России. НИЦПрИС, 1996. 192 с.

69. Каширин И.Ю., Маликова Л.В., Маркова В.В. Основы формальных систем: Учебное пособие/ Под ред. И.Ю. Каширина. М.: НИЦПрИС, 1999. 80 с.

70. Клещев А.С. Представление знаний в человеко-машинных и робототех-нических системах. М. .'ВИНИТИ, 1984.

71. Клоксин У., Мелиш X., Программирование на языке Пролог/ Пер. с англ. А.В. Горбунова, М.М. Комарова. М.: Мир, 1987. 336 с.

72. Кон П. Универсальные алгебры/ Под. ред. А.Г. Куроша. М.: Мир, 1968. -351 с.

73. Кострикин А.И. Введение в алгебру. Основы алгебры. М.: Физматлит, 1994. 320 с.

74. Кофман А. Введение в теорию нечетких множеств: Пер. с франц. М.: Радио и связь, 1982. 432 с.

75. Крошилин А.В. Некоторые аспекты задачи построения автоматизированной поисковой системы// Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 10-й Международной науч.-техн. конф. Рязань: РГРТА, 2001. С. 195-196.

76. Крошилин А.В. Основные механизмы поиска в информационных сетях// Микроэлектроника и информатика 2002: Сборник тезисов докладов 9-й Всероссийской межвуз. науч.-техн. конф. М.: МИЭТ, 2002. С. 128.

77. Крошилин А.В. Проблемы поиска информации при использовании интеллектуальных поисковых программ// Новые информационные технологии: Сб. научн. тр. Рязань: РГРТА, 2001. С.85-89.

78. Крошилин А.В. Свидетельство об официальной регистрации программыдля ЭВМ №2003611163, Россия. Интеллектуальная информационно-поисковая система "AnNet" (ИИПС "AnNet"). Зарегистрировано в РОСПАТЕНТ 19.05.2003, заявка №2003613612.

79. Крошилин А.В., Крошилин С.В. Интеллектуальные агенты как средство поиска в глобальных сетях// Математические и программное обеспечение вычислительных систем: Межвуз. сб. научн. тр. Рязань: РГРТА, 2001. С.107-110.

80. Крошилин А.В., Крошилин С.В. Некоторые аспекты построения запроса пользователя в интеллектуальной поисковой системе// Новые информационные технологии: Межвуз. сб. науч. трудов. Рязань: РГРТА, 2002. С.117-119.

81. Крошилин А.В., Крошилин С.В. Преимущества и недостатки существующих поисковых систем// Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. тр. Рязань: РГРТА, 2002. С.52-55.

82. Крошилин С.В., Крошилин А.В. Маркетинговые информационные системы// Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. тр. Рязань: РГРТА, 2002. С.46-52.

83. Кузин JI.T. Основы кибернетики: В 2-х т. Т. 1. Основы кибернетических моделей. М.: Энергия, 1979. 438 с.

84. Кузин JI.T. Основы кибернетики: В 2-х т. Т. 2. Основы кибернетических моделей. М.: Энергия, 1979. 584 с.

85. Кузнецов Б.П. Оптимизация продукционной базы знаний по достоверности и длительности вывода// Изв. РАН. Теория и системы управления. 1996. №5. С. 45-50.

86. Кузнецов И.П. Семантические представления. М.: Наука, 1985.

87. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. М.: Энергоатомиздат, 1988. 480 с.

88. Кузнецов С.В. Распределенные интеллектуальные сети// Открытые системы. 2002. №12. 74-75 с.

89. Логический подход к искусственному интеллекту: от классической логики к логическому программированию: Пер. с франц./ Тейз А., Грибомсч П., Луи Ж. и др. М.: Мир, 1990. 432 с.

90. Лозовский B.C. Семантические сети// Представление знаний в человеко-машинных и робототехнических системах. М.: ВИНИТИ, 1984. С. 84 -120.

91. Лорьер Ж.-Л. Системы искусственного интеллекта: Пер. с франц. М.: Мир, 1991.568 с.

92. Крейнес М.Г. Информационная технология смыслового поиска и индексирования текстовой информации в электронных библиотеках: ключи от текста, автореферат//Научный сервис в сети Интернет, конф., Новороссийск, 1999.

93. Маккалок У.С., Поте У. Логическое исчисление идей, относящихся к нервной деятельности. Автоматы. И.: 1956.

94. Маковский В.А., Похлебаев В.И. Базы знаний (экспертные системы). -М.: Издательство стандартов, 1993. 37 с.

95. Мальцев А.И. Алгебраические системы. М.: Наука, 1970. 392 с.

96. Мачераускас В.Ф. Фреймовая модель знаний в системах управления качеством// Изв. АН СССР. Техн. кибернетика. 1982. №5. С. 166 172.

97. Минский М. Л. Фреймы для представления знаний. М.: Энергия, 1979. 151 с.

98. Неусыпин К.А. Направления развития интеллектуальных систем// Автоматизация и современные технологии. 2002. №12. 12-15 с.

99. Нильсон Н. Принципы искусственного интеллекта: Пер. с англ. М.: Радио и связь, 1985. 372 с.

100. Орлов Н.Ю. Логический вывод в ассоциативных схемах// Изв. АН СССР. Техн. Кибернетика. 1984. №5. С. 121 131.

101. Осипов Г.С. Система приобретения знания SIMER+MIR// Программные продукты и системы. 1990. №3.

102. Петрушин В.А. Экспертно-обучающие системы. Киев: Наук, думка,1992. 196 с.

103. Плесневич Г.С. Концептуальные схемы и модели данных// Изв. АН СССР. Техн. кибернетика. 1984. №5. С. 23 39.

104. Плесневич Г.С. Представление знаний в ассоциативных сетях// Изв. АН СССР. Техн. кибернетика. 1982. №5. С. 6 22.

105. Попов Э.В. Динамические интеллектуальные системы в управлении и моделировании. М.: МИФИ, 1996.

106. Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. 320с.

107. Попов Э.В. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987. 288 с.

108. Поспелов Г.С., Искусственный интеллект основа новой информационной технологии. М.: Наука, 1988. 278 с.

109. Поспелов Г.С., Поспелов Д.А. Искусственный интеллект прикладные системы// Новое в жизни, науке и технике. (Серия Математика, кибернетика). 1985. №9. М.: Знание. МДНТП. 48 с.

110. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энергоатомиздат, 1981. 231 с.

111. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. М.: Радио и связь, 1989. 182 с.

112. Представление знаний в человеко-машинных и робототехнических системах/ Том В. Инструментальные средства разработки систем, ориентированных на знания. (Отчет рабочей группы РГ-18 КНВВТ.) М : ВИНИТИ, 1984. 288 с.

113. Представление знаний в человеко-машинных и робототехнических системах/ Том С. Прикладные человеко-машинные системы, ориентированные на знания. (Отчет рабочей группы РГ-19 КНВВТ.) М.: ВИНИТИ, 1984. 270 с.

114. Представление знаний в человеко-машинных и робототехнических системах/Том А. Фундаментальные исследования в области представления знаний. (Отчет рабочей группы РГ-18 КНВВТ.) М.: ВИНИТИ, 1984. 290 с.

115. Принятие решений и анализ экспертной информации/ Вопросы кибернетики. М.: ВИНИТИ, 1989. 180 с.

116. Розенблатт Ф. Принципы нейродинамики. М.: Мир, 1965. 480 с.

117. Рот М. Интеллектуальный автомат: компьютер в качестве эксперта: пер. с нем. М.: Энергоатомиздат, 1991. 80 с.

118. Саати Т. Принятие решений. Метод анализа иерархий: Пер. с англ. М.: Радио и связь, 1993. 320 с.

119. Семененко А.В. Сравнение и анализ различных программных решений в области поиска данных// Научно-техническая информация. 2002. №12. 28-32 с.

120. Смальян Р. Теория формальных систем. М.: Наука, 1981. 207 с.

121. Сопатый П.С. Об эффективности структурной реализации операций над семантическими сетями// Изв. АН СССР. Техн. кибернетика. 1983. №5. С.128 134.

122. Страуструп Б. Язык программирования С++, спец.изд./ Пер. с англ. М.; СПб.: Издательство БИНОМ «Невский Диалект», 2002. 1099 е., ил.

123. Степанов В.К. Русскоязычные поисковые механизмы в Internet// Computerworld. №11. 1977.

124. Терехина А.Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986. 167 с.

125. Толковый словарь по искусственному интеллекту/ А. Н. Аверкин, М. Г. Гаазе-Рапопорт, Д. А. Поспелов. М.: Радио и связь, 1992. 256 с.

126. Трахтенгерц Э.А. Компьютерная поддержка решений. М.: СИНТЕГ, 1998. 376 с.

127. Удавиченко М.Ф. Строим алгоритмы. М.: СТУ, 1990. 78 с.

128. Уинстон П. Искусственный интеллект/ Пер. с англ. B.JI. Стефанюка. М.: Мир, 1980. 519 с.

129. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика: Пер. с англ. М.: Мир, 1992. 240 с.

130. Уотермен Д. Руководство по экспертным системам: Пер. с англ. М.:Мир, 1989.388 с.

131. Уэно и Исидзука. Представление и использование знаний: Пер. с япон. М.: Мир, 1989. 220 с.

132. Факторный, дискриминантный и кластерный анализ: Сборник/ Пер. с англ. A.M. Хотинского, С.Б. Королева; Под. ред. И.С. Енокова, М.: Финансы и статистика, 1989. 215 с.

133. Харламов А.А., Самаев Е.С., Рябов Г.Н. Многомодульные семантические представления на основе нейронных сетей// Информационные технологии. 2001. №4. 14-18 с.

134. Хорошевский В.Ф. Программные средства представления знаний. В кн.: Искусственный интеллект. Книга 3. Программные и аппаратные средства. М.: Радио и связь, 2000. С. 7-17.

135. Хорошевский В.Ф., Гаврилова Т.А. Базы знаний интеллектуальных систем. СПб.: Питер, 2000. 220 с.

136. Ягджян В.Г., Джавян А.Ю. Методика построения интеллектуальной информационно-поисковой системы, основанной на модульно-распределенной архитектуре// Научно-техническая информация. 2002. №2. 20-23 с.