автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Формирование информационного обеспечения распределенных систем поддержки принятия решений

кандидата технических наук
Рогов, Сергей Викторович
город
Красноярск
год
2008
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Формирование информационного обеспечения распределенных систем поддержки принятия решений»

Автореферат диссертации по теме "Формирование информационного обеспечения распределенных систем поддержки принятия решений"

Рогов Сергей Викторович

ФОРМИРОВАНИЕ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ РАСПРЕДЕЛЕННЫХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

05 13 01 - Системный анализ, управление и обработка информации (космические и информационные технологии)

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Красноярск - 2008

003167835

Работа выполнена в Сибирском государственном аэрокосмическом университете имени академика М Ф Решетнева

Научный руководитель:

кандидат технических наук, доцент Тяпкин Валерий Николаевич

Официальные оппоненты

доктор технических наук,

профессор Петров Михаил Николаевич

кандидат технических наук,

доцент Усачев Александр Владимирович

Ведущая организация Сибирский государственный технологический университет, г Красноярск

Защита состоится « 16 » мая 2008 года в 11 00 часов на заседании диссертационного Совета Д 212 249 02 при Сибирском государственном аэрокосмическом университете им академика М Ф Решетнева по адресу г Красноярск, пр им газ «Красноярский рабочий», 31

С диссертацией можно ознакомиться в библиотеке Сибирского государственного аэрокосмического университета

Автореферат разослан « 15 » апреля 2008 года

Ученый секретарь диссертационного совета

А А Ступина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы Информационные технологии и компьютерные информационно-поисковые сервисы занимают все более существенное место в современных системах поддержки принятия решений (QiliP), так как существенно возрастает потребность лица, принимающего решения (JlIJP), в оперативно доступных документах, данных, информационно-аналитических материалах, позволяющих как улучшить, так и ускорить процесс принятия решений Для корпораций, которые интенсивно взаимодействуют с зарубежными партнерами, характерен существенный рост объемов разноязычной информации в корпоративной сети, что приводит к формированию мультилингвистической среды информационного взаимодействия пользователей сети Поэтому неудивительно, что все больше внимания уделяется сетевым сервисам и ресурсам сети Internet, как обширному справочному инструменту, а также технологиям, активно использующим поисковых агентов Растет количество информационных ресурсов, предоставленных для открытого доступа, включая растущие объемы тематико-ориентированной информации по всевозможным предметным областям Так же развитие глобальной сети и широкие возможности подключения к ней обусловили увеличение числа корпоративных пользователей сети

Следовательно, существующая распределенная архитектура систем поддержки принятия решений (включая ресурсы сети Internet), требует специальной организации информационного обеспечения СППР, включая разработку новых методов его эффективного формирования В настоящее время существует ряд моделей и алгоритмов для представления информации в распределенных информационных системах Частным случаем подобных систем являются информационно-управляющие системы, корпоративные информационные системы и, конечно, интенсивно развивающиеся системы поддержки принятия решения Однако большинство моделей распределенных информационных систем строятся на основе одноязычного представления информации или учитывают многоязычность неявно

Поэтому, одним из перспективных направлений при разработке новых моделей и алгоритмов представления, поиска и обработки информации в распределенных СППР является применение \ многоязычных предметных словарей или мультилингвистических частотных тезаурусов Следует отметить, что в современных

информационных системах подобные словари-тезаурусы не имеют мультюшнгвистической частотной реализации.

Таким образом, диссертационное исследование направлено на решение следующей научной проблемы, включающей

- поиск тематико-ориентированной информации для формирования информационного базиса распределенных систем поддержки принятия решений,

- анализ информационного базиса с целью определения принадлежности его документов к предметной области, учитывающей возникающие требования лица, принимающего решения,

- анализ частотных характеристик при проведении поисковой процедуры и операций определения релевантности и ранжирования информации,

- разработку алгоритмов обработки информации с использованием как обычных мультилингвистических тезаурусов, так и частотных,

- разработку моделей и алгоритмов синтеза структуры распределенных систем поддержки и принятия решений

Наличие данных проблем, которые охватывают весь процесс формирования информационного обеспечения, включая поиск и обработку информации, в распределенных системах поддержки принятия решений, обуславливает актуальность диссертационной работы

Объектом диссертационного исследования является информационное обеспечение распределенных систем поддержки принятия решений

Предмет исследований - модели и алгоритмы формирования информационного обеспечения и структуры распределенных систем поддержки принятия решений

Цель диссертационной работы состоит в повышении эффективности формирования информационного обеспечения в распределенных системах поддержки принятия решений на основе мультилингвистических частотных тезаурусов

Поставленная цель достигается путем решения следующих

задач

- анализ компьютерных систем поиска/метапоиска и обработки информации в распределенных сетях,

- анализ структур и алгоритмов работы распределенных систем поддержки принятия решений,

- модификация и разработка новых алгоритмов поиска и обработки мультилингвистической информации в распределенных

СППР для обеспечения высокого уровня релевантности поисковых процедур,

- разработка модели формирования информационного обеспечения распределенной СППР на основе тезауруса,

- синтез структуры информационного обеспечения распределенной СППР на основе тезаурусов

Методы исследования. При выполнении работы использовались методы системного анализа, элементы теории множеств, методы измерения количественных и качественных показателей информационных систем, методы оптимизации, прикладной структурный анализ

Новые научные результаты, полученные лично автором:

- модель формирования информационного обеспечения в распределенных системах поддержки принятия решений на основе мультилингвистических тезаурусов,

- модификация модели формирования информационного обеспечения для распределенных систем поддержки принятия решений, имеющих мультилингвистический частотный тезаурус с весами,

модель синтеза структуры информационного обеспечения в распределенной системе поддержки принятия решений, использующей мультилингвистический частотный тезаурус,

- программный комплекс формирования информационного обеспечения систем поддержки принятия решения

Значение для теории. Результаты, полученные при выполнении диссертационной работы, имеют существенное значение для развития моделей и методов компьютерной обработки информации, а также создания специального математического и программного обеспечения систем поддержки принятия решений Практическая ценность.

Создан инструмент, обеспечивающий эффективное применение мультилингвистических тезаурусов как с частотными характеристиками, так и без них для формирования и управления многоязычным информационным базисом в распределенных системах поддержки принятия решений

Разработанные модели и алгоритмы поиска и обработки информации позволяют выполнить качественную подборку данных и документов, необходимых для составления и актуализации частотных мультилингвистических тематико-ориентированных тезаурусов и словарей, используемых в СППР предприятий и организаций

Реализация результатов работы

Работа выполнялась в рамках ряда проектов аналитической ведомственной целевой программы "Развитие научного потенциала высшей школы (2006-2008 и 2007-2008 годы)", в частности, РНП 2 2 2 3 9676 «Модельно-алгоритмическое обеспечение

мультилингвистической технологии интерактивного формирования многоязычных информационных ресурсов» и РНП 222 3 10144 «Программно-информационная технология интерактивного формирования многоязычных частотных словарей терминологической лексики»

В ходе работы над диссертацией реализованы три программные разработки, зарегистрированная в Отраслевом фонде алгоритмов и программ (ОФАП)

Разработанный автором диссертации модуль формирования информационного базиса систем поддержки принятия решений принят в опытную эксплуатацию на кафедрах Информатики, Информационных технологий и Юнеско НТиМ ФГОУ ВПО «Сибирский федеральный университет»

Апробация работы. Основные положения и результаты работы прошли апробацию на VII и 1Х-й Всероссийских научных конференциях с международным участием «Решетневские чтения» (Красноярск, 2003, 2005), на научно-технических конференциях преподавателей, аспирантов и студентов Красноярского филиала МЭСИ (2003-2007), на ГХ-й международной открытой научной конференции «Современные проблемы информатизации в технике и технологиях» (Воронеж, 2004), на Всероссийских научных конференциях Российской академии естествознания «Новые информационные технологии и системы» (Москва, 2007-2008) Докладывались на научно-технических семинарах Сибирского государственного аэрокосмического университета (2003-2008 гг)

Публикации. Основные результаты диссертационной работы опубликованы в 14 работах автора (общим объемом 3,9 авторского листа), список которых помещен в конце автореферата

Структура и объем работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка литературы из 138 наименований

СОДЕРЖАНИЕ РАБОТЫ

Во введении дана общая характеристика проблемы, обоснована актуальность темы диссертационной работы, сформулированы цель и решаемые задачи, выдвигаются основные

защищаемые положения, определена научная новизна результатов и их практическое значение.

В первом разделе вводятся основные понятия и терминология, используемые для описания организации работы распределенных систем поддержки принятия решений. Рассматриваются типовые архитектуры СГТПР, выделены четыре наиболее популярных типа архитектур:

- Функциональная СГТПР.

- Независимые витрины данных.

- Двухуровневое хранилище данных.

- Трехуровневое хранилище данных.

Выпонен анализ достоинств и недостатков рассмотренных архитектурных решений.

На рис.1 представлено наиболее интересное, но и наиболее технически сложное решение.

Рис. 1 - Трехуровневое хранилище данных.

Хранилище данных представляет собой единый централизованный источник многоязычной корпоративной информации. Витрины данных представляют подмножества данных из хранилища, организованные для решения задач отдельных

подразделений корпоративной информационно-управляющей системы (КИУС) Конечные пользователи имеют возможность доступа к детальным данным хранилища в том случае, если данных в витрине недостаточно, а также для получения более полной информации о состоянии бизнеса Следует отметить, что выбор той или иной архитектуры зависти от предпочтений группы разработчиков или от организационных или технических требований заказчика к подобным системам

Проведен анализ возможностей современных СППР на примере двух систем системы ПАРУС, которая относится к недорогим корпоративным распределенным системам, и Oracle, которая является наиболее дорогим решением для бизнеса Необходимо отметить, что применение таких систем значительно повышает как явную, так и неявную экономическую эффективность КИУС Так же следует учесть, что подобные системы не стоят на месте и постоянно развиваются В частности, концепция построения систем поддержки принятия решений, предлагаемая Oracle, объединяет все компоненты, необходимые для создания и управления Хранилищем Данных, а также для использования накопленной в нем информации

В качестве механизма хранения в реляционных Хранилищах и Витринах Данных используется сервер Oracle8i, в многомерных Витринах - Express Server Центральным инструментальным средством является Oracle Warehouse Builder, построенный на базе современной архитектуры Common Warehouse Metadata, который позволяет спроектировать структуру целевого Хранилища, создать процедуры извлечения, согласования и загрузки данных из различных источников и сгенерировать метаданные для средств доступа, таких как Discoverer и Express

Для проектирования Хранилища используется известный инструмент Oracle Designer, что позволяет автоматически перенести описание проекта в репозиторий метаданных Warehouse Builder Средства доступа к данным покрывают весь спектр аналитических задач для стандартной отчетности используется Reports, для генерации нерегламентированных отчетов и запросов - Discoverer, для сложного многомерного анализа - продукты семейства Express, а для задач «извлечения знаний» - Darwm Data Mining Suite Кроме того, существуют готовые аналитические приложения для решения специализированных задач - Sales Analyzer, Financial Analyzer, Activa и Balanced Scorecard В настоящее время готовятся к выпуску новые аналитические приложения, такие как Demand Planning, Value Based

Management и другие Конечные пользователи могут получать информацию как с помощью традиционных клиент-серверных технологий, так и в Интранет-архитеюуре с использованием масштабируемого сервера приложений Application Server

В результате проведенного анализа можно сделать вывод, что одной из слабых сторон информационного обеспечения корпоративных СППР является невозможность

мультилингвистического представления в ней информации, а так же отсутствие средств оптимизации распределенной информационной корпоративной структуры СППР Решение данных задач требует разработки моделей распределенных информационных структур СППР

Во втором разделе представлен обобщенный алгоритм работы поисковых процедур в информационных подсистемах распределенных СППР Показано, что в большинстве практических задач построения таких сложных систем, как распределенные системы поддержки принятия решений, значительные затруднения вызывает формирование информационного обеспечения СППР, т е синтез структур информационных подсистем, что объясняется большой специфичностью формального описания этих подсистем и выбором содержательных критериев синтеза, учитывающих особенности рассматриваемой задачи

Рассмотрена модель информационного обеспечения распределенной СППР с использованием тезаурусов и ее разновидность, учитывающая возможность задания весов, описывающих распределение информации Предлагаемая модификация модели направлена, в первую очередь, на обеспечение возможности многоязычного представления информации В современных СППР необходима разработка мультилингвистического тезауруса Г, где t:j - это /-Й терм в г-м языковом множестве (г=1, J и j= 1, , J) Для тезауруса Т в работе определены условия, обеспечивающие формирование множества синонимических дескрипторов тезауруса Т0, введено обобщающее отношение

Модель информационного обеспечения распределенной СППР с применением тезауруса можно представить в виде четверки (Т, D„ М„ ô ), где Г - мультилингвистический тезаурус с дескрипторным множеством Т0, D, - коллекции разноязычных документов, М, -множество разноязычных вопросов, ô - множество ответов, сопоставляющее каждому независимому от языковой принадлежности вопросу множество разноязычных документов

Описание любого документа 4 е Д может быть представлено

в виде

1

¡(с1!)={ Ъы, 1,1,2, , 1м}, ¿ЛЬ , Т, , Т = и Т, >

>=1

и оно удовлетворяет условию никакие два дескриптора не встречаются в одном / (й), если они удовлетворяют обобщающему отношению

Можно считать также, что каждый вопрос т, е М, представляется в форме, аналогичной описанию разноязычных документов

Ввиду того, что множество разноязычных документов информационного обеспечения распределенной СППР является объединением множеств разноязычных документов локальных систем (подсистем распределенной информационной системы), можно выразить ответ на запрос ЛПР к распределенной системе как результат некоторых операций над ответами от совокупности локальных систем

В распределенной системе 5 глобальный ответ на вопрос т,

будет объединением локальных к ответов §(т ) = и 8 к(т )

к '

Отметим одно важное свойство распределенной информационной системы распределенная информационная система обладает свойством включения, если множество вопросов частично упорядочено Свойство включения позволяет формулировать цепь ответов на цепь вопросов, уточняя ответы более специализированными вопросами

Таким образом, предлагаемая модель позволяет решить проблему организации, хранения и обработки мультилингвистической информации в распределенных СППР корпоративных ИУС

Для повышения эффективности и качества обработки информации предлагается использовать частотные мультилингвистические тезаурусы, в которых вводятся веса для каждого терма в каждом языковом множестве Рассматривается модель для произвольного _/-го языка (количество языков в обработке запроса ЛПР зависит от имеющегося мультилингвитического словаря и представленным в нем языковым многообразием) Значение веса соответствует объему информации, падающему на дескриптор (°иеТ0 Описание мультилингвистических документов СППР так же удовлетворяет свойству включения

В работе введено определение подобия вопросов и описаний документов В этом случае тезаурус с весами с дескриптовым

множеством Т0 с Т сопоставляет каждой паре (вопрос, точность

подобия р) множество пар (документ, мера корреляции) В определении ответа отношение подобия позволяет осуществлять выбор мультилингвистических документов, точность подобия которых не менее р> с Мера корреляции показывает, какая часть информации в документе соответствует ответу на запрос ЛПР

Таким образом, представленная мультилигвистическая модель позволяет составлять мультилингвистические ответы даже на одноязычные запросы ЛПР Процедура выполняется более гибко с учетом неопределенности описания как мультилингвистических документов, так и запросов ЛПР по сравнению с простой распределенной информационной системой

В третьем разделе представлены современные системы поддержки принятия решений на основе тезаурусов А так же показана модификация модели синтеза структуры распределенной СППР на основе тезауруса

При модификации модели синтеза структуры распределенных СППР на основе тезауруса, отражая современные условия, необходимо производить учет мультилингвистичности документов, представленных в сети корпоративной ИУС Важно, что в ходе поиска мультилингвистической информации появляется возможность формирования мультилингвистических запросов как в рамках одной поисковой процедуры, так и рамках нескольких одноязычных поисковых процедур, но выполненных с применением разных языковых множеств

Пусть 5} = (Т}, В р , М, ), J = ТГ " локальные

информационные системы, предназначенные для обеспечения функционирования сложной управляющей системы, состоящей из совокупности К объектов Коэффициент г отвечает за языковую принадлежность документа или запроса в рассматриваемой модели При этом мультгошнгвистическая информация каждой локальной информационной системы поступает в центр сбора информации для дальнейшей передачи ее управляющему органу Одна локальная информационная система может обслуживать несколько объектов

Распределенная информационная система Б определяется через локальные составляющие Фактически, распределенная информационная система выступает в роли центра сбора и обработки информации, т е обработки ответов на запросы управляющих органов распределенной СППР

Описание состояния каждого объекта представляется в виде своей информационной модели, где Т1 - тезаурус с дескрипторным

множеством Г0' , описывающий состояние 1-го объекта, -

коллекция возможных мультилингвистических документов, которые требуются органам управления для принятия решения, М1,

множество допустимых мультилингвистических запросов со стороны органов управления, те каждому мультилингвисическому запросу сопоставляется множество мультилингвистических документов Здесь индекс ] указывает, что информационная модель 1-го объекта сформирована ву-й локальной информационной системе

Информация об объектах представляется независимыми мультилинвистическими информационными моделями и вместе с тем она сосредоточена в одном месте, в одной «точке» Таким образом, информационные модели объектов являются подсистемами локальной системы, обслуживающей эти объекты Это дает возможность формулировать ответы на запросы, причем правильность ответа гарантируется свойствами распределенной системы обеспечивая запросы сложного типа, включающие в себя несколько дескрипторов

Считаем, что объем передаваемой информации на запрос т, из 7-й локальной информационной системы равен ат — Р(д;1(т1)), где

F - оператор преобразования информации к виду, предназначенному для передачи в каналы связи

Исходя из независимости мультилингвистических информационных моделей, ставится задача распределения объектов по локальным информационным подсистемам при множестве допустимых запросов в распределенной системе, на которые ответы формируются последовательно без повторения запросов Для удобства рассматривается одноязычный запрос, полагая при этом, что каждый запрос описывается одним дескриптором Требуется найти

\jlij~l 1=1 '=1 1=1 1=1 при ограничениях

£ х, = IVI 6 К.

Ы1

Здесь для формализации задачи введены обозначения су/ -стоимость сбора информации об 1-й объекте у-й локальной информационной системой, ¿у - стоимость передачи единицы информации об 1-м. объекте в центр из у-й информационной локальной системы, х}I - булева переменная, равна 1, если 1-й объект обслуживается у-й локальной информационной системой, и 0 - в противном случае

Ограничение требует обслуживания каждого объекта только одной информационной подсистемой Условие ограничивает количество объектов, подлежащих обслуживанию локальными подсистемами, либо, напротив, требует, чтобы их было не меньше заданного числа

В работе усложнено требование к распределенной системе Требуется, чтобы органы управления получали ответы на запросы даже в случае, если любая локальная информационная система перестанет функционировать Иначе говоря, возникает потребность в дублировании информации об объектах Постановка задачи меняется только в части, касающейся ограничения, которое принимает вид

£ х}1 =2\/1еК

3=1

Предложена дальнейшая модификация постановки задачи, учитывающая, что после закрепления объектов за локальными информационными системами в задаче минимазации перераспределения объектов не происходит Однако органам управления (или ЛПР) необходимо иметь информацию о предыдущих состояниях объектов даже после прекращения функционирования любой из локальных подсистем Это означает, что происходит дублирование информационных моделей об объектах постоянно в процессе их функционирования и информация локальных информационных систем перераспределяется между ними

Полагаем, что перераспределение информации осуществляется один раз Хотя в реальной ситуации информация о состоянии объектов передается по мере ее поступления на всем интервале времени функционирования локальных информационных систем, указанное ограничение не снижает общности рассуждений, так как полная постановка задачи потребует просто дополнительного суммирования по дискретным моментам времени

Вводятся следующие обозначения а,, - стоимость передачи единицы информации из у-й локальной информационной системы в я-ю, уР! — булева переменная, равна 1, если информация об 1-й объекте перераспределяется из у-й локальной информационной системы в 5-ю

Формулируется задача синтеза структуры распределенной информационной системы, на основе которой также можно сформулировать ряд задач, учитывающих те или иные требования, касающиеся структуры распределенной системы Для этого необходимо сформулировать требования в виде ограничений и ввести их в описание задачи

В работе проанализировано, что нового в постановку задач синтеза информационного обеспечения распределенных СППР вносит использование модели системы на тезаурусе с весами Главное достоинство этой модели, как уже отмечалось, состоит в возможности учета распределения информации по дескрипторам, описывающим документ, и тем самым, по сути дела, возможности оценки неопределенности в описании ответов на запросы со стороны органов управления

В реальных ситуациях при описании состояния объектов естественно ожидать, что разные локальные информационные системы, обеспеченные различными техническими средствами измерения и наблюдения за состоянием объектов, будут представлять не совпадающие между собой описания одних и тех же объектов Тогда при запросе органов управления о состоянии некоторого объекта локальные информационные системы дадут ответы с точностью подобия р Очевидно, что ряд показателей может быть использован для уточнения структуры распределенной системы, т е выбора такой структуры, которая бы обеспечивала получение ответов с максимальной мерой корреляции или с мерой корреляции, не менее заданной Последнее требование эквивалентно условию передачи информации с отвечающей запросу содержательной частью, не менее заданной Формализация этого условия применительно к постановке задачи минимизации состоит во введении дополнительных ограничений

В практических приложениях возможны и другие требования к точности получаемых ответов Необходимо только всегда четко представлять себе целесообразность использования тех или иных моделей и конечный эффект от их реализации

В заключение данного раздела необходимо отметить, что эффективность целевого применения распределенной СППР, поддерживающей мультилингвистичность представления

информации, также зависит не только от того, насколько удачно при синтезе были выбраны структура (включая, избыточность информационного обеспечения) и параметры системы, но и от того,

насколько рационально организована система контроля функционирования компонентов в процессе эксплуатации

Четвертый раздел посвящен программной реализации предложенных подходов и методов Представлены алгоритмы организации работы подсистем при обработке информации в распределенных СППР и результаты проведенных экспериментов

Если рассматривать функциональную структуру предлагаемых решений, то можно выделить две подсистемы, первая из которых отвечает за поиск качественной информации в корпоративной информационной сети (с возможностью подключения глобальной сети Ыегпе^ Так же данная подсистема производит определение релевантности документов, полученных в процессе проведения поисковой процедуры, и выполняет ранжирование полученных документов

Вторая подсистема отвечает за формирование структуры информационного обеспечения распределенной СППР Данная подсистема необходима при формировании или модификации структуры распределенной системы Это связано с тем, что необходимо учитывать возможности узлов хранения и обработки информации, а также затраты на трафик как внутренний, так и внешний

Обобщенный алгоритм работы поисковой подсистемы можно представить в соответствии с рис 2

Необходимо отметить, что система работает в четырех режимах

- Произвести поиск без использования тезаурусов

- Произвести поиск с использованием тезауруса.

- Произвести поиск с использованием частотного тезауруса

- Произвести поиск по уже анализируемому ранее запросу Как видно из рисунка, первый процесс при выполнении

поисковой процедуры - это процесс первичного анализа проблемы На данном этапе происходит задание начальных параметров поиска и инициализация поисковой процедуры Также на данном этапе выполняется выбор одного из четырех возможных путей реализации процедуры поиска

После того как будет выполнена поисковая процедура по одному из возможных вариантов, необходимо обработать полученные данные для определения уровня релевантности и ранжирования Следующим шагом предлагаемого алгоритма является просмотр полученных и обработанных данных ЛПР для выработки окончательной стратегии решения возникшей проблемы

1 Проведение гокжсеой грэцеддоы

ЕЕ-1

Внешние факторы

проблеме

Проблема уже решал за.

Пераяьый анагиз проблемы

-121 Проведение поисковой процедуры без ислэльзсва»« тез^рух»

пояжсвая система

На проблему (уцеств)ег

На проблем у с^еств^т часготи^йтезадас

14*

13* Проведение поиск свой лроцед>ры оигпспъэсважем теээруса

поюссвая система

Проведение по и« свой прсцедмыуие

проблемы

поисковая система

Преедени* поисковой фоцедурыс использованием частотного тез аудса

поисковая система

Мнакестео да*ых

Об ростка гслуч ежсго мюяества даных

Множество дажых

почасовая астема

Ретзние проблемы

Просмотр необходимых документов и принял« решения

ЛПР гхжжсеая сютема

Репееангные, гроранжцюааше документы

Рис 2 - Алгоритм работы поисковой подсистемы

На рис 3 представлены основные функции подсистемы синтеза структуры информационного обеспечения распределенной

стар

По сути, данную подсистему можно охарактеризовать как администраторскую Ее назначение - это администрирование не только системы поиска, но и всей корпоративной сети в целом Данная подсистема решает такие важные задачи как

- Учет структуры и синтаксиса информационного ресурса

- Анализ скорости передачи данных по каждому информационному ресурсу

- Подключение и/или модификация мультилингвистических тезаурусов

Учет структуры является важной функцией корпоративной информационно-управляющей системы, так как позволяет анализировать не только информационное обеспечение, но и характер сетевой структурной организации, а также оборудования на узлах сети

2 Сютез струп)ры распределенная системы годдерики принятия решений

21

ЕЕ-2

Ксрпоратюные уиформа^исиуые ресурсы и сеть 1г1егге{

. Дажые.

Указание струсгугы и синтаксиса жформациожого ресурса

-►} адмжисграгср

поисковая система

_22_

Анализ скорости передни

дажыхкэедого шфсмационнсго ресурса

поисковая система

ЕЕ-3

Лщо гр^мающее решение

Требсеа^епо

работес тезаурусами

Тезаурусы

ПодключенлэЛ/одуфикгция тезаурусся

адмюистрагор поисковая система

Рис 3 - Структура синтеза распределенной системы поддержки принятия

решений

Решение задачи анализа скорости передачи данных по каждому информационному ресурсу необходимо для того, что бы оценить затраты на обработку информации и загруженность сетевого трафика Имея эти данные, можно принимать решение о целесообразности обновления как коммуникационного оборудования, так и корпоративных серверов.

В рамках решения последней задачи выполняется

- Подключение новых тезаурусов

- Замена простых тезаурусов на частотные (по мере их формирования)

- Замена простых тезаурусов и частотных тезаурусов на мультилингвистические (также по мере их формирования)

- Формирование требований на составление новых тезаурусов по заданным проблемным областям ЛПР

По результатам проведенного в работе эксперимента сделаны следующие выводы

- предлагаемая технология позволяет производить поиск исходной информации для формирования информационного обеспечения распределенной СППР с охватом значительно большего сегмента сети Internet (за счет использования метапоисковой технологии активного поиска);

- уровень релевантности предлагаемой технологии значительно выше при поиске узкоспециализированной информации, чем у классической поисковой технологии, и сопоставим с поисковыми системами каталожного типа, за счет использования проверки уровня релевантности на основе узкоспециализированных частотных словарей,

- по качеству ранжирования информации предлагаемая технология работает значительно лучше, чем

• классические поисковые технологии сети Internet,

• метапоисковые сервисы сети Internet,

• не уступает, а зачастую, и значительно превосходит каталожные системы

В заключении представлены основные результаты и выводы по работе

1 Проведен анализ типовых структур и возможностей систем поддержки принятия решений, в результате которого можно сделать вывод о том, что в настоящее время недостаточно уделяется внимания проблеме мультилингвистичности представления информации в корпоративных информационных системах Так же можно указать на недостаточную разработку подходов к оптимизации структуры информационного обеспечения распределенной СППР корпоративного типа

2 Проведенный анализ показал, что существующие модели поиска и обработки информации в корпоративных информационно-управляющих системах, как правило, не позволяют эффективно решать задачи формирования многоязычного информационно-лингвистического базиса распределенных систем поддержки принятия решений

3 Предложены новые модели представления и обработки

мультилингвистической информации в распределенных информационных системах, обеспечивающие эффективное формирование информационно-лингвистического базиса распределенных систем поддержки принятия решений Модифицирована модель информационного обеспечения распределенной СППР, основанной на тезаурусе, а также учитывающая весовые коэффициенты терминов используемого мультилингвистического тезауруса Это позволяет ускорить работу как метопоисковых технологий, так и совершенствовать процесс разработки новых информационных коллекций для частотного информационно-лингвистического базиса СППР

4 Впервые предложена модель синтеза структуры информационного обеспечения распределенной системы поддержки принятия решений на основе мультшшнгвистичного тезауруса Значимость данного подхода в современных условиях очевидна, так как большинство крупных как российских, так и зарубежных компаний работают на международном рынке и, следовательно, при подготовке и принятии решений основываться только на одноязычных данных уже нецелесообразно

5 Предложена новая схема работы поисковой подсистемы распределенной СППР, основанной на мультилингвистических частотных тезаурусах, и использующей несколько режимов поиск как с частотными, так и без частотных характеристик, метапоиск с использованием тезаурусов для проверки релевантности и ранжирования, а так же проведение поисковой процедуры без использования тезаурусов вообще, что существенно увеличивает возможности предлагаемого решения по сравнению с аналогами

6 Разработана функциональная структура системы формирования и обработки информационно-лингвистического базиса распределенных систем поддержки принятия решений Система содержит два модуля информационно-лингвистическая поисковая подсистема и подсистема анализа/синтеза структуры В рамках разработанных программных систем реализованы предложенные модели и алгоритмы обработки информации

7 В ходе эксперимента получены результаты, которые демонстрируют существенно лучшее качество анализа документов на релевантность по сравнению с классическими поисковыми системами Также показано, что по сравнению с реализацией подхода, основанного на частотных мультилингвистических словарях, степень релевантности определяется незначительно хуже, однако это не снижает значение полученного результата, так как составление

тезаурусов значительно менее трудоемкая задача по сравнению с составлением мультилингвистических тематических словарей Качество ранжирования предлагаемых алгоритмов значительно превосходит качество ранжирования информации классическими поисковыми сервисами, не уступает поисковым системам каталожного типа и системе, построенной на базе тематических частных словарей

Таким образом, в данной диссертационной работе решена задача повышения эффективности формирования информационного обеспечения распределенных СППР на базе частотных мультилингвистических тезаурусов как с использованием ресурсов корпоративной сети, так и сети Internet, что имеет существенное значение для развития теории и практики решения задач анализа и обработки мультилингвистической информации

Публикации по теме диссертации:

1 Рогов, С В Мультилингвистическая модель распределенной системы на основе тезауруса / С В Рогов, П В Зеленков, И В Ковалев, MB Карасева//ВестникСибГАУ сб научн трудов -Красноярск СибГАУ,2008 -№1(18) - С 26-28

2 Рогов, С В Распределенные базы данных экономических систем / С В Рогов // Современные проблемы информатизации в технике и технологиях- сб научн трудов по итогам IX-й международной открытой конференции -Воронеж изд-во «Научная книга», 2004 - Вып 9 - С 5-7

3 Рогов, С В Защита систем электронного документооборота в сетях / С В Рогов // Материалы 9-й Всероссийской научной конференции «Решетневские чтения» - Красноярск СибГАУ, 2005 -С 129-131

4 Рогов, С В Применение поляризационного уплотнения в решающих модулях земных станций для систем спутниковой связи и вещания / С В Рогов, В Н Тяпкин // Материалы 7-й Всероссийской научной конференции «Решетневские чтения» - Красноярск СибГАУ, 2003 - С 80-81

5 Рогов, С В Архитектура метапоисковых систем / В В Кожевников, СВ. Рогов, СФ Шевчук // Вестник НИИ

работа, опубликованная в одном из ведущих рецензируемых научных журналов, рекомендуемых ВАК РФ для опубликования основных научных результатов диссертационных исследований

СУВПТ сб научн трудов - Красноярск НИИ СУВПТ, 2006 -Вып 24 - С 29-34

6 Рогов, С В Системная архитектура мультилингвистической адаптивно-обучающей технологии / С В Рогов, М А Селиванова // Вестник НИИ СУВПТ сб научн трудов -Красноярск НИИ СУВПТ, 2006 -Вып 24 - С 16-21

7 Рогов, С В Структура и принципы организации информационно-терминологического базиса распределенных систем поддержки принятия решений / С В Рогов, МА Селиванова // Вестник НИИ СУВПТ* сб научн трудов -Красноярск НИИ СУВПТ, 2006. -Вып 25 - С 22-26

8 Рогов, С В Многоэтапный синтез структуры систем передачи и обработки информации / С В Рогов // Вестник НИИ СУВПТ сб научн трудов - Красноярск НИИ СУВПТ, 2006 - Вып 25 - С 35-41

9 Рогов, С В Анализ взаимосвязей информационных структур при моделировании объектов, сред и процессов / С В Рогов // Вестник НИИ СУВПТ сб научн трудов - Красноярск НИИ СУВПТ, 2006 -Вып 25 - С 42-54

10 Рогов, С В Алгоритм работы поискового модуля в системах поддержки принятия решений / С В Рогов, ПВ Зеленков, ИВ Ковалев, MB Карасева // Материалы Всероссийской научной конференции «Новые информационные технологии и системы», 15-20 декабря 2007 - М РАЕ, 2007 - С 3-7

11 Рогов, С В Поиск и обработка информации на базе мультилингвистических тезаурусов / С В Рогов, ПВ. Зеленков, ИВ Ковалев, MB Карасева ¡1 Материалы Всероссийской научной конференции «Новые информационные технологии и системы», 15-20 февраля 2008 -М РАЕ, 2008,-С 33-35

Разработки, зарегистрированные в Отраслевом фонде алгоритмов и программ:

12 Рогов С В , Ковалев И В , Карасева М В., Царев Р Ю, Лохмаков ПМ Кроссплатформенная поискавая мультиагентная система («MAS Search ver 1 0») М ВНТИЦ, 2007 №50200701084

13 Рогов С В , Перлиев А Г , Чурмантаев Д М, Золотарев В В , Жуков В Г Информационно-образовательный сайт по безопасности информационных технологий М ВНТИЦ, 2006 №50200601395

14 Рогов СВ, Васякин ИН, Вдовиченко ВИ, Губанов В.В, Пригорнев С К Сайт дистанционной системы дополнительного профессионального образования М ВНТИЦ, 2008 № 50200800468

Рогов С.В.

ФОРМИРОВАНИЕ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ РАСПРЕДЕЛЕННЫХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Автореферат

Подписано к печати 14 04 2008 г Формат 60x84/16

Уч изд л 1.0

Тираж 100 экз

Отпечатано в СибГАУ 660014, г Красноярск, пр им газ «Красноярский рабочий», 31

Оглавление автор диссертации — кандидата технических наук Рогов, Сергей Викторович

Введение.

1 Распределенные системы поддержки принятия решений.

1.1 Понятие систем поддержки принятия решений.

1.2 Типовые архитектуры систем поддержки принятия решений.

1.3 Анализ возможностей современных систем поддержки принятия решений.

1.3.1 Система поддержки принятия решений - ПАРУС.

1.3.2 Система поддержки принятия решений на платформе Oracle.

Выводы по разделу 1.

2 Модель распределенных систем обработки информации.

2.1 Обобщенный алгоритм работы поисковых процедур в информационных подсистемах СППР.

2.2 Модели информационного поиска.

2.2.1 Общие сведения.

2.2.2 PageRing.

2.2.3 Алгоритм Клейнберга.

2.2.4 Латентно-семантический анализ.

2.2.5 Алгоритмы морфологического анализа текстов.

2.2.6 Модель ранжирования с использованием весов сайтов.

2.2.7 Модель распределенной системы на основе тезауруса.

2.2.8 Модификация модели распределенной системы на основе тезауруса.

2.2.9 Модель распределенной системы имеющей тезаурус с весами.

2.2.10 Модификация модели распределенной системы имеющей тезаурус с весами.

Выводы по разделу 2.

3 Система поддержки принятия решения на основе Информационнолингвистического базиса.

3.1 Общие положения.

3.2 Лексико-семантическая база данных типа WordNet для русского языка.

3.3 Тезаурус SDK.

3.4 Тезаурус RCO for Oracle.

3.5 Синтез структуры распределенной системы поддержки принятия решений на основе тезауруса.

3.6 Модификация синтеза структуры распределенной системы поддержки принятия решений на основе тезауруса.

Выводы по разделу 3.

4 Система информационно-лингвистическиого обеспечения распределенных систем поддержки принятия решений.

4.1 Функциональная структура систем.

4.2 Алгоритм работы поисковой подсистемы.

4.3 Функциональные возможности подсистемы синтеза структуры распределенной системы поддержки принятия решений.

4.4 Программная реализация поисковой подсистемы.

4.5 Эксперимент.

Выводы по разделу 4.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Рогов, Сергей Викторович

Информационные технологии и компьютерные информационно-поисковые сервисы занимают все более существенное место в современных системах поддержки принятия решений (СППР), так как существенно возрастает потребность лица, принимающего решения (ЛПР), в оперативно доступных документах, данных, информационно-аналитических материалах, позволяющих как улучшить, так и ускорить процесс принятия решений. Для корпораций, которые интенсивно взаимодействуют с зарубежными партнерами, характерен лавинообразный рост объемов разноязычной информации в корпоративной сети, что приводит к формированию мультилингвистической среды информационного взаимодействия пользователей сети. Поэтому неудивительно, что все больше внимания уделяется сетевым сервисам и ресурсам сети Internet, как обширному справочному инструменту, а также технологиям, активно использующим поисковых агентов. Растет количество информационных ресурсов, предоставленных для открытого доступа, включая растущие объемы тематико-ориентированной информации по всевозможным предметным областям. Так же развитие глобальной сети и широкие возможности подключения к ней обусловили увеличение числа корпоративных пользователей сети.

Следовательно, существующая распределенная архитектура систем поддержки принятия решений (включая ресурсы сети Internet), требует специальной организации информационного обеспечения СППР, включая разработку новых методов его эффективного формирования. В настоящее время существует ряд моделей и алгоритмов для представления информации в распределенных информационных системах. Частным случаем подобных систем являются информационно-управляющие системы, корпоративные информационные системы и, конечно, интенсивно развивающиеся системы поддержки принятия решения. Однако большинство моделей распределенных информационных систем строятся на основе одноязычного представления информации или учитывают многоязычность неявно.

Поэтому, одним из перспективных направлений при разработке новых моделей и алгоритмов представления, поиска и обработки информации в распределенных СППР является применение многоязычных предметных словарей или мультилингвистических частотных тезаурусов. Следует отметить, что в современных информационных системах подобные словари-тезаурусы не имеют мультилингвистической частотной реализации.

Таким образом, диссертационное исследование направлено на решение следующей научной проблемы, включающей:

• поиск тематико-ориентированной информации для формирования информационного базиса распределенных систем поддержки принятия решений;

• анализ информационно-лингвистического базиса с целью определения принадлежности его документов к предметной области, учитывающей возникающие требования лица, принимающего решения;

• анализ частотных характеристик при проведении поисковой процедуры и операций определения релевантности и ранжирования информации;

• разработку алгоритмов обработки информации с использованием как обычных мультилингвистических тезаурусов, так и частотных;

• разработку моделей и алгоритмов синтеза структуры распределенных систем поддержки и принятия решений.

Наличие данных проблем, которые охватывают весь процесс формирования информационного обеспечения, включая поиск и обработку информации, в распределенных системах поддержки принятия решений, обуславливает актуальность диссертационной работы.

Объектом диссертационного исследования является информационное обеспечение распределенных систем поддержки принятия решений.

Предмет исследований — модели и алгоритмы формирования информационного обеспечения и структуры распределенных систем поддержки принятия решений.

Цель диссертационной работы состоит в повышении эффективности формирования информационного обеспечения в распределенных системах поддержки принятия решений на основе мультилингвистических частотных тезаурусов.

Поставленная цель достигается путем решения следующих задач:

• анализ компьютерных систем поиска/метапоиска и обработки информации в распределенных сетях;

• анализ структур и алгоритмов работы распределенных систем поддержки принятия решений;

• модификация и разработка новых алгоритмов поиска и обработки мультилингвистической информации в распределенных СППР для обеспечения высокого уровня релевантности поисковых процедур;

• разработка модели формирования информационного обеспечения распределенной СППР на основе тезауруса;

• синтез структуры информационного обеспечения распределенной СППР на основе тезаурусов.

Методы исследования. При выполнении работы использовались методы системного анализа, элементы теории множеств, методы измерения количественных и качественных показателей информационных систем, методы оптимизации, прикладной структурный анализа.

Новые научные результаты, полученные лично автором:

• модель формирования информационного обеспечения в распределенных системах поддержки принятия решений на основе мультилингвистических тезаурусов; 6

• модификация модели формирования информационного обеспечения для распределенных систем поддержки принятия решений, имеющих мультилингвистический частотный тезаурус с весами;

• модель синтеза структуры информационного обеспечения в распределенной системе поддержки принятия решений, использующей мультилингвистический частотный тезаурус;

• программный комплекс формирования информационного обеспечения систем поддержки принятия решения.

Значение для теории. Результаты, полученные при выполнении диссертационной работы, имеют существенное значение для развития моделей и методов компьютерной обработки информации, а также создания специального математического и программного обеспечения систем поддержки принятия решений.

Практическая ценность.

Создан инструмент, обеспечивающий эффективное применение мультилингвистических тезаурусов, как с частотными характеристиками, так и без них для формирования и управления многоязычным информационным базисом в распределенных системах поддержки принятия решений.

Разработанные модели и алгоритмы поиска и обработки информации позволяют выполнить качественную подборку данных и документов, необходимых для составления и актуализации, частотных мультилингвистических тематико-ориентированных тезаурусов и словарей, используемых в СППР предприятий и организаций.

Реализация результатов работы

Работа выполнялась в рамках ряда проектов аналитической ведомственной целевой программы "Развитие научного потенциала высшей школы (2006-2008 и 2007-2008 годы)", в частности, РНП 2.2.2.3.9676 «Модельно-алгоритмическое обеспечение мультилингвистической технологии интерактивного формирования многоязычных информационных 7 ресурсов» и РНП 2.2.2.3.10144 «Программно-информационная технология интерактивного формирования многоязычных частотных словарей терминологической лексики».

В ходе работы над диссертацией реализованы программные разработки, зарегистрированные в Отраслевом фонде алгоритмов и программ (ОФАП).

Разработанная автором диссертации компьютерная система формирования информационного обеспечения распределенных СППР принята в опытную эксплуатацию на кафедрах Информатики, Информационных технологий и Юнеско НТиМ ФГОУ ВПО «Сибирский федеральный университет».

Основные тезисы, выносимые на защиту

1. Модифицированные модели и методики обработки информации, основанные на использовании корпоративных и Internet ресурсов, а также средств многоагентной поисковой и метапоисковой технологии на основе мультилингвистического тезауруса (как с частотной характеристикой, так и без нее), позволяют повысить эффективность формирования и качество полученного информационного обеспечения в распределенных системах поддержки принятия решений.

2. Модифицированная модель и методика синтеза структуры информационного обеспечения в распределенных системах поддержки принятия решений на основе тезаурусов, позволяет организовать многоязычное информационное взаимодействие ЛПР с распределенными ресурсами корпоративных информационно-управляющих систем.

3. Разработанная программная система обладает языковой универсальностью организации обработки информационных ресурсов корпоративных систем, что позволяет формировать информационное обеспечение СППР с заданным уровнем релевантности относительно мультилингвистических тематико-ориентированных запросов лиц, принимающих решения. Апробация работы. Основные результаты

Структура и объем работы. Диссертационная работа состоит из введения, четырех разделов, заключения и списка использованной литературы.

Заключение диссертация на тему "Формирование информационного обеспечения распределенных систем поддержки принятия решений"

Выводы по разделу 4

1. Разработана функциональная структура системы формирования и обработки информационно-лингвистического базиса распределенных систем поддержки принятия решений. Система1 содержит два модуля: информационно-лингвистическая поисковая-подсистема и подсистема анализа/синтеза структуры. В рамках разработанных программных систем реализованы предложенные, модели и алгоритмы обработки информации.

2. Представлена программная реализация предложенных решений. Основной акцент при программной реализации уделен поисковым

117 решениям в корпоративной сети и сети Internet. Показана возможность проведения поисковой процедуры без использования тезаурусов вообще, с использованием простого тезауруса и с использованием частотного тезауруса. Также продемонстрирована возможность проведения мультилингвистического поиска и обработки информации в рамках разработанных алгоритмов и решений.

3. В ходе эксперимента получены результаты, которые демонстрируют существенно лучшее качество анализа документов на релевантность по сравнению с классическими поисковыми системами. Также показано, что по сравнению с реализацией подхода, основанного на частотных мультилингвистических словарях, степень релевантности определяется незначительно хуже, однако это не снижает значение полученного результата, так как составление тезаурусов значительно менее трудоемкая задача по сравнению с составлением мультилингвистических тематических словарей.

4. При анализе уровня качества ранжирования информации получены не менее интересные результаты. Так, качество ранжирования предлагаемых алгоритмов значительно превосходит качество ранжирования информации классическими поисковыми сервисами. Также качество ранжирования предлагаемых решений не уступает поисковым системам каталожного типа и системе, построенной на использовании тематических частных словарей.

ЗАКЛЮЧЕНИЕ

1. Проведен анализ типовых структур и возможностей систем поддержки принятия решений, в результате которого можно сделать вывод о том, что в настоящее время недостаточно уделяется внимания проблеме мультилингвистичности представления информации в корпоративных информационных системах. Так же можно указать на недостаточную разработку подходов к оптимизации структуры информационного обеспечения распределенной СППР корпоративного типа.

2. Проведенный анализ показал, что существующие модели поиска и обработки информации в корпоративных информационно-управляющих системах, как правило, не позволяют эффективно решать задачи формирования многоязычного информационно-лингвистического базиса распределенных систем поддержки принятия решений.

3. Предложены новые модели представления и обработки мультилингвистической информации в распределенных информационных системах, обеспечивающие эффективное формирование информационно-лингвистического базиса распределенных систем поддержки принятия решений. Модифицирована модель информационного обеспечения распределенной СППР, основанной на тезаурусе, а также учитывающая весовые коэффициенты терминов используемого мультилингвистического тезауруса. Это позволяет ускорить работу как метопоисковых технологий, так и совершенствовать процесс, разработки новых информационных коллекций для частотного информационно-лингвистического базиса СППР.

4. Впервые предложена модель синтеза структуры информационного обеспечения распределенной системы поддержки принятия решений на основе мультилингвистичного тезауруса. Значимость данного подхода в современных условиях очевидна, так как большинство крупных как российских, так и зарубежных компаний работают на международном рынке и, следовательно, при подготовке и принятии решений основываться только на одноязычных данных уже нецелесообразно.

5. Предложена новая схема работы поисковой подсистемы распределенной СППР, основанной на мультилингвистических частотных тезаурусах, и использующей несколько режимов: поиск как с частотными, так и без частотных характеристик, метапоиск с использованием тезаурусов для проверки релевантности и ранжирования, а так же проведение поисковой процедуры без использования тезаурусов вообще, что существенно увеличивает возможности предлагаемого решения по сравнению с аналогами.

6. Разработана функциональная структура системы формирования и обработки информационно-лингвистического базиса распределенных систем поддержки принятия решений. Система содержит два модуля: информационно-лингвистическая поисковая подсистема и подсистема анализа/синтеза структуры. В рамках разработанных программных систем реализованы предложенные модели и алгоритмы обработки информации.

7. В ходе эксперимента получены результаты, которые демонстрируют существенно лучшее качество анализа документов на релевантность по сравнению с классическими поисковыми системами. Также показано, что по сравнению с реализацией подхода, основанного на частотных мультилингвистических словарях, степень релевантности определяется незначительно хуже, однако это не снижает значение, полученного результата, так как составление тезаурусов значительно менее трудоемкая задача по сравнению с составлением мультилингвистических тематических словарей. Качество

120 ранжирования предлагаемых алгоритмов значительно превосходит качество ранжирования информации классическими поисковыми сервисами, не уступает поисковым системам каталожного типа и системе, построенной на базе тематических частных словарей.

Таким образом, в данной диссертационной работе решена задача повышения эффективности формирования информационного обеспечения распределенных СППР на базе частотных мультилингвистических тезаурусов, как с использованием ресурсов корпоративной сети, так и сети Internet, что имеет существенное значение для развития теории и практики решения задач анализа и обработки мультилингвистической информации.

Библиография Рогов, Сергей Викторович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Атанов, Г.А. Структурирование понятий предметной области с помощью методов представления знаний/ Г.А. Атанов, И.Н. Пустынникова//Искусственный интеллект, №2, 1997. с.29-40.

2. Ахо А., Хопкрофт Дж., Ульман Дж. Структура данных и алгоритмы. М.: Вильяме, 2000.

3. Башмаков, А.И. Технология и инструментальные средства проектирования тренажерно-обучающих комплексов для профессиональной подготовки и повышения квалификации. Часть 2. /А.И. Башмаков, И.А. Башмаков //Информационные технологии. №7, 1999. — с.39-45.

4. Бовтенко, М.А. Компьютерная лингводидактика: Учеб. пособие. — Новосибирск: Изд-во НГТУ, 2000.

5. Брюхов Д.О., В.И. Задорожный, Л.А. Калиниченко, М.Ю. Курошев, С.С. Шумилов. Интероперабельные информационные системы: архитектуры и технологии. Системы управления базами данных, 4, 1995.

6. Ван Лоун, Ч. Матричные вычисления. Издательство "Мир", Москва, 1999.

7. Вендров, A.M. CASE-технологии. Современные методы и средства проектирования информационных систем. М.: Финансы и статистика, 1998.

8. Вендров, A.M. Один их подходов к выбору средств проектирования баз данных и приложений //Системы управления базами данных. №3, 1995. - с.75-86.

9. Вторая ежегодной конференции «Поисковая оптимизация и продвижение сайтов». 2002 http://www.wmate.ru.konf.htm.

10. Даконта М, Саганич A. XML и Java 2. СПб.: Питер, 2001. - 384с.

11. Даниэла Флореску, Алон Леви, Альберто Мендельсон. Технологии баз данных для World-Wide Web: обзор. Системы управления базами данных, 4, 1998.

12. Дж. Голуб, Ч. Ван Лоун. Матричные вычисления. Издательство "Мир", Москва, 1999.

13. Джексон, Г. Проектирование реляционных баз данных для использования с микро-ЭВМ. -М. Мир, 1991.

14. Илан Гринберг, Ли Гарбер. Разработка новых технологий информационного поиска. Открытые Системы, 10, 1999.

15. Калянов, Г.Н. CASE структурный и системный анализ. Автоматизация и применение. -М.: Изд-во «ЛОРИ», 1996.

16. Калянов, Г.Н. Консалтинг при автоматизации предприятий. Подходы, методы, средства. -М.: СИНТЕГ, 1997.

17. Камер Дуглас Э. Компьютерные сети и Internet. Разработка приложений для Internet: Пер. с англ. М.: Изд. дом "Вильяме", 2002. - 640 с.

18. Карберри, С. Модели пользователя: проблема неадекватности //Новое в зарубежной лингвистике. Вып. 24. — М., 1989. - с.259-291.

19. Карцан, И.Н. Многоагентная система компьютерной обработки узкоспециализированной информации Текст. / И.Н. Карцан // Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко;. Красноярск: НИИ СУВПТ. 2006. - Вып. 24. - С. 3-9.

20. Карцан, И.Н. Мультиагентные технологии поиска информации в. распределенных источниках / И.Н. Карцан, Д.В. Кустов // Вестник -НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко; Красноярск: НИИ СУВПТ. 2003. - Вып. 14. - С. 22-30.

21. Кириллов, В.П. SSADM передовая технология разработки автоматизированных систем //Компьютеры + программы. - №2, 1994. -с.8-17.

22. Кривошеев, А.О. Перспективные internet-технологии информационного обеспечения образовательных услуг Часть 1. / А.О. Кривошеев, Г.С!

23. Голомидов, А.Н. Таран //Информационные технологии. №7, 1998. -с.38-44.

24. Кустов Д.В. PLSA-адаптация модели пользователя в открытой информационно-образовательной среде/ И.В. Ковалев, Д.В. Кустов// Журнал «Телекоммуникации и информатизация образования».—2004 — № 6(25)-Москва. СГУ.-С. 41-51.

25. Кустов Д.В. Агентные технологии для поиска и сбора информации/ Д.В. Кустов// Материалы докладов всероссийской научной конференции молодых ученых. «Наука. Технологии. Инновации». Ч. 1 .— Новосибирск. 2003. С. 187-189.

26. Кустов Д.В. Активная модель пользователя в среде распределенных информационных ресурсов/ Д.В. Кустов// Решетневские чтения: материалы IX Междунар.науч.конф., посвящ.45-летию Сиб.гос.аэрокосмич.ун-т —Красноярск, 2005-С. 217-218.

27. Кустов Д.В. Мультиагентные технологии поиска информации в распределенных источниках/ Д.В. Кустов// Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общей ред. профессора Н.В.Василенко -Красноярск НИИ СУВПТ. 2003. Вып. 14. - С. 22-30.

28. Кустов Д.В., Слободин М.Ю., Огнерубов С.С. «Адаптивная метапоисковая система». Инвентарный номер ФАП: 5955. Код программы по ЕСПД: .03524577.01366-01.

29. Лекции по теории графов / Емеличев В.А., Мельников О.И. Сарванов В.И., Тышкевич Р.И. М.: Наука, Гл. ред. физ.-мат. лит., 1990. - 384 с.

30. Лорьер Ж.-Л. Системы искусственного интеллекта. / Пер. с франц. -М.: Мир, 1991.-568с.

31. Лохмаков, П. М. Мультилингвистический переводчик по системному анализу Текст. / П.М. Лохмаков, И.В. Ковалев, К.В. Полянский, Р.Ю. Царев, С.С. Огнерубов, М.В. Карасева // Инновации в науке и образовании. -2007. № 3 (26). - С. 19.

32. Лохмаков, П.М. Особенности разработки локальных информационных систем Текст. / П.М. Лохмаков // Вестник университетского комплекса: сб. научн. тр. / под ред. Н.В. Василенко; ПИИ СУВПТ, ВСФ РГУИТП.- Красноярск, 2006. Вып. 23.- С. 136-140.

33. Мазурина С.М. Разработка моделей представления и обработки знаний в продукционных экспертно-обучающих системах. М.: МГИЭМ. 1995.- 164с.

34. Макфредрис, П. Создание Web-страниц. М.: Астрель, 2004. - 230 с.

35. Мамиконов А.Г. Принятие решений и информация. М.: Наука, 1983*. -184 с.

36. Манако, В. Коллекции интерактивных словарей для непрерывного обучения индивидуала. / В. Манако, А. Манако, К. Синица //Educational Technology & Society, 2001 № 4(1), http://ifets.ieee.Org/russian/depository/v4il/html/2.html

37. Марка, Д.А. Методология структурного системного анализа и проектирования SADT. М.: Метатехнология, 1993.

38. Некрестьянов, И.С. Тематико-ориентированные методы информационного поиска текст. дис. канд. физ. мат. наук: 05.13.11 /Новиков Б.А. Санкт-Петербург, 2000 - 136 с. - библиогр. 126-136 с.

39. Перегудов Ф.И., Тарасенко Ф.П. Основы системного анализа.— Томск: Изд-во НЛТ, 1997. 396 с.

40. Позин, Б.А. Современные средства программной инженерии для создания открытых прикладных информационных систем //Системы управления базами данных. №1, 1995. - с. 139-144.

41. Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. — 360 с.

42. Портал УИС «Россия» http://www.cir.ru/

43. Представление и использование знаний: Пер. с япон./Под ред. X. Уэно, М. Исидзука. М.: Мир, 1989. - 220 с.

44. Проект SESP (Search Engine Standards Project). Стандарты работы поисковых служб. http://www.searchenginewatch.com/standards/990204.html. 1999.

45. Растригин JI.A. Вычислительные машины, системы, сети. М.: Наука. Гл. ред. физ.-мат. лит., 1982. — 224 с.

46. Результат исследования поведения более 20 млн. пользователей сети. -www.searchenginewatch.com/reports/netratings.html 1999.

47. Ростунов Т.И. Сущность программированного метода обучения. / В сб.: Программированное обучение и кибернетические обучающие машины. / Под ред. Шестакова А.И. М.: Сов. радио, 1963. — с. 10-23.

48. Русский морфологический анализ. http://company.yandex.ru/articles/article 1 .html.

49. Русскин, В.М. Информационная методология SSADM: методика моделирования информационных потоков при разработке автоматизированных систем / В.М. Русскин, В.П. Кириллов. //Компьютеры + программы. №3, 1995. - с.15-23.

50. Сайт проекта RussNet http://www.phil.pu.ru/depts/12/RN/indexru.shtml

51. Сайт толкового словаря. www.glossary.ru.

52. Серия опросов посвященных Internet активности. — http://www.yandex.ru.polling/index.html

53. Словари, энциклопедии, справочники http://www.slovarik.ru/. http://www.artint.ru/projects/frqlist.asp.

54. Стенли Р. Перечислительная комбинаторика: Пер. с англ. М.:Мир, 1990.-440 с.

55. Степанов В. К. Русскоязычные поисковые механизмы в Интернет. ComputerWorld Россия, 11, 1997.

56. Талантов, М. Поиск в Интернете: подводные камни. // КомпьютерПресс №9, 1999. с. 46 - 52.

57. Терещенко Л.Я., Панов В.П., Майоркин С.Г. Управление обучением с помощью ЭВМ. Л.: Изд-во ЛГУ, 1981. - 143 с.

58. Тим Брэй, Джин Паоли, С.М. Сперберг-Макквин, Ив Мэйлер. Расширяемый язык разметки (XML) 1.0 (вторая редакция). Перевод Радика Усманова.// http://www.citforum.ru/internet/xmlspec/index.shtml.

59. Уотермен Д. Руководство по экспертным системам: Пер. с англ. М.: Мир, 1989.-388 с.

60. Усачев, А.В. Мнемотехника мультилингвистического подхода. Труды XL Международной научной студенческой конференции "Студент и научно-технический прогресс": Информационные технологии. Новосибирск, НГУ, 2002г. С. 97-103.

61. Усачев, А.В. Нейросетевая кластеризация множественных значений терминологии с учетом лингвистической избыточности. Вестник НИИ СУВПТ, сборник научных трудов, Красноярск, 2003г. С. 140-150.

62. Albrecht F. SmexWeb: An Adaptive Web-based Hypermedia Teaching System.// Journal of Interactive Learning Research, Special Issue on Intelligent Systems/Tools in Training and Lifelong Learning. 2000. P. 367388.

63. Anna Le Calve Database merging strategy based on logistic regression. Information Processing and Management, 36(3):341-359, May 2000.

64. Baeza-Yates R. Modern Information Retrieval. ACM Press, 1999.

65. Cannataro M., Cuzzocrea A., Pugliese A. A probabilistic approach to model adaptive hypermedia systems. Proceedings of the International Workshop on Web Dynamics. 2001.

66. Cohn, D. Learning to probabilistically identify authoritative documents. In Proc. 17th International Conf. on Machine Learning, pages 167-174, 2000.

67. Daphen K. and Sahami Mehran. Hierarchically classifying documents using very few words. In Proc. of the ICML'97, pages 170-178, 1997.

68. De Bra P., Aerts A., Houben G.J., Wu H. Making General-Purpose Adaptive Hypermedia Work. Proceedings of the WebNet Conference. 2000. P. 117123.

69. Douglas L. Baker and Andrew Kachites McCallum. Distributional clustering of words for text classification. In Proceedings of the SIGIR'98, pages 96103, 1998.

70. Fellbaum, C. The Global WordNet Association, http ://www.globalwordnet.org/

71. Foltz, P.W. Using latent semantic indexing for information filtering. In ACM Conference on Office Information Systems (COIS), pages 40-47, 1998.

72. Gay, G. Collaborative Design in a Networked Multimedia Environment: Emerging Communication Patterns //Journal of Research on Computing in Education. Vol.26, Iss.3. - Spring, 1994. - Pp.418-432.

73. Gilbert, J. E. and Han С. Y. Arthur: Adapting Instruction to Accommodate Learning Style // Proceedings ofWebNet'99 World Conference of the WWW and Internet.- Honolulu: Ш. 1999. P. 433-438.

74. Goodfellow, R. CALL Programs for Vocabulary Instruction //Computer Assisted Language Learning Journal. Vol.8. - №2, 1995. - Pp.205-226.

75. Hoffman T. Probabilistic Latent Semantic Indexing.// Proc. Of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999. P. 50-57.

76. Hoffman T. Unsupervised Learning by Probabilistic Latent Semantic. Analysis.//Machine Learning. 2001. Vol. 42. P. 177-196.

77. Hohl, H., H.-D. Bocker, and R. Gunzenhauser. Hypadapter: An adaptive hypertext-system for exploratory learning and programming.// User-Models and User Adapted Interaction. : 1996. Vol. 6.

78. Hopfield, J.J. Neural networks and physical systems with emergent collective computational abilities. Proc. Natl. Acad. Sci. 79, 1982. p. 25542558.

79. Horak A. "VisDic Wordnet Browsing and Editing Tool". P.Sojka, K.Pala, P.Smrz, C.Fellbaum, P.Vossen (Eds.): GWC 2004, Proceedings, pp. 136-141. Masaryk University, Brno, 2003

80. ЯР Labs Semantic Web Research http://www.hpl.hp.com/semweb/

81. Katsumoto M., M. Fukuda, Y. Shibata. The Kansei Link Method for MultimediaDatabase.// 10th International Conference on Information Networking (ICOIN-IO). 1996. P. 382- 389.

82. Kleinberg, Jon M. Authoritative sources in a hyperlinked environment // Journal of the ACM, 46(5): 604-632, 1999.

83. Koch, T. The building and maintenance of robot based internet search services: A review of current indexing and data collection methods. — Technical report, Lund University Library, Sweden, 1996.

84. Lawrence, S. Searching the World Wide Web. Science, 280(5360): 98100, 1998.

85. Maganti, A. An investigation of linguistic features and clustering algorithms for topical document clustering. In Proc. of the SIGIR'2000, 2000.

86. Moran, S. The stochastic approach for link-structure analysis (salsa) and the tkc effect. In Proc. WWW9, 2000.

87. Mukherjea, S., J. D. Foley, and S. Hudson. Visualizing complex hypermedia networks-through multiple hierarchical views.// СНГ95-Denver. 1995. P. 331-337.

88. Murtagh F., Tao F. Towards knowledge discovery from WWW log data. Proceedings of the International Conference on Information Technology: Coding and Computing. 2000.

89. OWL Web Ontology Language. Reference. W3C Recommendation 10 February 2004. http://www.w3.org/TR/2004/REC-owl-ref-20040210

90. P.Vossen. Building a multilingual database with wordnets for several European languages. http://www.illc.uva.nl/EuroWordNet/

91. Page, L. The pagerank citation ranking: Bringing order to the web. Technical report, Stanford Digital Libraries, 1998.

92. PageRing в Google http://digits.ru/articles/promotion/pagerank.html.

93. Powell, A. Evaluating database selection techniques: A testbed and experiment. In Proc. of the SIGIR'98, Melbourne, Australia, August 1998.

94. R.Bergmair WordNet ERD, 2002 http://wordnet2sql.infocity.cjb.net/modeloverview.html

95. Rauch Henzinger, M. Improved algorithms for topic distillation in a hyperlinked environment. In Proc. Research and Development in Information Retrieval, pages 104-111, 1998.

96. Ravi Kumar, S. Prabhakar Raghavan, Sridhar Rajagopalan, Andrew Tomkins, David Gibson, and Jon Kleinberg. Mining the Web's link structure. Computer, 32(8):60-67, 1999.

97. Raymie Stata, Krishna Bharat, and Farzin Maghoul. The term vector database: fast access to indexing terms for web pages. In Proc. of the WWW-9, May 2000.

98. RDF Vocabulary Description Language 1.0. RDF Schema. http://www.w3 .org/TR/2003/PR-rdf-schema-200331215

99. Ribeiro-Neto, B. Modern Information Retrieval. ACM Press, 1999.135

100. Smith M., Welty С., McGuinness D. OWL Web Ontology Language Guide// http://www.w3. org/TR/o wl-guide/.

101. Soumen, Chakrabarti. Integrating the document object model with hyperlinks for enhanced topic distillation and information extraction. In Proc. WWW10, 2001.

102. Sukhonogov A.M. "Language resources usage for English-Russian WordNet development". Applied Natural language Processing — possible application for Semantic Web. Eurolan 2003. Student Workshop Proceeding. Hamburg University, Juli 2003.

103. V.Balkova, A.Sukhonogov, S.Yablonsky "Russian WordNet. From UML-notation to Internet/Intranet Database Implementation". GWC 2004, Proceedings, pp. 31-38. Masaryk University, Brno, 2003. 374 pp.

104. Weiss, R. HyPursuit: A hierarchical network search engine that exploits content-link hypertext clustering. In Proc. of Seventh ACM Conference on Hypertext, March 1996.

105. Wieringa R., Dubois E., Huyts S. Integrating Semi-formal and Forpal Requirements.// Proceedings of Conference on Advanced Iiiformation Systems Engineering. 1997. P. 19-32. ; J

106. Wu H, Houben G.-J., De Bra P. (1998): AHAM> A Reference Model to Support Adaptive Hypermedia Authoring.// Proceedings of InfWet 98. 1998. 1

107. Zahn C.T. Graph-theoretical methods for detecting describing gestalt clusters.// IEEE Trans, on Computers. 1971. C-20(l). P. 68-86. J

108. Zelenkov, P. Multilingual Adaptive Method of Learning Foreign Languages /Р. Zelenkov, E.Kofman// труды международной конференций «14th 1ST Mobile & Wireless Communications Summit». Дрезден -Германия: Technische Universitat Dresden, 2005г. C.228-233.