автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Алгоритмы структуризации и унификации для моделей знаний в технологии Semantic Web на основе синтеза OWL-онтологий

кандидата технических наук
Каширин, Денис Игоревич
город
Рязань
год
2008
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Алгоритмы структуризации и унификации для моделей знаний в технологии Semantic Web на основе синтеза OWL-онтологий»

Автореферат диссертации по теме "Алгоритмы структуризации и унификации для моделей знаний в технологии Semantic Web на основе синтеза OWL-онтологий"

На правах рукописи

00345128Э

КАШИРИН Денис Игоревич

АЛГОРИТМЫ СТРУКТУРИЗАЦИИ И УНИФИКАЦИИ ДЛЯ МОДЕЛЕЙ ЗНАНИЙ В ТЕХНОЛОГИИ SEMANTIC WEB НА ОСНОВЕ СИНТЕЗА OWL-ОНТОЛОГИЙ

Специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

з О ОПТ 2008

Рязань 2008

003451289

Работа выполнена на кафедре Вычислительной и прикладной математики Рязанского государственного радиотехнического университета

Научный руководитель:

доктор технических наук, профессор Пылькин Александр Николаевич

Официальные оппоненты: доктор технических наук, профессор

Еремеев Виктор Владимирович

кандидат технических наук, доцент Корячко Алексей Вячеславович

Ведущая организация.

ФГУ ГНИИ ИТГ «Информика», г. Москва

Защита состоится 26 ноября 2008г. В 12 часов на заседании диссертационного совета Д 212.211.01 в Рязанском государственном радиотехническом университете по адресу: 390005, г. Рязань, ул. Гагарина, д.59/1.

С диссертацией можно ознакомиться в библиотеке Рязанского государственного радиотехнического университета

Автореферат разослан « 15 » октября 2008 г.

Ученый секретарь диссертационного совета

к.тд, доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Интенсификация развития современных технологий стала возможной за счет широкого внедрения средств информационной поддержки специалистов. К таким средствам относятся глобальные сети, распределенные информационные хранилища, интеллектуальные агенты и специализированные сервисы. В то же время существование востребованных данных, ликвидной информации или удобного программного сервиса в электронной форме не означает доступность этих средств для потребителя. Трудоемким остается не только их поиск, но и интегрирование информационных ресурсов в единую, совместимую для разных специалистов среду.

Решение проблемы видится ученым в семантическом подходе. Суть подхода в описании информационных ресурсов с помощью моделей знаний (МЗ), которые должны быть стандартизованы и понятны широкому кругу профессионалов в различных предметных областях (ПО). Весомые результаты в работах по представлению знаний связаны с такими учеными, как В.П. Гладун, Д.А. Поспелов, Э.В.Попов, В.Ф. Хорошевский, D.G. Bobrow, М. Minsky, R.C. Schenk, Т. Winograd.

Одним из наиболее известных современных подходов к стандартизации онтологического представления знаний является разработка консорциума W3C, развивающего Internet-технологии. Последняя версия стандарта в форме языка описания онтологий OWL (Web Ontology Language) была предложена научно-исследовательской группой W3C в 2004г. как основа новой технологии Semantic Web. Технология была распространена на решение широкого круга задач, к которым относятся не только интеллектуальный поиск информации, но также автоматическое аннотирование документов и семантическое сопровождение баз данных (информационных хранилищ). Наиболее известные работы в этой области принадлежат ученым: A.C. Клещев, A.B. Манцивода, T.Berners-Lee, T.R. Gruber, M.A. Musen, R. Staab, D. Studer.

В рамках Semantic Web различными группами специалистов разработаны и апробированы программы структуризации, оптимизации и конвертирования онтологических описаний (00), такие, как Protege, Chimaera, Ontolingua, ODE, GrOWL, FCA-Merge и др. Методологической основой таких программ являются оригинальные подходы к структуризации и унификации 00 с помощью их представления в специализированных МЗ. Опыт разработки реальных программ позволил выявить следующие проблемы, решение которых является наиболее актуальным.

1. Необходимо получить подробное и адекватное ПО онтологическое описание, учитывающее не только специфику тематической специализации, но и общую МЗ о мире, как основу совместимости знаний в разных ПО.

2. Существует проблема выделения ликвидных знаний из данных в условиях неоднородности и больших объемов первоначальной информации.

3. Необходимо иметь возможность реорганизации МЗ при внесении изменений в их первоначальную классификацию без дальнейших потерь при поиске.

4. Существует сложность в отыскании пользователя, нуждающегося в конкретной информации, с учетом различия задач, интересов и мотивации у разных пользователей.

5. Остается малоизученной проблема полиморфизма 00, предполагающая рассмотрение системы понятий под различными углами зрения различными специалистами из ПО.

6. Внесение изменений в существующие принятые формализмы не должно затрагивать их основания, т.е. принципов описания семантики.

Сложность решения перечисленных проблем является главной причиной низкой релевантности существующих поисковых систем и интеллектуальных агентов. Решение этих проблем связано с необходимостью получения новых модификаций известных формализмов, обладающих более хорошими возможностями представления знаний в МЗ, но не разрушающими достигнутые результаты по полноте и разрешимости логических теорий. Кроме того, необходимо получение новых программных средств, дающих возможность структуризации и унификации 00, делающих возможной оптимизацию, облегчающих автоматизацию проектирования и внесение изменений в 00.

Одному из подходов к решению этих проблем посвящена настоящая диссертация.

Целью диссертации является исследование и модификация формализма OWL-ориентированных онтологии, а также разработка алгоритмов унификации для моделей знаний, упрощающих оптимизацию, реорганизацию и автоматизированное проектирование их семантических описаний за счет использования полиморфических структур.

Достижение поставленной цели работы связано с решением следующих задач:

• анализ и модификация дескриптивной логики DL на основе использования иерархической типизации концептов для учета родовидовой таксономии, обладающей свойством полиморфизма;

• разработка представления 00 с использованием концепции признаковых структур (ПС) для выработки требований к регулярным формам онтологических ПС, позволяющим снизить трудоемкость их верификации и унификации;

• разработка универсальной алгебраической системы онтологических ПС и исследование ее операций и отношений, влияющих на свойства отношений эквивалентности и подобия онтологий;

• проектирование алгоритмов структуризации и унификации OWL-ориентированных 00, обеспечивающих возможность автоматизированной модификации и оптимизации семантических описаний ПО;

• разработка программного инструментария унификации онтологий с учетом свойств их концептов и отношений, повышающего характеристики релевантности поисковых систем и интеллектуальных агентов, работающих в технологии Semantic Web.

Методы исследования

В работе использовались дескриптивная логика, теория унификации, концепция признаковых структур, универсальные алгебры и бинарные отношения, методы объектно-ориентированного анализа.

Научная новизна работы заключается в получении нового модифицированного формализма, основанного на использовании базового отношения ICF, обладающего свойством полиморфизма при онтологическом описании ПО. Формализм позволяет адекватно описывать семантику ПО, за счет чего повышается релевантность поиска в распределенных информационных сетях и хранилищах. Спроектированный в диссертации алгоритм унификации Web-ориентированных 00 дает возможность автоматизировать верификацию, дополнение и унификацию онтологии ПО, изначально разработанных различными специалистами.

На защиту выносятся

1. Новый формализм для адекватного онтологического описания ПО, обладающий возможностью полиморфического представления используемых в описании понятий и отношений.

2. Общие принципы построения регулярных онтологических структур, позволяющих снизить трудоемкость верификации и реорганизации МЗ ПО.

3. Метод последовательного синтеза регулярных OWL - ориентированных онтологий.

4. Алгебраические свойства операций и отношений, влияющие на формирование классов эквивалентности и подобия двух онтологий, изначально разработанных различными специалистами.

5. Оригинальный алгоритм унификации онтологий, позволяющий повысить характеристики релевантности поиска документов, данных и информационных сервисов в технологии Semantic Web.

Практическая значимость работы. На основе полученных теоретических результатов автором создана инженерная методика проектирования регулярных 00, состоящих из общей и прикладной онтологий для заданной ПО. Эффект от внедрения методики получается за счет следующего улучшения характеристик:

• снижение трудоемкости проектирования и улучшения достоверности семантического описания ПО;

• упрощение верификации соответствующей МЗ с выявлением противоречивых утверждений о понятиях и отношениях модели ПО;

• упрощение достраивания МЗ при появлении новых описаний для понятий и отношений ПО;

• унификация различных онтологий с целью обеспечения их совместимости для различных специалистов.

Практическим результатом является программная реализация инструментария ICF PUTE v. 2.01 для структуризации и унификации OWL-ориентированных онтологий в технологии Semantic Web, выполненная с использованием средств Protégé и Microsoft Visual С#. Программа может использоваться в системах интеллектуального поиска, информационных сервисах

Internet и интеллектуальных агентах с целью улучшения характеристик точности поиска.

Реализация и внедрение результатов работы. Результаты исследования внедрены в форме программного информационного сервиса в автоматизированной системе Негосударственного пенсионного фонда «Алмазная Осень» в Республике Саха (Якутия) а также, в поисковой системе Рязанского Центра научно-технической информации (поисковом инструментарии компании ЕРАМ Systems). Методические результаты внедрены в учебный процесс Рязанского государственного радиотехнического университета при подготовке и выполнении практических занятий студентами специальностей 220400, 351400 по дисциплинам «Проектирование систем искусственного интеллекта» и «Перспективные методы программирования». Программные средства, разработанные автором диссертации, зарегистрированы в отраслевом фонде алгоритмов и программ (Свидетельства о регистрации №9885 от 15.02.2008, №10019 от 26.02.2008).

Апробация работы. Результаты исследований, составляющие основное содержание диссертации, докладывались на 9-и международных и 3-х всероссийских конференциях и семинарах:

• МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань, РГРТУ 2002, 2003, 2004,2005, 2008 гг.;

• МНТК «Современные проблемы информатизации». Воронеж, ВГТУ 2005,2007,2008 гг.;

• Всероссийская НТК «Новые информационные технологии в научных исследованиях и в образовании», Рязань, РГРТУ, 2003,2008 гг.;

• International Conference «Interactive Systems». Ulyanovsk: U1STU, 2003;

• Всероссийская НТК «Новые технологии в учебном процессе и производстве». Рязань, Рязанский ин-т МГОУ, 2006г.;

• Всероссийская НПК «Актуальные проблемы информатизации». Москва, МИЭТ, 2007г.

Публикации. По теме диссертации опубликовано 19 научных работ: 6 статей, в том числе 3 статьи в изданиях, включенных в перечень ВАК, и 13 материалов докладов на международных и всероссийских конференциях и семинарах.

Структура и объем работы. Диссертация состоит из введения, 4-х глав, заключения, списка литературы и 3-х приложений, содержащих копии документов о внедрении и материалы, не вошедшие в основной текст диссертации. Общий объем работы составляет 185 страниц, в том числе основное содержание - 171 е., 34 рисунка, 15 таблиц, списка литературы на 12 с. (124 наименования), приложения - 14 с.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертации, формулируется цель исследования, научная новизна и практическая ценность основных результатов диссертации.

В первой главе выполнен анализ существующих моделей представления знаний, используемых для описания информационных ресурсов, и рассмотрены основные понятия технологии Semantic Web.

Рассмотрены основные положительные и отрицательные свойства моделей знаний, а также использованных в них теоретических концепций, влияющие на эффективность их применения в системах описания семантики ПО для последующего информационного поиска.

На основе анализа обоснован выбор дескриптивной логики DL с языком ALC в качестве основного формализма, использованного в диссертационном исследовании. Грамматика ALC описана в форме Бэкуса-Наура:

<ALC-выражение>::=<Атомарный концепт> | |(< ALC-выражение>)| <ALC-выражение>u<ALC-выражение> | | < ALC - выражение > n < ALC - выражение > | | < ALC - выражение > 13 < Атомарная роль > . < ALC - выражение > | | V < Атомарная роль > . < ALC - выражение > |

< ALC - выражение > = < ALC - выражение > |

< ALC - выражение > с < ALC - выражение > |

< ALC - выражение > | (< Ограничитель >) < ALC - выражение >;

< Атомарная роль >::=< Слово из символов > |

| < Атомарная роль > -1 < Атомарная роль > *;

< Ограничитель >::=>< целое число > | << целое число >.

К описанному синтаксису добавлены индивидные выражения:

а :С — конкретный денотат а, входящий в множество денотатов концепта С, (a,b):R - конкретная пара индивидов (а,Ь) из отношения R. Приведена семантика языков ALC, ALCN, ALCK+ SHIQ, SHOQ(D), SHIF(D), SHOIN(D) дескриптивной логики DL (таблица 1), а также с конкретными примерами рассмотрены стандарты языков описания онтологии OWL-Lite и OWL-DL. Сформулирована цель и определены задачи развития формализмов и инструментальных программных средств в Semantic Web.

Вторая глава посвящена разработке базового формализма для полиморфического представления знаний и системы оперирования онтологическими описаниями.

В нотации Стааба-Студера формально описывается новая модифицированная онтология, названная по имени главного отношения онтологии - ICF. При

формализации далее используется синтаксис теории множеств и универсальных алгебр.

__Таблица 1 - Семантика языков дескриптивной логики

Конструкция логики Синтаксис языка Семантика ' Версия Г>1. языка

Атомарный концепт А А'с Д'

Абстрактное свойство К Я' с Д' х Д'

Обязательное свойство 0^.0)'= {х| РЬ

Уу.(х, у)еЯ' и уеС'}

Пересечение С, пСг (С,пС 2)' = С'1пС'2

Существование отношения ЗЯ #(Я')> 1 5(5НШ, ЗНВД

Предельный концепт т т'=А'

Пустой концепт х' = 0

Дополнение -,С (-.С)/-Л'\С'

Объединение С, и с. (С| и С2)' = с', с С'2

Существование свойства з&с ( ЗЯ.С)' = {х | Зу.(х, у)еК' и уеС1} АЬ* (С,СВД+)

Включение концепта С,еС2 С': С С,

Ограничитель < <пК (<п ю' = {х|#«у.(х,у)еЯ'}<п)

Ограничитель > {х;#((у.(х, у)€Я'!>п)

Индивид 0 о'еД' 0(ЗН0(2) Н(5НЩ,

Один из представителей { 0], ... 0„ } , V \ 0' ], ... 0 я /

Вкямчеше сьсйсиа | К, с К, К'^В.1! - --- ... ЭН^)

Ограничение свойства . 1 >п К.С Кэнш,

С 1 'ч ) -1 < ^С' ) 8НК2) Осэнш,

Ограничение свойства : <п Тч.С ' и - ч, ' Щу (х, у)е&*) я уеС7} БЫК})

Тип данных 0 Овс До'

Константа данных V 1 о V — V

Свойство типа данных и и' с Д' х Ао

Существование типа зи.о (ЗиХ>)' = {х| Зу.(х,у)еи'иубО°}

Обязательный тип уи.о (Уи.О )'= {х | Уу.(х, у)еи' уеТ>" }

Ограничитель типа < <п и (<п и)' - { х | #({у.(х, у)еи' }<п)

Ограничитель типа > >п и (>п и/ = { х | #({у.(х, у)еи' }>п)

Тип «Один из ...» {».,-.,*»}-{Л, ... Л}

Транзитивность свойства ■ • ТгагДЯ)- • • 8НВД +

Включение типов и,си2 и' 1 с и'2

Включение индивидов а:С а' € С'

Равенство индивидов а = Ь а' = ь'

Неравенство индивидов а * Ь а' Ь'

Существование концепта ЗС #(С')> 1

Определение 1. 1СР-онтологией 0/сг называется система множеств: О кг =< С,Я,0,А>, где пара <С,Я> - алгебраическая модель онтологии, вклю-

чающая С = {с,,с2.....с„} - конечное множество концептов как понятий предметной области, и сигнатура модели Л = {г„гг,...,гт} - конечное множество отношений на С; D = {dl,d2,...,d,} - множество денотатов; л = {о„аа,...,в4} - множество отношений различной конечной местности, называемое аксиомами онтологии.

Определение 2. Главным отношением ICF-онтологии является отношение, формирующее концептуальную таксономию на основе трех базовых составляющих:

ICF(X,y,z) <=> IsA(X,y)п/sA(X,z)n Conl(y.z)n Form(X,y)о Form(X,z), DL: у SX,zcXy nz = 0, X = VForm.y n VForm.z, X = VStat.y, X = VStat.z. Здесь IsA - родовидовое отношение, Form - бинарное отношение, соответствующее смыслу «быть одной из форм существования сущности», Cont - бинарное отношение противоположности двух концептов по смыслу.

ICF-отношение вводит возможность смежного наследования, т.е. возможность взаимного наследования свойств смежными сестринскими вершинами таксономического дерева посредством общей вершины-предка. В общих онто-логиях это позволяет избавиться от множественного /л4-наследования с сохранением строгой дихотомической классификации концептов, что дает возможность использовать такую классификацию при полиморфической типизации концептов прикладных онтологии.

Определение 3. Общими регулярными ICF-онтологиями называются онтологии, содержащие в базовой таксономии исключительно ICF-ребра.

В целях полиморфического описания концептов онтологии вводится их типизация. Каждый концепт cf | с, е С и каждый индивид (денотат) можно отнести к некоторому типу, определяющему, под каким углом зрения они рассматриваются. Например, концепт «программа» можно рассматривать, как «процесс» и как «объект собственности». Запись:

Программа! ТСобственность^Интеллектуальная собственность следует понимать так: «концепт «программа» по типу входит в более общее понятие «собственность», но является частным случаем собственности «интеллектуальная собственность»». Стрелки «Т» и «4-» означают соответственно подъем и спуск в дереве ICF-таксономии. В общем случае таких подъемов и спусков может быть много, но обязательно конечное число. Это означает, что множество С в онтологии продолжает оставаться счетным.

Поскольку ICF-онтология базируется на таксономическом дереве, вычислить траекторию подъема и спуска в нем не представляется сложным. Вследствие этого вводится дополнительный символ «•» для сокращения записи уточняющей траектории:

Программа |«Собственность • Интеллектуальная собственно сть .

Если рассмотреть «• », как транзитивное замыкание, этот пример можно записать более кратко: Программа | • Интеллекту альная собственно сть

К основам организации регулярной ICF-онтологии относятся следующие принципы ее построения.

1. Дихотомическая классификация концептов.

2. Строгая родовидовая таксономия (Is-A).

3. Исключение множественного наследования.

4. Строгая видо-видовая таксономия (Form).

5. Противоположность дочерних вершин в дихотомической триаде.

6. Уникальность концептов (редукция в смежное наследование).

7. Минимальность пути смежного наследования.

Для соблюдения перечисленных принципов организации при проектировании онтологии формулируются правила их преобразования к регулярной форме, которые представляются схемой:

{<Контрафактное утверждение>}

Рп:- [<Условиг применимости'^,

{ < Регулярное утверждение > } где Рп - индексное обозначение правила, <Контрафактное утверждение> -утверждение, не соответствующее реальным фактам или плохо отражающее их, < Регулярное утверждение > - правильное (исправленное) утверждение, <Условие применимости - необходимое условие применения правила.

Правила преобразования онтологии приведены в таблице 2.

В главе приведен пример общей онтологии, концепты которой могут использоваться для типизации прикладных онтологии различных ПО.

Таблица 2 - Выражения для PL-правил реорганизации онтологий

Индекс правила Нерегулярное утверждение Условие применимости Регулярное утверждение

Pl-DL x с X, у с X, z с X Существование концепта 1 t с X, z с X, xct, yet

P2-DL Xct,ycX,zcX Существование инверсии tgX, yet, zct

Рз-DL X с X, у С X, ZCX, t су, tez Существование концепта Ь t s X, h с X, xch, yex, zcx

P4-DL у с X, z с X у = Ропп.Х, г = Рогт.Х у с X, z с X, у = Form.X, z = Form.X

P5-DL усХ, zcX у пг =0 ycX, zcX,ynz = 0

P6-DL х с X, у с X, z с х, t с х, г с у, t с у Существование концептов Ь, к h с X, z с h, t с h, к с X, x с к

P7-DL 0 \}h-A(x{,xí*) = T i.l Зц,ц<х (j U Is-А{х!,хГ')^ц Г«1 j'k-l

В онтологии описано 29 базовых понятий, среди которых: «форма», «содержание», «статическая ситуация», «динамика», «случайность», «причина», «следствие», «аргумент», «результат», «элемент», «система» и т.п.

Рассмотрено формальное отличие общей и прикладной онтологий. Для базовых отношений общей онтологии должны выполняться следующие условия: 1) VX Зу 3z Is-A (X, у) & Is-A (X, z) & Cont (у, z) Form (X, у) & Form (X, z),

2) Vy Vz 3X Form(X, y) & Form (X, z) & Cont (y, z) ->

Is-A (X, y) & Is-A (X, z),

3)3!S Vxlls-A (x, S),

4) 3(n) t 1 [ By 3z Is-A (t, y) & Is-A (t, z)

Cont (y, z) & Form (t, y) & Form (t, z)]. где "-»" - импликация, "3!" и "Э(п)" - соответственно кванторы существования единственного элемента и существования элементов, количество которых равно целому числу п.

В отличие от общей прикладные онтологии определяются свойствами:

1) ЗХ Эу 3z Is-A (X, у) & Is-A (X, z) & Cont (у, z) ->

Form (X, у) & Form (X, z),

2) 3y 3z ЭХ Form(X, y) & Form (X, z) & Cont (y, z)

Is-A (X, y) & Is-A (X, z),

3) 3!S Vx ] Is-A (x, S), 4) 31 13y is-А (t, y),

где выражения 1) и 2) аналогичны соответствующим выражением для общих онтологии, но являются более слабыми, т.к. предполагают смежное наследование не для всех концептов и индивидов выбранной предметной области и допускают множественное наследование на нижних уровнях классификации.

Пример дерева классификации концептов для прикладной онтологии «Транспорт» приведен на рисунке 1.

Система

Рисунок 1 - Пример классификации прикладной онтологии «Транспорт»

В главе также предложены способы проектирования прикладных онтоло-гий для решения задач в технологии Semantic Web на основе типизации с помощью концептов общей ICF-онтологии.

В третьей главе рассматриваются Алгоритмы унификации и структуризации для моделей знаний в технологии Semantic Web.

Дескриптивная логика DL описывается, как формальная система, представляющая собой четверку: DL =< ALC, А,Р,Т >,

где ALC - язык выражений логики, А - множество аксиом, Р - множество правил вывода и Т - множество теорем.

С учетом ICF-типизации семантика DL задается таблицей 3.

А как множество аксиом может описывать определение концептов (терминологические аксиомы) и аксиомы существования взаимных отношений между концептами.

С = D — синонимия двух концептов, возможно заданных выражениями.

CcD- таксономическое утверждение.

Аксиомами и правилами вывода можно описать свойства отношений из R. В аксиомах использованы мета-отношения «=» и «с», соответствующие в семантике равенству множеств и нестрогому включению подмножеств денотатов.

Р, как правила вывода, дают возможность достраивать и проверять правильность таксономии, т.е. находятся ли два концепта в таксономическом отношении на всей области интерпретации или нет. Приведем два основных правила:

1) С с D если и только если концепта С n ->D не существует в реальности;

2) С существует в реальности, если и только если оно не противоречит реальности, т.е. not С с Dkj-,d, где Z) - некоторый другой концепт

Таблица 3 - Семантика логики DL с ICF-типизацией

Конструкция Синтаксис Семантика Пример

Атомарный концепт А А' с А' Программа

Атомарная роль R Л'сД' хД' Иметь цвет

Типизированный концепт C|.D С' с|х)(х|*С')еД'} Бревно | • Твердый предмет • Топливо

Конъюнкция CoD С' nD' Мужчина г\ Солдат

Дизъюнкция СиО С' uD' Студент и Школьник

Отрицание -,с Д'\С' -1 Конечное

Существование же ^с | Зу(х,у) е R' &у<=с\ 3 Иметь запах Лшца

Всеобщность мне V Иметь ребенка. Мальчик

Ограничитель > >nR > 7 Иметь карандаши

Ограничитель 2 <nR {y(x,y)zR')\<n\ < 1 Иметь руководителя

В главе рассматриваются особенности информационного поиска на основе онтологий, и сформулированы необходимые условия поиска.

1) Поиск основывается на онтологии пользователя, которая рассматривается в качестве семантической модели его предметной области.

2) Для поиска необходимо представление документов информационного хранилища в онтологической форме.

3) Необходимо получение алгоритмов автоматизированного синтеза онтологий для пользователя и для документов.

4) Необходимо получение алгоритмов унификации онтологий, как для поиска, так и для синтеза производных онтологий из базовых, возможно разнородных, фрагментов.

5) Нужны алгоритмы верификации онтологий, позволяющие обнаруживать семантические ошибки и приводить онтологии к регулярным формам.

Для описания моделей ПО для поиска предлагается использовать ситуативные онтологические структуры. Отправными положениями при описании ситуаций являются следующие.

1) Ситуации состоят из множества элементов.

2) Элементы ситуации находятся между собой в различных отношениях.

3) Ситуации и их фрагменты могут сравниваться между собой и унифицироваться для последующей классификации по разным основаниям.

4) Элементы и фрагменты ситуаций имеют уникальные имена в тезаурусе.

5) Отношения между элементами и фрагментами могут иметь как обобщенные наименования в тезаурусе, так и быть конкретными.

6) Полное дихотомическое описание и классификация ситуаций как систем элементов является неоправданным, как в силу его трудоемкости, так и отсутствия такой необходимости для решения конкретной пользовательской задачи.

7) Классификация объектов и отношений ситуации должна быть строгой, но необязательно дихотомической. Это даст возможность описывать объекты и отношения как переменные алгебраических термов с четко очерченной областью определения для последующей унификации.

В качестве прикладной предметной области рассмотрено "Программирование для ЭВМ". Чтобы описать множество присутствующих в ситуации конкретных бинарных отношений, их можно привязать 1Б-А дугой к вершине "Бинарные" общей онтологии. Это описывается так: Ситуация программа с Статическая ситуация, Отношение сразу после с

Бинарные, Отношение быть внутри с Бинарные, Отношение быть аргументом с Бинарные, Иметь уникальное имя с Бинарные. Следующее выражение говорит о том, что "Ситуация программа" в качестве элементов содержит все денотаты из группы "Бинарные":

(УЭлемент.Ситуация программа) с Бинарные.

Можно конкретизировать элементы программы соответствующим именем "Элемент программы", например:

Ситуация программа | «Статическая ситуация с Элемент программы | «Элемент. Чтобы описать множество всех присутствующих в ситуации конкретных объектов, их можно привязать Ь-А-дугой к вершине "Статическая ситуация".

Оператор программы с Элемент программы,

Оператор присваивания с Оператор программы,

Оператор условия с Элемент программы,

Оператор цикла с Элемент программы,

Оператор функция с Элемент программы.

Оператор программы с (УЭлемент | • Ситуация программа).

В прикладных онтологиях отношение [s-A более конкретно, чем ICF и поэтому запрещает использовать смежное наследование.

Если описать операторы программы более точно, можно ситуативно представить конкретную программу. С помощью смежного наследования в ICF ее также можно будет рассмотреть как динамический процесс.

Ситуативное описание программы как последовательности выполняемых друг за другом операторов можно представить графически (рисунок 2).

Программная реализация ситуативных онтологий основывается на концепции признаковых структур. В целях проектирования модели ПО рассматриваются примеры определения в DL понятий: «системный аналитик», «аналитика», «база данных», «проектирование», «SQL», «поиск», «справочник».

Бинарные

Сразу после

Q

\ Быть внутри

Ь

Статическая ситуация

0

1 Ситуация-программа

О....................... ы

Элемент

Элемент программы

'-Ó

Оператор программы

""О

ABC ... N

Рисунок 2 - Описание программы как последовательности операторов

Например, для онтологического описания понятия "SQL-проектирование": SQL-проектирование I • Проектирование, { Прикладной программист I «Актер • Специалист,

Задача I «Аргументы, SQL-Программа I • Результат, SQL I • Инструмент, База данных I «Предметная область } с Элемент | • Система .

Соответствующая признаковая структура приведена на рисунке 3. Для построения алгебраической системы признаковых структур вводятся следующие определения.

Пусть К - множество всех имен понятий, а Т - множество всех возможных типов понятий онтологии. Для онтологий предметной области можно выделить словарь-тезаурус : V = {(nN t,), (n2, t2), ... (пш, tj }, n, е К}, t, € Т, который

представляет собой множество всех типизированных понятий, используемых при проектировании онтологий различными группами специалистов

Заголовок

Наследование

Hmh[SQL - проектирование] Тип[П рооектирование»] Имя[Элемент\ Тип\Система]

Составляющие

Имя^Актер]

Тип\Специалист • Прикладной - программист •]

Имя[ Аргументы] Гкл[3адаа

Рисунок 3 - Признаковая структура понятия «Б()Ь-проектированиеу>

Определение 4. Примитивная признаковая структура s, некоторой i-й ситуативной структуры отологии представляет собой кортеж:

s, = ((Nps„ TpSj), (Nisi, Tis;),..., (nli, tlj),..., (nn„ tai)), где (Nps„ Tps,), (Nisj, Tisj) - соответственно, пары "имя, тип" задаваемого структурой понятия и "имя, тип"- понятия-предка по родовидовой таксономии, (nl„ tlj),..., (пп„ txii) - список пар для элементов ситуативной структуры.

Онтологическая структура документа Dj -есть совокупность структур sij, рассматриваемая как объединение атомарных структур в одно множество 2(DJ):2(DJ)={slJ,s2J,...,skJ}.

Определение 5. Множество признаковых структур, описывающих семантику документа, и само являющееся сложной признаковой структурой S„ представленной k-местным кортежем: Si = < s 1 j, s2j , ..skj > назовем комбинированной признаковой структурой (КПС).

Определение 6. Все возможные ситуативные структуры, соответствующие универсуму всех возможных документов, являются объединением всевозможных кортежей и составляют семантическое пространство I:

2 = { 2( D|), Ц D2), ..., £( D^, ..., S( D,) }, или, в терминах признаковых структур: £ = { Sb S2,..., Sj,..., Si }.

Универсальную алгебру А признаковых структур образуют два множества: Z, Q. Запись А = {2, Q } означает, что А состоит из носителя 2, представляющего собой все возможные комбинации онтологических структур (семантическое пространство) и Q, сигнатуры алгебры, т.е. множества операций, которые можно производить над элементами множества £.

Определение 7. В множестве 2 выделяется подмножество Zg , 20 с 2, которое состоит из одноэлементных кортежей, число которых равно числу понятий тезауруса и называемое базисом алгебры А. Эти одноэлементные кортежи назовем примитивными признаковыми структурами(Ш1С).

Из элементов £0 можно построить все множество 2 с помощью операций сигнатуры О. Одноэлементные множества ППС, образующиеся единственной парой "(имя, тип)", называются атомарными признаками (АП).

В главе исследованы свойства операций алгебраической системы признаковых структур, которые далее используются в алгоритме их унификации.

Общая схема алгоритма унификации представлена на рисунке 4. Основные обозначения сведены в таблицу 4.

Таблица 4 - Обозначения, использованные в алгоритме унификации

So Атомарный базис двух унифицируемых КПС

То, No Подмножества АП, тождественных по типу и по имени

Z, Подмножество тождественных АП

У- v Подмножества АП, подобных по типу и по имени

L Подмножество подобных АП

Ii(D),£i(P) Подмножества независимых ППС (можно также добавить определения через дополнения)

С, Класс тождественности

Ci, Сг; Сз; О, Cs. C<¡ Классы подобия

Ки Коэффициент унификации

Кис Сумма всех индексов унификации для всех классов тождественности

Кис i Сумма всех индексов унификации для всех скорректированных классов тождественности

• k¡ Весовые коэффициенты тождественности для разных классов

k* Дополнительный понижающий коэффициент, учитывающий классы коррекции 50 и Бр - исходные ППС

KD) и KP) КПС документа и абонента

SD И Sp Частичное подобие элементов

В четвертой главе рассматривается программная система ICF PUTE v.2.01 (ICF polymorphic unification tools environment), реализованная как инструментарий для унификации и структуризации прикладных онтологических описаний в технологии Semantic Web. Основной задачей, для решения которой была разработана система, является проверка работоспособности и эффективности алгоритма унификации онтологических структур. Кроме того, в системе ICF PUTE реализована поисковая подсистема, назначение которой - проверка работы средств структуризации и алгоритма унификации на конкретной прикладной задаче. На примере системы [CF PUTE в главе рассматриваются проектные решения для реализации систем этого класса. На рисунке 5 приведена архитектура системы.

Уровень данных системы состоит из специально разработанных онтологий и тезауруса. Две OWL-онтологии, общая и прикладная, содержат информацию о концептуализации, необходимой для работы системы в Semantic Web.

Выделе! не ХдДо.Ид

¡ВыделениеЕ- п

Выделение 11(0),11(Р)

Формирование С_

|| Формирование С,, Сг, С3, С,, С5, С6

с

Б* =5ви81)Л5о+ = !(п]..й)1(пЬ,ЧОеБо, | \/(тга,пт)б5р,(гоьЦ,)±(тю,ит))}) !

8„=8р; 30€СЭ(Х(0))

5*р =50, 5'реС3(1(Р))

С. йрсЗр или врсЗр.,

П = ((к,. |С. (Ц Э'))| + к,- (1( Р'))|) + I \ (Ц-|СДЕ(0'*))| + кг|С,(ЦР'»))|))/2 |

/ ио»)),с,(ЧР»)),сг(«о»)),сг / (Щ*)),...Х^ЦО^ С,(ЦР*_))}

Рисунок 4 - Обобщенный алгоритм унификации признаковых структур

Интерфейс пользователя

\7

Контролер

Модуль структуризации и унификации

Модуль обработки XML

Морфологически й модуль

Уровень приложения

i>

Поисковая подсистема

Парсер

\7 47 47

Г—х Г-^ icir;

\ Общая I ( Прикладная <

( tCF-онтология ) ( онтология ) Тезаурус

Уровень данных

Рисунок 5 - Архитектурная схема системы ICF PUTE

Основными компонентами уровня приложения являются модуль структуризации и унификации онтологических описаний и модуль-контролер, которые составляют ядро системы. Связь с уровнем данных осуществляется с помощью методов модуля структуризации и унификации. Этот модуль использует элементы знаний из онтологии и тезауруса при обработке онтологических описаний документов и запросов при информационном поиске. Для типизации концептов прикладной онтологии здесь используются концепты общей онтологии. Таким образом, обеспечивается свойство онтологического полиморфизма. Для анализа слов из тезауруса, модуль структуризации и унификации обращается к морфологическому модулю.

Модуль-контролер используется для решения вспомогательных задач, таких как обработка команд пользователя и передача их другим компонентам уровня приложения. Контролер отвечает за взаимодействие с модулем обработки XML-конструкций.

Поисковая подсистема функционирует на основе сервисов, предоставляемых контролером и модулем структуризации и унификации. Для анализа найденных Web-страниц используется специальный парсер.

На уровне пользовательского интерфейса реализованы диалоговые окна поиска документов, импорта и экспорта данных, конструктора модели пользователя, тестирования алгоритмов и настройки системы.

Поисковая подсистема системы ICF PUTE v.2.01 спроектирована как мета-поисковая система. Подсистема может обрабатывать запросы различной структуры. Это могут быть как традиционные наборы ключевых слов, так и специ-

ально спроектированные модели пользователя, включающие множества пар «имя понятия; тип». В этом случае тип концепта позволяет определить, под каким углом зрения рассматривается понятие в том или ином контексте, специфицировав общее полиморфическое описание понятия.

Поисковый модуль системы ÍCF PUTE ориентирован, главным образом, на работу с поисковыми серверами, использующими технологию Semantic Web. Такие серверы при индексировании документов используют онтологии, при этом каждый документ получает свое собственное онтологическое описание.

1 - ';."';';••• Ж:Ч - V".: V-

• -л • .. - ; - -

- -¿у- v^V. ' , '-W- , f' • .Л ■ v 7 -л v г

' • V,- - '■ А

' '' -' ~ • V-'- '■"•i,- •••'. ■■..-•'

..

-,< ' ■ ■ .•/ 7

■ ■■■: Í* ' г

• •

■ - .; - ..

• Запрос 1 ■ Запрос 2 Л Запрос 3

* Запрос 4

30О 400

Количество документов

Рисунок 6 - Зависимость времени поиска от сложности запроса и количества документов

Для использования всех возможностей ICF PUTE, к процедуре индексирования предъявляется требование типизации концептов онтологических описаний документов концептами общей онтологии. Если поисковый сервер удовлетворяет приведенным требованиям, алгоритм выполняет полиморфическую унификацию для уточнения результатов поиска. В противном случае выполняется расширенный поиск по ключевым словам. На последнем шаге поиска вычисляются коэффициенты релевантности документов, производится их ранжирование, после чего результаты выдаются пользователю.

В главе подробно проанализированы результаты двух серий экспериментов. В первой серии тестировались поисковые системы Yandex, Google, Quintu-ra, Sindice, ICF PUTE. При существенно больших затратах времени на семантический анализ iCF PUTE показала повышение пертинентности информационного поиска в 1,5-8 раз в сравнении с другими поисковыми системами.

Вторая экспериментальная серия проведена для определения зависимости времени поиска от сложности запроса и количества обработанных документов. Полученные результаты (рисунок 6) показывают, что зависимость времени по-

иска от количества обрабатываемых запросов близка к линейной, что является хорошим показателем вычислительной сложности алгоритма.

В заключении приводится обобщение основных результатов работы.

В приложениях приводится поясняющий материал, не вошедший в основной текст диссертации, а также копии документов о внедрении результатов диссертационного исследования.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Приведен краткий анализ существующих моделей знаний, применяемых в различных задачах для описания предметных областей. Рассмотрено соответствие основных понятий, используемых в различных моделях знаний. Приведена классификация онтологий, и описано семейство используемых для формализации дескриптивных логик DL, а также взаимосвязь языков логик AL, SHIQ, SHIN, SHOIN.

2. Приведен краткий обзор программных средств, используемых при структуризации и унификации онтологий. Проанализированы средства формализации онтологий в технологии Semantic Web, определены их положительные свойства и выявлены недостаточно исследованные проблемы.

3. Сформулирована цель и определены задачи развития формализмов и инструментальных программных средств в Semantic Web.

4. Приведены основные определения общей и прикладных онтологий, рассмотрено их взаимодействие и формальные отличия. Конструктивно описано новое lCF-отношение онтологий, имеющее свойство полиморфизма, превосходящее по структурным возможностям используемое в OWL свойство множественного наследования.

5. Разработана базовая версия общей ICF-онтологии, достаточная для адекватного описания семантики широкого класса предметных областей. Сформулированы основные принципы структуризации регулярных ICF-онтологий, обладающих свойствами, обеспечивающими эффективность при внесении изменений и дополнений в онтологическую структуру. Формально описаны правила реорганизации OWL-онтологий для приведения их к lCF-типу.

6. Рассмотрены способы проектирования прикладных онтологий для решения задач в технологии Semantic Web. Предложен новый способ последовательного проектирования, основанный на поэтапном построении семантики на основе is-A и Form-таксономий, упрощающий автоматизированное проектирование онтологических структур.

7. Предложена модификация DL логики с соответствующим дополнением семантики, позволяющая учитывать ICF-отношения, не нарушая свойств полноты и разрешимости. Рассмотрены вопросы применения онтологий для анализа документов в задачах информационного поиска с использованием Semantic Web.

8. Разработан новый подход к реализации алгоритмов унификации онтологий на основе их представления с помощью аппарата признаковых структур.

Исследованы алгебраические свойства операций отношений на множестве струетур признаков, позволяющие упростить алгоритм унификации признаковых структур.

Спроектирован алгоритм унификации признаковых структур для прикладных онтологий. В рамках алгоритма унификации конструктивно описаны принципы преобразования двух онтологий к их наиболее общей форме. Преобразование позволяет автоматически достраивать прикладные онтологии, используя результаты их унификации с другими.

9. Разработана оригинальная объектно-ориентированная архитектура поисковых систем, ориентированных на полиморфическое представление знаний. Приведены проектные решения, позволяющие оптимизировать программную реализацию алгоритмов унификации онтологий. Программно реализована система ICF PUTE v.2.01, использующая основные результаты теоретической части диссертации.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

В периодических изданиях из списка ВАК

1. Каширин Д.И. Формализм ICF-онтологии для представления знаний в глобальной сети нового поколения Semantic Web // ISSN 1995-4565. Вестник РГРТУ, выпуск 22, Рязань, 2007г., с. 57-64

2. Каширин Д.И. ICF-онтология для анализа документов в технологии Semantic Web // Вестник ТГТУ, том 13, №4, Тамбов, 2007г., с. 892-901

3. Каширин Д.И., Пылькин А.Н. Структуризация и унификация онтологических описаний на языке OWL в задачах информационного поиска // Известия высших учебных заведений. Проблемы полиграфии и издательского дела. №4 июль-август. М.: 2008., с. 45-57.

В других изданиях

4. Каширин Д.И. Эвристические программы, использующие объекты // Доклады МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань, РГРТА, 2002. с. 103-105.

5. Каширин Д.И. Применение объектно-ориентированных методов в эвристическом программировании // Межвуз. Сб. науч. трудов «Информатика и прикладная математика, Рязань, РГПУ, 2002. с. 69-70.

6. Каширин Д.И. Применение интеллектуальных метастратегий при прогнозировании количественных и качественных экономических показателей // VIII Всероссийская НТК «Новые информационные технологии в научных исследованиях и в образовании», Рязань, РГРТА, 2003. с. 145-147.

7. Guchapshev Н., Kashirm D. Intellectual Systems Оf Information Retrieval Based On Algebraic Representation Of Queries // Interactive Systems: The Problems of Human-Computer Interaction. - Proceedings of the International Conference, 2327 September 2003. - Ulyanovsk: U1STU, 2003. c.15-16. ■ ;

8. Гучапшев X.M., Каширин Д.И. Интеллектуальные системы информационного поиска с алгебраическим представлением запросов // МНТК «Проблемы

передачи и обработки информации в сетях и системах телекоммуникаций». Материалы конференции. Рязань, РГРТА, 2003.

9. Каширин Д.И. Об основных признаках интеллектуальных систем // Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. трудов», Рязань, РГРТА, 2004. с. 66-70.

10.Каширин Д.И. Использование метрических шкал в алгоритме нечеткой унификации II МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Материалы конференции. Рязань, РГРТА, 2004. с. 176-177.

11.Каширин Д.И. Алгоритм нечеткой унификации интеллектуальных автоматизированных систем // Современные проблемы информатизации в технике и технологиях: Сб. трудов. Вып. 10 / Под ред. О.Я.Кравца - Воронеж: Издательство «Научная книга», 2005. с. 219-221.

12.Каширин Д.И. Использование унификации в логическом программировании // МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Материалы конференции. Рязань, РГРТА, 2005. с. 163165.

13.Каширин Д.И. Поиск документов в электронном справочнике с использованием алгоритмов унификации // IV Межвузовская НТК «Новые технологии в учебном процессе и производстве». Материалы конференции. Рязань: Рязанский ин-т МГОУ, 2006. с. 31-33.

14.Каширин Д.И. Повышение эффективности поиска документов с помощью унификации признаковых структур // Современные проблемы информатизации в моделировании и анализе сложных систем: Сб. трудов. Вып. 12 (по итогам XII международной конференции) / Под ред. ОЛ.Кравца - Воронеж: Издательство «Научная книга», 2007. с. 173-175.

15.Каширин Д.И. Использование унификации в системах поиска текстовых документов // Математическое и программное обеспечение информационных систем: Межвуз. сб. науч. трудов, - М.: Горячая линия - Телеком, 2007. с. 66-68.

16.Каширин Д.И. Использование онтологий для создания моделей пользователей и документов // Актуальные проблемы информатизации. Развитие информационной инфраструктуры, технологий и систем. Всероссийская межвузовская научно-практическая конференция: Материалы конференции. - М.: МИЭТ, 2007. 224с. - с. 108-109.

17.Каширин Д.И. Метапоисковая система на основе унификации онтологических структур // Современные проблемы информатизации в проектирования и информационных системах: Сб. трудов. Вып. 13 (по итогам XIII международной конференции) / Под ред. О.Я.Кравца - Воронеж: Издательство «Научная книга», 2008. с.473-476.

18.Каширин Д.И. Полиморфические онтологии для описания информационных ресурсов в Semantic Web // МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Материалы конференции. Часть 2. Рязань, РГРТУ, 2008. с.43-45.

19.Каширин Д.И. OntoUNI - программа унификации онтологических признаковых структур. Свидетельство об официальной регистрации программы для ЭВМ в ОФАГТ, №9885 от 15.02.2008.

20.Каширин Д.И. ICF PUTE - Метапоисковая система на основе унификации онтологических структур. Свидетельство об официальной регистрации программы для ЭВМ в ОФАП, №10019 от 26.02.2008.

21.Каширин Д.И., Крошилина C.B. Поиск документов в Интернет с помощью структуризации и унификации онтологических описаний // Новые информационные технологии в научных исследованиях и в образовании: материалы XIII Всероссийской НТК. Часть I. Рязань, РГРТУ, 2008., с. 147-149.

Каширин Денис Игоревич

Алгоритмы структуризации и унификации для моделей знаний в технологии Semantic Web на основе синтеза OWL-онтологий

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Подписано в печать 22.09.2008.Формат бумаги 60x84 1/16. Бумага офисная. Печать офсетная. Усл. печ. л. 1,0. Усл.-изд. л. 1,0. Тиране 100 экз.

Разанский государственный радиотехнический университет. 390005, г. Рязань, ул. Гагарина, д. 59/1. Редакционно-издательский центр РГРТУ.

Оглавление автор диссертации — кандидата технических наук Каширин, Денис Игоревич

Введение.

Глава 1. Проблема инженерии знаний в технологии Semantic Web.

1.1 Цели и задачи развития технологии Semantic Web.

1.2 Основные понятия и модели представления знаний, используемые для описания информационных ресурсов.

1.3 Дескриптивная логика как средство формализации онтологии.

1.4 Семейство языков OWL для описания онтологий в Semantic Web.

1.5 Проблемы развития технологии Semantic Web.

Основные результаты.

Глава 2. Разработка базового формализма для полиморфического представления знаний и системы оперирования онтологическими описаниями.

2.1 Проектирование общей ICF-онтологии для полиморфического представления знаний с использованием дескриптивной логики.

2.1.1 Основные понятия и определения.

2.1.2 Основные отношения онтологии.

2.1.3 Описание таксономии. Пример описания.

2.2 Типизация концептов.

2.3 Мета-отношения.

2.4 Принципы построения общих регулярных ICF-онтологий.

2.4.1 Принципы организации общих регулярных онтологий.

2.4.2 Дихотомическая классификация концептов.

2.4.3 Строгая родовидовая таксономия (Is-A).

2.4.4 Исключение множественного наследования.

2.4.5 Строгая видо-видовая таксономия (Form).

2.4.6 Противоположность дочерних вершин в дихотомической триаде.

2.4?7 Уникальность концептов. Редукция в смежное наследование.

2.4.8 Минимальность пути смежного наследования.

2.5 Правила реорганизации регулярных ICF-онтологий.

2.6 Принципы проектирования прикладных регулярных ICF-онтологий

2.6.1 Формальные отличия прикладных онтологий от общей.

2.6.2 Принципы проектирования прикладных онтологий.

2.6.3 Способы проектирования прикладных онтологий.

2.6.4 Способ последовательного проектирования.

2.6.5 Взаимодействие общей и прикладной онтологий.

Основные результаты.

Глава 3. Алгоритмы унификации и структуризации для моделей знаний в технологии Semantic Web.

3.1 Дескриптивная логика с ICF-типизацией.

3.1.1 Дескриптивная логика и ее семантика.

3.1.2 Проблема анализа документов для поиска.

3.1.3 Прикладная ICF-онтология. Описание в DL-нотации.

3.1.3.1 Описание сложных ситуативных структур.

3.1.3.2 Ситуативные структуры на примере предметной области "программирование".

3.1.3.3 Пример описания предметной области.

3.2 Унификация в прикладных ICF-онтологиях.

3.3 Алгебраическая система онтологических признаковых структур.

3.3.1 Концепция признаковых структур.

3.3.2 Основные определения.

3.3.3 Свойства отношений и операций.

3.4 Алгоритм унификации онтологических признаковых структур.

3.5 Формальное описание алгоритма унификации.

3.6 Схема алгоритма унификации.

Основные результаты.

Глава 4. Унификация и структуризация прикладных онтологических описаний в программной системе ICF PUTE.

4.1 Назначение программной системы ICF PUTE.

4.2 Проектирование архитектуры системы.

4.3 Вопросы реализации алгоритма унификации.

4.4 Поисковая подсистема.

4.5 Диаграмма классов.

4.6 Проектные решения в системе ICF PUTE.

4.7 Экспериментальный анализ свойств системы и сравнение с существующими аналогами.

Основные результаты.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Каширин, Денис Игоревич

Актуальность работы. Интенсификация развития современных технологий стала возможной за счет широкого внедрения средств информационной поддержки специалистов. К таким средствам относятся глобальные сети, распределенные информационные хранилища, интеллектуальные агенты и специализированные сервисы [1-3]. В то же время существование востребованных данных, ликвидной информации или удобного программного сервиса в электронной форме не означает доступность этих средств для потребителя. Трудоемким остается не только их поиск, но и интегрирование информационных ресурсов в единую, совместимую для разных специалистов среду.

Решение проблемы видится ученым в семантическом подходе [4, 5]. Суть подхода в описании информационных ресурсов с помощью моделей знаний (МЗ), которые должны быть стандартизованы и понятны широкому кругу профессионалов в различных предметных областях (ПО). Весомые результаты в работах по представлению знаний связаны с такими учеными, как В.П. Гладун, Д.А. Поспелов, Э.В.Попов, В.Ф. Хорошевский, D.G. Bobrow, М. Minsky, R.C. Schenk, Т. Winograd.

Одним из наиболее известных современных подходов к стандартизации онтологического представления знаний является разработка консорциума W3C, развивающего Internet-технологии. Последняя версия стандарта в форме языка описания онтологий OWL (Web Ontology Language) была предложена научно-исследовательской группой W3C в 2004г. как основа новой технологии Semantic Web [4]. Технология была распространена на решение широкого круга задач, к которым относятся не только интеллектуальный поиск информации, но также автоматическое аннотирование документов и семантическое сопровождение баз данных (информационных хранилищ) [6]. Наиболее известные работы в этой области принадлежат ученым: А.С. Клещев, А.В. Манцивода, Т. Berners-Lee, T.R. Gruber, М.А. Musen, R. Staab, D. Studer.

В рамках Semantic Web различными группами специалистов разработаны и апробированы программы структуризации, оптимизации и конвертирования онтологических описаний (00) [7], такие, как Protege, Chimaera, Onto-lingua, ODE, GrOWL, FCA-Merge и др. Методологической основой таких программ являются оригинальные подходы к структуризации и унификации 00 с помощью их представления в специализированных МЗ. Опыт разработки реальных программ позволил выявить следующие проблемы, решение которых является наиболее актуальным.

1) Необходимо получить подробное и адекватное ПО онтологическое описание, учитывающее не только специфику тематической специализации, но и общую МЗ о мире, как основу совместимости знаний в разных ПО.

2) Существует проблема выделения ликвидных знаний из данных в условиях неоднородности и больших объемов первоначальной информации.

3) Необходимо иметь возможность реорганизации МЗ при внесении изменений в их первоначальную классификацию без дальнейших потерь при поиске.

4) Существует сложность в отыскании пользователя, нуждающегося в конкретной информации, с учетом различия задач, интересов и мотивации у разных пользователей.

5) Остается малоизученной проблема полиморфизма 00, предполагающая рассмотрение системы понятий под различными углами зрения различными специалистами из ПО.

6) Внесение изменений в существующие принятые формализмы не должно затрагивать их основания, т.е. принципов описания семантики.

Сложность решения перечисленных проблем является главной причиной низкой релевантности существующих поисковых систем и интеллектуальных агентов. Решение этих проблем связано с необходимостью получения новых модификаций известных формализмов, обладающих более хорошими возможностями представления знаний в МЗ, но не разрушающими достигнутые результаты по полноте и разрешимости логических теорий. Кроме того, необходимо получение новых программных средств, дающих возможность структуризации и унификации 00, делающих возможной оптимизацию, облегчающих автоматизацию проектирования и внесение изменений в 00.

Одному из подходов к решению этих проблем посвящена настоящая диссертация.

Целью диссертации является исследование и модификация формализма OWL-ориентированных онтологий, а также разработка алгоритмов унификации для МЗ, упрощающих оптимизацию, реорганизацию и автоматизированное проектирование их семантических описаний за счет использования полиморфических структур.

Достижение поставленной цели работы связано с решением следующих задач:

• анализ и модификация дескриптивной логики DL на основе использования иерархической типизации концептов для учета родовидовой таксономии, обладающей свойством полиморфизма;

• разработка представления 00 с использованием концепции признаковых структур (ПС) для выработки требований к регулярным формам онтологических ПС, позволяющим снизить трудоемкость их верификации и унификации;

• разработка универсальной алгебраической системы онтологических ПС и исследование ее операций и отношений, влияющих на свойства отношений эквивалентности и подобия онтологий;

• проектирование алгоритмов структуризации и унификации OWL-ориентированных 00, обеспечивающих возможность автоматизированной модификации и оптимизации семантических описаний ПО;

• разработка программного инструментария унификации онтологий с учетом свойств их концептов и отношений, повышающего характеристики релевантности поисковых систем и интеллектуальных агентов, работающих в технологии Semantic Web.

Методы исследования

В работе использовались дескриптивная логика, теория унификации, концепция признаковых структур, универсальные алгебры и бинарные отношения, методы объектно-ориентированного анализа.

Научная новизна работы заключается в получении нового модифицированного формализма, основанного на использовании базового отношения ICF, обладающего свойством полиморфизма при онтологическом описании ПО. Формализм позволяет адекватно описывать семантику ПО, за счет чего повышается релевантность поиска в распределенных информационных сетях и хранилищах. Спроектированный в диссертации алгоритм унификации Web-ориентированных 00 дает возможность автоматизировать верификацию, дополнение и унификацию онтологий ПО, изначально разработанных различными специалистами.

На защиту выносятся

1. Новый формализм для адекватного онтологического описания ПО, обладающий возможностью полиморфического представления используемых в описании понятий и отношений.

2. Общие принципы построения регулярных онтологических структур, позволяющих снизить трудоемкость верификации и реорганизации МЗ ПО.

3. Метод последовательного синтеза регулярных OWL - ориентированных онтологий.

4. Алгебраические свойства операций и отношений, влияющие на формирование классов эквивалентности и подобия двух онтологий, изначально разработанных различными специалистами.

5. Оригинальный алгоритм унификации онтологий, позволяющий повысить характеристики релевантности поиска документов, данных и информационных сервисов в технологии Semantic Web.

Практическая значимость работы. На основе полученных теоретических результатов автором создана инженерная методика проектирования регулярных 00, состоящих из общей и прикладной онтологий для заданной ПО. Эффект от внедрения методики получается за счет следующего улучшения характеристик:

• снижение трудоемкости проектирования и улучшения достоверности семантического описания ПО,

• упрощение верификации соответствующей МЗ с выявлением противоречивых утверждений о понятиях и отношениях модели ПО,

• упрощение достраивания МЗ при появлении новых описаний для понятий и отношений ПО,

• унификация различных онтологий с целью обеспечения их совместимости для различных специалистов.

Практическим результатом является программная реализация инструментария TCF -PUTE -v. 2:01 -для структуризации и -унификации OWL-ориентированных онтологий в технологии Semantic Web, выполненная с использованием-средств Protege и Microsoft Visual зС# 2005. -Программа может использоваться в системах интеллектуального поиска, информационных сервисах Internet и интеллектуальных агентах с целью улучшения характеристик точности поиска.

Реализация и внедрение результатов работы. Результаты исследования внедрены в форме программного информационного сервиса в автоматизированной системе негосударственного пенсионного фонда «Алмазная Осень» в Республике Саха (Якутия) а также, в поисковой системе Рязанского Центра научно-технической информации. Методические результаты внедрены в учебный процесс Рязанского государственного радиотехнического университета при подготовке и выполнении практических занятий студентами специальности 230105 - «Программное обеспечение -вычислительнойтехники ^ автоматизированных систем» по дисциплине «Объектно-ориентированное программирование», и специальности 080801 - «Прикладная информатика (в экономике)» по дисциплине «Высокоуровневые методы программирования». Программные средства, разработанные автором диссертации зарегистрированы в отраслевом фонде алгоритмов и программ (Свидетельства о регистрации №9885 от 15.02.2008, №10019 от 26.02.2008).

Апробация работы. Результаты исследований, составляющие основное содержание диссертации докладывались на 9-и международных и 3-х всероссийских конференциях и семинарах:

• МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань, РГРТУ 2002, 2003, 2004, 2005, 2008 гг.;

• "МНТК «Современные проблемы информатизации». "Воронеж, ВГТУ 2005, 2007, 2008 гг.;

• "Всероссийская "НТК «Новые информационные технологии в научных исследованиях и в образовании», Рязань, РГРТУ, 2003, 2008гг.;

• 'International'Conference <<Interactive*Systems>>. Ulyanovsk: U1STU, 2003;

• Всероссийская НТК «Новые технологии в учебном процессе и производстве». Рязань, Рязанский ин-т МГ0У, 2006гг;

• Всероссийская НПК «Актуальные проблемы информатизации». Москва, МИЭТ, 2007г.

Публикации. По теме диссертации опубликовано 19 научных работ: 3 статьи, 1 тезисы доклада и 12 материалов докладов на международных и всероссийских конференциях и семинарах. Кроме того, опубликовано три статьи в изданиях, включенных в перечень ВАК.

Структура и объем работы. Диссертация состоит из введения, 4-х глав, заключения, списка литературы и 2-х приложений, содержащих копии документов о внедрении и материалы, не вошедшие в основной текст диссертации. Общий объем работы составляет 185 страниц, в том числе основное содержание -171 е., 34 рисунка, 15 таблиц, списка литературы на 12 страницах (124 наименования), приложения -14 с.

Заключение диссертация на тему "Алгоритмы структуризации и унификации для моделей знаний в технологии Semantic Web на основе синтеза OWL-онтологий"

Основные результаты

1. Разработана оригинальная объектно-ориентированная архитектура поисковых систем, ориентированных на полиморфическое представление знаний.

2. Приведены проектные решения, позволяющие оптимизировать программную реализацию алгоритмов унификации онтологий.

3. Программно реализована система ICF PUTE v.2.01, использующая основные результаты теоретической части диссертации.

4. Экспериментально доказана эффективность полиморфического поиска по критериям релевантности и пертинентности.

5. Предложен удобный пользовательский интерфейс, дающий возможность адаптировать информационный поиск под особенности предметной области и индивидуальный подход пользователя, используя характеристики тождественности и подобия онтологических структур, описывающих предметную область.

Заключение

Диссертация посвящена решению актуальной научно-технической задачи разработки алгоритмов структуризации и унификации для моделей знаний с полиморфическими свойствами отношений. Разработанные в результате исследования онтологические модели, алгоритмы и программы могут служить основой для проектирования интеллектуальных сервисов и систем информационного поиска в технологии Semantic Web.

В ходе диссертационного исследования получены следующие основные результаты.

1. Приведен краткий анализ существующих моделей знаний, применяемых в различных задачах для описания предметных областей. Рассмотрено соответствие основных понятий, используемых в различных моделях знаний. Приведена классификация онтологий, и описано семейство используемых для формализации дескриптивных логик DL, а также взаимосвязь языков логик AL, SHIQ, SHIN, SHOIN.

2. Приведен краткий обзор программных средств, используемых при структуризации и унификации онтологий. Проанализированы средства формализации онтологий в технологии Semantic Web, определены их положительные свойства и выявлены недостаточно исследованные проблемы.

3. Сформулирована цель и определены задачи развития формализмов и инструментальных программных средств в Semantic Web.

4. Приведены основные определения общей и прикладных онтологий, рассмотрено их взаимодействие и формальные отличия. Конструктивно описано новое ICF-отношение онтологий, имеющее свойство полиморфизма, превосходящее по структурным возможностям используемое в OWL свойство множественного наследования.

5. Разработана базовая версия общей ICF-онтологии, достаточная для адекватного описания семантики широкого класса предметных областей. Сформулированы основные принципы структуризации регулярных ICF-онтологий, обладающих свойствами, обеспечивающими эффективность при внесении изменений и дополнений в онтологическую структуру. Формально описаны правила реорганизации OWL-онтологий для приведения их к ICF-типу.

6. Рассмотрены способы проектирования прикладных онтологий для решения задач в технологии Semantic Web. Предложен новый способ последовательного проектирования, основанный на поэтапном построении семантики на основе Is-A и Form-таксономий, упрощающий автоматизированное проектирование онтологических структур.

7. Предложена модификация DL логики с соответствующим дополнением семантики, позволяющая учитывать ICF-отношения, не нарушая свойств полноты и разрешимости. Рассмотрены вопросы применения онтологий для анализа документов в задачах информационного поиска с использованием Semantic Web.

8. Разработан новый подход к реализации алгоритмов унификации онтологий на основе их представления с помощью аппарата признаковых структур. Исследованы алгебраические свойства операций отношений на множестве структур признаков, позволяющие упростить алгоритм унификации признаковых структур.

9. Спроектирован алгоритм унификации признаковых структур для прикладных онтологий. В рамках алгоритма унификации конструктивно описаны принципы преобразования двух онтологий к их наиболее общей форме. Преобразование позволяет автоматически достраивать прикладные онтологии, используя результаты их унификации с другими.

Библиография Каширин, Денис Игоревич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Moukas. A., Maes. P. Amalthaea: An evolving Multi-Agent 1.formation Filtering and Discovery System for the WWW, Autonomous Agents and Multi-Agent Systems, 1, 1998.-pp. 59-88.

2. Агеев M.C., Добров Б.В., Лукашевич H.B., Сидоров А.В. Экспериментальные алгоритмы поиска/классификации и сравнение с «basic line». // Российский семинар по Оценке Методов Информационного Поиска (РОМИП 2004) — Пущино, 2004. — стр. 62-89.

3. Рассел С., Норвиг П. «Искусственный интеллект: современный подход (AIMA)», 2-е издание.: Пер. с англ. М. : Издательский дом "Вильяме", 2006. - 1424 с.

4. Berners-Lee Т., Hendler J., Lassila О. The Semantic Web, Scientific American, 17. Mai 2001.

5. Klein M. Supporting Evolving Ontologies on the Internet, in EDBT Workshops 2002, 2002. pp. 597-606.

6. Passin T.B. Explorer's guide to the Semantic Web, Manning Publication Co., Greenwich, 2004. 282 p.

7. Овдей O.M., Проскудина Г.Ю. Обзор инструментов инженерии онтологий. Труды 6-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL2004, Пущино, Россия, 2004. - 11с.

8. Menczer F., Belew R.K. Adaptive information agents: Internalizing local context and scaling up to the web. Machine Learning, 2000, pp.203-242.

9. Henzinger M.R. Hyperlink analysis for the web. IEEE Internet Computing, 2001, pp. 45-50.

10. Каширин Д.И., Гучапшев Х.М. Интеллектуальные системы информационного поиска с алгебраическим представлением запросов/ МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Материалы конференции. Рязань, РГРТА, 2003.

11. Минский М. Фреймы для представления знаний. М.: Энергия, 1979. -151с.

12. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем, «Питер», СПБ, 2001 384с.

13. Beckett D. W3C Recommendation, February 10, 2004, Электронный ресурс./ Режим доступа http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/

14. Unicode standard Электронный ресурс. Режим доступа: http://www.unicode/unicode/standard/standard.html

15. Дейтел X. М., Дейтел П. Дж., Нието Т. Р., Лин Т.М., Садху П. Как программировать на XML. М., Бином-Пресс, 2007 г. - 944 стр.

16. Lassila О., Hendler J. Embracing «Web 3.0». ШЕЕ Internet Computing, May/June 2007. IEEE Computer Society, 2007.

17. Prudhommeaux E., Seaborne A. SPARQL Query Language for RDF. W3C working draft, 26 Mar. 2007; www.w3.org/TR/rdf-sparql-query.

18. Patel-Schneider P. F., Hayes P., Horrocks I. OWL Web Ontology Language Semantics and Abstract Syntax, W3C Recommendation, 10 February 2004, http://www.w3.org/TR/2004yREC-owl-semantics-20040210/

19. Tsarkov D., Horrocks I., Patel-Schneider P. F. Optimizing Terminological Reasoning for Expressive Description Logics. J. of Automated Reasoning, 39(3), 2007 pp.277-316.

20. Клещев A.C., Шалфеева E.A. Онтологии и их классификация. Владивосток, РАН ДО ИАПУ, 2005. - 19с.

21. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М.: Наука, 1983. - 288с.

22. Попов Э.В. Искусственный интеллект: Кн.1. Системы общения и экспертные системы: Справочник / под ред. Попова Э.В. М.: радио и связь, 1990. - 464с.

23. Нильсон Н. Принципы искусственного интеллекта. М.: Радио и связь, 1985. - 372с.

24. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энергоиздат, 1981. - 231с.

25. Каширин Д.И. Эвристические программы, использующие объекты // Доклады МНТК «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань, РГРТА, 2002.

26. Троелсен Э. С# и платформа .Net. СПб.: «Питер», 2007. - 796с.

27. Слэйгл Дж. Искусственный интеллект. М.: Мир, 1973. - 319с.

28. Загорулько Ю.А. Семантические сети и системы продукций. Методическое пособие. Изд-во НГУ. Новосибирск, 1996. 46с.

29. Шенк Р. Обработка концептуальной информации. М. Энергия, 1980. -360с. v

30. Поспелов Д.А. Ситуационное управление. Теория и практика. М.: Наука, 1986. - 288с.

31. Братко И. Язык PROLOG (Пролог): алгоритмы искусственного интеллекта. -М.: Издательский дом "Вильяме", 2007. 640с.

32. Мартынов В.В. Основы семантического кодирования. М.: ЕГУ, 2001. -140 с.

33. Брябрин В.М. Ф-язык формализм для представления знаний в интеллектуальной диалоговой системе // Прикладная информатика. Сб. статей.-М., 1981.-е. 73-103.

34. Гладун В.П. Растущие пирамидальные сети // Новости искусственного интеллекта, №1, 2004. с. 30-40.

35. Knight К. Unification: A Multidisciplinary Survey. ACM Computing Surveys. - 1989. - V.21. -Nl. - pp. 93-124.

36. Abdul-Ghafour S., Ghodous P., Shariat В., Perna E. A Common Design-Features Ontology for Product Data Semantics Interoperability // IEEE/WIC/ACM International Conference on Web Intelligence (WT07), 2007. pp. 443-446.

37. Bullinaria J.A., Huckle C.C. Modelling lexical decision using corpus derived semantic representations in a connectionist network. In Proceedings of the Fourth Neural Computation and Psychology Workshop, 1997.

38. Кормен Т. X. и др. Алгоритмы для работы с графами // Алгоритмы: построение и анализ 2-е изд. — М.: «Вильяме», 2006. — С. 1296.

39. Клыков Ю.И. Ситуационное управление большими системами. М.: Энергия, 1974. - 134с.

40. Кандрашина Е.Ю., Литвинцева А.В., Поспелов Д.А. Представление знаний о времени и пространстве в интеллектуальных системах. М.: Наука, 1989.

41. Bloch I., Petrosino A., Tettamanzi A.G.B. Fuzzy Logic and Applications // Lecture Notes in Computer Science, Vol. 3849, 2006.

42. Masulli F., Mitra S., Pasi G. Applications of Fuzzy Sets Theory // Lecture Notes in Computer Science, Vol. 4578, 2007.

43. Goldstein I. A Frame Representation Language, AI Memo 333, MIT, Cambridge, MA, 1976.

44. Uschold M. Knowledge Level Modeling: Concepts and Terminology. In The Knowledge Engineering Review, Vol. 13:1, 1998, pp.5-29.

45. Гладкий A.B. Формальные грамматики и языки. М.: Наука, 1973. -368с.

46. Baader F., Narendran. P. Unification of concepts terms in description logics. J. of Symbolic Computation, 31(3), 2001- pp. 277-305.

47. Baader F., Horrocks I., Sattler U. Description Logics. In Frank van Harmelen, Vladimir Lifschitz, and Bruce Porter, editors, Handbook of Knowledge Representation. Elsevier, 2007.

48. Beckett D. RDF/XML Syntax Specification (Revised), W3C Recommendation, 10 February 2004, режим доступа : http://www.w3.Org/TR/2004/REC-rdf-syntax-grammar-20040210/

49. Fensel D., Lausen H., Polleres A., Bruijn J., Stollberg M., Roman D., Domingue J. Enabling Semantic Web Services. The Web Service Modeling Ontology. Springer-Verlag, Berlin Heidelberg 2007 - 188 p.

50. Fensel D., Harmelen F., Horrocks I., McGuinness D., Patel-Schneider P. F. OIL: An Ontology Infrastructure for the Semantic Web. IEEE Intelligent Systems, 16(2), 2001. 38-45pp.

51. Bryson J., at al. Agent-Based Composite Services in DAML-S. 2002, - Режим доступа: www.cs.batch.ac.ulc/~jjb/ftp/springer-daml.pdf

52. Bruijn J., Polleres A., Lara R., Fensel D. OWL DL vs. OWL Flight: Conceptual modeling and reasoning on the Semantic Web. In Proceedings of the 14th International World Wide Web Conference (WWW2005), Chiba, Japan, 2005.

53. Артемьева И.Л., Высоцкий В.И., Рештаненко H.B. Модель онтологии предметной области (на примере органической химии) // НТИ, сер.2. 2005. №8. с. 19-27.

54. Клещёв А.С., Москаленко Ф.М., Черняховская М.Ю. Модель онтологии предметной области "Медицинская диагностика". В 2-х частях. // НТИ. Сер. 2. Часть 1: 2005. №.12. с.1-7. Часть 2: 2006. № 2. с.19-30.

55. Холюшкин Ю.П., Гражданников Е.Д. Системная классификация археологической науки (элементарное введение в археологическое науковедение). Новосибирск: Изд-во ИДМИ Минобразования, Новосибирск, 2000.

56. Bruauxs S., Kassel G., Morel G. An Ontological approach to the construction of problem-solving models, LARIA RESEARCH REPORT: LRR 2005-03, May, 2005. Юр.

57. Farquhar A., Fikas R., Rice J. The Ontolingua server: A tool for collaborative ontology construction // International Journal of Human-Computer Studies, 46(6), 1997.-pp. 707-728.

58. Sure Y., Erdmann M, Angele J., Staab S., Studer R., Wenke D. OntoEdit: Collaborative ontology development for the Semantic Web. // In Proc. of the Inter. Semantic Web Conference (ISWC 2002), Sardinia, Italia, June 2002.

59. Leuf B. The semantic web. Crafting infrastructure for agency. John Wiley & Sons Ltd, GmbH, 2006. 358p.

60. Grosso E., at al. Knowledge modeling at the millennium: the design and evolution of PROTEGE-2000. In proceedings of the 12-th International Workshop on Knowledge Acquisition, 1999, Banff, Canada.

61. Chaudhri V., Farquhar A., Fikes R., Karp P., Rice J. OKBC: A Programmatic Foundation for Knowledge Base Interoperability. // Fifteenth National Conf. on Artificial Intelligence. AAAIPres/The MIT Press, Madison, 1998. pp. 600-607.

62. Altova SemanticWorks Электронный ресурс. http://www.altova.com /products/semanticworks/semanticwebrdfowleditor.html

63. Fernandez M, Gomez-Perez A., Pazos J. A Building a Chemical Ontology Using Methondology and the Ontology Design Environment // IEEE Intelligent Systems, Jan./Feb. 1999.- pp. 37-46.

64. Arpirez J.C., Corcho O, Fernandez-Lopez M, Gomez-Perez A. WebODE: a scalable workbench for ontological engineering // First Intern. Conf. on Knowledge Capture (K-CAP)., Oct. 21-23, 2001. Victoria, Canada.

65. GrOWL Электронный ресурс. http://ecoinformatics.uvm.edu /technologies/growl-knowledge-modeler.html

66. Bechhofer S. OilEd: Travailing domain experiment: Preliminary results for Oiffid. In Sure&Angele, Vol.62., 2002. pp.80-82.

67. Schreiber G., Akkermans H., Anjewierden A., at al. The CommonKADS Methodology. // Knowledge engineering and management. MIT press, Mas-sachussets, 1999.

68. Domingue J. Tadzebao and WebOnto: Discussing, Browsing, and Editing Ontologies on the Web // Proc. of the 11th Knowledge Acquisition for KBS Workshop, Modeling and Management, KAW'98, April 1998, Banff, Canada.

69. MacGregor R. Inside the LOOM classifier // SIGART bulletin, Vol.3, No.2, 1991.-pp. 70-76.

70. Dou D., McDermott D., Qi P. Ontology translation by ontology merging and automated reasoning // EKAW'02 workshop on Ontologies for Multi-Agent Systems. Siguenza, Spain, 2002.

71. Noy N.F., Musen M.A. PROMPT: Algorithm and tool for automated ontology merging and alignment. In Proceedings of the 17th National Conf. On AI (AAAI2000), pp.450-455.

72. McGuinness D., Fikes R., Rice J., Wilder S. An environment for merging and testing large ontologies // In Proc. of the 7th Int. Conf., KR2000, Morgan Kaufmann Publishers, San Francisco, CA, 2000.

73. Guarino N., at al. OntoSeek: Content-based access to the Web. IEEE Intelligent Systems, 14(3).

74. Mitra P., Wiederhold G., Decker S. Ascalable framework for interoperation of informationsources // The 1st Intern. Semantic Web Working Symp., SWWS'01, Stanford University, CA, 2001.

75. Stumme G., Medche A. FCA-Merge: Bottomup merging of ontologies // In Proceeding of Int. Joint Conf. on Artificial Intelligence, (IJCAI2001), Seattle, USA, 2001, pp.225-234.

76. Heflin J. Hendler J. A Portrait of the Semantic Web in Action // IEEE Intelligent Systems, March/April, 2001.- pp. 54-59.

77. Дублинское ядро Электронный ресурс. http://metabrowser.spmt. net.au/tutorial/DC.html.

78. Maedche A. at al. SEAL typing up information integration and web site management by ontologies. IEEE Computer Society Data Engineering Bulletin, 25(1), 2002,- pp. 10-17.

79. Smolle P., Sure Y. FRED: Ontology-based agents for enabling e-coachingjsupport in large company. In 2 Int. Workshop on Ontologies in Agent Systems, 2002, Bologna, Italy.

80. Tennison J., Shadbolt N. APECKS: A tool to support living ontologies.- In 11th Knowledge Acquisition Workshop (KAW 1998), Banff, Canada.

81. Гаврилова T.A. Управление знаниями: что делать? // Сб. докладов Седьмой научно-практической конференции «Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями» (РБП-СУЗ-2004). М. с.61-67.

82. Davies J., Studer R., Warren P. Semantic Web technologies: trends and research in ontology-based systems/ Davies, J. (N. John), Chichester, 2006. 312c.

83. Хаусдорф Ф. Теория множеств. M.: Едиториал УРСС, КомКнига, ЛКИ, 2006 г.-384с.

84. Кострикин А.И. Введение в алгебру. Основы алгебры. М.: Физматлит, 1994.-320с.

85. Baader F., Penaloza. R. Axiom pinpointing in general tableaux. LTCS-Report 07-01, Germany, 2007. -http://lat.inf.tu-dresden.de/research/reports.html.

86. Mizogushi R., Bourdeau J. Using Ontological Engineering to Overcome Common AI-ED Problems // International Journal of Artificial Intelligence in Education, 2000, vol. 11, 1-12.

87. Churning Ch., Manton M. Extending Description Logic for Reasoning about Ontology Evolution // IEEE/WIC /АСМ International Conference on Web Intelligence (WT07) pp. 452-456.

88. Shaban-Nejad A., Haarslev V. Managing Conceptual Revisions in a Temporal Fungal Taxonomy. CBMS 2007, pp. 624-632.

89. Burger A. at al. Integrating partonomic hierarchies in anatomy ontologies, BMC Bioinformatics 2004, pp.184.

90. Каширин Д.И. ICF-онтология для анализа документов в технологии Semantic Web. Вестник ТГТУ, том 13, №4, 2007г., с. 892-901.

91. Каширин Д.И. Формализм ICF-онтологии для представления знаний в глобальной сети нового поколения Semantic Web, Вестник РГРТУ, № 4, 2007.

92. Потапова Р.К. Новые информационные технологии и лингвистика, М.: УРСС, 2005. 368 с.

93. Cawsey A. Developing an Explanation Component for a Knowledge-Based System: Discussion', In Expert Systems with Applications, vol 8:4, 1995. -pp. 527-531.

94. Ильина Е.П., Слабоспицкая O.A. Формы, метрики и свойства отношения сходства между концептами в онтологиях экспертных точек зрения // Проблемы программирования. 2005. № 4.

95. Antoniou G. at al. Combining Rules and Ontologies Asurvey. Deliverables I3-D3, REWERSE, March 2005.

96. Bruijn J., Lara R., Polleres A., Fense D. OWL DL vs. OWL flight: conceptual modeling and reasoning for the semantic Web. In WWW 2005: Proceedings of the 14th international conference on World Wide Web, ACM Press, 2005,-pp. 623-632.

97. Бурков B.H., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами М.: Синтег, 2001. 124 с.

98. Glass A., Holtz N., RasdorfW.J. A system for describing design artifacts using the knowledge representation technique of frames. Engineering with Computers, Volume 10, Number 4, 1994. - pp. 197-211.

99. ЮЗ.Каширин Д.И. Использование унификации в системах поиска текстовых документов.- Математическое и программное обеспечение информационных систем: Межвуз. сб. науч. трудов, М.: Горячая линия - Телеком, 2007.

100. Глушков В.М., Цейтлин Г.Е., Ющенко E.JI. Алгебра. Языки. Программирование. Киев, Наукова думка. 1974 - 328с.

101. Хорошевский В.Ф. OntosMiner: семейство систем извлечения информации из мультиязычных коллекций документов, Труды конференции КИИ-2004, Тверь, Россия, 2004.

102. Юб.Голубев А.В., Травина Л.Л., Патаракин Е.Д. Репертуарные решетки Кел-ли на Всемирной паутине Всероссийская научно-методическая конференция ТЕЛЕМАТИКА'97, Санкт-Петербург, май, 1997.

103. Батыршин И.З., Хабибулин Р.Ф. Тестирование кластерных алгоритмов на инвариантность относительно нумерации объектов // Известия академии наук. Теория и системы управления. 1997. № 2. с. 165-168.

104. Ю8.Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining СПб.: БХВ-Петербург, 2004.-336с.

105. Молчанов А.Ю., Гордеев А.В. Программирование. Общие вопросы. СПб.: «Питер», 2003 736с.

106. Ю.Ильина Е.П. Методы представления и комплексного использования структур знаний различных уровней формализации в описании экспертной точки зрения на предметную область решаемой проблемы // Проблемы программирования. 2002. №1-2. с. 409-421.

107. П.Букин А.Г. Поиск знаний в сети Интернет / Сб. науч. тр. Научной сессии МИФИ-2005, М. МИФИ, 2005.

108. Farrell J. Object-Oriented Programming Using С++. Course Technology. 2001. -560p.

109. ПЗ.Арский Ю.М., Гиляревский P.С., Егоров B.C., и др. Информационные системы в экономике: Учебник / Под ред. Проф. В.В.Дика. М.: Финансы и статистика, 1996. - 272с.

110. De Roure D., Frey J. Three Perspectives on Collaborative Knowledge Acquisition in e-Science. In: Workshop on Semantic Web for Collaborative Knowledge Acquisition (SWeCKa) 2007, January 2006, Hyderabad, India.

111. Каширин Д.И. Поиск документов в электронном справочнике с использованием алгоритмов унификации. // IV Межвузовская НТК «Новые технологии в учебном процессе и производстве». Материалы конференции. Рязань: Рязанский ин-т МГОУ, 2006.

112. Ефимов Е.И. Решатели интеллектуальных задач. Серия: Проблемы искусственного интеллекта. М.: Наука. 1982. 320с.

113. Люгер Дж. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем, 4-е издание. : Пер. с англ. М.: Издательский дом "Вильяме", 2003.-864с.

114. ШемакинЮ. И. Тезаурус в автоматизированных системах управления и информации. М: Военное изд-во министерства обороны СССР, 1974. -192с.

115. Виейра Р. Программирование баз данных Microsoft SQL Server 2005 для профессионалов: Пер. с англ. М.: Издательский дом "Вильяме", 2008. -1072с.

116. Dreilinger D., Howe A. Experiences with Selecting Search Engines Using Metasearch. ACMTOIS, 15(3), July 1997, pp. 195-222.

117. Буч Г. Объектно-ориентированное программирование с примерами применения: Пер. с англ. М.: Конкорд, 1992. - 519 с.

118. Frakes W.B., Baeza-Yates R. Information Retrieval: Data Structures and Algorithms. Englewood Cliffs, N.J.: Prentice Hall, 1992. - 464p.

119. Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval. New York et al.: ACM Press, Addison-Wesley, 1999. - 513 p.

120. Леоненков A.B. Объектно-ориентированный анализ и проектирование с использованием UML и IBM Rational Rose. -М.: Бином, 2006. 329с.