автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод автоматизированного построения онтологии предметной области

кандидата технических наук
Антонов, Игорь Вадимович
город
Псков
год
2011
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Метод автоматизированного построения онтологии предметной области»

Автореферат диссертации по теме "Метод автоматизированного построения онтологии предметной области"

005000998

АНТОНОВ Игорь Вадимович

МЕТОД АВТОМАТИЗИРОВАННОГО ПОСТРОЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ

Специальность 05.13.01 - Системный анализ, управление и обработка информации

1 7 НОЯ 2011

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Псков-2011

005000998

Работа выполнена в Псковском государственном политехническом институте

Научный руководитель:

доктор технических наук Воронов Михаил Владимирович

Официальные оппоненты:

доктор технических наук Попов Михаил Сергеевич

кандидат технических наук Суздалов Евгений Георгиевич

Ведущая организация:

Петербургский государственный университет путей сообщения

Защита диссертации состоится декабря 2011 года в 14.00 часов на заседании совета по защите докторских и кандидатских диссертаций Д.212.010.03 Балтийского государственного технического университета «ВОЕНМЕХ» имени Д.Ф. Устинова по адресу: 190005, г. Санкт-Петербург, 1-я Красноармейская ул., д. 1.

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан «-?/» /О 2011 года.

Ученый секретарь Диссертационного Совета

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В диссертации ставятся и решаются задачи, связанные с разработкой математического и программного обеспечения автоматизированного построения онтологии предметной области. Процесс развития современного общества характеризуется постоянно возрастающей ролью информационных технологий в науке, производстве и управлении. В последние годы многократно увеличились объемы информационных потоков, что привело к необходимости поиска новых способов хранения, представления, формализации, систематизации и автоматической обработки информации в компьютерных системах. Одним из результатов работ, выполняемых в данном направлении, стало появление онтологических технологий и их использование в информационных системах. Онтологии обеспечивают связное системное представление иерархии и содержания системы понятий, охватывающих предметную область. В этой роли они используются в учебных, научных и производственных приложениях, включая задачи информационной поддержки проектирования сложных технических систем. Формализованное представление понятийной структуры предметной области в онтологии позволяет выполнять автоматическую обработку онтологической информации, что находит применение в поисковых системах нового поколения и системах интеграции данных, получаемых из гетерогенных источников.

Весомые результаты в работах по онтологическому представлению знаний связаны с работами таких ученых, как Т.А. Гаврилова, В.П. Гладун,

A.C. Клещев, В.Д. Соловьев, Т.В. Левашова, В.Ф. Хорошевский, M. Minsky, Т. Gruber, S. Staab, R. Studer, A. Gomez-Perez, Y. Sure, T. Winograd и др.

В применяемых в настоящее время редакторах онтологий построение онтологий выполняется экспертом предметной области вручную и сводится к последовательному включению моделей новых концептов в онтологию. В последние годы в ряде работ рассматриваются различные методы автоматического и автоматизированного построения онтологий, для чего, как правило, используется лексический и синтаксический анализ документов. Исследования, проводимые в данном направлении, представлены в работах Н.Г. Загоруйко, JI.B. Найхановой, A.M. Налетова, Е.А. Рабчевского,

B.Ш. Рубашкина, C.B. Смирнова, A. Maedche, S. Staab, H. Haav и др.

Однако рассматриваемые в работах вышеупомянутых авторов методы автоматизации не охватывают всех аспектов построения онтологии, характеризуются рядом ограничений и, как правило, не предусматривают автоматизации построения многоуровневой онтологической иерархии. В целом проблема отсутствия инструментов автоматического и автоматизированного построения онтологий остается актуальной.

Целью диссертационной работы явилась разработка средств, обеспечивающих автоматизацию процесса построения онтологии предметной области.

Поставленная цель потребовала решения следующего ряда взаимосвязанных задач: .

1. Исследовать существующие методы и технологии построения онтологии предметной области.

2. Сформировать модель онтологии предметной области, обеспечивающую возможность автоматизации построения онтологии.

3. Разработать метод автоматизированного построения онтологии предметной области.

4. Построить алгоритмы, реализующие метод автоматизированного построения онтологии предметной области.

5. Разработать программное обеспечение построения онтологии предметной области.

Объектом исследования является технология построения онтологии предметной области.

Предметом исследования являются модели и методы автоматизированного построения онтологии предметной области.

Методы исследования. При проведении исследований использовались принципы и методы системного анализа, теория множеств, теория графов, математическая логика, технологии объектно-ориентированного анализа, проектирования и программирования.

Научные положения, выносимые на защиту.

1. Модель онтологии предметной области, реализующая принцип классообразующей роли атрибутивной структуры концептов.

2. Метод построения онтологии предметной области, обеспечивающий автоматическое размещение концепта в онтологии на основе анализа атрибутивного состава концепта.

3. Проект базы данных и редактора онтологии в качестве программного комплекса, обеспечивающего автоматизированное формирование онтологии предметной области с функциями машинного обучения распознаванию семантически незначимых обобщенных концептов.

Научная новизна:

1. Построенная математическая модель онтологии предметной области, основанная на классообразующей роли атрибутивной структуры концептов, позволяет автоматизировать операции включения концептов в онтологию, выполняемые до этого экспертом предметной области вручную.

2. Разработанный метод построения онтологии предметной области обеспечивает автоматический поиск места для размещения новых концептов в онтологической иерархии, что позволяет исключить влияние субъективности эксперта и необходимость принятия экспертом интуитивных решений в процессе определения места включения нового концепта в онтологию.

3. Построенный программный комплекс реализует совокупность операций автоматизированного построения онтологии предметной области и обеспечивает машинное обучение автоматическому распознаванию семантически незначимых обобщенных концептов, что позволяет исключить многократную обработку таких концептов в процессе построения онтологии.

Практическая ценность работы. В результате выполнения работы создано специальное программное обеспечение, обеспечивающее автоматизацию операций включения концептов в состав онтологии предметной области. Предложенное решение сокращает число операций, выполняемых вручную экспертом предметной области в процессе создания онтологии, исключает влияние субъективности эксперта и необходимость принятия им интуитивных решений при включении новых концептов в состав онтологии. Указанные свойства разработанного в диссертации решения улучшают потребительские качества и расширяют диапазон возможностей программных средств, используемых для построения онтологии предметной области, в случае применения в них разработанного метода.

Разработанные алгоритмы и программные средства могут использоваться для построения онтологий предметной области в системах семантически-ориентированного доступа к информационным ресурсам, включая системы навигации и поиска, электронных обучающих системах, использующих онтологическое структурирование элементов знаний и учебных объектов, информационных системах научно-исследовательского назначения, обеспечивающих построение согласованной между специалистами унифицированной концептуальной модели предметной области.

Реализация результатов работы. Результаты диссертационной работы используются в учебном процессе кафедр вычислительной техники и информационных систем и технологий Псковского государственного политехнического института и кафедры «Прикладная информатика» Санкт-Петербургского Государственного университета технологии и дизайна. Модель онтологии и метод построения онтологии, обеспечивающие автоматизацию размещения новых концептов в онтологической иерархии, используются в качестве теоретических материалов по современным онтологическим технологиям в учебных курсах «Представление знаний в информационных системах» и «Интеллектуальные информационные системы». Редактор онтологии CONCEPT MAKER используется при проведении практических занятий студентов специальности 230201 по курсу «Представление знаний в информационных системах» в качестве инструмента автоматизированного построения онтологии предметной области.

Апробация работы. Результаты работы были представлены для обсуждения на XV Международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в образовании и науке» в 2008 году, на XIII Всероссийской конференции по проблемам науки и высшей школы в 2009 году, на XIV всероссийской конференции «Фундаментальные исследования и инновации в национальных исследовательских университетах» в 2010 году, на XIV Международной научно-практической конференции «Системный анализ в проектировании и управлении» в 2010 году, на XVIII Международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в национальных исследовательских

университетах» в 2011 году, на 12-м Международном форуме «Высокие технологии XXI века» в 2011 году.

Личный вклад автора. Основные научные положения, методы, алгоритмы и их программные реализации, содержащиеся в диссертационной работе, получены автором самостоятельно.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 20 научных работах, среди которых 8 статей (одна статья опубликована в журнале, входящем в число ведущих рецензируемых изданий, рекомендуемых в перечне ВАК), 11 докладов на международных и общероссийских научно-практических и научно-технических конференциях, а также 1 свидетельство о государственной регистрации программы для ЭВМ.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, включающего в себя 108 наименований. Работа изложена на 128 страницах, содержит 39 рисунков, 6 таблиц и 4 приложения.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выбранной темы; формулируется цель работы и содержание поставленных задач, а также объект и предмет исследования; определяется теоретическая значимость и прикладная ценность полученных результатов.

В первой главе диссертационной работы проанализировано современное состояние дел в рассматриваемой области, проведен анализ существующих технологий построения онтологии предметной области. Особое внимание уделено методам автоматизации построения онтологии. На основе выполненного анализа сделан вывод, что существующие подходы в ограниченной мере и частично решают поставленные в работе задачи исследования.

В главе рассмотрен ряд направлений, в которых ведется исследовательская работа по созданию средств автоматизации формирования и сопровождения онтологий предметной области: автоматизированное построение онтологии на основе анализа содержания \veb-pecypcoB; автоматизированный синтез онтологии на основе анализа массива текстов предметной области; автоматический синтез онтологической иерархии на основе совокупности данных об атрибутах объектов предметной области. Отмечается, что рассматриваемые методы автоматизации построения онтологии двух первых направлений не обеспечивают формирования иерархической структуры онтологии, а только предоставляют для этого этапа исходные данные. В работах третьего направления не учитывается необходимость контроля семантической значимости концептов, создаваемых формальными методами, и не рассматривается итеративное формирование онтологии. В результате анализа работ по проблеме автоматизации построения онтологий в первой главе сделан вывод о необходимости разработки метода автоматизированного построения онтологии предметной области, позволяющего совместить

автоматизацию формирования онтологической иерархии на основе формальных методов с учетом и обработкой семантической значимости концептов, автоматически создаваемых на основе использования методов анализа данных.

Во второй главе представлена модель онтологии предметной области, обеспечивающая возможность автоматизированного построения онтологии, и разработан метод автоматизированного построения онтологии.

Особенностью предложенной модели онтологии является использование множеств атрибутов концептов в роли данных, однозначно идентифицирующих концепты, что позволяет автоматизировать включение концепта в онтологию на основе анализа атрибутивного состава концепта. Модель онтологии представлена кортежем

где С = {с,} - множество концептов, образующих онтологию, / = 1,7; М. = {/и, } - множество атрибутов концепта с(;

А! с Сх С - отношение непосредственного наследования концептов, которое может быть задано матрицей размером 1x1.

Если концепт ск непосредственно наследует концепту с,, т. е. (спск) е Я, то элемент ги = 1, в противном случае, если (с,,ск) г Я, то г1к = 0.

Для обеспечения соответствия модели онтологии задаче автоматизации построения онтологии в разработанную модель онтологии введен ряд аксиоматических свойств онтологии.

1. Наследование атрибутов родительского концепта дочерним концептом:

Ус^сД^ = 1=>М, сМ;).

2. Эквивалентность отношения порядка и вложенности множеств атрибутов концептов:

V с,Усу( М1 с MJ с, < су.).

3. Возможность множественного наследования:

3^0,3^=1) л (г,, =1)).

4. Единственность прямого наследования концептом определенного множества атрибутов:

Зс,1у1,((гЛ = 1) л(г,, = 1)л(Л/,. с Л/,.)).

5. Единственность концепта верхнего уровня с0:

3с0(Vс,(с0 < с,)) лЗс0'(Ус,.(с0'< с,)).

6. Уникальность атрибутивного состава концепта:

3 =М]).

Предложенная в работе модель отличается от традиционных моделей онтологии наличием однозначного соответствия определенного набора атрибутов определенному концепту онтологии. Связанные отношением наследования концепты в предложенной модели всегда отличаются составом своих атрибутов. Данное решение позволяет формализовать операцию включения Нового концепта в онтологическую иерархию.

На основе построенной модели онтологии в диссертации разработан метод автоматизированного построения онтологии предметной области.

Идея метода заключается в использовании формализованного анализа атрибутивного состава вводимых в онтологию концептов в качестве инструмента, применяемого для объективного определения места включения концепта в онтологическую иерархию на основе выявления родовидовых связей концепта. Возможность такого использования анализа атрибутивного состава концептов обусловлена особенностями предложенной в диссертационной работе модели онтологии предметной области. Дальнейший анализ позволяет определить общие подмножества атрибутов, наличествующие у существующих и у вновь вводимых в онтологию концептов, что позволяет выявить абстрактные понятия, характеризующих предметную область, но не входящие в состав онтологии. Среди выявленных формальными методами обобщений встречаются случайно повторяющиеся комбинации атрибутов, не имеющие соответствия среди актуальных для предметной области абстрактных понятий. Сохранение информации о не имеющих семантической значимости концептах позволяет реализовать машинное обучение распознаванию концептов, не имеющих семантической значимости для онтологии.

Критерии, позволяющие объективно определить место концепта в онтологической иерархии, сформулированы в диссертационной работе в форме ряда утверждений, для которых приведены их доказательства. В утверждениях рассматривается ситуация включения нового концепта сх в существующую иерархию.

Утверждение 1. Если множество атрибутов концепта не является надмножеством состава атрибутов какого-либо из концептов онтологии, то концепт занимает положение на уровне, непосредственно следующим за корневым концептом онтологии с0: 3({с] е С) л(Му с Мх)) => г0х := 1.

Доказательство. Если множество атрибутов сх не является надмножеством множества атрибутов сj: Му <г Мх, то в соответствии со свойством 2 онтологии сх не является потомком с]. Если указанное условие выполняется для всех концептов онтологии, кроме с0, то ни один из них не является родительским для сх, и, следовательно, концепт сх наследует непосредственно от концепта с0.

Утверждение 2. Концепт ср является прямым родительским концептом для сх, если множество атрибутов концепта ср является подмножеством множества атрибутов сх, а множество атрибутов любого из прямых дочерних концептов концепта ср не является при этом подмножеством множества

атрибутов сх: {(Мр сМ,) лЗг,((>> = 1)л{МА сМх))=$грх:= 1. (1)

Доказательство. Из условия М р с Мх с учетом свойства 2 следует, что сх наследует от ср. Опосредованное наследование от ср возможно только через

потомков с . Из условия отсутствия потомков ср, обозначаемых с(П для которых А/, с Мх, по свойству 2 следует, что сх не может наследовать от с(/. Таким образом, сх может наследовать от ср только непосредственно.

Утверждение 3. Если множество атрибутов концепта с^ в случае истинности условия (1) является надмножеством множества атрибутов концепта сх, то си является для сх прямым дочерним концептом:

Vc, ((^ =1)л(М,сМ,)л (Мх с М„) о (V := 1, ^ := 1, ^ := 0)). Доказательство. Из условия Мх с Мл по свойству 2 следует, что са наследует от с,. Поскольку наследование сс1 от с являлось прямым, то концепт сх является единственным посредником в цепочке наследования от ср к и, следовательно, с1/ является для сх прямым дочерним концептом.

Разработанный в диссертационной работе метод позволяет автоматически определить место включения нового концепта в онтологию за счет выполнения последовательного обхода графа концептов в направлении «сверху вниз» и применения критериев, основанных на утверждениях 1-3. Блок-схема соответствующего алгоритма приведена на рисунке 1.

Рисунок 1 - Блок-схема алгоритма автоматического включения концепта в онтологию

Используемые на блок-схеме алгоритма обозначения:

Р - множество родительских для концепта сх концептов, которое на промежуточных шагах содержит опосредованных и прямых предков сх. По завершении алгоритма множество Р содержит полный набор прямых предков концепта с„\ N, И' - вспомогательные множества концептов, проверяемых на принадлежность к родительским концептам сх; Э - множество, содержащее дочерние по отношению к сх концепты.

Атрибутивный состав нового концепта сх может обусловливать наличие в онтологии дочерних для него концептов нижних уровней, не имеющих в числе своих предков родительских для сх концептов, но дополнительно наследующих от концепта сх в рамках отношения множественного наследования. Обнаружение таких связей в онтологии требует выполнения дополнительных действий.

Утверждение 4. Если множество атрибутов некоторого концепта с„ является надмножеством множества атрибутов концепта сх, а множество атрибутов любого из прямых родительских концептов концепта сп не является надмножеством множества атрибутов концепта сх, то сх является для сп прямым родительским концептом:

Чс„((Л/, с М„) Л Зск ({гы = 1) Л (М, с Мк)) гт := 1). (2)

Доказательство. Из условия Мх сМ, в соответствии со свойством 2 следует, что сп наследует от сх. Из условия Зск ((гь = 1) л(Мх с Мк) по свойству 2 следует, что ни один из прямых предков сп не наследует от сх. Следовательно, с„ может наследовать от сх только непосредственно и сх является для с„ прямым родительским концептом.

На основе утверждения 4 в диссертационной работе разработан алгоритм автоматического определения полного множества дочерних концептов нового концепта сх.

При включении нового концепта в онтологию в онтологической иерархии могут быть автоматически сформированы новые обобщенные концепты более высоких уровней на основе выявления повторяющихся в составе различных концептов наборов атрибутов. В качестве критерия наличия формального обобщения, не представленного в онтологии, может рассматриваться существование непустого множества, являющегося пересечением множеств атрибутов концепта сх и некоторого другого концепта онтологии с„, и не являющегося множеством атрибутов какого-либо из существующих концептов онтологии:

Зс„({Мг = (М„ п Мх) * {}) л 3(с( \М, = М„ п Мх)) => С := С. (3) Утверждение 5. Для обнаружения отсутствующих в онтологии обобщений, порождаемых включением сх в онтологию, достаточно проверить на соответствие условию (3) множество концептов нижнего уровня онтологии

и

{°11 ^ст(г1т = 0)} и множество родительских концептов тех концептов нижнего уровня, пересечение множеств атрибутов которых с множеством атрибутов сх будет непустым.

Доказательство. В случае, когда пересечение множеств атрибутов концептов сх и с„ является пустым, сх и с„ не имеют общих атрибутов, что истинно и для всех предков концепта с„, так как в силу свойства 2 их множества атрибутов являются подмножествами множества атрибутов концепта сп. Следовательно, всех предков концепта с„ следует исключить из процесса поиска новых обобщений.

Утверждение 6. Для предков концепта сх, рассматриваемых в качестве концепта сп, условие (3) не выполняется.

Доказательство. В силу свойства 2 пересечение множества атрибутов любого из родительских для сх концептов с множеством атрибутов концепта сх будет эквивалентно множеству атрибутов данного родительского концепта. Следовательно, условие (3) не будет выполняться.

На основе утверждений 5 и 6 в диссертационной работе разработан алгоритм автоматического построения новых обобщенных концептов. Алгоритм включает в себя интерактивную операцию проверки экспертом предметной области семантической значимости полученного автоматически обобщения. За счет пополнения списка В обобщений, не имеющих семантической значимости, реализуется машинное обучение распознаванию семантически незначимых обобщений.

Разработанный в диссертации метод автоматизированного построения онтологии предметной области заключается в следующем:

1. Онтология предметной области формируется в процессе последовательного ввода в онтологию новых моделей концептов предметной области, представляемых набором характеризующих концепт атрибутов. Ввод моделей концептов выполняется либо вручную экспертом предметной области, либо путем автоматического ввода моделей из внешних источников, в том числе, в результате работы программного обеспечения, формирующего модели концептов в результате анализа данных предметной области.

2. Для вновь введенного концепта выполняется последовательное сопоставление атрибутивного состава нового концепта и атрибутивных составов существующих концептов в порядке обхода графа онтологии в направлении «сверху вниз». На основе условий из утверждений 1-3 выявляется место включения нового концепта в онтологическую иерархию и определяются его родовидовые связи в позиции включения концепта в онтологию.

3. На основе условия из утверждения 4 выявляются и включаются в модель онтологии дополнительные связи с дочерними концептами нижних уровней, появление которых может быть обусловлено атрибутивным составом нового концепта.

4. На основе условий из утверждений 5-6 выполняется формирование отсутствующих в онтологии обобщенных концептов и оценка их семантической значимости для онтологии.

Таким образом, разработанный в диссертационной работе метод позволяет автоматически определить место нового концепта в онтологии, объективно выявить родовидовые связи концепта в онтологии и автоматически сформировать новые обобщенные концепты, обусловленные вводом в онтологию нового концепта.

Основные особенности разработанного метода автоматизированного построения онтологии предметной области следующие:

1. Метод позволяет автоматически определить место включения нового концепта в онтологическую иерархию и автоматически сформировать новые обобщения концептов, обусловленные вводом в систему нового концепта;

2. Позиция концепта в онтологии на основе метода определяется независимо от уровня, который должен занять концепт в общей иерархии. Новый концепт может быть автоматически размещен на верхнем уровне, на нижнем уровне или на любом из промежуточных уровней онтологии;

3. Метод реализует машинное обучение онтологической системы автоматическому распознаванию семантически незначимых обобщенных концептов;

4. Метод может быть использован как для начального формирования онтологии, так и для расширения уже сформированной онтологии предметной области.

5. Ограничения метода заключаются в невозможности использовать метод для автоматизированного построения онтологий, модели концептов которых не основаны на определенном атрибутивном составе концептов. К такого рода онтологиям можно отнести онтологии верхнего уровня, онтологии из области философии и некоторые другие.

В третьей главе спроектирован программный комплекс, реализующий автоматизированное построение онтологии предметной области на основе разработанного в работе метода.

В отличие от других редакторов онтологий разработанный комплекс обеспечивает автоматическое включение концептов в онтологическую онтологию, автоматическое построение и автоматический контроль семантической значимости обобщенных концептов. Эти особенности позволяют уменьшить число операций, выполняемых вручную, и исключить влияние субъективности эксперта в процессе построения онтологической иерархии концептов, что отличает разработанный программный комплекс от других редакторов онтологий, используемых в настоящее время.

Разработанное программное обеспечение реализовано на основе методологии объектно-ориентированного проектирования на языке С#.

Основные компоненты созданного программного обеспечения и их информационные связи представлены на схеме потоков данных, приведенной на рисунке 2.

^Подключаемые I модули { импорта • данных

crtè"

Документы предметной области

Модуль интерфейса пользователя

Модуль интерфейса подключаемых компонентов

Модуль экспорта/импорта

OWL

Модуль управлении

ч

Дополнительные диалоги

Модуль ввода-вывода

I

Модуль онтологии

1

Модуль данных

Рисунок 2 - Схема потоков данных

В программном комплексе реализован принцип открытой архитектуры, обеспечивающий возможность использования подключаемых модулей независимых разработчиков, выполняющих автоматический ввод информации о концептах и объектах определенной предметной области.

Для хранения данных онтологии использована база данных в формате Microsoft Access. Хранение динамически перестраиваемой концептуальной модели онтологии в базе данных реализовано на основе изменения состава и содержания записей, размещаемых в таблицах реляционной базы данных.

Разработанная структура базы данных обеспечивает возможность машинного обучения распознаванию семантической значимости обобщенных концептов за счет включения в модель базы данных таблиц, содержащих информацию об исключенных из онтологии концептах и их атрибутах.

Построенный программный комплекс обеспечивает выполнение следующих основных действий с онтологией:

1. Ручной ввод, редактирование, удаление модели концепта;

2. Автоматический ввод моделей концептов;

3. Автоматическое формирование обобщенных концептов;

4. Контроль семантической значимости автоматически построенных концептов;

5. Ввод, редактирование, удаление атрибутов;

6. Отображение иерархии концептов в виде дерева и в виде графа;

7. Ручной и автоматический ввод, редактирование, удаление экземпляров концептов.

В четвертой главе проведено экспериментальное исследование использования разработанного программного обеспечения для автоматизированного построения онтологии предметной области. В качестве

предметной области для исследования режима ручного ввода моделей концептов была выбрана предметная область форматов компьютерных документов и мультимедиа-файлов. В качестве примера в программу были введены модели концептов, характеризующие десять форматов файлов. Модели отдельных концептов задавались в виде подмножества 17 атрибутов, характеризующих объекты предметной области. Введенные концепты были автоматически упорядочены в онтологическую иерархию. При этом программа автоматически определила существование семи обобщенных концептов, из которых четыре были в режиме экспертной оценки признаны имеющими семантическую значимость и включены в состав онтологии, а три оставшихся, как семантически незначимые, помещены в список исключенных из онтологии концептов.

Для исследования режима автоматического ввода информации о концептах предметной области был разработан подключаемый модуль, обрабатывающий метаданные файлов HTML формата. В качестве обрабатываемого модулем набора файлов был использован набор учебных текстов по языку разметки web-страниц HTML. В результате обработки 14 файлов их метаданные были автоматически упорядочены в онтологическую иерархию. Онтология, включающая введенные в ручном и в автоматическом режимах концепты, представлена на рисунке 3.

JSi

Файл Операции Настрой« Объекты Иерархия понятий

ЮЗ тег й- Файп

-j Файл TXT й-Файл HTML Й Язык HTML

Е- Секция тела документа Й Web-Формы

3 цементы web-форм Изображения в HTML Изображеииякарты в HTf Таблицы в HTML Теги логического Формап Теги уровня блока Теги Физического Формат Фреймы в HTML К Секция заголовка документа *} ФайлР^ +1 Файл MFV

Текстовый дсжулемт ♦i Анимационный Файл ■и .Чяикпвлй фдйл__-ZJ

Понятия | Конструктор понятия | Объекты Граф j

~ФШ>тдЩВёИ

)Звуковой файл| |Файл МРУ| |ФайлТХТ| (Текстовый документ! (Файл РЫоГ^нкмацуюнный файл)

|кция тела до^к^ентаЦ^ документа^

ического форматирования! ^УеЬ-формы) |Д>реимы в HTML] рГеги физического форматирования} -J ¡Элементы wetKjaopM]

J

Рисунок 3 - Результат ручного и автоматического ввода моделей концептов

На основе анализа результатов проведенного эксперимента сделан вывод, что разработанное программное обеспечение успешно реализует разработанный в диссертационной работе метод автоматизированного построения онтологии предметной области.

ОСНОВНЫЕ НАУЧНЫЕ И ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ

1. Предложена новая модель онтологии предметной области для задач автоматизированного построения онтологии.

2. Разработан новый конструктивный метод автоматизированного построения онтологии предметной области, обеспечивающий автоматическое определение места включения концепта в онтологическую иерархию, автоматическое формирование обобщенных концептов и машинное обучение распознаванию не имеющих семантической значимости концептов.

3. Спроектированы алгоритмы программной реализации метода автоматизированного построения онтологии предметной области.

4. Разработана модель базы данных онтологии предметной области с поддержкой операций машинного обучения распознаванию концептов, не имеющих семантической значимости.

5. На основе разработанного метода построен программно-технологический комплекс автоматизированного построения онтологии предметной области.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, включенных в перечень ВАК РФ:

1. Антонов И.В., Воронов М.В. Методы анализа данных в задачах автоматизации построения онтологии предметной области // Дистанционное и виртуальное обучение. - 2011. - № 8. - С. 19-35.

Публикации в других изданиях:

2. Антонов И.В. Актуальные проблемы машинной обработки текстов на естественном языке // Фунд. иссл. и инн-и. в техн. ун-х: Мат. XI Всеросс. конф. по пр. науки и высш. шк. - СПб.: Изд-во Политехи, ун-та, 2007. - С. 161-162.

3. Антонов И.В. Методы автоматизированного построения тезаурусов предметной области // Выс. интелл. техн-и и инн-и в обр. и науке: Мат. XV межд. научно-метод.конф. - СПб.: Изд-во Политехи, ун-та, 2008. - Т. 1. - С. 84-85.

4. Антонов И.В. О построении семантически-ориентированного интерфейса пользователя персонального компьютера на основе машинного представления системы понятий предметной области // Фунд. иссл. и инн-и в техн. ун-х: Мат. XIII Всероссийской конференции по проблемам науки и высшей школы. 18 мая 2009 года. - СПб.: Изд-во Политехнического ун-та, 2009. - Т. 1. - С. 184.

5. Антонов И.В. О применении метода формального анализа понятий к задачам автоматизированного построения системы понятий предметной области // Мат. моделирование в образовании, науке и производстве: Тезисы VI Межд. конф. - Тирасполь : Изд-во Приднестр. ун-та, 2009. - С. 23.

6. Антонов И.В., Воронов М.В. Формирование онтологических моделей предметной области для электронных обучающих систем // Инф. технологии в обеспечении нового качества высшего образования. Сб. науч. статей. - Кн. 2. -М.: Иссл. центр пробл. кач. подг. специалистов, 2010. - С. 48-55.

7. Антонов И.В. Модели предметной области в электронных обучающих системах // Выс. интелл. техн-и и иннов-и в обр-и и науке: Мат. XVII Межд. научно-метод. конф-и.-Т. 1.-СП6.: Изд-во Политехи, ун-та2010.-С. 98-99.

8. Антонов И.В. Актуальные проблемы автоматизации формирования онтологии предметной области // Фунд. иссл-я и инновации в нац. исслед. ун-тах. Мат. XIV всеросс. конф. - Т. 2. - СПб.: Изд-во Политехи, ун-та 2010. - С. 159-161.

9. Антонов И.В., Вертешев С.М., Воронов М.В. Автоматизированное формирование онтологии предметной области для информационных систем // Сб. научн. трудов XIV Межд. науч.-практ. конф. Системный анализ в проектировании и упр-и. - Ч. 2. - СПб.: Изд. Политехи, ун-та, 2010. - С. 5-6.

10. Антонов И.В., Воронов М.В. Метод построения онтологии предметной области // Вестник СПБГУТД. Периодический научный журнал. Серия «Естественные и технические науки». - №2, 2010. - СПб. - С. 28-32.

11. Антонов И.В. Метод автоматизированной поддержки формирования онтологии предметной области // ММТТ-23: сб. тр. XXIII Межд. научн. конф. Т. 12. - Смоленск : РИО ф-ла ГОУВПО МЭИ (ТУ), 2010. - С. 59-63.

12. Антонов И.В. Инструментальные средства автоматизированного формирования онтологии предметной области // Труды Псковского политехи, института. Электротехника. Машиностроение. -2011. -№ 14.3. - С. 335-339.

13. Антонов И.В. Модель онтологии предметной области для систем семантически-ориентированного доступа // Труды Псковского политехи, ин-та. Электротехника. Машиностроение. -2011. -№ 14.3. - С. 339-343.

14. Антонов И.В., Воронов М.В. Метод автоматизированного построения онтологии предметной области // Моделирование и анализ данных. Научный журнал. -М.: МГППУ, 2011. -№1. - С. 116-130.

15. Антонов И.В. Построение онтологий предметной области для систем проектирования электронных учебных пособий // Выс. интелл. техн-и и инн-и в нац. исслед. ун-тах. Мат. XVIII Междунар. научно-методической конф. -Т. 1. - СПб.: Изд-во Политехнического университета 2011. - С. 119-120.

16. Андреев Д.А., Антонов И.В., Воронов М.В. Разработка средств формализованного представления знаний // Реализ. интелл. и технолог, пот-ла универс. и прикл. науки в постр-и экономики, осн. на знаниях. Мат. конф. XII Межд. форума «Выс. техн-и XXI века», 18-21.04.2011. - М.: Изд-во ЛКИ, 2011. — С. 123-126.

17. Антонов И.В., Воронов М.В. К разрешению проблемы автоматизации построения онтологии предметной области // Моделир. и анализ данных. Тр. факта инф. технологий МГППУ. - Вып. 6 (2011). - М.: РУСАВНА, 2011. - С. 47-53.

18. Антонов И.В. Представление онтологии предметной области средствами реляционной СУБД // Мат. мод. в образовании, науке и производстве. Тез. VII Межд. конф. Тирасполь, 8-10.06.2011. - Тирасполь : Изд-во Приднестр. ун-та, 2011.-С. 10-11.

19. Антонов И.В. Программное обеспечение для автоматизированного построения онтологии предметной области // Фунд. иссл. и инн-и в нац. иссл. ун-тах. Мат. XV всеросс. конф. - Т. 1. - СПб.: Изд-во Политехи, ун-та, 2011. - С. 56-57.

20. Свидетельство о государственной регистрации программы для ЭВМ №2011616150. Программа автоматизированного построения онтологии предметной области CONCEPT MAKER // И.В. Антонов. - 2011.

Подписано в печать 28.10.2011 г. Заказ № 3681 Формат 60x90/16. Усл. п. л. 0,96. Тираж 100 экз. Типография Псковского политехнического института

Оглавление автор диссертации — кандидата технических наук Антонов, Игорь Вадимович

ВВЕДЕНИЕ.

1. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ ПОСТРОЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ.

1.1. Способы формального представления онтологии.

1.2. Инструментальные средства построения онтологии.

1.3. Анализ существующих подходов к автоматизации построения онтологии предметной области.

1.4. Постановка задачи по разработке метода автоматизированного построения онтологии предметной области.

Выводы по главе . 1.

2. РАЗРАБОТКА МОДЕЛИ И МЕТОДА АВТОМАТИЗИРОВАННОГО ПОСТРОЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ.

2.1. Математическая модель онтологии предметной области.

2.2. Модель машинного представления онтологии.

2.3. Разработка метода и алгоритмов автоматизированного построения онтологии предметной области.

Выводы по главе 2.

3. ПРОЕКТИРОВАНИЕ ПРОГРАММНОЙ РЕАЛИЗАЦИИ МЕТОДА АВТОМАТИЗИРОВАННОГО ПОСТРОЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ.

3.1 Разработка базы данных онтологии предметной области.

3.2 Разработка редактора онтологии предметной области.

3.3 Технология построения онтологии на основе метода автоматизированного построения онтологии предметной области.

Выводы по главе 3.

4. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ МЕТОДА АВТОМАТИЗИРОВАННОГО ПОСТРОЕНИЯ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ.

4.1 Выбор предметной области для исследования метода автоматизированного построения онтологии.

4.2 Экспериментальное построение онтологии предметной области. 103 Выводы по главе 4.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Антонов, Игорь Вадимович

Процесс развития современного общества характеризуется постоянно возрастающей ролью информационных технологий в науке, производстве и управлении. В последние годы многократно увеличились объемы информационных потоков и сложность ориентации в информационных ресурсах, что привело к необходимости поиска новых способов хранения, представления, формализации, систематизации и обработки информации в компьютерных системах [1-9]. Традиционные технологии в новых условиях не решают на должном уровне задачи навигации по информационным ресурсам, предоставления доступа к информации, поиска файлов и документов. Одним из результатов исследований, проводившихся в последние годы в целях преодоления указанных трудностей, стало появление онтологических технологий и их использование в информационных системах [10-14]. По своей сути онтология предметной области представляет собой формальную модель понятийной структуры предметной области [15-20]. В известной формулировке Грубера (1993) [21] онтология определена как «формальная спецификация концептуализации, которая имеет место в некотором контексте предметной области». Под концептуализацией понимается представление предметной области через описание множества понятий (концептов) предметной области и связей (отношений) между ними. Путем создания онтологий формируется согласованное между специалистами формализованное представление структуры предметной области [22].

Онтологии являются инструментом системного анализа предметной области, обеспечивая целостное представление совокупности понятий, характеризующих предметную область, и их связей [23].

Формализованное представление понятийной структуры предметной области в онтологии делает возможной автоматическую обработку онтологической информации, что находит применение в поисковых системах нового поколения [24-25], мультиагентных системах, системах интеграции данных, получаемых из гетерогенных источников [26, 27].

Онтологии предметной области находят основное применение в следующих областях деятельности:

1. Построение поисковых систем, использующих технологию семантически-ориентированного поиска. Онтологии используются в таких системах как инструмент семантического аннотирования информационных ресурсов.

2. Интегрирование данных и знаний. При объединении информационных баз онтология позволяет устанавливать семантическую эквивалентность фактов и понятий, сформулированных в разных терминах.

3. Построение информационных систем научно-исследовательского назначения. Онтологии являются в этой сфере инструментом обеспечения согласованной между специалистами и унифицированной терминологии предметной области.

4. Системный анализ предметной . области. Онтология предоставляет структурированную и частично формализованную основу для проведения системного анализа предметной области.

5. Создание электронных обучающих систем, использующих онтологическое структурирование элементов знаний и учебных объектов.

На основе онтологических аннотаций может обеспечиваться семантически ориентированный доступ к информации из различных источников, к которым относятся ресурсы глобальной сети [28], научно-технические базы знаний, обучающие системы [29-31], а также управленческие, производственные и коммерческие информационные ресурсы и системы [32-35]. Во всех этих сферах существует проблема возрастающей сложности ориентации пользователей в постоянно увеличивающемся объеме документов, заполняющих информационные хранилища в глобальных и корпоративных сетях. До настоящего времени трудоемкими и требующими дальнейшей разработки являются задачи организации поиска нужной информации, навигации по информационным ресурсам и интегрирования информационных ресурсов в единую среду. Общее направление решения указанных проблем 5 многим специалистам видится в онтологическом подходе к структурированию и аннотированию информационных ресурсов.

В сфере практического применения онтологических технологий наиболее известен проект Semantic Web [36-37], в рамках которого ведется работа по семантическому аннотированию web-pecypcoB на основе онтологий предметной области, что позволяет обеспечить качественно новые возможности навигации в web-среде. В качестве примера систем такого рода можно привести поисковые системы Swoogle (http://swoogle.umbc.edu) [38], Watson (http://watson.kmi.open.ac.uk), SWSE (http://swse.deri.org). Однако значение информационных систем, создаваемых на основе онтологий предметной области, существенно шире рамок проекта Semantic Web. На этой основе могут быть реализованы информационные системы, обеспечивающие согласованное управление корпоративными и персональными данными в различных областях деятельности [10-13]. За рамками web-приложений наибольшего распространения и прогресса использование онтологических технологий пока достигло в сфере медицины. Там созданы обширные онтологические базы, используемые во всём мире и включающие в себя более миллиона понятий (SNOMED СТ, http://www.ihtsdo.org) [39]. Использование онтологий может играть важную роль при создании хранилищ информации и в других предметных областях, в которых информация передается по сети и используется в независимых приложениях. Онтологии задают единые правила структурированного описания сущностей предметной области, позволяя на этой основе различным программам корректно работать с общей информацией и обмениваться ею.

Исследования в области развития информационных технологий с использованием онтологий понятий проводили многие исследователи России и других стран. Результаты, достигнутые в этом направлении, представлены в работах Т.А.Гавриловой [40-41], Н.Г.Загоруйко [42], Л.В.Найхановой [43-44], Е.А.Рабчевского [45-46], В.Ш.Рубашкина [16, 17, 47], T.Gruber [14, 21], S. Staab

48], R. Studer [15], N.F.Noy [49], A.Gomez-Perez [50]. 6

Информационные системы, разработанные на основе онтологий, показали на практике свою эффективность и интерес к ним постоянно растет. Однако существующие методы построения онтологии требуют экспертных знаний в исследуемой предметной области, а построение онтологии на основе их использования занимает существенный объем времени, поэтому актуальной задачей является автоматизация процесса построения онтологии. Фактором, сдерживающим распространение технологий, использующих онтологические модели, является недостаточный уровень разработки формализованных и автоматизированных процедур формирования структуры онтологий и отсутствие соответствующих программных средств. Рассматриваемые же в работах ряда авторов [51-58] методы автоматизации не охватывают всех аспектов построения онтологии и не предусматривают автоматизации построения многоуровневой онтологической иерархии. В этой связи в целом проблема отсутствия инструментов автоматического и автоматизированного построения онтологий остается актуальной. Так в стандарте на методологию онтологического проектирования ГОЕР5 отмечается [59, п.2.4]: «Проектирование онтологии традиционно было трудной и дорогостоящей задачей. Онтологии, разработанные к настоящему времени, являются результатом очень дорогих и ручных усилий высококвалифицированных специалистов. Многие предприятия не в состоянии финансировать такую работу. Стандартные и рентабельные средства создания онтологий должны быть разработаны, если предприятия хотят получить выгоды от использования онтологий».

Таким образом, с одной стороны, создание современных систем представления и обработки знаний невозможно без активного использования онтологических технологий. С другой стороны, процесс построения онтологий остается по настоящее время слабо структурированной задачей, решаемой экспертами предметной области на основе собственной интуиции и профессиональных знаний.

В настоящей диссертационной работе ставятся и решаются задачи, 7 связанные с разработкой математического и программного обеспечения автоматизированного построения онтологии предметной области.

Целью диссертационной работы является разработка средств, обеспечивающих автоматизацию процесса построения онтологии предметной области.

Поставленная цель требует решения следующего ряда взаимосвязанных задач:

1. Исследовать существующие методы и технологии построения онтологии предметной области.

2. Сформировать модель онтологии предметной области, обеспечивающую возможность автоматизации построения онтологии.

3. Разработать метод автоматизированного построения онтологии предметной области.

4. Построить алгоритмы, реализующие метод автоматизированного построения онтологии предметной области.

5. Разработать программное обеспечение построения онтологии предметной области.

Объектом исследования является технология построения онтологии предметной области.

Предметом исследования являются модели и методы автоматизированного построения онтологии предметной области.

Методы исследования. При проведении исследований использовались принципы и методы системного анализа, теория множеств, теория графов, математическая логика, технология объектно-ориентированного анализа и проектирования.

Научные положения, выносимые на защиту:

1. Модель онтологии предметной области, реализующая принцип классообразующей роли атрибутивной структуры концептов.

2. Метод построения онтологии предметной области, обеспечивающий автоматическое размещение концепта в онтологии на основе анализа атрибутивного состава концепта.

3. Проект базы данных и редактора онтологии в качестве программного комплекса, обеспечивающего автоматизированное формирование онтологии предметной области с функциями машинного обучения распознаванию семантически незначимых обобщенных концептов.

Научная новизна.

1. Построенная математическая модель онтологии предметной области, реализующая принцип классообразующей роли атрибутивной структуры концептов, позволяет автоматизировать операции включения концептов в онтологию, выполняемые до этого экспертом предметной области вручную.

2. Разработанный метод построения онтологии предметной области обеспечивает автоматическое размещение новых концептов в онтологической иерархии, что позволяет исключить влияние субъективности эксперта и необходимость принятия экспертом интуитивных решений в процессе определения места включения нового концепта в онтологию.

3. Построенный программный комплекс обеспечивает реализацию совокупности операций автоматизированного построения онтологии предметной области, в том числе, обучение автоматическому распознаванию семантически незначимых обобщенных концептов, что позволяет исключить многократную обработку обобщенных концептов, не имеющих семантической значимости, в процессе построения онтологии.

Практическая ценность работы. В результате проведенной работы создано специальное программное обеспечение, обеспечивающие автоматизацию операций включения концептов в состав онтологии предметной области. Предложенное решение сокращает число операций, выполняемых вручную экспертом предметной области в процессе создания онтологии, исключает влияние субъективности эксперта и необходимость принятия им 9 интуитивных решений при включении новых концептов в состав онтологии. Указанные свойства разработанного в диссертации решения улучшают потребительские качества и расширяют диапазон возможностей программных средств, используемых для построения онтологии предметной области, в случае применения в них разработанного метода.

Разработанные алгоритмы и программные средства могут являться основой для построения систем семантически-ориентированного доступа к информационным ресурсам, включая системы навигации и поиска, электронных обучающих систем, использующих онтологическое структурирование элементов знаний и учебных объектов, информационных систем научно-исследовательского назначения, обеспечивающих построение согласованной между специалистами унифицированной концептуальной модели предметной области.

Реализация результатов работы. Результаты диссертационной работы используются в учебном процессе кафедр вычислительной техники и информационных систем и технологий Псковского государственного политехнического института и кафедры «Прикладная информатика» Санкт-Петербургского Государственного университета технологии и дизайна. Модель онтологии и метод построения онтологии, обеспечивающие автоматизацию размещения новых концептов в онтологической иерархии, используются в качестве теоретических материалов по современным онтологическим технологиям в учебных курсах «Представление знаний в информационных системах» и «Интеллектуальные информационные системы». Редактор онтологии CONCEPT MAKER используется при проведении практических занятий студентов специальности 230201 по курсу «Представление знаний в информационных системах» в качестве инструмента автоматизированного построения онтологии предметной области.

Апробация работы. Результаты работы были представлены для обсуждения на XV Международной научно-методической конференции

Высокие интеллектуальные технологии и инновации в образовании и науке» в ю

2008 году, на XIII Всероссийской конференции по проблемам науки и высшей школы в 2009 году, на XIV всероссийской конференции «Фундаментальные исследования и инновации в национальных исследовательских университетах» в 2010 году, на XIV Международной научно-практической конференции «Системный анализ в проектировании и управлении» в 2010 году, на XVIII Международной научно-методической конференции "Высокие интеллектуальные технологии и инновации в национальных исследовательских университетах" в 2011 году, на 12-м Международном форуме «Высокие технологии 21 века» в 2011 году.

Личный вклад автора. Основные научные положения, методы, алгоритмы и их программные реализации, содержащиеся в диссертационной работе, получены автором самостоятельно.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 20 научных работах, среди которых 8 статей (одна статья опубликована в журнале, входящем в число ведущих рецензируемых изданий, рекомендуемых в перечне ВАК), 11 докладов на международных и общероссийских научно-практических и научно-технических конференциях, а также 1 свидетельство о государственной регистрации программы для ЭВМ.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, включающего в себя 108 наименований. Работа изложена на 128 страницах, содержит 39 рисунков, 6 таблиц и 4 приложения.

Заключение диссертация на тему "Метод автоматизированного построения онтологии предметной области"

Выводы по главе 4

В результате проведенного экспериментального исследования установлено, что разработанное в настоящей диссертационной работе программное обеспечение успешно решает задачи по построению онтологии предметной области в режиме ручного и автоматического ввода моделей концептов и экземпляров концептов [107-109]. В процессе построения онтологии редактором онтологии CONCEPT MAKER выполняется автоматическое определение места включения нового концепта в онтологическую иерархию, автоматическое формирование обобщенных концептов, формирование концептов на основе автоматического ввода данных об объектах предметной области. Средства навигации и доступа, реализованные в проекте, могут использоваться в качестве основы для

115 построения систем семантически ориентированного доступа к информационным объектам, включая файлы и документы, в различных предметных областях.

Библиография Антонов, Игорь Вадимович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Воронов М.В. Разработка вполне гибких открытых информационных систем. // Труды 4 Международной конференции Новые информационные технологии. Минск -2000. 5-7 декабря, 2000. С.20-28.

2. Башмаков. А.И. Интеллектуальные информационные технологии: учеб. пособие. М.: Изд-во МГТУ им. Н.Э.Баумана. 2005. - 304 с.

3. Мизогучи Р. Шаг в направлении инженерии онтологий. // Новости искусственного интеллекта. 2000, №1-2 С. 11-36.

4. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах // М.: Наука, 1989.

5. Когаловский М.Р. Перспективные технологии информационных систем. -М.: ИТ-Экономика, 2003. 288 с.

6. Осипов Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии // Проблемы искуственного интеллекта. М.: Наука. Физматлит, 1997.

7. Леонтьев A.A., Леонтьев Л.А. Способы представления знаний и их компьютерное моделирование Обработка текста и когнитивные технологии / Под ред. В.Д. Соловьева. Пущино: 1999. Вып.З.

8. Норенков И.П. Интеллектуальные технологии на базе онтологий // Информационные технологии, 2010, №1, с.17-23.

9. Ю.Гладун. А.Я., Рогушина Ю.В. Онтологии в корпоративных системах // Корпоративные системы, 2006 №1, - с. 41-47.

10. П.Попов Э.В. Корпоративные системы управления знаниями // "Новости ИИ", 2001, №1.

11. Ciorascu С., Ciorascu Г. and Stoffel К. knOWLer Ontological Support for Information Retrieval Systems // Proceedings of 26th Annual International ACM SIGIR Conference, Workshop on Semantic Web, Toronto, Canada, August 2003.

12. Ding Y., Fensel D., Klein M., Omelayenko В., Schulten E. The role of ontologies in eCommerce // Steffen Staab, Rudi Studer (ed.), Handbook of Ontologies, 2004.

13. M.Gruber T. Toward principles for the design of ontologies used for knowledge sharing. Presented at the Padua workshop on Formal Ontology // International Journal of Human-Computer Studies, Vol. 43, Issues 4-5, November 1995, pp. 907-928.

14. Staab S., Studer R. (eds). Handbook on Ontologies. // Springer—Verlag, 2004.

15. Рубашкин В. Ш. Онтологии концептуальные границы, проблемы и решения. Точка зрения разработчика // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции "Диалог 2007". М.: Издательский центр РГГУ, 2007. С. 481 - 485.

16. Рубашкин В. Ш., Лахути Д.Г. Онтология: от натурфилософии к научному мировоззрению и инженерии знаний // Вопросы философии № 1, 2005. С. 64-81.

17. Нариньяни А.С. Кентавр по имени ТЕОН: Тезаурус + Онтология. // В сб. "Межд. Семинар ДИАЛОГ'2001", Аксаково, Июнь 2001, Том 1, с. 199154

18. Нариньяни. А. С. ТЕОН-2: от тезауруса к онтологии и обратно // Компьютерная лингвистика и интеллектуальные технологии: междунар. семинар Диалог'2002 М.: Наука. 2002. - Т. 1. -С. 307-313.

19. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Онтологии в системах искусственного интеллекта: способы построения и организации // Новости искусственного интеллекта. М.: Изд-во РАИН. 2002. - № 2. -С. 3-9.

20. Gruber Т. R. A Translation Approach to Portable Ontology Specifications. // Knowledge Acquisition. 1993, 5(2). - pp. 199-220.

21. Евгенев Г.Б. Онтология инженерных знаний // Информационные технологии. 2001. №6, с.2-5.

22. Смирнов С.В. Онтологический анализ предметных областей моделирования // Известия Самарского научного центра РАН. 2001. Т.З. № 1, с.62-70.

23. Добров Б.В., Лукашевич Н.В. Лингвистическая онтология по естественным наукагй и технологиям для приложений в сфере

24. Yildiz В., Miksch S. Ontology-Driven Information Systems: Challenges and Requirements // Proceedings of the International Conference on Semantic Web and Digital Libraries, 2007.Й.11.

25. Guarino Nicola. Formal Ontology and Information Systems // Formal Ontology in Information Systems. Proceedings of FOIS'98, Trento, Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15.

26. Berners-Lee Т., Hendler J., Lassila О. The Semantic Web // Scientific American. 2001. - May 17.

27. Аверченков, В.И., Рощин C.M. Мониторинг и системный анализ информации в сети Интернет: монография. Брянск: БГТУ, 2006. - 160 с.

28. Ruch P.; Gobeil J., Lovis C., Geissbtihler A. Automatic medical encoding with SNOMED categories // BMC Medical Informatics and Decision Making 20082008, 8(Suppl 1):S6.

29. Гаврилова T.A., Хорошевский В.Ф. Базы знаний интеллектуальных систем: учебное пособие для вузов. СПб.: Питер, 2000. - 382с.

30. Найханова J1. В., Хаптахаева Р. Б., Янсанова Е. Н. Создание декларативного метода извлечения знаний из терминологических словарей // Информационные технологии, 2008. № 12. С. 2—8.

31. Найханова, JI.B. Технология создания методов автоматического построения онтологий с применением генетического и автоматного программирования : монография. Федеральное агенство по образованию, ГОУ ВПО ВСГТУ. Улан-Удэ : Изд-во БНЦ СО РАН, 2008. - 244с.

32. Рабчевский Е.А., Булатова Г.И., Автоматическое построение онтологий // Научно-технические ведомости СПбГПУ. 2007. - 4. - Санкт-Петербург : Изд-во политехнического Университета, 2007.

33. Sure Y, Erdmann M., Angele J., Staab S., Studer R., Wenke D. OntoEdit: Collaborative ontology development for the Semantic Web. // In Proc. of the Inter. Semantic Web Conference (ISWC 2002), Sardinia, Italia, June 2002.

34. Gomez-Perez A., Fernando-Lopez M., Corcho O. Ontology Engineering // Springer-Verlag, 2004.

35. Haav Н.М. An Application of Inductive Concept Analysis to Construction of Domainspecific Ontologies. // In Proceedings of the Workshop of VLDB2003, 2003, - pp.63-67.

36. Maedche, A. and Staab, S.: Discovering Conceptual Relations from Text. ECAI 2000. Proceedingsof the 14th European Conference on Artificial Intelligence, IOS Press, Amsterdam, 2000

37. IDEF5 Method Report. Armstrong Laboratory AL/HRGA Wright-Patterson Air Force Base, Ohio 45433. -1994, - 187p.

38. Добров Б.В., Иванов B.B., Лукашевич H.B., Соловьев В.Д. Онтологии и тезаурусы: модели, инструменты, приложения. М., БИНОМ, Интернет-университет информационных технологий-ИНТУИТ.ру, 2009. - 173с.

39. Коваль С.А. Безэкземплярные и экземплярные онтологии. Материалы XXXVI Междунар. филолог, конф. 12 марта 2007 г. в Санкт

40. Петербургском университете (в печати).http://skowal.narod.ru/research/ontology2007

41. Клещёв А. С., Артемьева И. JI. Математические модели онтологий предметных областей. Ч. 1. Существующие подходы к определению понятия " онтология '7/НТИ. Сер. 2. 2001. - № 2. - с. 20 - 27.

42. Клещёв А. С., Артемьева И. JI. Математические модели онтологий предметных областей. 4.2. Компоненты модели //НТИ. Сер. 2. 2001. -№ 3. - с. 19-29.

43. Клещёв А. С., Артемьева И. JI. Математические модели онтологий предметных областей. Ч. 3. Сравнение разных классов моделей онтологий //НТИ. Сер. 2. 2001. - № 4. - С. 10-15.

44. Finin Т., Mayfield J., Grosof В. DARPA Agent Markup Language (DAML) Tools for Supporting Intelligent Annotation, Sharing and Retrieval. 2007 University of Maryland, Baltimore, 109p.

45. Декер С., Мельник С. Semantic Web: роли XML и RDF // Открытые системы, 2001. № 09. С. 23-27.

46. Brickley D., Guha R.V. Resource description framework (RDF) schema specification. http://www.w3.org/TR/PR-rdf-schema. W3C Proposed Recommendation. Technical report, W3C, 1999.

47. Бездушный A. A. RDFS как основа среды разработки цифровых библиотек и Web-порталов / Бездушный А. А., Бездушный А. Н., Нестеренко А. К., Серебряков В. А., Сысоев Т. М. // Электронные библиотеки 2003 - №3 Электронный журнал. - http://www.elbib.ru/.

48. OWL Web Ontology Language Semantics and Abstract Syntax. http://www.w3.org/TR/owl-semantics. W3C, 2004.

49. Михаленко П. Язык онтологий в Web. //URL: http://www.osp.ni/os/2004/02/l 83921/

50. Kalyanpur A. et al. OWL: Capturing Semantic Information using a Standardized Web Ontology Language. // Multilingual Computing & Technology Magazine, Vol. 15, issue 7, Nov 2004.

51. Минский M. Фреймы для представления знаний. М.: Энергия, 1979. -152с.

52. Cui. Z., Сох M, Jones D. An Environment for Managing Enterprise Domain Ontology // Chapter in Information Modeling lor the New Millennium. IBSR. -2000. http:/www.btexact.com/-project/-ibsr/publications.htm

53. Gruninger M., Obrst L. An Ontology Framework // Ontology Summit NIST, Gaithersburg, MD April 22-23, 2007

54. Слета В. Д., Сергеев А. С. Построение и эволюционное развитие онтологий // Известия ПГПУ им. В.Г. Белинского. 2010 № 18 (22). С. 196-200.

55. Муромцев Д.И. Онтологический инжиниринг знаний в системе Protégé: Методическое пособие. — СПб: СПбГУ ИТМО, 2007. — 62 с.

56. Horridge M. et al. A Practical Guide To Building OWL Ontologies Using The Protege-OWL Plugin and CO-ODE Tools Edition 1.0 // University Of Manchester, 2004.

57. Смирнов A.B., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Управление онтологиями // Известия РАН. Теория и системы управления. 2003. Ч. 1, № 4. С. 132—146; Ч. 2, № 5. С. 89—101.

58. Лурия А. Р. Язык и сознание./ Под редакцией Е. Д. Хомской. М: Изд-во Моск. ун-та, 1979 - 320 с.

59. В. А. Пронина, Л. Б. Шипилина, "Использование отношений между атрибутами для построения онтологии предметной области", Пробл. управл., 2009, № 1, С. 27-32.

60. Wille R. Concept lattices and conceptual knowledge systems. // Computers and Mathematics with Applications, 1992, №23.

61. Евтушенко С.А., Система анализа данных "Concept Explorer," труды 7-ой Национальной Конференции по Искусственному Интеллекту (КИИ-2000), Москва, 2000, с.127-134.

62. Антонов И.В., Воронов М.В. Методы анализа данных в задачах автоматизации построения онтологии предметной области // Дистанционное и виртуальное обучение. 2011. - N 8. - с. 19-35.

63. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. 2-е изд., перераб. и доп. -СПб.: БХВ-Петербург, 2007. -384 с.

64. Антонов И.В., Воронов М.В. К разрешению проблемы автоматизации построения онтологии предметной области // Моделирование и анализ данных. Труды факультета информационных технологий МГГТПУ. Вып.6 (2011) М.: РУСАВНА. 2011 . с. 47-53.

65. Антонов И.В. Метод автоматизированной поддержки формирования онтологии предметной области. // Математические методы в технике и технологиях ММТТ-23: сб.трудов XXIII Междунар. науч. конф. Т. 12. Смоленск: РИО ф-ла ГОУВПО МЭИ (ТУ), 2010. - с.59-63.

66. Антонов И.В., Воронов М.В. Метод построения онтологии предметной области // Вестник СПБГУТД. Периодический научный журнал. Серия "Естественные и технические науки", №2, 2010 СПБ, - с. 28-32.

67. Антонов И.В., Воронов М.В. Методы анализа данных в задачах автоматизации построения онтологии предметной области // Дистанционное и виртуальное обучение. 2011. - N 8. - с. 12-19.

68. Шилдт Герберт С# 3.0 Полное руководство. М., ООО «И.Д.Вильямс», 2010, 992с.

69. Троелсен. Э. Язык программирования С# 2008 и платформа .NET 3.5. «И.Д.Вильямс», 2010, 1344с.

70. Когаловский М.Р. Абстракции и модели в системах баз данных. // СУБД, 4-5/1998, с. 73-81.

71. Антонов И.В. Модель онтологии предметной области для систем семантически-ориентированного доступа // Труды Псковского политехнического института. Электротехника. Машиностроение .— 2011 .—№ 14.3 .— с. 339-343.

72. IEEE Learning Technology Standards Committee (LTSC), Learning Object Metadata (LOM), IEEE PI 484.12-2002. Url: http : //www. imsglobal .org/metadata/

73. SCORM 2004 4th Edition Version 1.1 Overview. Url: http://www.adlnet.gov/Technologies/scorm/SCORMSDocuments/2004%204th %20Edition/Overview.aspx

74. Кузнецов С. О., Объедков С. А. Алгоритмы построения множества всех понятий формального контекста и его диаграммы Хассе. // Изв. Рос. акад. наук. Теория и системы упр. 2001 . N 1. с. 120-129.

75. Антонов И.В. Инструментальные средства автоматизированного формирования онтологии предметной области // Труды Псковского политехнического института. Электротехника. Машиностроение .— 2011 .—№ 14.3 .—с.335-339.

76. Свидетельство о государственной регистрации программы для ЭВМ № 2011616150. Программа автоматизированного построения онтологии предметной области CONCEPT MAKER // И.В. Антонов 2011.