автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии

кандидата технических наук
Привезенцев, Алексей Иванович
город
Томск
год
2009
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии»

Автореферат диссертации по теме "Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии"

□034867В1

На правах рукописи

Привезенцев Алексей Иванович

ОРГАНИЗАЦИЯ ОНТОЛОГИЧЕСКИХ БАЗ ЗНАНИЙ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ОПИСАНИЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ В МОЛЕКУЛЯРНОЙ СПЕКТРОСКОПИИ

Специальность 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных

сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

-Здек 2009

Томск-2009

003486761

Работа выполнена в Институте оптики атмосферы СО РАН

Научный руководитель: кандидат физико-математических наук,

старший научный сотрудник Фазлиев Александр Зарипович

Официальные оппоненты:

доктор технических наук, профессор

Янковская Анна Ефимовна;

кандидат технических наук, старший научный сотрудник Загорулько Юрий Алексеевич

Ведущая организация: Новосибирский государственный

университет

Защита состоится «17» декабря 2009 г. в 10 час. 30 мин. на заседании диссертационного совета Д 212.267.08 по адресу: 634050, г. Томск, пр. Ленина, 36, корп. 2, ауд. 102, Томский государственный университет.

С диссертацией можно ознакомиться в научной библиотеке Томского государственного университета по адресу: 634050, г.Томск, пр. Ленина, 34а.

Отзывы на автореферат (2 экз.), заверенные печатью, высылать по адресу: 634050, г. Томск, пр. Ленина, 36, ученому секретарю ТГУ.

Автореферат разослан 16 ноября 2009 г.

Ученый секретарь диссертационного совета, д.т.н., профессор

А.В. Скворцов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертационной работы.

Молекулярная спектроскопия является одним из широко используемых во многих прикладных исследованиях разделов физики. Предметом изучения молекулярной спектроскопии являются спектральные свойства молекул. Детальное изучение спектральных свойств молекул не закончено до сих пор. Связано это с тем обстоятельством, что в расчетах физических характеристик атмосферы используются сотни тысяч линий, каждая из которых описывается десятком параметров. В молекулярной спектроскопии постоянно публикуется огромное количество сложных результатов измерения или расчетов спектров - результаты решения предметных задач. Решаются предметные задачи для расчёта сотен миллионов линий, проводятся эксперименты с помощью современной техники для измерения спектров, которая позволяет получать данные с большей точностью и в тех диапазонах длин волн, в которых ранее измерения не проводились. Также растет число исследовательских групп. Кроме увеличения объёма спектральных данных постоянно меняется структура представления данных, как с предметной точки зрения так с технической реализации. Например, за почти сорокалетнюю историю одна из ведущих групп экспертов по спектроскопии, поддерживающая базу данных HITRAN, несколько раз модифицировала как набор физических сущностей, так и формат документов и файлов, в котором хранятся данные. Все это указывает на необходимость сбора, хранения, обработки и распространения информации с использованием современных подходов для коллективной работы на базе информационных систем в сети Internet.

На данный момент, для работы с этой информацией создаются специальные базы постоянно пополняющихся спектральных данных: HITRAN, GEISHA, VALD, CDMS, BASECOL, STSP. Работа с такими массивами данных требует, с одной стороны, предметной систематизации данных, с другой стороны, программных средств для их автоматизированной обработки, включающей программную интеграцию и структурирование разнородных ресурсов из различных предметных областей, а также возможность подготовки данных для решения прикладных задач в смежных предметных областях: астрономии, атмосферной радиации, оптики атмосферы. Поэтому, на основе этих баз данных создаются информационные системы. Несмотря на это, для молекулярной спектроскопии характерны следующие информационные проблемы, не решаемые в существующих информационных системах:

- для коллективной работы в информационной системе у пользователя отсутствует возможность самостоятельного формирования структуры массивов спектральных данных и их наполнение конкретными значениями, проведения на их основе расчетов и сравнения с результатами экспериментов;

- базы спектральных данных могут содержать недостоверные данные, что снижает их научную ценность;

- имеется неопределенность в информации о собранных данных, об их способах получения;

- существующие информационные системы не дают средств для автоматизированного программного анализа информации о данных и её последующей логической машинной обработки, необходимой для построения Semantic Web.

Идея Semantic Web состоит в машинной логической обработке семантики информационных ресурсов, имеющихся в сети Internet, для автономного решения интеллектуальных задач. Для решения таких задач должны использоваться специализированные интеллектуальные программы-агенты, которые предлагают решения, используя базу знаний, основанную на онтологии (онтологическую базу знании). Для организации онтологий консорциум W3C, разрабатывающий Semantic Web, определил в качестве спецификации язык OWL DL.

Активные исследования по представлению знаний в виде онтологии начались в начале 1990-х и продолжаются до сих пор. Среди большого количества работ можно выделить M.R. Genesereth, T.R. Gruber, N. Guarino, R. Mizogushi, J.F. Sowa, R. Studer. Актуальные исследования онтологий в рамках Semantic Web представлены в работах I.A. Horrocks, D.L. McGuinness, P.F. Patel-Schneider. Среди отечественных публикаций существует разнообразие подходов к представлению знаний в виде онтологий, и исследования в данной области активно ведутся И.Л. Артемьевой, Е.М. Бенеаминовым, В.И. Воробьевым, Б.В. Добровым, Т.А. Гавриловой, Н.Г. Загоруйко, Ю.А. Загорулько, JI.A. Калиниченко, А.С. Клещевым, Н.В. Лукашевич, Д.Е. Пальчуновым, А.Ф. Тузовским, В.Ф. Хорошевским. Большое количество публикаций в данной области указывает на решение разнообразных задач с помощью баз знаний, основанных на онтологиях.

Онтологические базы знаний позволяют осуществлять открытое представление машинно-обрабатываемых знаний, что позволяет повысить эффективность коллективной работы ученых в своих узкоспециализированных предметных областях. Так как они дают возможность учёным строить собственные концептуализации предметной области и проверять согласованность своих знаний с другими экспертными публикуемыми знаниями. Кроме этого ученые, анализируя получаемое

знание о результатах решения предметных задач, могут своевременно реагировать на важные сведения, например о некорректных данных. Кроме того, использование онтологических баз знаний для описания разнородных данных в рамках научных информационно-вычислительных систем позволяет решать задачи классификации, интеграции, поиска и сравнения информационных ресурсов.

В настоящее время в молекулярной спектроскопии в рамках научных информационно-вычислительных систем отсутствуют машин-но-обрабатываемые базы знаний.

На основе всего вышеперечисленного можно сделать вывод о том, что исследование подхода к организации онтологической базы знаний по молекулярной спектроскопии имеет научную и практическую актуальность.

Цель диссертационной работы: разработка и исследование подхода к построению в рамках научной информационно-вычислительной системы онтологических баз знаний для описания разнородных данных молекулярной спектроскопии, извлечённых из научных публикаций и проверяемых на достоверность.

Для достижения цели диссертационной работы решаются следующие задачи:

1. Создание информационных моделей для представления данных и знаний в области молекулярной спектроскопии.

2. Разработка структур данных для информации, извлеченной из научных публикаций по спектроскопии молекул, допускающих автоматическую проверку целостности данных и необходимых для обмена между интеллектуальными агентами.

3. Создание терминологической компоненты (ТВох) онтологической базы знаний для представления знаний в области молекулярной спектроскопии.

4. Разработка алгоритма формирования онтологического описания опубликованных данных с целью построения набора фактов в базе знаний по молекулярной спектроскопии, содержащих знания о их первоисточниках и достоверности.

5. Реализация программного обеспечения, созданного на основе разработанного алгоритма онтологического описания информационных ресурсов и практического использования этого описания в НИВС по спектроскопии молекул воды.

6. Реализация фактографической компоненты (АВох) онтологической базы знаний по описанию опубликованных данных спектроскопии молекул воды.

Объектом исследования являются структуры данных и модели представления знаний в информационных системах по молекулярной спектроскопии.

Предметом исследования являются подходы и алгоритмы создания баз знаний и систем управления ими в научных информационно-вычислительных системах по молекулярной спектроскопии.

Методы исследования. В ходе диссертационного исследования были использованы методы онтологического моделирования, теории множеств, дескриптивной логики, объектно-ориентированного проектирования и программирования.

Научная новизна диссертационной работы заключается в следующем:

1. Впервые построена семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением инф'ормационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач, позволившая решить задачу автоматической систематизации знаний о достоверности этих решений.

2. Впервые создан алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах, являющийся необходимым для машинной актуализации знаний о достоверности решений задач и применимый для всех спектральных молекул.

3. Впервые создана онтологическая база знаний спектроскопии молекул воды, в которой фактологическая компонента (АВох) содержит наиболее полную информацию о значениях параметров спектральных линий молекул воды, опубликованную в мире.

Теоретическая значимость исследования состоит в разработке онтологии спектроскопии молекул как основы для построения и проверки научных гипотез, разнообразных систематизации знаний, интеграции знаний различных предметных областей, что открывает перспективы для постановки и решения новых предметных задач, как в молекулярной спектроскопии, так и смежных с ней областях науки, таких как астрономия, атмосферная радиация, оптика атмосферы.

Практическая ценность диссертационной работы заключается:

1. В создании наиболее полной прикладной онтологии по опубликованным данным спектроскопии молекул воды.

2. В возможности использования открытых результатов семантического описания решений задач, оформленных по стандарту OWL DL, во внешних специализированных системах по работе с онтоло-гиями, использующих машины вывода.

3. В разработке программного обеспечения в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, на основе предложенного алгоритма онтологического описания информационных ресурсов и применении этого программного обеспечения рядом ведущих исследовательских групп спектроскопистов в России (Санкт-Петербургский государственный университет, Институт прикладной физики РАН, Институт оптики атмосферы РАН).

Основные защищаемые положения:

1. Семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением информационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач.

2. Алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах.

3. Программное обеспечение в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, созданное на основе разработанного алгоритма онтологического описания информационных ресурсов и полученная с его использованием онтологическая база знаний спектроскопии молекул воды.

Апробация диссертационной работы. Все результаты работы докладывались и обсуждались на следующих научных конференциях: IX Рабочем совещании по электронным публикациям «El-Pub2004» -Новосибирск, 23-25 сентября 2004; V Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям - Новосибирск, 1-3 ноября 2004; Международной конференции по вычислительно-информационным технологиям для наук об окружающей среде «Cites-2005» - Новосибирск, 13-23 марта 2005; X Байкальской Всероссийской конференции «Информационные и математические технологии в науке, технике и образовании» - Севе-робайкальск, 12-19 июля 2005; 7-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005) - Ярославль, 4-6 октября 2005; International conference on environment observations, modeling and informational systems (ENVIROMIS-2006) - Tomsk, 1-8 June 2006; XVth Symposium on High Resolution Molecular Spectroscopy «HighRus-2006» - Nizhny Novgorod, 18-21 July 2006; Рабочем семинаре «Проблемы и решения задач в области наук о Земле в распределенной ИНТЕРНЕТ среде» - Москва, 13-15 февраля 2007; European Geosciences Union General Assembly 2007 - Vienna, 15-20 April 2007; International conference

on Computational Information Technologies for Environmental Sciences «Cites-2007» - Томск, 14-25 июля 2007; Всероссийской конференции «Знания - Онтологии - Теория» - Новосибирск, 14-16 сентября 2007; 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2007) - Переславль-Залесский, 15-18 октября 2007; Всероссийской научно-практической конференции «Свободное программное обеспечение: разработка и внедрение» - Томск, 17-18 мая 2008; XIII Байкальской всероссийской конференции «Информационные и математические технологии в науке, технике и образовании» - Иркутск, 716 июля 2008; International conference on environment observations, modeling and informational systems (ENVIROMIS-2008) - Tomsk, 28-5 July 2008; European geosciences union general assembly 2009 - Vienna, 19-25 April 2009; XVI Международном симпозиуме «Оптика атмосферы и океана. Физика атмосферы» - Томск, 12-15 октября 2009; IV Всероссийской конференции молодых учёных «Материаловедение, технологии и экология в 3-м тысячелетии» - Томск, 19-21 октября 2009; Всероссийской конференции «Знания - Онтологии - Теория» - Новосибирск, 20-22 октября 2009.

По теме диссертационной работы опубликовано 17 научных работ:

- из них шестнадцать печатных [1,2, 3, 4, 6, 7, 8,9,10, 11, 12, 13, 14,15,16,17] и одна в электронном журнале [5];

- из них четырнадцать работ на русском языке [4, 5, 6, 7, 8, 9, 10, 11,12,13, 14,15,16,17] и три на английском [1,2, 3];

- из них две в журналах из перечня ВАК по управлению, вычислительной технике и информатике [4, 9], две в журналах из перечня ВАК по физике [8, 11], две в журналах [5, 10], одиннадцать в трудах и материалах конференций [1,2, 3, 6,7, 12,13, 14,15, 16, 17].

Внедрение результатов диссертационной работы, было осуществлено в трех основных исследовательских группах спектроскопистов в России:

- Институт оптики атмосферы СО РАН, где результаты доступны активно используется в рамках НИВС (http://saga.iao.ru);

- Институт прикладной физики РАН, где результаты доступны в рамках НИВС по адресу http://saga.atmos.appl.sci-nnov.ru;

- Санкт-Петербургский государственный университет, где результаты доступны в рамках НИВС по адресу http://saga.molsp.phys.spbu.ru.

Работа выполнена при поддержке грантов: Российского Фонда Фундаментальных Исследований (РФФИ) «Распределенная информационная система «Молекулярная спектроскопия»« (05-07-90196, А.Д.

Быков, 2005-2007); РФФИ «Интернет доступная информационная система по молекулярной спектроскопии, основанная на знаниях» (08-07-00318-а, А.З. Фазлиев, 2008-2010); UIPAC task 2004-035-1-100 «A database of water transitions from experiment and theory».

Личный вклад автора.

Опубликованные работы написаны в соавторстве с экспертами предметной области спектроскопии молекулы воды и сотрудниками центра интегрированных информационных систем ИОА СО РАН. В совместных работах диссертант принимал участие в непосредственной разработке схем XML-данных, метаданных и их дальнейшем внедрении в модель НИВС, в разработке прикладной онтологии задач по спектроскопии молекул воды, во внедрении результатов работы. В разработке перечисленного программного обеспечения ему принадлежит определяющая роль.

Благодарности.

Автор выражает благодарность профессорам А.А. Мицелю и А.Ф. Тузовскому за внимание к работе, ценные замечания и помощь, способствующие окончательному варианту рукописи. Автор признателен с.н.с. А.З. Фазлиеву за ценные консультации, постановки задач и всестороннюю поддержку данной работы._

Автор благодарен чл.-корр. РАН С.Д. Творогову|, а также благодарит д.ф.-м. н. А.Д. Быкова и к.ф.-м.н. Б. А. Воронина за консультации и помощь при определении структуры данных в молекулярной спектроскопии воды; Н.А. Лаврентьева за реализацию программ для расчета коэффициентов поглощения газов; А.Ю. Ахлёстина за реализацию ядра НИВС; А.В. Козодоева за реализацию системы ввода данных; д.ф.-м.н. О.Б. Родимову за помощь в составлении типовых вопросов для задачи нахождения уровней энергии молекулы.

Структура и объём диссертационной работы. Диссертация состоит из перечня условных обозначений, введения, четырёх глав, заключения, списка использованных источников и шести приложений. Общий объём работы составляет 239 страниц. Список использованных источников насчитывает 128 наименований. Работа содержит 42 рисунка и 25 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении излагается положение дел в прикладной части молекулярной спектроскопии, обосновывается актуальность темы диссертационной работы, сформулированы цель и задачи работы, изложены основные научные результаты, выносимые на защиту, и их практическая значимость.

В первой главе излагается подход к организации онтологических баз знаний в информационных системах.

Определение. Знания - совокупность зафиксированных в сознании и мышлении человека или машины фактов предметной области. Сознание определяет восприятие и понимание окружающего мира, а мышление задаёт способы установления связей, сопоставлений и осуществление из этого выводов, используя логику. Если рассматривать логику, заложенную в машину, то используется формальный язык математической логики. Формальный язык (множество конечных слов над конечным алфавитом) определяется словами, порождёнными некоторой формальной грамматикой, например формой Бэкуса-Наура для описания синтаксиса. Интерпретации смысла синтаксических конструкций формального языка логики определяется логической семантикой, которая определяется формально. Формализация логической семантики позволяет явно задавать смысл высказываний и разделять сами высказывания и заключения об их истинности.

Для достижения компромисса между логикой предикатов, имеющей формальную семантику, и семантическими сетями, являющимися удобным способом представления знаний предметной области в виде иерархий понятий и их отношений, используется семейство дескриптивных логик, которое является подмножеством логики предикатов первого порядка.

Во вводной части главы рассматриваются разные точки зрения на понятие «онтология». Рассматриваются подходы к онтологической концептуализации и различные классификации онтологий. Представлено описание инженерии онтологий, языков онтологий и инструментальных средств для работы с ними.

В диссертационной работе понятие «онтология» используется в соответствии с определением языка спецификации онтологий OWL, имеющим формальный синтаксис и формальную семантику семейства дескриптивных логик, например, OWL Lite имеет основу в виде дескриптивной логики под названием SHIF(D), a OWL DL - SHOIN(D).

Определение. Онтология (база знании) - совокупность ТВох и АЬох на формальном языке OWL DL.

Формальный синтаксис языка содержит алфавит, состоящий из трёх компонентов (С, R, I}, где С = {Т, 1, С,...Ст} - конечное множество имён классов (понятий), включающее универсальный класс Т и пустой класс ±; R = {/f,..J?t} - конечное множество имён свойств (бинарных отношений); 1 = {/,.../„} - конечное множество имён объектов (экземпляров). Набор терминологических аксиом типа «дочерний класс», «эквивалентный класс», «дочерний свойство», «эквивалентное свойство» называется ТВох (сокращение от terminological box), то есть вводит терминологию предметной области. Набор аксиом утверждений типа «экземпляр класса», «экземпляр свойства» называется АВох (assertional box), то есть содержит утверждения об именованных индивидах в заданной терминологии.

Определение. Семантические метаданные - описание информационного ресурса (АВох) относительно некоторой терминологии онтологической модели предметной области (ТВох).

В работе семантические аннотации представлены с помощью языка спецификации OWL DL. Такие аннотации будем называть онтологическими аннотациями или онтологическими описаниями. Процесс формирования структуры семантической аннотации обусловлен задачей перевода интерпретируемого человеком описания в описание, интерпретируемое машиной.

В главе представлен обзор существующих НИВС по молекулярной спектроскопии.

Во второй главе рассмотрен подход к информационной модели предметной области в виде цепей её прямых и обратных задач.

В естественных науках большая часть задач связана со знаниями, основанными на решениях задач предметной области. Целью решения предметной задачи является изучение состояний физической системы. Эти состояния исследуемой системы при представлении знаний рассматриваются как наборы фактов (АВох). Задачи классификации в молекулярной спектроскопии, как правило, сводятся к построению таксономии терминов предметной области и на практике рассматриваются как вспомогательные задачи. Предполагается, что в задаче классификации концепты представляют интенсионалы предметной области (ТВох). Описание предметной области основано на нескольких таксо-номиях и наборах фактов для каждой из задач модели предметной области.

Важную роль при создании базы знаний играет концепт «информационный источник». Концепт информационный источник описывает решение задачи предметной области и важен при семантическом описании решений задач молекулярной спектроскопии.

Основной акцент для модели предметной области в виде цепей прямых и обратных задач сделан на автоматическое установление достоверности данных решений задач. В проверке на достоверность результатов решений задач можно выделить несколько уровней:

1. Проверка ограничений на типы данных.

2. Проверка ограничений на допустимые интервальные значения физических величин.

3. Проверка ограничений, следующих из математических моделей исследуемых физических объектов.

4. Систематизация результатов решений задач по величине среднеквадратичных отклонений.

5. Указание недостоверности данных, выявленных экспертом предметной области на основе «дальних корреляций» результатов решений задач.

Прямые задачи молекулярной спектроскопии связаны с расчетами из первых принципов фундаментальных характеристик молекул. Обратные задачи молекулярной спектроскопии связаны с обработкой данных измерений спектральных функций, что позволяет в дальнейшем при машинной обработке классифицировать их выходные данные как экспериментальные. В цепи задач молекулярной спектроскопии существуют связи между прямыми и обратными задачами.

При решении задач обоих типов проводятся вычисления одних и тех же физических величин. Их сравнение между собой позволяет делать выводы о достоверности данных.

К классам элементарных прямых задач, используемых нами для проектирования информационной системы, относятся следующие классы задач: задача определения физических характеристик изолированной молекулы (Т1); задача определения параметров спектральной линии изолированной молекулы (Т2); задача определения параметров контура спектральной линии (ТЗ); задача расчета спектральных функций (Т4).

К классам элементарных обратных задач, используемых нами для проектирования информационной системы, относятся следующие классы: задача измерения спектральных функций (Е1); задача приписывания квантовых чисел спектральным линиям (Т5); задача определения коэффициентов Эйнштейна (Т6); задача определения уровней энергии изолированной молекулы (Т7).

В работе для первых двух уровней автоматической проверки на достоверность данных решений задач можно использовать представление структурированных данных в виде ХМЬ-документа с соответствующей ХМЬ-схемой, с заданными ограничениями на типы данных и интервальные значения. В НИВС можно использовать проверку дан-

ных по XML-схемам для выявления ошибок загрузки и выделять данные, которые не соответствуют заданным ограничениям.

В рамках диссертационной работы созданы XML-схемы. Организация XML-схем основана на предположении, что любая физическая задача состоит в изучении определенной молекулы. Поэтому, корневым элементом в документе будет название изотопомера молекулы, ему соответствуют название файла содержащего XML-схему.

В третьей главе рассмотрен подход к построению базы знаний по спектроскопии молекулы воды, описан процесс автоматизации процедуры наполнения онтологии молекулярной спектроскопии новыми фактами. Созданные онтологии используются для машинной систематизации и интерпретации знаний, для интеграции знаний в другие смежные предметные области, а также организации семантического поиска. На рис 1. представлены базовые классы прикладной онтологии по молекулярной спектроскопии, представленные в нотации Protégé.

▼ Thing

?.....UBandCorrelationPair

С BandQuantumNumbers UBroadeningSubstanceRecord CCorrelationBand ODimensionalQuantity yinformationSource ^Metadata ►•"■OPhysicalQuantity

CPhysicalQuantityRecord OSpectralBand -JSubstanceRecord "J Un it

• OQuantumNumbersType GSymmetryCroup ©Nothing OPhysicalState >- OSubstance О Data

GDataStructure

CMethod

CTask

Рис. 1. Базовые классы онтологии по молекулярной спектроскопии

В этой онтологии можно выделить три группы классов:

Классы, содержащие объекты, относящиеся к спектроскопии молекул, в частности, молекулы воды и ее изотопомеров (Substance, PhysicalState, PhysicalQuantity, DimensionalQuantity, QuantumNum-

bersType, Unit, SpectralBand, BandQuantumNumbers, BandQuan-tumNumbers, CorrelationBand)

Классы, содержащие математические модели объектов, используемые в молекулярной спектроскопии (SymmetryGroup, Task, Method).

Классы, содержащие информационные объекта (Metadata, In-formationSource, SubstanceRecord, PhysicalQuantityRecord, Broad-eningSubstanceRecord).

. Реализация онтологий по молекулярной спектроскопии проведена на языке OWL DL. Большая часть классов прикладной онтологии задач построены с помощью ограничений на свойства. Программная реализация ТВох онтологии содержит 11 файлов, представляющих разные части предметной области.

Особенностью работы с онтологиями задач в НИВС «Молекулярная спектроскопия» является тот факт, что пользователи при решении задач механически составляют свою собственную онтологию, содержащую индивиды, соответствующие конкретной решенной задаче. Эти индивиды можно объединять с онтологиями других задач или других пользователей, если это позволяют права доступа к базе знаний.

Использование прикладной онтологии возможно на клиентском месте с помощью любого редактора онтологий, например Protégé. Средства этого редактора позволяют пользователю составлять запросы с помощью конструкции утверждения (субъект, предикат и объект), экземпляры которого можно создавать из концептов прикладных онтологий.

Полная прикладная онтология по молекулярной спектроскопии в НИВС «Молекулярная спектроскопия» содержит 1 347 796 утверждений на языке OWL. Из которых, 1 467 утверждений приходится на таксономию. На факты по задаче Т1 приходится 1 432 утверждений. На факты по задаче Т2 приходится 1 586 утверждений. На факты по задаче ТЗ приходится 4 265 утверждений. На факты по задаче Т5 приходится 28 723 утверждений. На факты по задаче Т6 приходится 17 202 утверждений. На факты по задаче Т7 приходится 6 159 утверждений. На факты по корреляциям результатов решений задач Т1 и Т7, включая информацию в полосах, приходится 216 567. На факты по корреляциям результатов решений задач Т2 и Т6, включая информацию в полосах, приходится 543 515. На факты по корреляциям результатов решений задач ТЗ и Т5, включая информацию в полосах, приходится 521 269.

В четвёртой главе описаны алгоритмы и программное обеспечение Мета+ для организации онтологической базы знаний.

Представлена общая структура программного обеспечения Ме-та+ в рамках существующей НИВ С «Молекулярная спектроскопия», которая включает в себя:

- онтологическую базу знаний, хранящую метаданные и онтологии НИВС;

- прикладные программные интерфейсы POWL (модифицированный) и RAP, созданные сторонними разработчиками и предоставляющие функции доступа к онтологическому хранилищу;

- классы и библиотеки функций, составляющие ядро Мета+ и выполняющие задачи формирования, хранения, обработки и визуализации онтологического описания;

- конфигурационные файлы и шаблоны Мета+, позволяющие настраивать и организовывать работу различных функциональных блоков.

Кроме перечисленных блоков в программное обеспечение Ме-та+ входят модули и шаблоны, реализуемые по правилам, предлагаемым ядром НИВС:

- модули для взаимодействия с внешней средой через ядро НИВС, организующие web-ориентированное интерактивное взаимодействие с пользователем;

- шаблоны для формирования визуализации функциональности, реализуемой модулями.

В работе описываются алгоритмы формирования семантического описания на основе онтологии задач по молекулярной спектроскопии.

Алгоритм создания метаданных описывает поход к составлению метаданных для решений задач, используя анализ входных и выходных данных задач и способов их описания. Описание решений задач можно представить количественными и качественными метаданными.

Таким образом, имеем два способа получения метаданных. Первый способ — это автоматизированное генерирование метаданных непосредственно из доступных массивов данных. Будем называть такие метаданные вычисляемыми. Второй способ - это ввод метаданных пользователем, что требует создания дополнительных интерфейсов ввода. Будем называть такие метаданные невычисляемыми.

Шаг формирования вычисляемых метаданных отделен от шага заведения невычисляемых метаданных. На любом шаге можно создать экземпляр OWL-класса решения задачи, но этот индивид будет недостоверным в силу своей неполноты, в соответствии с требованиями из определения OWL-класса решения задачи. Индивид решения задачи

будет полным и достоверным, если будет выполнена последовательность из шагов по формированию вычисляемых и невычисляемых метаданных.

.Алгоритм формирования индивидов онтологии предназначен для преобразования информации в семантические метаданные, основанные на прикладной онтологии решений задачи. Алгоритм состоит из систематизированной последовательности следующих шагов:

1. Создание онтологического уровня (ТВох) прикладной онтологии решения задачи предметной области, описывающей входные и выходные данные решения задачи, а также дополнительные характеристики, полученные в результате применения алгоритма фиксации схем метаданных.

2. Создание шаблонного индивида 0\¥Ь-класса решения задачи.

3. Создание на основе ХМЬ-синтаксиса шаблонного индивида 0\УЬ-класса решения задачи ХМЬ-шаблона для генератора индивидов, созданного по определенным правилам, накладываемым программной реализацией генератора.

4. Применение алгоритма создания метаданных, основанного на выявлении вычисляемых и невычисляемых метаданных, реализуя:

4.1. функции преобразования данных из конкретных решений задачи в метаданные (вычисляемые метаданные) для них;

4.2. интерфейсы запроса и функции обработки невычисляемых метаданных для решений задачи;

5. Формирование дополнительных программных модулей для использования в единой научной информационно-вычислительной системе.

Данная последовательность шагов является универсальной для составления индивидов (ЖЬ-классов решений задач.

В диссертационной работе представлено описание функциональности ядра программного обеспечения Мета+, предлагающего два направления разработки:

- функциональность для разработчика, включающая в себя существующие эффективные техники программирования, в частности, предварительное тестирование, использование исключений, интерфейсы и модули по поддержке разработки. В работе представлены некоторые иМЬ-диаграммы тестов. Для сообщения об определенных видах ошибок были созданы новые классы исключений. Для разработчика предусмотрены отдельные интерфейсы для управления результатами своих действий, в частности модуль обновления для пересчета данных и занесения их в метаданные.

- функциональность для конечного пользователя, включающая в себя: функции визуализации массивов данных с учетом их метадан-

ных; функции экспортирования OWL/RDF моделей из НИВС во внешнюю среду в XML-синтаксисе; функции визуализации в HTML-формате индивидов OWL-классов решений задач; функции для составления онтологических экземпляров классов задач, используя HTML-формы и их обработку; функции для составления онтологических экземпляров классов задач, используя автоматический обсчёт имеющихся массивов данных; функции осуществления семантического поиска, используя интерфейс составления вопросов в виде связанных триплетов для получения адекватного ответа. В работе представлены некоторые UML-диаграммы классов ядра Мета+.

В диссертационной работе описана реализация программного обеспечения Мета+, осуществленного на языке РНР 5. Программное обеспечение Мета+ использует открытое свободное API для работы с RDF и OWL. Для работы с RDF используется RDF API for PHP (RAP), а для работы с OWL используется API pOWL, основанное на API RAP.

Основным языком для разметки информации в ПО Мета+ использовался язык XML. На этом языке создавались конфигурационные файлы, шаблоны для генерации онтологических экземпляров. Сами онтологии написаны в XML-синтаксисе RDF/XML.

В заключении сформулированы основные результаты работы и представлены основные направления развития представляемой работы.

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Bykov, A. D. Distributed information system on atmospheric spectroscopy / A. D. Bykov, A. Z. Fazliev, N. N. Filippov, A. V. Kozodoev, A. I. Privezentsev. L. N. Sinitsa, M. V. Tonkov, M. Yu. Tretyakov // Geophysical Research Abstracts. European Geosciences Union General Assembly 2007 - Vienna, 15-20 april 2007. - Vol. 9. - Vienna: Copernicus, 2007.-8 pp.

2. Bykov, A. D. Distributed information system on molecular spectroscopy / A. D. Bykov, A. Z. Fazliev, A. V. Kozodoev, A. I. Privezentsev. L. N. Sinitsa, M. V. Tonkov, N. N. Filippov, M. Yu. Tretyakov // Proc. of SPIE, 15th Symposium on High-Resolution Molecular Spectroscopy -Vol. 6580. - pp. 65800W. - 2006. - 12 pp.

3. Fazliev, A. Z. Semantic metadata application for information resources systematization in water spectroscopy / A. Z. Fazliev, A. I. Privezentsev. J. Tennyson // Geophysical Research Abstracts. European Geosciences Union General Assembly 2009 - Vienna, 19-25 april 2009. -Vol. 11.- Vienna: Copernicus, 2009. - 4 pp.

4. Быков, А. Д. Структурирование ресурсов информационной системы по молекулярной спектроскопии / А. Д. Быков, А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Вычислительные технологии. -2007.-Т. 12.-С. 10-18.

5. Козодоев, А. В. Аннотирование информационных ресурсов в распределенной информационной системе «Молекулярная спектроскопия» [Электронный ресурс] / А. В. Козодоев, А. И. Привезенцев. А. 3. Фазлиев // Электронные библиотеки: Российский научный электронный журнал. - Электрон, журн. - М.: Институт развития информационного общества, 2006. - Т. 9. - № 3. - Режим доступа: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2006/partЗ/KPF, свободный.

6. Козодоев, А. В. Аннотирование информационных, ресурсов в распределенной информационной системе «Молекулярная спектроскопия» / А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Труды 7-ой Всероссийской конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (ЯСОЬ'2005) -Ярославль, 4-6 октября 2005. - Ярославль: Издательство Ярославского Государственного Университета, 2005. - С. 80-86.

7. Козодоев, А. В. Данные и метаданные в распределенной информационно-вычислительной системе «Молекулярная спектроскопия» / А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Труды X Байкальской Всероссийской конференции «Информационные и математические технологии в науке, технике и образовании» - Северобай-кальск, 12-19 июля 2005. - Ч. 1. - Иркутск: Издательство ИСЭМ СО РАН, 2005.-С. 45-50.

8. Козодоев, А. В. Информационная система для решения задач молекулярной спектроскопии. 3. Уровни энергии молекул / А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. -2007. - Т. 20. - № 9. - С. 805-809.

9. Козодоев, А. В. Организация информационных ресурсов в распределенной информационно-вычислительной системе, ориентированной на решение задач молекулярной спектроскопии / А. В. Козодоев, А. И. Привезенцев, А. 37 Фазлиев // Вычислительные технологии. -2005.-Т.10., спец. выпуск.-С. 82-91.

10. Козодоев, А. В. Структура ресурсов информационно-вычислительной системы по молекулярной спектроскопии / А. В. Козодоев, А. И. Привезенцев. А. 3. Фазлиев // Измерения, моделирование и информационные системы для изучения окружающей среды : сб. ст. / под ред. Е. П. Гордова. - Томск: Томский ЦНТИ, 2006. - С. 32-35.

11. Лаврентьев, Н. А. Информационная система для решения задач молекулярной спектроскопии. 4. Переходы в молекулах симмет-

рии C2v и Cs / Н. А. Лаврентьев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. - 2008. - Т. 21. - № 11. - С. 957-962.

12. Лаврентьев, Н. А. Распределенная информационная система по молекулярной спектроскопии углекислого газа / Н. А. Лаврентьев, А. И. Поивезенцев. А. 3. Фазлиев // Материалы XVI Международного симпозиума «Оптика атмосферы и океана. Физика атмосферы» -Томск, 12-15 октября 2009. - Томск: Издательство ИОА СО РАН, 2009.-С. 42-45.

13. Привезенцев, А. И. Прикладная онтология для задач молекулярной спектроскопии / А. И. Привезенцев, А. 3. Фазлиев // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2007) - Переславль-Залесский, 15-18 октября 2007. - Т. 1. -Переславль-Залесский: Издательство института программных систем РАН, 2007. - 10 с.

14. Привезенцев, А. И. Прикладная онтология задач для молекулярной спектроскопии / А. И. Привезенцев. А. 3. Фазлиев // Труды Всероссийской конференции «Знания - Онтологии - Теория» - Новосибирск, 14-16 сентября 2007. - Т. 2. - Новосибирск: Омега Принт, 2007.-С. 82-87.

15. Привезенцев, А. И. Применение семантических метаданных для систематизации информационных ресурсов в молекулярной спектроскопии / А. И. Привезенцев. А. 3. Фазлиев // Труды XIII Байкальской Всероссийской конференции «Информационные и математические технологии в науке, технике и образовании» - Иркутск, 7-16 июля 2008. - Ч. 1. - Иркутск: Издательство ИСЭМ СО РАН, 2008. - С. 171-176.

16. Привезенцев, А. И. Логическая молекулярная спектроскопия / А. И. Привезенцев. А. 3. Фазлиев, J. Tennyson // Материалы Всероссийской конференции «Знания - Онтологии - Теории» - Новосибирск, 20-22 октября 2009. - Т. 2. - Новосибирск: РИЦ Прайс-Курьер, 2009.-С. 202-206.

17. Привезенцев, А. И. Онтологическая база знаний по описанию результатов решений задач в молекулярной спектроскопии / А. И. Привезенцев // Материалы IV Всероссийской конференции молодых учёных «Материаловедение, технологии и экология в 3-м тысячелетии» - Томск, 19-21 октября 2009. - Томск: Издательство ИОА СО РАН,2009.-С. 624-628.

Печ. л. 1. Тираж 100 экз. Заказ № 94.

Тираж отпечатан в типографии ИОА им. В.Е. Зуева СО РАН.

Оглавление автор диссертации — кандидата технических наук Привезенцев, Алексей Иванович

ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ.

ВВЕДЕНИЕ.

Глава 1. Организация баз знаний в ИС.

1.1 Представление знаний.

1.1.1 Концептуализация.

1.1.2 Инженерия онтологий.

1.1.3 Представление данных, информации и знаний в Semantic Web.

1.1.3.1 Extensible Markup Language (XML).

1.1.3.2 Resource Description Framework (RDF).

1.1.3.3 Ontology Web Language (OWL).

1.1.4 Дескриптивная логика и машины вывода.

1.2 Информационные системы.

1.2.1 Определение информационной системы.

1.2.2 Слои информационной системы.

1.3 Ресурсы информационной системы.

1.3.1 Определение информационных ресурсов.

1.3.2 Метаданные.

1.4 Обзор информационных систем по молекулярной спектроскопии.

1.4.1 Информационные ресурсы в предметной области молекулярной спектроскопии.

1.5 Выводы по главе.

Глава 2. Информационная модель предметной области с процедурными знаниями.

2.1 Информационная модель предметной области с процедурными знаниями в виде цепей её прямых и обратных задач.

2.2 Информационная модель молекулярной спектроскопии.

2.2.1 Прямые задачи.'.

2.2.2 Обратные задачи.

2.3 Модель данных молекулярной спектроскопии. XML-схемы результатов решений прямых и обратных задач молекулярной спектроскопии.

2.3.1 Прямая задача определения физических характеристик изолированной молекулы.

2.3.2 Прямая задача определения параметров спектральной линии изолированной молекулы.

2.3.3 Прямая задача определения параметров контура спектральной линии.

2.3.4 Обратная задача приписывания квантовых чисел спектральным линиям.

2.3.5 Обратная задача определения коэффициентов Эйнштейна.

2.3.6 Обратная задача определения уровней энергии изолированной молекулы.

2.4 Выводы по главе.

Глава 3. База знаний по спектроскопии молекул воды.

3.1 Прикладная онтология спектроскопии молекулы воды.

3.2 Свойства и классы прикладной онтологии спектроскопии воды.

3.2.1 Классы.

3.2.2 Свойства.

3.3 Индивиды в прикладной онтологии по молекулярной спектроскопии воды.

3.3.1 Представление источника информации в форме индивида прикладной онтологии для задач по определению, уровней энергии.

3.3.2 Представление источника информации в форме индивида прикладной онтологии задач по определению переходов.

3.3.3 Представление источника информации в форме индивида прикладной онтологии задач определения параметров контура спектральных линий.

3.3.4 Представление информации о среднеквадратических отклонениях в форме индивида прикладной онтологии.

3.4 Применение прикладной онтологии по молекулярной спектроскопии воды.

3.4.1 Канонические источники информации и проблема достоверности

3.4.2 Организация поиска источников информации по запросам пользователя.

3.4.3 Размещение прикладной онтологии в сети Интернет.

3.5 Схемы метаданных прямых и обратных задач молекулярной спектроскопии.

3.5.1 Представление метаданных результатов решений задач по определению уровней энергии.

3.5.2 Представление метаданных результатов решений задач по определению переходов.

3.5.3 Представление метаданных результатов решений задач по определению параметров контура спектральных линий.

3.6 Выводы по главе.

Глава 4. Программное обеспечение "Мета+" для организации базы знаний.

4.1 Архитектура программного обеспечения "Мета+".

4.2 Алгоритмы организации базы знаний предметной области.

4.2.1 Алгоритм фиксации схем метаданных.

4.2.2 Алгоритм создания метаданных для решений задач.

4.2.3 Алгоритм формирования индивидов (АВох) прикладной онтологии

4.3 Проектирование программного обеспечения "Мета+".

4.3.1 Функциональность для разработчика.

4.3.2 Функциональность для пользователя.

4.4 Реализация программного обеспечения "Мета+".

4.5 Характеристики программного обеспечения "Мета+".

4.6 Выводы по главе.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Привезенцев, Алексей Иванович

Молекулярная спектроскопия является одним из широко используемых во многих прикладных исследованиях разделов физики. Предметом изучения молекулярной спектроскопии являются спектральные свойства молекул. Детальное изучение спектральных свойств молекул не закончено до сих пор. Связано это с тем обстоятельством, что в расчетах физических характеристик атмосферы используются сотни тысяч линий, каждая из которых описывается десятком параметров. Работа с такими массивами данных требует, с одной стороны, предметной систематизации данных, а с другой стороны, программных средств для их обработки. Систематизация спектральных данных проведена теоретиками несколько десятков лет назад.

Классификацией, сбором, хранением и распространением информационных ресурсов по молекулярной спектроскопии занимаются несколько групп, среди которых выделяются группы, поддерживающие банки данных HITRAN [36] и GEISA[25]. В России работы по созданию информационных ресурсов- в области молекулярной спектроскопии ведутся в Институте Оптики Атмосферы СО РАН с начала 80-х годов [95].

Стоит отметить, что задача классификации данных в предметной области относится к задачам спектроскопии, и её решение во многом определяет организацию сбора, хранения и распространения данных и знаний - действий, являющихся предметом изучения в информатике.

Процесс наполнения банков данных далек от завершения. За почти сорокалетнюю историю группа, поддерживающая HITRAN, несколько раз модифицировала как набор физических сущностей, так и формат документов и файлов, в котором хранятся данные. Современная техника измерения спектров позволяет получать данные с большей точностью и в тех диапазонах длин волн, в которых ранее измерения не проводились. Количество расчетных спектров растет еще более стремительно, например, за последние десять лет данные по молекуле воды выросли более чем в сто раз. Растет также число исследовательских групп. Все это указывает на необходимость сбора, хранения, обработки и распространения информации с использованием современных информационных технологий для коллективной работы с информацией, на базе информационных систем.

Качественный скачок в создании информационных систем (ИС) произошел с появлением персональных компьютеров в начале 90-х, когда появились системы, работающие на клиентском месте. Дальнейшее техническое развитие привело к появлению глобальной информационной системы Web [1]. Web-технологии позволили сделать значительный шаг в развитии информационно-вычислительных систем (ИВС) коллективного использования по молекулярной спектроскопии. В 1999 году появилась первая Web-информационная система «Спектроскопия атмосферных газов» (http://spectra.iao.ru) [90], опирающаяся на известные банки спектроскопических данных HITRAN и GEISA. В последние годы произошло переосмысление принципов создания ИВС, как в целом в информатике [15], так и, в частности, в молекулярной спектроскопии [122]. Это связано с инициативой World Wide Web Consortium (W3C) по преобразованию Web в Semantic Web [5], где декларируется представление информации, используемой компьютерами, для автоматизации, интеграции и повторной используемости приложениями [84]. В рамках этой инициативы ведутся активные работы по созданию инфраструктуры Semantic Web, создаются рекомендации [64, 68, 87], программное обеспечение, онтологические базы знаний. Использование этих рекомендаций является элементом технологий, актуальным для представления знаний в Интернете.

Активные исследования по представлению знаний в виде онтологии начались в начале 1990-х и продолжаются до сих пор. Среди большого количества работ можно выделить M.R. Genesereth [27], T.R. Gruber [32], N. Guarino [34], R. Mizogushi [48], J.F. Sowa [70], R. Studer [74]. Актуальные исследования онтологий в рамках Semantic Web [37, 46, 51, 52, 53, 68] представлены в работах I.A. Horrocks, D.L. McGuinness, P.F. Patel-Schneider.

Среди отечественных публикаций существует разнообразие подходов к представлению знаний в виде онтологий, и исследования в данной области активно ведутся [89, 97, 100, 101, 102, 116, 123, 124] И.Л. Артемьевой, Е.М. Бенеаминовым, В.И. Воробьевым, Б.В. Добровым, Т.А. Гавриловой, Н.Г. Загоруйко, Ю.А. Загорулько, JI.A. Калиниченко, А.С. Клещевым, Н.В. Лукашевич, Д.Е. Пальчуновым, А.Ф. Тузовским, В.Ф. Хорошевским. Большое количество публикаций в данной области указывает на решение разнообразных задач с помощью баз знаний, основанных на онтологиях (онтологических баз знаний).

Создание рекомендаций RDF и OWL в W3C заставило переосмыслить роль метаданных в информационных системах. Создатели рекомендаций построили базис для формирования инструментов и сервисов для разработчиков информационных систем с целью "проектирования и реализации высококачественных, значимых, корректных, минимально избыточных и хорошо аксиоматизированных онтологий" [55]. На базе этих онтологий должна быть решена следующая ключевая задача - создание машинно-обрабатываемых аннотаций для информационных ресурсов в Web.

При современном подходе к построению модели научной информационно-вычислительной системы (НИВС) используют её трёхслойную модель [15]. В число слоев входит:

- слой данных и вычислений;

- слой метаданных (информации);

- слой знаний.

Так, слой данных и вычислений ориентирован на непосредственное решение предметных задач, информационный слой ориентирован на описание данных предыдущего слоя и возможности обмена этой информацией между программами. Это означает, что такая информация должна быть формализована и машинно-обрабатываема. Эта задача в рамках подхода Semantic Web решается с помощью языков разметки XML [87] и RDF [65]. Слой знаний необходим для машинной интеграции и структурирования разнородных ресурсов из различных предметных областей с возможностью унифицированного доступа к ним в рамках информационной системы и последующей их логической машинной обработкой. Данный слой создается на основе онтологий, для описания которых W3C рекомендовало язык спецификации OWL [52].

Онтология задач, разработанная Лабораторией Прикладных Онтологий [45] и реализованная в KIF и OWL Full, является онтологией верхнего уровня, которую можно использовать при решении задач коллективного машинного использования знаний в рамках парадигмы Semantic Web. Стоит отметить работы [88, 89], которые представляют прикладные онтологии решения задач. В настоящее время развитый в них поход лежит вне рамок развития Semantic Web.

Ссылочная онтология по молекулярной спектроскопии воды представляет собой «domain-lightweight-reference» онтологию, то есть предметную ссылочную онтологию, которая основной акцент делает на составление предметной описательной картины, не изменяющейся во времени и являющейся основой для других онтологий. Тогда как онтология задач молекулярной спектроскопии воды представляет собой «domain-lightweight-application» онтологию, то есть предметную онтологию приложения, которая основной акцент делает на индивиды, динамически формирующиеся во время описания решаемых задач в информационной системе с определенными входными предметными данными. Первая упрощенная версия ссылочной онтологии по молекулярной спектроскопии воды была опубликована в [122].

Прикладные онтологии, связанные с приложениями, относящимися к нашей информационной системе, формализованы таким образом, чтобы с ними можно было работать в реальном масштабе времени (например, машинное отнесение фактов к классам осуществляется за небольшой промежуток времени). Они созданы, в частности, для решения задачи поиска источников данных, характеризующих решения конкретных задач молекулярной спектроскопии воды. По выделенной цели и выразительности такие онтологии, согласно классификации, называют прикладными онтологиями [49].

Такой подход тесно связан с трактовкой информационного ресурса в виде связанных между собой данных и метаданных. С появлением НИВС по молекулярной спектроскопии стала явной необходимость создания информационных ресурсов в виде структур, содержащих не только параметры спектральных линий, но и ряд других физических величин. Более того, потребовалось расширение набора метаданных, используемого в банках данных (например, HITRAN и GEISA). Стало очевидным, что для коллективной работы в ИБС необходимо предоставить пользователю возможность самостоятельного формирования структуры массивов спектральных данных и их наполнение конкретными значениями, проведения на их основе расчетов и сравнения с результатами экспериментов. Работа в этом направлении состояла, в первую очередь, в создании системы ввода данных произвольной структуры.

Наряду с работами, в которых информационные ресурсы представляются в виде связанных между собой данных и метаданных, в настоящее время ведутся активные работы по разработке и внедрению информационных систем, основанных на знаниях [101, 116, 124]. Существующие информационно-вычислительные системы по молекулярной спектроскопии [47, 90] содержат в себе только слой данных и вычислений. Качественно новый скачок в работе с информационными ресурсами в ИС предоставляет реализация информационного слоя и слоя знаний. Учёт этих слоев повышает эффективность и качество обработки спектральной информации. Отсутствие этих двух слоев, необходимых для перехода к автоматической машинной обработке информации и знаний, указывает на ограниченность развития существующих информационно-вычислительных систем.

Таким образом, задача создания слоя знаний для НИВС по молекулярной спектроскопии является актуальной. Решение задач в молекулярной спектроскопии логическими программными агентами позволит повысить эффективность работы ученых в своих специализированных предметных областях. Имеющиеся инструментальные средства для работы со знаниями, представленными в виде онтологий, позволяют уже сейчас проверять корректность отнесения понятий и делать логические выводы с помощью машин вывода.

Для предметной области молекулярной спектроскопии введение в модель ИС слоя метаданных и слоя знаний даёт возможность учёным проводить анализ решений задач и проверять согласованность своих неявных знаний с другими научными публикуемыми знаниями. Кроме этого, ученые, анализируя получаемое знание о результатах решения предметных задач, могут своевременно реагировать на важные сведения, например, о некорректных данных.

В рамках диссертационной работы рассматривается ИС, позволяющая собирать, хранить, распространять и представлять информацию и знания о трёхатомных молекулах типа ассиметрического волчка, относящихся к группам симметрии Сгу и Cs. К молекулам, которые может описывать созданная ИС, относятся: Н20, SCb, 03, H2S, НОС1, НОВг и их изотопомеры. Так как основное заполнение АВох в НИВС сделано для спектральных параметров молекулы воды, то для простоты именования спектроскопии молекул этих групп симметрии в нашей работе используется понятие спектроскопия молекул воды.

В работе анализируется состояние информационных систем в предметной области спектроскопии молекул и предлагается переход к трехслойной модели информационной системы, где важным является использование семантического описания ресурсов, используя онтологический подход, рекомендованный инициативой W3C по Semantic Web, для формирования слоя метаданных и слоя знаний.

В настоящее время в молекулярной спектроскопии в рамках НИВС отсутствуют машинно-обрабатываемые базы знаний.

На основе всего вышеперечисленного можно сделать вывод о том, что исследование подхода к организации онтологической базы знаний по молекулярной спектроскопии имеет научную и практическую актуальность.

Цель диссертационной работы: разработка и исследование подхода к построению в рамках научной информационно-вычислительной системы онтологических баз знаний для описания разнородных данных молекулярной спектроскопии, извлечённых из научных публикаций и проверяемых на достоверность.

Для достижения цели диссертационной работы решаются следующие задачи:

1. Создание информационных моделей для представления данных и знаний в области молекулярной спектроскопии.

2. Разработка структур данных для информации, извлеченной из научных публикаций по спектроскопии молекул, допускающих автоматическую проверку целостности данных и необходимых для обмена между интеллектуальными агентами.

3. Создание терминологической компоненты (ТВох) онтологической базы знаний для представления знаний в области молекулярной спектроскопии.

4. Разработка алгоритма формирования онтологического описания опубликованных данных с целью построения набора фактов в базе знаний по молекулярной спектроскопии, содержащих знания о их первоисточниках и достоверности.

5. Реализация программного обеспечения, созданного на основе разработанного алгоритма онтологического описания информационных ресурсов и практического использования этого описания в НИВС по спектроскопии молекул воды.

6. Реализация фактографической компоненты (АВох) онтологической базы знаний по описанию опубликованных данных спектроскопии молекул воды.

Объектом исследования являются структуры данных и модели представления знаний в информационных системах по молекулярной спектроскопии.

Предметом исследования являются подходы и алгоритмы создания баз знаний и систем управления ими в научных информационно-вычислительных системах по молекулярной спектроскопии.

Методы исследования. В ходе диссертационного исследования были использованы методы онтологического моделирования, теории множеств, дескриптивной логики, объектно-ориентированного проектирования и программирования.

Научная новизна диссертационной работы заключается в следующем:

1. Впервые построена семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением информационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач, позволившая решить задачу автоматической систематизации знаний о достоверности этих решений.

2. Впервые создан алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах, являющийся необходимым для машинной актуализации знаний о достоверности решений задач и применимый для всех спектральных молекул.

3. Впервые создана онтологическая база знаний спектроскопии молекул воды, в которой фактологическая компонента (АВох) содержит наиболее полную информацию о значениях параметров спектральных линий молекул воды, опубликованную в мире.

Теоретическая значимость исследования состоит в разработке онтологии спектроскопии молекул как основы для построения и проверки научных гипотез, разнообразных систематизаций знаний, интеграции', знаний ' различных предметных областей, что открывает перспективы для постановки и решения новых предметных задач, как в молекулярной спектроскопии, так и смежных с ней областях науки, таких как астрономия, атмосферная радиация, оптика атмосферы.

Практическая ценность диссертационной работы заключается:

1. В создании наиболее полной прикладной онтологии по опубликованным данным спектроскопии молекул воды.

2. В возможности использования открытых результатов семантического описания решений задач, оформленных по стандарту OWL DL, во внешних специализированных системах по работе с онтологиями, использующих машины вывода.

3. В разработке программного обеспечения в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, на основе предложенного алгоритма онтологического описания информационных ресурсов и применении этого программного обеспечения рядом ведущих исследовательских групп спектроскопистов в России (Санкт-Петербургский государственный университет, Институт прикладной физики РАН, Институт оптики атмосферы РАН).

Основные защищаемые положения:

1. Семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением информационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач.

2. Алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах.

3. Программное обеспечение в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, созданное на основе разработанного алгоритма онтологического описания информационных ресурсов и полученная с его использованием онтологическая база знаний спектроскопии молекул воды.

Апробация диссертационной работы. Все результаты работы докладывались и обсуждались на следующих научных конференциях:

- IX Рабочем совещании по электронным публикациям с участием иностранных ученых "El-Pub2004" - Академгородок, Новосибирск, 23-25 сентября 2004;

- V Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям с участием иностранных ученых — Академгородок, Новосибирск, 1-3 ноября 2004;

- Международной конференции по вычислительно-информационным технологиям для наук об окружающей среде «Cites-2005» — Академгородок, Новосибирск, 13-23 марта 2005;

- X Байкальской Всероссийской конференции "Информационные и математические технологии в науке, технике и образовании" — Северобайкальск, 12-19 июля 2005;

- 7-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005) -Ярославль, 4-6 октября 2005;

- International conference on environment observations, modeling and informational systems (ENVIROMIS-2006) - Tomsk, 1-8 June 2006;

- XVth Symposium on High Resolution Molecular Spectroscopy "HighRus-2006" -Nizhny Novgorod, 18-21 July 2006;

- Рабочем семинаре «Проблемы и решения задач в области наук о Земле в распределенной ИНТЕРНЕТ среде» - Москва, 13-15 февраля 2007;

- European Geosciences Union General Assembly 2007 - Vienna, 15-20 April

2007;

- International conference on Computational Information Technologies for Environmental Sciences «Cites-2007» - Томск, 14-25 июля 2007;

- Всероссийской конференции с международным участием «Знания -Онтологии - Теория» — Новосибирск, 14-16 сентября 2007;

- 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2007) -Переславль-Залесский, 15-18 октября 2007;

Всероссийской Научно-Практической конференции «Свободное программное обеспечение: разработка и внедрение» - Томск, 17-18 мая 2008;

- XIII Байкальской Всероссийской конференции "Информационные и математические технологии в науке, технике и образовании" - Иркутск, 7-16 июля 2008;

- International conference on environment observations, modeling and informational systems (ENVIROMIS-2008) - Tomsk, 28-5 July 2008;

- Всероссийской конференции с международным участием «Знания -Онтологии - Теория» - Новосибирск, 20-22 октября 2009;

По теме диссертационной работы опубликовано 17 научных работ:

- из них шестнадцать печатных [8, 9, 24, 93, 105, 106, 107, 109, 110, 112, 113, 117, 118, 119, 120, 121] и одна в электронном журнале [104];

- из них четырнадцать работ на русском языке [93, 104, 105, 106, 107, 109, 110, 112, 113, 117, 118, 119, 120, 121] и три на английском [8, 9, 24];

- из них две в журналах из перечня ВАК по управлению, вычислительной технике и информатике [93, 109], две в журналах из перечня ВАК по физике [107, 112], две в журналах [104, 110], одиннадцать в трудах и материалах конференций [8, 9, 24, 105, 106, 113, 117, 118, 119, 120, 121].

Внедрение результатов диссертационной работы, было осуществлено в трех основных исследовательских группах спектроскопистов в России:

- Институт оптики атмосферы СО РАН, где результаты доступны активно используется в рамках НИВС (http://saga.iao.ru);

- Институт прикладной физики РАН, где результаты доступны в рамках НИВС по адресу http://saga.atmos.appl.sci-nnov.ru;

- Санкт-Петербургский государственный университет, где результаты доступны в рамках НИВС по адресу http://saga.molsp.phys.spbu.ru.

Работа выполнена при поддержке грантов: Российского Фонда Фундаментальных Исследований (РФФИ) «Распределенная информационная система «Молекулярная спектроскопия»« (05-07-90196, А.Д. Быков, 2005-2007); РФФИ «Интернет доступная информационная система по молекулярной спектроскопии, основанная на знаниях» (08-07-00318-а, А.З. Фазлиев, 20082010); UIPAC task 2004-035-1-100 «А database of water transitions from experiment and theory».

Личный вклад автора.

Опубликованные работы написаны в соавторстве с экспертами предметной области спектроскопии молекулы воды и сотрудниками центра интегрированных информационных систем ИОА СО РАН. В совместных работах диссертант принимал участие в непосредственной разработке схем XML-данных, метаданных и их дальнейшем внедрении в модель НИВС, в разработке прикладной онтологии задач по спектроскопии молекул воды, во внедрении результатов работы. В разработке перечисленного программного обеспечения ему принадлежит определяющая роль.

Благодарности.

Автор выражает благодарность профессорам А.А. Мицелю и А.Ф. Тузовскому за внимание к работе, ценные замечания и помощь, способствующие окончательному варианту рукописи. Автор признателен с.н.с. А.З. Фазлиеву за ценные консультации, постановки задач и всестороннюю поддержку данной работы.

Автор благодарен чл.-корр. РАН |С.Д. Творогову а также благодарит д.ф.м. н. А.Д. Быкова и к.ф.-м.н. Б.А. Воронина за консультации и помощь при определении структуры данных в молекулярной спектроскопии воды; Н.А. Лаврентьева за реализацию программ для расчета коэффициентов поглощения газов; А.Ю. Ахлёстина за реализацию ядра НИВС; А.В. Козодоева за реализацию системы ввода данных; д.ф.-м.н. О.Б. Родимову за помощь в составлении типовых вопросов для задачи нахождения уровней энергии.

Структура и объём диссертационной работы. Диссертация состоит из перечня условных обозначений, введения, четырёх глав, заключения, списка использованных источников и шести приложений. Общий объем работы составляет 239 страниц. Список использованных источников насчитывает 128 наименований. Работа содержит 42 рисунка и 25 таблиц.

Заключение диссертация на тему "Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии"

4.6 Выводы по главе

1. Архитектура программного обеспечения "Мета+" имеет программное ядро, являющееся самостоятельным программным решением.

2. Программное обеспечение «Мета+» было интегрировано в НИВС «W@DIS» для организации в ней дайджеста метаданных и онтологической базы знаний.

3. Предложены алгоритмы для подготовки и формирования онтологических описаний в НИВС по молекулярной спектроскопии. Алгоритм фиксации схем метаданных предлагает подход к подбору схем метаданных для наиболее полного описания информационных ресурсов, расширяя понятие «метаданные» до понятия «аннотация». Алгоритм создания метаданных описывает поход к составлению метаданных для решений задач, используя анализ входных и выходных данных задач и способов их описания. Алгоритм формирования индивидов онтологии предназначен для преобразования информации в семантические метаданные, основанные на прикладной онтологии решений задачи.

4. Реализация программного обеспечения произведена с использованием современных подходов к созданию Web-ориентированных приложений, используя существующие прикладные интерфейсы (pOWL, RAP, jQuery).

5. Программное обеспечение «Мета+» позволяет:

- производить машинное вычисление значений метаданных источника информации о решении задачи;

- создавать индивиды, характеризующие источники информации, являющимися экземплярами расширения OWL-класса;

- использовать индивиды OWL-класса «источник информации» при работе пользователя (человек) с решениями предметных задач посредством просмотра, попарного сравнения физических величин (отклонение, среднеквадратичное отклонение) и атрибутного и семантического поиска;

- переводить внутреннее представление модели онтологии в XML-синтаксис для практической работы с ней редакторов онтологий и машин вывода.

ЗАКЛЮЧЕНИЕ

Диссертационная работа посвящена решению научно-технической задачи разработки структур данных, алгоритмов и программного обеспечения для онтологического описания ресурсов в НИВС по молекулярной спектроскопии воды. Разработанное программное обеспечение "Мета+", реализующее алгоритмы формирования онтологического описания, является современным и актуальным решением задачи создания трех уровней НИВС: уровня данных и вычислений, уровня метаданных и уровня знаний.

В работе определены подходы к научной информационно-вычислительной системе, учитывая актуальные задачи логической машинной обработки в сети Internet. Исследовано использование онтологий в информационных системах. Разработаны схемы данных решений задач для молекул симметрии СгУ и Cs с целью их автоматической проверки и обмена в распределенной НИВС.

Использование систематизированной цепи прямых и обратных задач в предметной области «W@DIS» позволяет разработать онтологию задач в этой предметной области. Результаты решения задач в молекулярной спектроскопии связываются с информационным источником, позволяя проводить анализ результатов. Кроме того, онтология задач предметной области «W@DIS», осуществляет интеграцию разнородных информационных ресурсов и позволяет осуществлять семантический поиск по ним.

Подходы к формированию онтологического уровня (ТВох) и уровня экземпляров (АЬох) в онтологии по молекулярной спектроскопии отличаются. Терминологический уровень (ТВох) формируется экспертным советом во время разработки онтологии, а уровень экземпляров (АЬох) создается во время работы НИВС. Это позволяет формировать постоянно пополняемые профессиональные знания в предметной области.

Предложены алгоритмы для подготовки и формирования онтологических описаний в НИВС по молекулярной спектроскопии воды. Разработанное программное обеспечение на основе этих алгоритмов позволяет: производить автоматическое аннотирование метаданными решения вычислительных задач и решений задач, загружаемых в НИВС, использовать индивиды OWL-класса решения задач для идентификации данных в информационных задачах: визуализации, манипуляции, сравнения и поиска.

Результаты диссертационной работы внедрены в основных спектроскопических группах России, находящихся в Институте Оптики Атмосферы СО РАН, в Институте прикладной физики РАН и в Санкт-Петербургском Государственном Университете. Планируется внедрить результаты работы на международном уровне в основных спектроскопических группах Европы.

Планируется дальнейшее развитие представляемой работы по следующим основным направлениям: создание онтологических моделей для смежных областей, использующих решения задач молекулярной спектроскопии;

- создание Web-сервисов и OWL-S онтологий для них;

- создание "интеллектуальных " агентов, выстраивающих потоки работ в решении комплексных задач, допускающих автоматизацию алгоритма их решения.

Библиография Привезенцев, Алексей Иванович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Alesso, Н. P. Thinking on the Web: Berners-Lee, Godel, and Turing / H. P. Alesso, C. F. Smith. Hoboken: John Wiley & Sons, 2006. - 261 pp.

2. Antoniou, G. A Semantic Web Primer / G. Antoniou, F. van Harmelen. -Cambridge: MIT Press, 2004. 238 pp.

3. Baader, F. Description Logics / F. Baader, I. Horroks, U. Satter // Handbook of knowledge representation / edited by F. van Harmelen, V. Lifschitz, B. Porter. Oxford: Elsevier Science, 2008. - pp. 135-180.

4. Barber, R. J. A high accuracy computed water line list BT2 / R.J. Barber, J. Tennyson, G.J. Harris, R.N. Tolchenov // Mon. Not. R. Astron. Soc. - 2006. - Vol. 368.-pp. 1087-1094.

5. Berners-Lee, T. The Semantic Web / T. Berners-Lee, J. Hendler, O. Lassila// Scientific American. -2001. 284. pp. 34-43.

6. Borst, W. N. Construction of engineering ontologies for knowledge sharing and reuse : CTIT Ph.D. Thesis Series No. 97-14, Universiteit Twente / W. N. Borst Enschede, 1997. - 243 pp.

7. Brachman, R. J. An Overview of the KL-ONE Knowledge Representation System / R. J. Brachman, J. Schmolze // Cognitive Science. 1985. - Vol. 9. - № 2. -pp. 171-216.

8. Bykov, A. D. Distributed information system on molecular spectroscopy / A. D. Bykov, A. Z. Fazliev, A. V. Kozodoev, A. I. Privezentsev, L. N. Sinitsa, M. V.

9. Tonkov, N. N. Filippov, M. Yu. Tretyakov // Proc. of SPIE, 15th Symposium on High-Resolution Molecular Spectroscopy -Vol. 6580. pp. 65800W. - 2006. - 12 pp.

10. Chandrasekaran, В. What are ontologies, and why do we need them? / B. Chandrasekaran, J. R. Josephson, V. R. Benjamins // IEEE Intelligent Systems. -1999.-Vol. 14. -№ l.-pp. 20-26.

11. Cycorp, Inc. Home Page Электрон, текстовые дан. - 2007. - Режим доступа: http://www.cyc.com/.

12. Daconta, М. С. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management / M. C. Daconta, L. J. Obrst, К. T. Smith. -Indianapolis: Wiley, 2003. 281 pp.

13. Davies, J. Semantic Web Technologies Trends and Research in Ontology-based Systems / J. Davies, R. Studer, P. Warren. Chichester: John Wiley & Sons, 2006.-312 pp.

14. Description Logic Complexity Navigator Электронный ресурс. / edited by E. Zolin. Электрон, текстовые дан. — 2007. — Режим доступа: http://www.cs.man.ac.uk/~ezolin/dl/. - The University of Manchester.

15. Description Logic Reasoners Overview Электронный ресурс. / edited by U. Sattler. Электрон, текстовые дан. - 2007. - Режим доступа: http://www.cs.man.ac.uk/~sattler/reasoners.html. - The University of Manchester.

16. Descriptive Ontology for Linguistic and Cognitive Engineering (DOLCE) Электронный ресурс. / Laboratory for Applied Ontology. Электрон, текстовые дан. - 2007. - Режим доступа: http://www.loa-cm-.it/DOLCE.html.

17. Devedzic, V. Semantic Web and education / V. Devedzic. New York: Springer, 2006. - 353 pp.

18. DL Implementation Group (DIG) Home Page Электронный ресурс. / University of Manchester. Электрон, текстовые дан. - 2007. - Режим доступа: http://dl.ki-.org/dig/.

19. Dublin Core Metadata Initiative (DCMT) Home Page Электронный ресурс. / Dublin Core Metadata Initiative. Электрон, текстовые дан. — 1995 - . -Режим доступа: http://www.dublincore.org/.

20. FaCT++ Home Page Электронный ресурс. / University of Manchester. -Электрон. текстовые дан. 2007. - Режим доступа: http://owl.man.ac.uk/factplusplus/.

21. Genesereth, M. R. Logical Foundation of Artificial Intelligence / M. R. Genesereth, N. J. Nilsson. San Francisco: Morgan Kaufmann, 1987. - 405 pp.

22. Gomez-Perez, A. Ontological engineering with examples from the areas of knowledge management, e-Commerce and the Semantic Web / A. Gomez-Perez, M. Fernandez-Lopez, O. Corcho. London: Springer-Verlag, 2004. - 403 pp.

23. Goodman, D. JavaScript Bible / D. Goodman, M. Morrison. -Indianapolis: Wiley, 2004. 1236 pp.

24. Gregor, Sh. The struggle towards an understanding of theory in information systems / Sh. Gregor // Information systems foundations: constructing and criticising / edited by D. Hart, Sh. Gregor. Canberra: ANU E Press, 2005. - pp. 311.

25. Gruber, T. R. A Translation Approach to Portable Ontology Specifications / T. R. Gruber // Knowledge Acquisition. 1993. - Vol. 5. - № 2. - pp. 199-220.

26. Gruber, T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing / T. R. Gruber // Human-Computer Studies. 1993. - № 43. - pp. 907-928.

27. Guarino, N. Formal Ontology in Information Systems / N. Guarino // Proceedings of Conference on Formal Ontology in Information Systems (FOIS'98) — Trento, 6-8 June 1998. Amsterdam: IOS Press, 1998. - pp. 3-15.

28. Guarino, N. Ontologies and Knowledge Bases: Towards a Terminological Clarification / N. Guarino, P. Giaretta // Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing / edited by N. Mars. Amsterdam: IOS Press, 1995.-pp. 25-32.

29. Harold, E. R. XML 1.1 Bible / E. R. Harold. Indianapolis: Wiley, 2004. - 1022 pp.

30. HITRAN Home Page Электронный ресурс. / Harvard-Smithsonian Center for Astrophysics. Электрон, текстовые дан. - 2007. - Режим доступа: http://cfa-www.harvard.edu/hitran/.

31. Information systems: the state of the field / edited by J. L. King, K. Lyytinen. Chichester: John Wiley & Sons, 2006. - 362 pp.

32. Lenat, D. В. Building Large Knowledge-based Systems: Representation and Inference in the Cyc Project / D. B. Lenat, R. V. Guha. Boston: Addison-Wesley, 1989.-372 pp.

33. Leuf, B. The Semantic Web: crafting infrastructure for agency / B. Leuf. — Chichester: John Wiley & Sons, 2006. 358 pp.

34. Luke, S. Web Agents that Work / S. Luke, J. Hendler // IEEE MultiMedia. 1997. - Vol. 4. - № 3. - pp. 76-80.

35. MacGregor, R. Inside the LOOM clasifier / R. MacGregor // ACM SIGART Bulletin. 1991. - Vol. 2. - № 3. - pp. 88-92.

36. McGuinness, D. L. Ontologies come of age / D. L. McGuinness // Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential / edited by D. Fensel, J. Hendler, H. Liebemian, W. Wahlster. Boston: MIT Press, 2002.-pp. 171-194.

37. Mikhailenko, S. M. The DataBank of Ozone Spectroscopy on WEB (S&MPO) / S. M. Mikhailenko, B. L. Babikov, V. G. Tyuterev, A. Barbe // Computational Technologies. 2002. - Vol. 7. - pp. 64-70.

38. Oberle, D. Semantic management of middleware / D. Oberle. Berlin: Springer, 2006. - 268 pp.

39. Ontologies for software engineering and software technology / edited by C. Calero, F. Ruiz, M. Piattini. Berlin: Springer-Verlag, 2006. - 339 pp.

40. OWL 1.1. Web Ontology Language Overview Электронный ресурс. / edited by P. F. Patel-Schneider, I. Horrocks. — Электрон, текстовые дан. — 2006. -Режим доступа: http://www.w3.org/Submission/owlll-overview/. W3C Recommendation.

41. OWL Web Ontology Language Overview Электронный ресурс. / edited by D. L. McGuinness, F. van Harmelen. Электрон, текстовые дан. - 2004. -Режим доступа: http://www.w3.org/TR/owl-features/. - W3C Recommendation.

42. OWL Web Ontology Language Semantics and Abstract Syntax Электронный ресурс. / edited by P. F. Patel-Schneider, I. Horrocks. Электрон, текстовые дан. - 2004. - Режим доступа: http:/Avww.w3.org/TR/owl-semantics/. -W3C Recommendation.

43. Partridge, H. The determination of an accurate isotope dependent potential energy surface for water from extensive ab initio calculations / H. Partridge, D. W. Schwenke // Journal of Chemical Physics. 1997. - Vol. 106. - №. 11. pp. 46184639.

44. Passin, Т. B. Explorer's Guide to the Semantic Web / Т. B. Passin. -Greenwich: Manning, 2004. 281 pp.

45. Pellet: The Open Source OWL DL Reasoner Home Page Электронный ресурс. / Clark & Parsia. Электрон, текстовые дан. - 2006-2007. - Режим доступа: http://pellet.owldl.com/.

46. Polyansky, О. L. A High-Accuracy ab Initio Rotation-Vibration Transitions for Water / O. L. Polyansky, A. G. Csaszar, S. V. Shirin, N. F. Zobov, P. В arietta, J. Tennyson, D. W. Schwenke, P. J. Knowles // Science. 2003. - Vol. 299. -№5606.-pp. 539-542.

47. Pn^ge Ontology Editor and Knowledge Acquisition System Home Page Электронный ресурс. / Stanford Medical Informatics. — Электрон, текстовые дан.- 2007. Режим доступа: http://protege.stanford.edu/.

48. Racer Pro Home Page Электронный ресурс. / Racer Systems GmbH & Co. KG. Электрон, текстовые дан. - 2007. — Режим доступа: http.V/www.racer-systems.com/.

49. RAP RDF API for PHP Home Page Электронный ресурс. / Freie Universitat Berlin. — Электрон, текстовые дан. — 2007. — Режим доступа: http://sites.wiwiss.fu-berlin.de/suhl/bizer/rdfapi/.

50. RDF Vocabulary Description Language 1.0: RDF Schema Электронный ресурс. / edited by D. Brickley, R. V. Guha. — Электрон, текстовые дан. 2004. — Режим доступа: http://www.w3.org/TR/rdf-schema/. - W3C Recommendation.

51. Resource Description Framework (RDF) Model and Syntax Specification Электронный ресурс. / edited by O. Lassila, R. R. Swick. — Электрон, текстовые дан. 1999. - Режим доступа: http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/. - W3C Recommendation.

52. Resource Description Framework (RDF): Concepts and Abstract Syntax Электронный ресурс. / edited by G. Klyne, J. Carroll. — Электрон, текстовые дан.- 2004. Режим доступа: http://www.w3.org/TR/rdf-concepts/. - W3C Recommendation.

53. Rodriguez, М. A. Using RDF to Model the Structure and Process of Systems / M.A. Rodriguez, J.H. Watkins, J. Bollen, C.O. Gershenson // International Conference on Complex Systems — Boston, October 2007. LA-UR-07-5720. - 8 pp.

54. Rothman, L. S. The HITRAN 2004 molecular spectroscopic database / Rothman L.S., Jacquemart D., Barbe A., Benner D. Chris, Birk M., Brown L.R.,

55. Semantic Web Activity Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. — 2001 — . — Режим доступа: http ://www. w3. org/2001 / sw/.

56. Semantic Web and Peer-to-Peer: Decentralized Management and Exchange of Knowledge and Information / edited by S. Staab, H. Stuckenschmidt. -Berlin: Springer-Verlag, 2006. 318 pp.

57. Sowa, J. F. Knowledge representation: logical, philosophical and computational foundations / J. F. Sowa. Pacific Grove, CA: Brooks Cole, 2000. -594 pp.

58. SPARQL Query Language for RDF Электронный ресурс. / edited by E. Prud'hommeaux, A. Seaborne. Электрон, текстовые дан. — 2007. — Режим доступа: http://www.w3.org/TR/rdf-sparql-query/. - W3C Candidate Recommendation.

59. Standard Upper Ontology Working Group (SUO WG) Home Page -Электрон, текстовые дан. — 2007. — Режим доступа: http://suo.ieee.org/.

60. Stuckenschmidt, Н. Information Sharing on the Semantic Web / H. Stuckenschmidt, F. van Harmelen. Berlin: Springer, 2005. - 276 pp.

61. Studer, R. Knowledge Engineering: Principles and Methods / R. Studer, R. Benjamins, D. Fensel // Data and Knowledge Engineering. — 1998. — Vol. 25. — №. 1-2.-pp. 161-197.

62. Su, X. Using a Semiotic Framework for a Comparative Study of Ontology Languages and Tools / X. Su, L. Ilebrekke // Information modeling methods andmethodologies / edited by J. Krogstie, T. Halpin, K. Siau. — Hershey: Idea Group, 2005.-pp. 278-299.

63. Suehring, S. MySQL Bible / S. Suehring. New York: Wiley, 2002. - 686pp.

64. Suggested Upper Merged IEEE Systems GmbH & Co. KG. Электрон, текстовые дан. - 2007. — Режим доступа: http://www.ontologyportal.org/.

65. The description logic handbook: theory, implementation, and applications / edited by F. Baader, D. L. McGuinness, D. Nardi, P. F. Patel-Schneider. Cambridge: Cambridge University Press, 2003. - 505 pp.

66. Tennyson, J. IUPAC Critical Evaluation of the Rotational-Vibrational17

67. Transformation of knowledge, information and data: theory and applications / edited by P. van Bommel. — London: Idea Group, 2005. 318 pp.

68. Van Welie, M. An Ontology for Task World Models / M. van Welie, G. C. van der Veer, A. Eliens // 5th International Eurographics Workshop on Design Specification and Verification of Interactive Systems Abingdon, 3-5 june 1998. -14pp.

69. Walton, C. Agency and the Semantic Web / C. Walton. New York: Oxford University Press, 2007. - 249 pp.

70. Web semantics and ontology / edited by D. Taniar, J. W. Rahayu. -London: Idea Group, 2006. 404 pp.

71. World Wide Web Consortium (W3C) Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. - 1994 - . - Режим доступа: http://www.w3.org/.

72. XML Activity Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. — 1996 — . - Режим доступа: http://www.w3. org/XML/.

73. Артемьева, И. JI. Концепция оболочки для разработки решателей задач на основе моделей онтологий / И. JI. Артемьева, Д. А. Крылов // Искусственный интеллект. — 2005. — № 3. С. 109-116.

74. Артемьева, И. JI. Спецификации задач в терминах онтологии химии и методы их решения / И. JI. Артемьева, Н. В. Рештаненко. Владивосток: ИАПУ ДВО РАН, 2006.-36 с.

75. Бек, К. Экстремальное программирование: разработка через тестирование / К. Бек. — СПб.: Питер, 2003. 224 с.

76. Быков, А. Д. Структурирование ресурсов информационной системы по молекулярной спектроскопии / А. Д. Быков, А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Вычислительные технологии. — 2007. Т. 12. - С. 10-18.

77. Васильев, И. А. Методы и инструментальные средства построения семантических Web-порталов: дис. . канд. техн. наук: 05.13.11: защищена 14.12.2005 / И. А. Васильев Томск, 2005.- 190 с.

78. Войцеховская, О. К. Информационная система по спектроскопии высокого разрешения / О. К. Войцеховская, А. В. Розина, Н. Н. Трифонова. -Новосибирск: Наука, 1988. 150 с.

79. Гаврилова, Т. А. Базы знаний логических систем / Т. А. Гаврилова, В. Ф. Хорошевский. СПб.: Питер, 2000. - 384 с.

80. Гранд, М. Шаблоны проектирования в Java / М. Гранд. М.: Новое знание, 2004. - 559 с.

81. Гутмане, Э. РНР 5. Профессиональное программирование / Э. Гутмане, С. Баккен, Д. Ретанс. СПб.: Символ-Плюс, 2006. — 704 с.

82. ЮО.Добров, Б. В. Онтологии и тезаурусы: модели, инструменты, приложения : учеб. пособие / Б. В. Добров, В. В. Иванов, Н. В. Лукашевич, В. Д. Соловьев. — М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2008. 172 с.

83. Клещёв, А. С. Математические модели онтологий предметных областей. Часть 1. Существующие подходы к определению понятия "онтология" / А. С. Клещёв, И. JI. Артемьева // Научно-техническая информация. 2001. — Серия 2. - № 2. - С. 20-27.

84. ЮЗ.Когаловский, М. Р. Перспективные технологии информационных систем / М. Р. Когаловский. М.: ДМК Пресс; М.: Компания АйТи, 2003. -288 с.

85. Козодоев, А. В. Информационная система для решения задач молекулярной спектроскопии. 3. Уровни энергии молекул / А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. — 2007. — Т. 20. — №9.-С. 805-809.

86. Козодоев, А. В. Информационная система для решения задач молекулярной спектроскопии. 2. Операции преобразования наборов параметров спектральных линий / А. В. Козодоев, А. 3. Фазлиев // Оптика атмосферы и океана.-2005.-Т. 18.-№9.-С. 760-764.

87. Конноли, Т. Базы данных: проектирование, реализация и сопровождение. Теория и практика / Т. Конноли, К. Бегг, А. Страчан. — М.: Вильяме, 2000.-1120 с.

88. Лаврентьев, Н. А. Информационная система для решения задач молекулярной спектроскопии. 4. Переходы в молекулах симметрии C2v и Cs / Н. А. Лаврентьев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. 2008. - Т. 21. - № 11. - С. 957-962.

89. Пальчунов, Д. Е. Виртуальный каталог / Д. Е. Пальчунов, Е. С. Сидорова // Труды Всероссийской конференции с международным участием «Знания Онтологии - Теория» — Новосибирск, 14-16 сентября 2007. - Т. 1. — Новосибирск: Омега Принт, 2007. — С. 166-175.

90. Труды симпозиума «Онтологическое моделирование Звенигород, 19-20 мая 2008. - Москва: ИЛИ СО РАН; под ред. Калиниченко Л. А. - 2008. -303 с.

91. Тузовский, А. Ф. Онтолого-семантические модели в корпоративных системах управления знаниями: дис. . докт. техн. наук: 05.13.01: защищена 10.10.2007 / А. Ф. Тузовский Томск, 2007. - 376 с.

92. Фаулер, М. UML. Основы / М. Фаулер, К. Скотт. СПб.: Символ-Плюс, 2002.- 192 с.

93. Фаулер, М. Рефакторинг: улучшение существующего кода / М. Фаулер. СПб.: Символ-Плюс, 2003. - 432 с.