автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей
Автореферат диссертации по теме "Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей"
На правах рукописи
Зуенко Александр Анатольевич
СЕМАНТИЧЕСКИЙ ИНТЕРФЕЙС РЕЛЯЦИОННЫХ БАЗ ДАННЫХ В СИСТЕМАХ МОДЕЛИРОВАНИЯ ДЛЯ СЛАБО ФОРМАЛИЗОВАННЫХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ
Специальность:
05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук
СЕН
Санкт-Петербург 2009
003477759
Работа выполнена в Учреждении Российской академии наук Институте информатики и математического моделирования технологических процессов Кольского научного центра РАН
Научный руководитель:
доктор технических наук, профессор
Фридман Александр Яковлевич
Официальные оппоненты:
доктор технических наук, профессор
Охтилев Михаил Юрьевич
кандидат технических наук, доцент
Бржезовский Александр Викторович
Ведущая организация:
Институт автоматики и процессов управления ДВО РАН.
Защита состоится « 15 » октября 2009 г. в 11:00 часов на заседании диссертационного совета Д002.199.01 Санкт-Петербургского института информатики и автоматизации РАН по адресу: 199178, Санкт-Петербург, 14-я линия, д. 39
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского института информатики и автоматизации РАН
Автореферат разослан «14» сентября 2009 г.
Учёный секретарь диссертационного совета
Ронжин Андрей Леонидович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы диссертации
Современные системы моделирования, как правило, предоставляют возможности исследования слабо формализованных предметных областей, для которых не существует аналитических моделей. Такие системы позволяют не только настраивать отдельные параметры модели, но и оперативно менять ее структуру, добавляя/удаляя элементы по мере накопления знаний о предметной области. В связи с постоянным усложнением модели возникает необходимость использования новых программных модулей, реализующих более совершенные алгоритмы расчетов. Таким образом, программный комплекс, поддерживающий проведение моделирования, должен проектироваться открытым как для оперативных модификаций структуры модели, так и для включения новых элементов из вычислительной среды. Сам процесс построения модели происходит поэтапно. Вначале проектируется "скелет" модели, позволяющий решать небольшую часть задач. В дальнейшем эта приближенная модель уточняется путем дополнения новыми деталями и выбора тех алгоритмов из общего набора, которые необходимы и достаточны для конкретного варианта расчетов.
Ввиду открытости модели возникает необходимость реализовыватъ незапланированные запросы к базе данных системы моделирования, так как невозможно заранее предугадать информационные потребности подключаемых программных модулей. Целесообразно автоматически осуществлять проверку самой модели и запросов к ней, чтобы своевременно выявлять некорректные конструкции, например, ошибки при редактировании модели или подключении модулей, и, тем самым, гарантировать точность результатов запросов и корректность процесса моделирования.
Тем не менее, в большинстве систем моделирования обеспечение корректности модели остается задачей конечного пользователя. На общем фоне выгодно отличаются системы концептуального моделирования, автоматизирующие проверки структуры модели, но и в них отсутствуют средства анализа незапланированных запросов. Кроме того, в существующих системах моделирования рассматриваются только ограничения, очерчивающие допустимые модели, и не учитываются ограничения, специфичные для конкретной предметной области. Причина перечисленных недостатков, по мнению автора, состоит в том, что ограничения на модель "жестко зашиты" в специализированных процедурах проверки и не могут быть ни модифицированы в процессе эксплуатации системы моделирования, ни использованы в других целях, в частности, при анализе запросов.
Многие недостатки существующих систем моделирования можно преодолеть путем создания семантического интерфейса, существенно дополняющего стандартные функции СУБД средствами анализа незапланированных запросов и контроля корректности модели на уровне БД. Предлагается уточнять запрос до стадии его исполнения, основываясь на упомянутых ограничениях и пользовательских правилах оптимизации запроса. Это составляет главное отличие предлагаемого подхода от методов семантической обработки данных, типичных для документальных поисковых систем Semantic Web, где пространство поиска, наоборот, расширяется посредством логического вывода, что вызывает необходимость участия пользователя в окончательном выборе интересующей его информации.
Потребность оперативно изменять модель предметной области обусловливает применение реляционных СУБД при организации семантического интерфейса, поскольку они обеспечивают корректность модификаций данных за счет механизма ссылочной целостности. Однако на данные моделирования целесообразно накладывать ограничения, отличные от ограничений целостности реляционных СУБД, в которых семантическая составляющая развита слабо. Такие ограничения часто можно представить в виде логических формул. "Расширенные" или семантические модели (например, ER, RM/T), которые используют в качестве базовой реляционную модель, также не позволяют работать со структурами, типичными для баз знаний (логические формулы, продукции). В диссертационной работе предлагается использовать семантические модели данных для декларативного представления концептуальной схемы реляционной БД, что облегчает ее проектирование и автоматическую генерацию. Такое представление БД позволяет естественным образом накладывать ограничения на сложно
структурированные данные. Дополнив семантическую модель подобными ограничениями, а также пользовательскими правилами оптимизации запроса, необходимо разработать формальную основу для программно-алгоритмической реализации процедур анализа БД и незапланированных запросов.
Изложенное обосновывает следующую формулировку цели выполненных автором исследований и разработок.
Цель работы состоит в совершенствовании процессов построения, развития и использования инструментов контроля корректности модели и незапланированных запросов при исследовании слабо формализованных предметных областей путем разработки математического и программно-алгоритмического обеспечения процедур семантической обработки информации в реляционных базах данных систем моделирования.
Для достижения этой цели решены перечисленные ниже Задачи исследования
1. Анализ существующих средств хранения и семантической обработки данных в современных информационных системах.
2. Разработка декларативного способа представления схемы БД, ограничений на данные моделирования, а также пользовательских правил оптимизации запросов в виде специализированной базы знаний.
3. Разработка процедуры автоматической синхронизации открытой модели предметной области и базы данных системы моделирования с возможностью дополнительного контроля модели на уровне БД.
4. Создание метода анализа незапланированных запросов к семантизированной базе данных, гарантирующего соответствие их результатов пользовательским ограничениям на данные моделирования.
5. Автоматизация процедур семантического анализа незапланированных запросов.
6. Программно-алгоритмическая реализация семантического интерфейса реляционных баз данных для систем моделирования слабо формализованных предметных областей.
Методы исследования
Для решения поставленных в работе задач используются методы искусственного интеллекта, концептуального моделирования, элементы теории множеств, теории графов, математической логики. Положения, выносимые на защиту
1. Модель базы знаний, содержащая семантическую модель данных, ограничения на данные, правила оптимизации запросов.
2. Контекстно-ориентированный подход к отбору ограничений, актуальных для исследуемой модели предметной области.
3. Метод семантических преобразований и анализа незапланированных путевых запросов на основе контекстов, а также средства автоматизации процедуры анализа запросов с помощью разработанной алгебры условных кортежей.
4. Практическая реализация семантического интерфейса баз данных для систем моделирования слабо формализованных предметных областей.
Научная новизна
1. Разработана модель базы знаний, специализированная для анализа незапланированных запросов. Она отличается от "расширенных" моделей данных (ER, RM/T) тем, что позволяет задавать правила семантической оптимизации и учитывать, помимо ограничений ссылочной целостности, дополнительные ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов.
2. Предложен контекстно-ориентированный подход к управлению знаниями, отличающийся применением контекста для отбора только тех ограничений, которые актуальны для исследуемой в текущий момент модели предметной области. Это позволяет декларативно описывать и оперативно анализировать как ограничения, общие для всего класса допустимых моделей, так и специфичные для конкретной предметной области.
3. Предложен метод семантических преобразований и анализа незапланированных запросов на основе контекстов, отличающийся от методов поиска Semantic Web тем, что
область поиска сужается с учетом ограничений на данные моделирования. Это позволяет выявлять некорректность запроса до стадии его исполнения и гарантировать соответствие результатов запроса указанным ограничениям. Метод дает возможность выявлять ошибки в работе системы моделирования, возникающие в результате подключения новых программных модулей.
4. Разработана алгебра условных кортежей, которая, в отличие от реляционной алгебры и алгебры кортежей, позволяет использовать в качестве значений атрибутов отношений не только константы и одноместные предикаты, но и двуместные предикаты, и, соответственно, расширить возможности автоматизации логического анализа данных.
Научная новизна работы подтверждена включением ее результатов в исследования по Программе фундаментальных научных исследований Отделения нанотехнологий и информационных технологий РАН (проект 2.3) и Программе № 3 Президиума РАН (проект № 4.3 "Интеллектуальные базы данных"). Обоснованность и достоверность
Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечивается за счет тщательного анализа состояния исследований в данной области, подтверждается корректностью предложенных решений, а также всесторонней апробацией основных теоретических положений диссертации в печатных трудах и докладах на Всероссийских научных конференциях, положительными результатами практического использования разработанной системы в различных отечественных организациях. Практическая ценность работы
На этапе проектирования системы моделирования предложенные программные средства способствуют ускорению разработки инструментов контроля корректности. С использованием предложенной модели базы знаний представление ограничений на модель предметной области становится декларативным и появляется возможность применять их не только для анализа самой модели, но и при проверке незапланированных запросов. Модификация контекстно-ориентированного подхода для управления знаниями в системах моделирования даст возможность учитывать и оперативно анализировать как ограничения, общие для всех допустимых моделей, так и ограничения, специфичные для конкретной предметной области.
В процессе эксплуатации системы моделирования разработанные методы и алгоритмы позволяют организовать автоматическую проверку модели предметной области на уровне ее структуры и выявлять некорректности при обращении к данным со стороны подключаемых программных модулей. Разработанный метод семантического анализа незапланированных запросов на основе контекстов позволяет исключить некорректные обращения к реляционной СУБД.
Использование семантического интерфейса способствует уменьшению трудозатрат на модификацию и ввод ограничений в систему моделирования. Реализация результатов работы
Результаты проведенных исследований применены в следующих разработках:
1. Система моделирования региональной энергетики, созданная в рамках хоздоговоров с ЦЭС ОАО "Колэнерго".
2. Информационная система моделирования и прогнозирования безопасности на опасном объекте (хвостохранилище) АНОФ-2, созданная при выполнении хоздоговора с ОАО "Апатит".
3. Система баз данных, способствующая оперативной диагностике состояния горного массива рудника "Карнасурт" и разработанная в рамках хоздоговора с Горным институтом КНЦ РАН.
4. Учебные курсы "Представление знаний в информационных системах", "Теория принятия решений" в Кольском филиале Петрозаводского государственного университета.
В основу диссертационной работы положены результаты, полученные автором в ходе ■исследований по планам научно-исследовательских работ Института информатики и математического моделирования Кольского научного центра РАН в период 2006-2009 гг.: "Ситуационный синтез стратегий устойчивого развития региональных промышленных комплексов с учетом техногеино-природных рисков", гос.рег. N2 01.20.06 03210, "Модели и
методы координации решений по управлению региональным промышленно-природным комплексом" гос.рег. № 01.2.00 951211. Апробация работы
Основные результаты и положения диссертационной работы докладывались и обсухздались на пятой и седьмой Всероссийской школе-семинаре "Прикладные проблемы управления макросистемами" (Апатиты, 2004 г. и 2008 г.), второй и третьей Всероссийской научной конференции "Теория и практика системной динамики" (Апатиты, 2007 г. и 2009 г.), одиннадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2008 (Дубна, 2008 г.), четвертой школе молодых ученых "Сбалансированное природопользование" (Апатиты, 2007 г.), девятнадцатой конференции молодых ученых, посвященной памяти члена-корреспондента, профессора К.О. Кратца "Геология и геоэкология: исследования молодых" (Апатиты, 2008 г.). Публикация
По теме диссертации опубликовано 14 печатных работ (из них 4 - в списке ВАК). Структура и объём работы
Диссертация состоит из введения, четырех глав, заключения, списка литературы (123 наименования). Общий объем - 159 печатных страниц, в том числе 15 рисунков, 11 таблиц и 1 приложение.
СОДЕРЖАНИЕ РАБОТЫ
Во введении описывается современное состояние принятой к рассмотрению проблемы и актуальность темы диссертации, сформулированы цель и основные задачи исследования. Излагаются краткое содержание и основные результаты диссертационной работы, а также приводятся данные о внедрении и апробации результатов.
В первой главе анализируются особенности современных систем и методов обработки информации, которые могут найти применение в исследуемой проблематике, и необходимые направления их развития, а также приводится обзор существующих систем моделирования на основе концептуального подхода и возможностей этих систем при работе с данными моделирования.
В связи с постоянно растущим объемом информации ее семантическая обработка в настоящее время является актуальной проблемой как в документальных (ЧТО-системы в терминологии Д.А. Поспелова), так и в фактографических (КАКОЙ-системы по Д.А. Поспелову) информационных системах. Для ее решения в документальных системах используется поиск информации по заранее сформированным базам данных, включающим миллионы страниц тематически отобранных материалов. Для преодоления своего основного недостатка - низкой релевантности поиска (высокого уровня шума) - современные поисковые машины в рамках направления Semantic Web используют интеллектуальные интерфейсы пользователя, основанные на формализованном представлении знаний о предметной области (онтологии предметных областей на основе стандарта OWL). При семантической обработке в пользовательском запросе выделяются понятия онтологии некоторой предметной области, затем они расширяются посредством логического вывода, формируя релевантное окружение терминологии запроса, на основании которого система и осуществляет поиск документов. Основной проблемой описанной процедуры логического вывода является прекращение движения по связям онтологии. Решить задачу обеспечения точности ответов на запросы в документальных системах не удается, и окончательный выбор интересующей информации лежит на пользователе. Во многом это обусловлено использованием в запросах естественных языков, а также трудностью выделения в тексте неструктурированных документов экземпляров классов (понятий, концептов) онтологии.
Методы поиска информации, на которых базируется Semantic Web, непосредственно не применимы в фактографических системах, поскольку здесь необходимо гарантировать точность результатов запросов. Для хранения данных в фактографических системах, как правило, применяются "классические" реляционные СУБД, к достоинствам которых относятся, прежде всего, поддержка корректных модификаций данных за счет механизма ссылочной целостности и возможность выполнения незапланированных (ad hoc) запросов. Однако семантическая
составляющая реляционных СУБД развита слабо, что привело к появлению семантического моделирования и созданию объектно-ориентированных систем. Применение объектного подхода для организации хранения данных (объектные, объектно-реляционные, постреляционные СУБД) является предметом критики, поскольку негативно влияет на возможность выполнения незапланированных запросив, а в некоторых системах и на поддержку целостности информации.
Исследования в области семантического моделирования были вызваны необходимостью создания системного подхода к решению проблемы проектирования баз данных. Для представления семантики данных разработаны различные "расширенные" модели данных, которые включают как неформальные семантические понятия, так и формальную модель для их интерпретации.
Наиболее популярны расширенные модели ЕЯ и ИМ/Т. ЕЯ-модель, по сути, представляет собой неформальное дополнение реляционной модели и получила широкое распространение за счет использования диаграммной техники. С помощью диаграмм можно декларативно задавать ограничения ссылочной целостности. Механизм реализации расширений в КМ/Т, напротив, низкоуровневый: вводятся формальные объекты (например, графовые отношения), правила целостности и операторы. Это делает модель более мощной и гибкой, но вместе с тем более сложной и ориентированной, в первую очередь, на программистов, а не на пользователей.
Применение расширенных моделей при организации доступа к базам данных позволяет формулировать запрос с использованием семантики данных, повышая их уровень абстракции. Однако расширенные модели не ориентированы на семантический анализ запросов. Они не обладают развитыми средствами для описания семантических преобразований запроса, а также для задания ограничений, отличных от правил целостности.
Описанные недостатки реляционных СУБД и их расширений существенны при моделировании слабо формализованных предметных областей. В рассматриваемых системах моделирования, где данные имеют сложную иерархическую структуру, целесообразно проверять корректность как самой модели, так и незапланированных запросов к ней с точки зрения широкого спектра ограничений, которые обычно можно представить в виде логических формул над элементарными одно- и двуместными предикатами без кванторов. Инструменты анализа корректности во многих системах моделирования либо отсутствуют, либо производят проверку лишь самой модели и не содержат средств семантической обработки данных БД (например, в системах на основе концептуального подхода).
Системы концептуального моделирования разработаны для проектирования программных комплексов и расширены для исследования природно-технических комплексов. Несмотря на то, что существующие процедуры проверки корректности модели (полнота, связность и т.п.) позволяют накладывать разнообразные ограничения на элементы концептуальной модели предметной области и отношения между ними, подобные ограничения не учитываются при решении задач, отличных от анализа корректности модели, в частности, для обеспечения точности запросов, адресованных БД.
На основе вышеизложенного, к семантическому интерфейсу БД, предназначенному для преодоления перечисленных недостатков систем моделирования слабо формализованных предметных областей, предъявляются следующие требования:
1. Возможность декларативно представлять схему БД, чтобы гибко настраиваться на ограничения модели предметной области.
2. Возможность оперативно анализировать ограничения, актуальные для исследуемой модели.
3. Поддержка на уровне БД корректных модификаций редактируемой модели предметной области в процессе ее эксплуатации.
4. Поддержка незапланированных запросов к БД и обеспечение их соответствия пользовательским ограничениям.
Для удовлетворения перечисленных требований принято решение разработать семантический интерфейс в виде надстройки над реляционными СУБД, дополнив расширенные
модели данных средствами для работы с логическими формулами и пользовательскими правилами оптимизации запросов.
Во второй главе представлена модель базы знаний (БЗ) семантического интерфейса, которая специализирована для анализа незапланированных запросов. Предложен контекстно-ориентированный подход к управлению знаниями. Решена задача синхронизации открытой модели предметной области и базы данных системы моделирования. Предложена технология семантического доступа, предназначенная для обращения к БД в терминах ее концептуальной схемы.
БЗ семантического интерфейса состоит из следующих частей: 1) семантическая модель данных; 2) ограничения на данные; 3) пользовательские правила преобразования (оптимизации) запроса с целью сопоставления с ограничениями.
Разработанная семантическая модель данных является модификацией ER-модели, ее отношения дополнительно типизированы и для новых типов введены правила целостности. Она предназначена для описания концептуальной схемы базы данных, где хранится информация с иерархической структурой. Такую структуру имеют, в частности, данные моделирования для обеспечения возможности их версификации. Модель содержит следующие абстракции: классы объектов, свойства, иерархические отношения "часть-целое", ассоциативные отношения и т.д.
Помимо ограничений целостности, которые формируются автоматически на основе концептуальной схемы, на отдельные отношения, а также на их наборы пользователь может накладывать ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов. Это позволяет конкретизировать, какие именно объекты и в каких сочетаниях могут вступать в те или иные отношения. Формализация ограничений выполнена с помощью математического аппарата многосортных алгебр.
Многосортная алгебра А = ((ь'А )ses>(fA )/ег) состоит из семейства множеств-носителей i4 (сортов) и семейства частичных функций fA\
В рассматриваемой задаче в качестве множества сортов многосортной алгебры принято множество классов концептуальной схемы БД и типов их атрибутов. Семейство частичных функций формализует отношения, заданные в схеме.
С каждым сортом s, е S свяжем счетное множество X, переменных и определим множество термов TR и функцию type: TR-*S следующим образом:
- всякая переменная -Т е Л', есть терм, причем !урс(х) — s\
- всякий 0-арный функциональный символ (константа) /е F со схемой отображения /• -м есть терм, причем type(J) = s;
- если/е F имеет схему отображения /: ii-Mz и 1\, h - термы, у которых type(ti)=su type{t{) = i2, rof[t,j2) - терм, typc(f[tu t2j) = s2.
Определение 1. Назовем фактом упорядоченный список вида (f, t\, ti), где/a F,f. S1-M2, t, e TR (TR - множество допустимых термов), type ((,) = s/ (i = 1,2), или список вида (type, t, s), где teTR,seS, type(t) = s.
В этих обозначениях ситуацией d назовем конечную конъюнкцию фактов. В дальнейшем через D будем обозначать множество возможных ситуаций.
Определенная таким образом ситуация представляет собой множество конъюнктивно-связанных фактов, и поэтому в дальнейшем будем обращаться с нею как со множеством, используя операции объединения и, пересечения п, разности \ и отношение включения э.
Обозначим через var(d) множество имен переменных, входящих в ситуацию d, а через T(d) ::= {type(x)\x 6 var(d)} - множество типов переменных, входящих в факты ситуации d.
Введем также понятие подстановки:
9 ::= {?i / vi, t2 / V2,... , tm /vm}, где t, - термы, Vj - переменная, type(i,) = type(v/), i=\,m. Запись dQ означает результат одновременной замены всех вхождений переменной v, в d на соответствующий терм t\. По умолчанию, термы убудем полагать константами.
Подстановку Qa ::= {х\ Iуи хг I уг.....xm/ym], где xt, yi(i= 1, m) - переменные, назовем
алфавитным вариантом. Для каждого алфавитного варианта определена обратная подстановка: 9Л"' = {у\ Ixuyilx^,... ,ут/х„].
Две ситуации d и d' назовем эквивалентными (d = d). если найдется алфавитный вариант 0„ такой, что: d э d'Qa и d'^dQa'\
Определение 2. Ограничением на данные моделирования назовем пару <decl, ехрг>, в которой decl - сшуация, называемая декларацией переменных (переменные соответствуют классам концептуальной схемы БД и их атрибутам), ехрг - логическое выражение над элементарными одно- и двуместными предикатами, где переменные - атрибуты классов, присутствующие в декларации.
Определение 3. Системой ограничений назовем конечное множество пар COND - {<deci, ехрг>}.
Контекстно-ориентированный подход к управлению знаниями служит для систематизации ограничений и их активации по мере необходимости. Основными контекстами являются контексты приложения, запроса и БД. Каждый из них, в свою очередь, подразделяется на абстрактный и прикладной контексты. Абстрактный контекст каждого из этих объектов, участвующих в обработке данных моделирования, соответствует интенсионалу этого объекта. Прикладной контекст объекта позволяет описать некоторое множество его экземпляров. Так, абстрактный контекст БД задает ограничения, которые свойственны всем моделям данного класса (ранее содержались в процедурах проверки модели), а прикладной контекст БД - это ограничения, специфичные для конкретной предметной области (ранее в системах моделирования не учитывались).
На основе концептуальной схемы производится автоматическая генерация реляционной БД системы моделирования, в процессе которой устанавливается взаимно-однозначное соответствие между элементами схемы и конструкциями реляционной БД. Благодаря тому, что используемая модель включает семантические абстракции существующих расширенных моделей данных, заимствуется большинство формальных интерпретаций этих абстракций и ограничений целостности. Для проверки корректности информации, хранящейся в БД, относительно контекстных ограничений, последние транслируются в конструкции языка SQL. В результате решается задача синхронизации открытой модели предметной области и БД системы моделирования, что позволяет легко находить требуемые экземпляры классов объектов, а при необходимости - осуществлять проверку их соответствия ограничениям.
Поскольку классы концептуальной схемы упорядочены в иерархию включения, целесообразно, чтобы структура незапланированного запроса к БД также отражала иерархичность, обеспечивая возможность адекватно строить запросы в терминах метаданных. Аналогичная задача решается в XML-документах с помощью путевых запросов. Однако системы обработки XML-документов не отвечают требованиям, предъявляемым к разрабатываемому семантическому интерфейсу, поскольку не обеспечивают поддержку оперативных модификаций. Поэтому для доступа к реляционной БД систем моделирования предлагается использовать путевые запросы следующего вида:
<Имя_структуры>[<условия_фильтрации>] {.<Имя_структуры>[<условия фильтрации>]}г0[.Имя_атрибута] (1)
Данное адресуется как свойство некоторой структуры (или как сама структура), которая занимает определенное место в общей иерархии включения (уровни иерархии в запросе разделены символом «.»). Элементарные условия фильтрации можно разделить на следующие виды:
1. Одноместные предикаты.
2. Двуместные предикаты (<, >, =, ф), где переменные - атрибуты уровня.
3. Переход к вложенному запросу при помощи связей, регламентированных концептуальной схемой.
4. Переход к вложенному запросу по не регламентированным концептуальной схемой связям.
Таким образом, предложен способ декларативного представления схемы БД и пользовательских ограничений. Он обеспечивает возможности проектирования реляционной БД на языке семантической модели данных, автоматической генерации БД, проверки корректности данных, а также обращения к данным в терминах концептуальной схемы. Для систематизации ограничений используется контекстно-ориентированный подход, который применяется при проверке корректности данных моделирования.
В третьей главе формализация правил оптимизации запросов производится на основе введенного ранее аппарата многосортных алгебр. Исследуются свойства полученной системы продукций. Рассматриваются этапы семантического анализа незапланированных запросов на основе контекстов и средства его автоматизации с помощью предложенной алгебры условных кортежей (АУК).
Суть разработанного метода семантического анализа незапланированных запросов заключается в том, чтобы совместно рассматривать контексты, детализирующие дополнительные (по отношению к стандартным для СУБД) ограничения на пространство поиска запроса.
До наложения контекстов предложено оптимизировать запрос с целью устранения избыточности и нахождения "скрытых ограничений", одновременно выявляя (при ее наличии) некорректность структуры запроса. Поэтому база знаний семантического интерфейса содержит пользовательские правила оптимизации запросов: правила "склейки" вершин графа запроса и правила доопределения ситуации.
Правила "склейки" предназначены для выявления вершин графа запроса, которые фактически адресуют одно и то же множество однотипных элементов базы данных системы моделирования, и их отождествления. Для пары вершин А я В отождествление происходит следующим образом: итоговая вершина наследует все входные и выходные дуги исходных вершин, а условия фильтрации вершин А и В конъюнктивно соединяются. Если в итоге получается тождественно ложная логическая формула, то запрос некорректен.
Основной задачей правил доопределения ситуации является добавление в граф запроса фактов, которые выводятся из фактов, уже присутствующих в графе запроса. Таким образом, например, выявляются дополнительные связи, которые возникают при транзитивном применении базовых отношений, присутствующих в запросе. В результате этого при анализе запроса появляется возможность представить в явном виде ограничения на вновь добавляемые связи, то есть "скрытые" ограничения запроса.
Для осуществления оптимизации запрос необходимо разложить в набор конъюнктивных запросов так, чтобы совокупность результатов их исполнения была идентична результату исходного запроса. Любой конъюнктивный путевой запрос вида (1) может быть записан в форме ограничения <decl, ехрг>. Это следует из графового представления предлагаемых конъюнктивных путевых запросов. Вершины графа соответствуют уровням запроса и атрибутам уровней, а ребра - связям между ними. Причем, часть ребер сопоставляется отношениям концептуальной схемы БД или их дополнениям, а другая часть описывает не регламентированные схемой связи, формируемые с помощью таких операторов запроса, как «<», «>», «=», «#». Кроме того, вершинам, соотнесенным с атрибутами, назначаются конкретные значения из областей их определения. Факты вида (type, t, s) из ситуации decl описывают вершины графа запроса, а факты вида (f, tu t-j), содержащиеся в decl, -регламентированные ребра этого графа. В логическом выражении ехрг содержатся факты о конкретных значениях атрибутов, а также о незапланированных отношениях, возникающих на атрибутах. В фактах для обозначения регламентированных ребер и вершин графа запроса используются специальные константы.
Весь набор указанных правил формирует систему продукций, на основе которой осуществляется логический вывод, выявляющий структурные некорректности запроса не только до стадии его исполнения, но и до анализа запроса с учетом контекстных ограничений.
Определим сначала элементарные операции преобразования ситуации, к которым относятся добавление фактов и переобозначение термов. Для фиксированного d' е D:
а) операция добавления: D—>D
A[d%d) = с/и d'\
b) операция переобозначения термов RW[67-]: D->D
RlV[0j](d) - с10т, где бг= (Л / e\,t\ / ei), причем t\, е\,ег- имена термов (все константы или все переменные), терм t\ назовем замещающим, а термы е\, ej - замещаемыми.
Операция переобозначения нужна для того, чтобы отождествить пару термов, описывающих одну и ту же сущность. Например, одна и та же константа в ситуации может быть обозначена по-разному, и применение к такой ситуации операции переобозначения термов означает введение единого обозначения этой константы. При выполнении этой операции не происходит удаления фактов как такового, но исключается дублирование фактов, отличающихся только обозначением эквивалентных термов.
Определим множество программ R преобразования ситуаций следующим образом. Во-первых, будем считать элементами R программы A[d% кЩвт] при любых d' е D и б г, во-вторых, если две программы т\, тг е R, то программа (п; ri), определенная посредством равенства (п; r2)(d) '■'■= ЫпО^)) V с/ е А также есть элемент R.
Определение 4. Продукцией назовем пару (q, г), в которой q - ситуация, называемая условием применимости продукции, г - программа (г е R), называемая действием. Системой продукций назовем конечное множество кортежей Pr = {(q, г)}.
Поскольку в качестве условий применимости выступают фрагменты запроса, то q представимо в виде <decl, ехрг>. В правилах явно задаются преобразования, касающиеся ситуации deel - структурной части запроса, а преобразования выражения ехрг заранее определены для используемых видов правил.
В полученной вышеописанным способом системе продукций Рг, каждая продукция соответствует либо правилу доопределения запроса, либо правилу "склейки". Факты, входящие как в условия применимости (часть dect), так и в программы, содержат переменные, поскольку продукции предназначены для задания схем правил, а не отдельных правил.
Теперь рассмотрим организацию логического вывода на базе такой системы продукций. Будем говорить, что dj непосредственно выводима из d\ посредством продукции pr = (q, г), (di pr </2), если найдется такая подстановка 9, что d\ (dj- фрагмент, затрагиваемый
программой г, a dj = rQ(dJ) u {dt \ df)).
Если do-> dk 04 - ситуация, получающаяся из dg в результате применения
последовательности продукций) и \/pr, (dt pr d =>d'= dk), то dt - результирующая ситуация для do.
Результирующая ситуация зависит в общем случае (при использовании операций удаления фактов) от выбора подстановки и порядка применения продукций, то есть неоднозначна.
Пусть задано исходное состояние do и система продукций Pr = {pr, = (q„ г,)}, /= 1,я, л > 0. Назовем Рг корректной на do, если не существует бесконечной последовательности применимых к do продукций, и для любых двух результирующих ситуаций d и аР', выводимых из do, выполнено d = d".
Отметим, что в результате применения правил доопределения ситуации из исходной ситуации (запроса) не происходит удаления фактов.
Правила "склейки" описывают всевозможные пары эквивалентных вершин графа запроса и способ их отождествления. Каждое правило сводится к выполнению операции переобозначения термов с исключением повторяющихся фактов. Если в запросе имеются два различных обозначения одной и той же константы (вершины графа запроса), то подстановка 0 формируется таким образом, чтобы замещающий терм сз е {ci, сг) подстановки 676 = (сз / с\, с3 / сг) имел наименьший индекс из индексов замещаемых термов ci и сг.
Обозначим E(q) множество фактов Fe= {factД fact/} вида (type,t,s) из условия применимости q некоторого правила "склейки", которые соответствуют отождествляемым вершинам в графе запроса.
Теорема. Пусть Рг = {рг,} - система продукций, такая, что каждая продукция (qi, г,) соответствует либо правилу "склейки" вершин, либо правилу доопределения запроса. Если для любой пары продукцийрг\,ргг, где рг\ - правило доопределения или правило "склейки", аргг -
И
правило "склейки", выполняется соотношение fact' iq |V fact/ <t qi {fact', fact2' e E{qßB), 6Д -допустимый алфавитный вариант), то система продукций Рг корректна.
После проведения оптимизации конъюнктивного запроса производится проверка логических формул, получающихся в результате "склейки" вершин. Если выявляются противоречия в условиях фильтрации запроса, то он признается структурно некорректным. В случае положительного исхода описанных проверок, происходит семантический анализ запроса с точки зрения контекстов. Для запроса Q=<decfi, ехрп> формируется система активированных ограничений CONIf" = {<decl„ ехрг,>}. Очевидно, что для каждого ограничения condf=<decli, exprf> может быть несколько допустимых подстановок - {9'}. Конкретизированные ограничения (полученные в результате применения всех допустимых постановок ко всем активированным ограничениям) образуют систему COND9 ={<declД ехрг,в>), i~\...k.
Определение 5. Конъюнктивный путевой запрос является некорректным с точки зрения конкретизированных контекстных ограничений, если:
exprQ л ехрг\ л ... Aexpr*=false. (2)
В противном случае конъюнктивный путевой запрос признается корректным. Для программно-алгоритмической реализации процедуры логического вывода на основе предложенных правил и автоматизации работы с логическими формулами создан аппарат алгебры условных кортежей, который, в отличие от реляционной алгебры и алгебры кортежей, позволяет в качестве значений атрибутов использовать не только константы и одноместные предикаты, но и двуместные предикаты (бинарные отношения).
Пусть А= {Ai^f-^ip} - множество атрибутов (например, атрибутов классов концептуальной схемы данных), называемых простыми, а С = {A\yA2,---An-A\'*AiA\*Ai>---} -множество, состоящее из простых атрибутов и их всевозможных попарных декартовых произведений (сложных атрибутов). Тогда в качестве гибкого универсума следует рассматривать булеан (множество всех подмножеств) множества С - 5(C) = {Qi}. АУК задается следующим образом:
A = <{ÄKi[Qi]}, и, П, +Attr, -Attr, Пр, <->Attr, □>, где: ÄratQi] - некоторый АУК-объект (условный С-кортеж или условная С-система); Qi - схема отношения, представляющая собой некоторое множество атрибутов классов и их попарных декартовых произведений; и -операция объединения АУК-объектов; П - операция пересечения АУК-объектов; +Attr, -Attr -операции добавления и элиминации атрибутов; *-»Attr- операция перестановки атрибутов; Пр -операция взятия проекции; □ - операция наполнения АУК-объектов.
Элементарные условные С-кортежи соответствуют логическим формулам, не содержащим связки по «или» между двуместными предикатами. Условные С-системы учитывают такие связки. В именах АУК-объектов йк[М] явно указывается множество сложных атрибутов - К. В описании компонент сложных атрибутов используются лишь имена бинарных отношений, а конкретные множества значений формируются в результате операции наполнения, при реализации которой анализируется возможность одновременно сформировать все бинарные отношения, описанные в элементарном кортеже. Пересечение и объединение АУК-объектов регулируется разработанными таблицами, регламентирующими способ получения результирующих компонент на основе компонент исходных АУК-объектов.
Пусть <CZ)ki[Di],...,CZ)kji[Dii]> - набор условных С- систем, соответствующих конкретизированным ограничениям, a 6f[B] - запрос. Тогда на языке АУК условие (2) выглядит следующим образом:
□tex[Y] = 0, где tox[Y] = ßF[B]nCAa[Di]n... ЛаЫБ,,].
Таким образом, в работе решена задача обеспечения соответствия результатов незапланированных путевых запросов ограничениям на данные моделирования.
Предложенный во 2 и 3 главах подход к организации семантического интерфейса БД систем моделирования реализуется с помощью следующих этапов:
1. Формирование концептуальной схемы БД, ограничений на данные, пользовательских
правил оптимизации запросов. 1. Генерация БД на основе концептуальной схемы и проверка ее корректности. 3. Конструирование незапланированного путевого запроса.
4. Оптимизация запроса.
5. Сопоставление запроса с ограничениями на данные моделирования. В результате этого этапа выявляются все некорректности запроса.
6. Трансляция корректного запроса в конструкции языка SQL.
7. Исполнение запроса средствами реляционной СУБД.
В четвертой главе описывается программная реализация семантического интерфейса в системах моделирования и его применение в приложениях этих систем.
Семантический интерфейс реализован в виде СОМ-ссрвера, который обеспечивает доступ к БД средствами путевых запросов, проверяет их корректность и выполняет трансляцию запросов на язык SQL (см. рис.1).
Рис.1. Архитектура семантического интерфейса
Разработанные СОМ-интерфейсы используются при построении клиентских приложений (модулей системы моделирования). Основным клиентским приложением является редактор метаданных, функционирующий в двух основных режимах: 1) формирования ограничений модели предметной области; 2) конструирования и исполнения пользовательских запросов. В первом режиме эксперт строит концептуальную схему БД, детализирует ограничения на допустимые модели и специфичные ограничения для исследуемой предметной области, а также описывает правила семантической оптимизации запросов. В режиме конструирования и исполнения запросов происходит их предварительная обработка, управляемая процедурой логического вывода, а затем собственно семантический анализ на основе сопоставления с информацией из базы знаний. Конструктор запроса позволяет выделять интересующие ситуации концептуальной схемы, а также содержит редактор формул, с помощью которого задаются логические условия выборки. Редактор метаданных обеспечивает независимое от СУБД представление БД. Для взаимодействия с СУБД семантический интерфейс использует технологию ADO, поэтому имеется возможность настраиваться на различные СУБД. В качестве СУБД использовались PostgreSQL8.0 и Microsoft SQL Server.
Программную реализацию семантического интерфейса целесообразно рассматривать на трех уровнях: уровне исходного кода, уровне СОМ-интерфейсов и уровне кода клиентских компонентов. При разработке всех слоев (за исключением некоторых клиентских приложений) использовалась среда Borland С++ Builder.
Уровень исходного кода содержит базовую логику семантического интерфейса. Он представляет собой декларацию и дефиницию классов компонента на языке объектно-ориентированного программирования С++. На этом уровне можно выделить следующие структурные и алгоритмические элементы: списки метаданных БД, транслятор запросов, список
наборов данных, очередь транзакций, монитор транзакций. Кроме того, слой включает классы, реализующие объекты и операции АУК.
Уровень СОМ-интерфейсов содержит средства по обеспечению взаимодействия между исходным кодом и клиентами. Одним из его наиболее важных интерфейсов является интерфейс набора данных, который позволяет выполнять многочисленные манипуляции над данными в динамической памяти и сохранять модификации в базе данных по мере необходимости.
Уровень клиентских компонентов содержит набор невизуальных ргоху-компонентов и объектных классов. Невизуальные ргоху-компоненты перепредставляют СОМ-интерфейсы в виде классов на языке С++.
Предложенный метод семантического анализа запросов и реализующие его алгоритмы апробированы в следующих приложениях:
1. При реализации хозяйственных договоров со службами диспетчерского управления (СДУ) энергосистемы "Колэнерго" используется система моделирования региональной энергетики, разработанная в ИИММ КНЦ РАН при работе по договору «Создание информационно-аналитической справочной системы (ИАСС) на единой картографической основе для задач оперативного и перспективного управления ЦЭС ОАО "Колэнерго"».
2. При выполнении хозяйственного договора на опасном объекте (хвостохранилище) АНОФ-2 ОАО "Апатит" для моделирования и прогнозирования безопасности используется информационная система, созданная с участием ИИММ КНЦ РАН. Применение системы обеспечивает проведение оперативной диагностики состояния элементов хвостохранилища и прогноз возможности опасных сценариев, вызванных технологическими неисправностями и/или внешними факторами.
3. При проведении комплексного мониторинга вмещающего массива Ловозерского редкометального месторождения в рамках хоздоговора с Горным институтом КНЦ РАН «Оценка современного состояния рудника "Карнасурт" в условиях изменившегося геодинамического режима и его склонности к горно-тектоническим ударам» используется система баз данных, способствующая оперативной диагностике состояния массива.
4. В учебном процессе в Кольском филиале Петрозаводского государственного университета при чтении курсов "Представление знаний в информационных системах", "Теория принятия решений".
Положительный эффект использования диссертационной работы заключается в снижении трудоемкости ввода и модификации ограничений на модель предметной области, что подтверждается следующими экспериментальными данными.
Среднее
время
ввода зо (часы)
/
20
0
10
20
30
40 50
Количество ограничений
Система ограничений -*— Программирование
Рис.2. Время настройки системы моделирования на ограничения предметной области
Декларативное представление ограничений в виде специализированной системы позволяет ускорить проектирование инструментов контроля корректности, как показано на рис.2. Также интерфейс получает преимущества при развитии этих инструментов по сравнению с непосредственным программированием процедур проверки модели.
Креме того, выполнение предварительных преобразований и применение контекстных ограничений при семантическом анализе незапланированных запросов позволяет выявлять ошибки, возникающие как при подключении программных модулей, так и в процессе их функционирования.
В таблице приводятся результаты сравнения производительности программных компонентов: а) реализованного изначально для анализа 8(21^-запросов и б) созданного затем на базе путевых запросов в рамках предложенного семантического интерфейса.
Таблица
Длительность обработки запросов (в сотых долях секунды)_
SQL-запросы Путевые запросы
Этап преобразования запроса 0,83 0,47
Этап семантического анализа 0,59 0,56
Этап трансляции - 0,05
Как видно из сопоставления результатов, предпочтительным является использование путевых запросов, поскольку они непосредственно отражают в своей структуре абстракции используемой модели данных, что облегчает процедуры их анализа
Акты о внедрении приложены к диссертации.
В заключении изложены основные результаты работы и возможные направления дальнейших исследований.
В приложение вынесен синтаксис предложенного языка путевых запросов.
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие основные результаты:
1. Разработана модель базы знаний, специализированная для анализа незапланированных запросов и содержащая семантическую модель данных, ограничения на данные, правила оптимизации запросов. Используемая семантическая модель данных является расширением ER-модели, ее отношения дополнительно типизированы, для них определены правила ссылочной целостности. Концептуальная схема строится на основе семантической модели и описывает базу данных в виде классов объектов, организованных в иерархию включения и связанных ассоциативными отношениями. На отдельные отношения, а также на их наборы могут накладываться ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов. С целью устранения избыточности и выявления "скрытых ограничений" в запросе обеспечена возможность построения пользовательских правил его оптимизации. Формализация ограничений и правил оптимизации запросов осуществляется с помощью аппарата многосортных алгебр.
2. Предложен контекстно-ориентированный подход к управлению знаниями, отличающийся применением контекста для отбора только тех ограничений, которые актуальны для исследуемой в текущий момент модели предметной области. Это позволяет декларативно описывать и оперативно анализировать как ограничения, общие для всего класса допустимых моделей, так и специфичные для конкретной предметной области.
3. Разработана процедура автоматической синхронизации модели предметной области, открытой для редактирования, и структур реляционной базы данных с использованием информации, которая хранится в базе знаний. На основе концептуальной схемы осуществляется генерация базы данных. Для проверки корректности содержимого базы данных применяются контекстные ограничения, представленные на языке SQL.
4. В качестве технологии доступа к данным предложено использовать путевые запросы, структура которых адекватно отображает абстракции описанной семантической модели
данных. Это позволяет формулировать запрос к базе данных в терминах ее концептуальной схемы, что облегчает сопоставление запроса с ограничениями на данные моделирования.
5. Разработан метод семантических преобразований и анализа незапланированных запросов на основе контекстов, гарантирующий соответствие результатов запроса ограничениям на данные моделирования. До непосредственного наложения контекстов запроса и БД предложено выполнять преобразования незапланированных запросов в виде процедуры логического вывода, которая основана на применении двух видов правил (правил "склейки" вершин графа запроса и правил доопределения ситуации) с целью оптимизации запроса либо выявления некорректности его структуры. Правила преобразования запроса записываются в форме системы продукций, для которой сформулированы и доказаны условия корректности.
6. Автоматизированы процедуры проверки корректности незапланированных запросов. С этой целью разработана алгебра условных кортежей, которая, в отличие от реляционной алгебры и алгебры кортежей, позволяет использовать в качестве значений атрибутов отношений не только константы и одноместные предикаты, но и двуместные предикаты, и, соответственно, расширить возможности работы с логическими формулами. Такие формулы описывают условия фильтрации запросов и ограничения на данные моделирования.
7. Спроектирован программный компонент, реализующий семантический интерфейс баз данных системы моделирования и обеспечивающий синтез баз данных по их декларативному описанию, а также семантический анализ незапланированных запросов. Компонент может настраиваться на различные модели предметной области и взаимодействовать с различными реляционными СУБД.
8. Результаты работы апробированы при решении следующих задач: моделирование и прогнозирование безопасности на опасном объекте (хвостохранилище) АНОФ-2 ОАО "Апатит"; оперативное и перспективное управление ЦЭС ОАО "Колэнерго"; оценка современного состояния рудника "Карнасурт" ООО "Ловозерский ГОК"; в учебных курсах Кольского филиала Петрозаводского государственного университета.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
В рецензируемых журналах из перечня ВАК
1. Бойков С.А., Фридман А.Я., Зуенко A.A., Соловьев A.B., Македонов P.A., Зайцев A.B., Тарова Е.С. Программно-алгоритмическая организация системы ситуационного управления промышленно-природными комплексами // Труды ИСА РАН. Прикладные проблемы управления макросистемами. Том 8. - М.: Едиториал УРСС, 2004. - С.199-210.
2. Зуенко A.A., Фридман А.Я. Управление контекстом при организации интеллектуализированного интерфейса БД в системах моделирования на основе концептуального подхода // Труды ИСА РАН. Прикладные проблемы управления макросистемами / Под ред. Ю.С. Попкова, В.А. Путилова. Т. 39. - М.: Книжный дом "ЛИБРОКОМ", 2008. - С.128-141.
3. Зуенко A.A., Фридман А .Я. Метод семантического анализа нерегламентированных запросов в реляционной базе данных с иерархической структурой // Труды ИСА РАН. Прикладные проблемы управления макросистемами / Под ред. Ю.С. Попкова, В.А. Путилова. Т. 39. - М.: Книжный дом "ЛИБРОКОМ", 2008. - С.141-159.
4. Зуенко A.A., Фридман А.Я. Развитие алгебры кортежей для логического анализа баз данных с использованием двуместных предикатов // Известия РАН. Теория и системы управления. 2009. №2. - С.95-103.
В других изданиях
5. Македонов P.A., Зуенко A.A. Описание программно-алгоритмической организации ситуационной системы моделирования // Информационные технологии в региональном развитии. - Апатиты: Изд-во КНЦ РАН, 2006. - Выл.VI. - С.48-51.
6. Зуенко A.A., Македонов P.A. Логическая структура базы данных системы ситуационного моделирования // Информационные технологии в региональном развитии. - Апатиты: Изд-во КНЦ РАН, 2006. - Вып-VI. - C.S2-55.
7. Зуенко A.A. Расширение концептуальной модели природно-технического комплекса на задачу хранения данных вычислительного эксперимента // Н-ая Всероссийская научная конференция "Теория и практика системной динамики" (Апатиты, 3-6 апреля 2007 г.). Труды конференции. - Апатиты: Изд-во КНЦ РАН, 2007. - С.207-212.
8. Зуенко A.A. Формализация метаданных для хранилищ информации, поддерживающих открытую концептуальную модель // Информационные технологии в региональном развитии. -Апатиты: Изд-во КНЦ РАН, 2007. - Вып.УИ. - С.82-86.
9. Зуенко A.A., Македонов P.A. Программное обеспечение задач обогащения комплексного минерального сырья // Сборник материалов IV школы молодых ученых и специалистов "Сбалансированное природопользование" (6-8 ноября 2007 г.) - Апатиты: Изд-во КНЦ РАН, 2008. - С.248-254.
10. Зуенко A.A., Фридман А.Я. Логический вывод при семантическом анализе нерегламентированных путевых запросов. // Одиннадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2008 (28 сентября - 3 октября 2008 г., Дубна, Россия): Труды конференции. Т.1. - М.: ЛЕНАНД, 2008. - С.298-304.
11. Зуенко A.A., Фридман А.Я. Спецификация ограничений предметной области в системе концептуального моделирования (на примере региональной энергетики) // Информационные технологии в региональном развитии. - Апатиты: Изд-во КНЦ РАН, 2008. - Вып.VIII. - С.57-61.
12. Зуенко A.A., Македонов P.A. Комплексное моделирование нормального функционирования и безопасности хвостохранилища АНОФ-И. // Геология и геоэкология: исследования молодых. Материалы XIX конференции молодых ученых, посвященной памяти члена-корреспондента, профессора К.О. Кратца. (24-28 ноября 2008 г., г. Апатиты) - Апатиты: Изд-во Кольского научного центра РАН. 2008 -С.126-128.
13. Зуенко A.A., Фридман А.Я. Контекстный подход в системах сопровождения открытых моделей предметной области // Искусственный интеллект и принятие решений. 2008. №3. С. 4151.
14. Зуенко A.A., Фридман А.Я. Метод обеспечения стопроцентной точности путевых запросов к интеллектуальным базам данных // Ш-ая Всероссийская научная конференция "Теория и практика системной динамики" (Апатиты, 30 марта - 2 апреля 2009 г.). Труды конференции. - Апатиты: Изд-во КНЦ РАН, 2009. - С. 19-23.
Автореферат
ЗУЕНКО Александр Анатольевич
СЕМАНТИЧЕСКИЙ ИНТЕРФЕЙС РЕЛЯЦИОННЫХ БАЗ ДАННЫХ В СИСТЕМАХ МОДЕЛИРОВАНИЯ ДЛЯ СЛАБО ФОРМАЛИЗОВАННЫХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ
Технический редактор: Каржавина С.И.
Подписано к печати 10.09.09.
Формат 60*84 1/16. Бумага типографская. Печать офсетная. Уч.-изд.л. 1. Усл. краско-отт. Заказ № КФ-9. Тираж 60 экз.
Издательство Петрозаводского государственного университета Петрозаводск, пр. Ленина, 33
Отпечатано подразделением оперативной полиграфии
Кольского филиала ПетрГУ
184200, г. Апатиты, ул.Космонавтов, 3.
Оглавление автор диссертации — кандидата технических наук Зуенко, Александр Анатольевич
ВВЕДЕНИЕ.
Глава 1. ОБЗОР СОСТОЯНИЯ ПРОБЛЕМЫ ХРАНЕНИЯ И ДОСТУПА К
ДАННЫМ В ИНФОРМАЦИОННЫХ СИСТЕМАХ.
1.1. Основные модели представления данных.
1.2. Документальные информационные системы.
1.2.1. Поддержка XML-формата данных в СУБД.
1.2.2. Использование онтологии для организации семантического поиска.
1.3. Фактографические информационные системы.
1.3.1. Совместное использование реляционного и объектно-ориентированного подходов.
1.3.2. "Расширенные"модели данных как способ представления семантики.35'
1.4. Системы концептуального моделирования.
1.5. Алгебра кортежей.
1.6. Выводы по гл. 1.Л.
Глава 2. РАЗРАБОТКА БАЗЫ ЗНАНИЙ ДЛЯ УЧЕТА ОГРАНИЧЕНИЙ
МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ.
2.1. Конструирование схемы расширенной ситуационной концептуальной модели природно-технического комплекса.
2.2. Модель базы знаний семантического интерфейса.
2.3. Контекстно-ориентированный подход к управлению знаниями.
2.4. Контекст базы данных системы моделирования (на примере системы ситуационного моделирования).
2.4.1. Формирование абстрактного контекста БД.
2.4.2. Формирование прикладного контекста БД.
2.5. Организация хранения и доступа к информации баз данных систем моделирования средствами семантического интерфейса.
2.6. Выводы по гл. 2.
Глава 3. СЕМАНТИЧЕСКИЙ АНАЛИЗ КОРРЕКТНОСТИ ЗАПРОСОВ.
3.1. Основные этапы анализа запросов.
3.1.1. Конструирование и синтаксический разбор незапланированных запросов.
3.1.2. Метод семантической оптимизации и анализа незапланированных запросов.
3.2. Автоматизация процедур анализа незапланированных запросов.
3.2.1. Основные понятия и структуры алгебры условных кортежей
3.2.2. Примеры применения АУК для анализа запросов.
3.3. Выводы по гл. 3.
Глава 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ СЕМАНТИЧЕСКОГО
ИНТЕРФЕЙСА.
4.1. Принципы работы семантического интерфейса.
4.1.1. Уровень исходного кода программного компонента.
4.1.2. Описание СОМ-интерфейсов программного компонента:.
4.2. Применение семантического интерфейса в системе ситуационного моделирования.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Зуенко, Александр Анатольевич
Актуальность. В современном обществе возрастает роль моделирования как способа познания сложных по структуре объектов. Это происходит из-за невозможности или нежелательности проведения эксперимента на реальных объектах (высокие затраты, временной фактор, экологический фактор).
Моделирование изначально применялось в «хорошо» исследованных предметных областях (для них уже были известны основные законы взаимодействия объектов и инварианты, которые должны сохраняться при переходе от реального объекта к модели). Эти знания позволяли априорно задать класс используемых моделей предметной области (МПО) и свести задачу к настройке параметров модели по имеющимся экспериментальным данным. Таким образом, общая схема процесса моделирования сводилась к следующему [12]. Строилась математическая модель исследуемого объекта в виде, например, системы дифференциальных уравнений, описывающих влияние тех или иных свойств моделируемого объекта на его исследуемые характеристики. По математической модели разрабатывались численные алгоритмы решения сформулированной математической задачи [84]. После этого следовали этапы, связанные непосредственно с моделированием на компьютере: подготовка и отладка программы реализации моделируемых задач. Данное направление в моделировании привело к появлению большого количества пакетов прикладных программ [22, 41, 76, 85].
Принципиальное изменение схемы моделирования произошло при переходе к разработке систем моделирования для «слабо» формализованных предметных областей, где сама структура и класс применимых моделей должны уточняться в ходе исследований [12, 42]. Исходная модель, отражающая представления специалиста о предметной области, изменяется и уточняется в итеративном режиме по результатам проверки на имеющихся реальных данных предметной области. В связи с постоянным усложнением модели возникает необходимость использования новых программных модулей, реализующих более совершенные алгоритмы расчетов. Сам процесс построения модели происходит поэтапно. Вначале проектируется и программируется «скелет» модели, позволяющий решать небольшую часть задач. В дальнейшем эта приближенная модель уточняется путем дополнения модели новыми деталями и выбора тех алгоритмов из общего набора, которые необходимы и достаточны для конкретного варианта расчетов. Таким образом, программный комплекс, поддерживающий постановку и проведение моделирования, - далее такой продукт называется системой моделирования (СМ), - должен проектироваться открытым как для оперативных модификаций структуры модели, так и для включения новых элементов из вычислительной среды.
Большинство современных программных продуктов ориентировано на I пользователя-непрограммиста. Удобство работы с инструментальными системами зачастую является одним из решающих факторов их применения, ; так как пользователь может выступать в роли аналитика предметной области, определяющего структуру и состав модели предметной области, а также в роли конечного пользователя, проводящего моделирование в созданной исполнительной среде и оценивающего результаты. Поэтому СМ должна осуществлять автоматический контроль за ходом всего процесса моделирования. В ряде работ показана- необходимость интеллектуализации хранилищ данных [28, 38, 44, 72] и автоматизации средств анализа содержимого этих хранилищ [2, 7, 8, 66-68].
Ввиду открытости модели возникает необходимость реализовывать незапланированные запросы к БД СМ, так как невозможно заранее предугадать информационные потребности подключаемых программных модулей. Целесообразно автоматически проверять саму модель и запросы к ней, чтобы своевременно выявлять некорректные конструкции, например, ошибки при редактировании модели или подключении модулей и, тем самым, гарантировать точность результатов запросов и корректность процесса моделирования.
Тем не менее, в большинстве систем моделирования обеспечение корректности модели остается задачей конечного пользователя. На общем фоне выгодно отличаются системы концептуального моделирования [12-15, 96-99], автоматизирующие такие проверки, но и они обладают рядом недостатков. Все проверки рассчитаны только на один класс допустимых моделей, причем знания об ограничениях "жестко" зашиты в специализированных процедурах, то есть не отделены от управляющих знаний. Поэтому ограничения невозможно использовать при построении дополнительных инструментов контроля, а именно, инструментов контроля корректности незапланированных запросов. Кроме того, пользователь в процессе эксплуатации СМ лишен возможности развивать уже реализованные инструменты контроля, в частности, нельзя гибко настраиваться на ограничения, специфичные для исследуемой предметной области, в силу чего такие ограничения в существующих СМ не учитываются.
Многие недостатки систем моделирования можно преодолеть путем создания семантического интерфейса, существенно дополняющего стандартные функции СУБД средствами анализа незапланированных запросов и контроля корректности модели на уровне БД. Предлагается уточнять запрос до стадии его исполнения, основываясь на упомянутых ограничениях и пользовательских правилах оптимизации запроса. Это составляет главное отличие предлагаемого подхода от методов семантической обработки данных, типичных для документальных поисковых систем Semantic Web, где пространство поиска, наоборот, расширяется посредством логического вывода, что вызывает необходимость участия пользователя в окончательном выборе интересующей его информации [2, 5, 28].
Потребность оперативно изменять модель предметной области обусловливает применение реляционных СУБД при организации семантического интерфейса, поскольку они обеспечивают корректность модификаций данных за счет механизма ссылочной целостности [23, 111, 113, 114]. Однако на данные моделирования целесообразно накладывать ограничения, отличные от ограничений целостности реляционных СУБД, в которых семантическая составляющая развита слабо. Такие ограничения часто можно представить в виде логических формул. "Расширенные" или семантические модели (например, ER, RM/T) [23, 112], которые используют в качестве базовой реляционную модель, также не позволяют работать со структурами, типичными для-баз знаний (логические формулы, продукции). В диссертационной работе предлагается использовать семантические модели данных для декларативного представления концептуальной схемы реляционной БД, что облегчает ее проектирование и- автоматическую генерацию. Такое представление БД позволяет естественным образом накладывать ограничения на сложно структурированные данные. Дополнив семантическую модель подобными ограничениями, а также пользовательскими правилами оптимизации запроса, необходимо разработать формальную - основу для программно-алгоритмической реализации процедур анализа БД и незапланированных запросов.
Изложенное обосновывает следующую формулировку цели выполненных автором исследований и разработок.
Цель работы состоит в совершенствовании процессов построения, развития и использования инструментов контроля корректности модели и незапланированных запросов* при исследовании слабо формализованных предметных областей путем разработки математического и программно-алгоритмического обеспечения процедур семантической обработки информации в реляционных базах данных систем моделирования.
Задачи исследования 1. Анализ существующих средств хранения и семантической обработки данных в современных информационных системах.
2. Разработка декларативного способа представления схемы БД, ограничений на данные моделирования, а также пользовательских правил оптимизации запросов в виде специализированной базы знаний.
3. Разработка процедуры автоматической синхронизации открытой модели предметной области и базы данных системы моделирования с возможностью дополнительного контроля модели на уровне БД.
4. Создание метода анализа незапланированных запросов к семантизированной базе данных, гарантирующего соответствие их результатов пользовательским ограничениям на данные моделирования.
5. Автоматизация процедур семантического анализа незапланированных запросов.
6. Программно-алгоритмическая реализация семантического интерфейса реляционных баз данных для систем моделирования слабо формализованных предметных областей.
Методы исследования
Для решения поставленных в работе задач используются методы искусственного интеллекта, концептуального моделирования, элементы теории множеств, теории графов, математической логики.
Положения, выносимые на защиту
1. Модель базы знаний, содержащая семантическую модель данных, ограничения на данные, правила оптимизации запросов.
2. Контекстно-ориентированный подход к отбору ограничений, актуальных для исследуемой модели предметной области.
3. Метод семантических преобразований и анализа незапланированных путевых запросов на основе контекстов, а также средства автоматизации процедуры анализа запросов с помощью разработанной алгебры условных кортежей.
4. Практическая реализация семантического интерфейса баз данных для систем моделирования слабо формализованных предметных областей.
Научная новизна
1. Разработана модель базы знаний, специализированная для анализа незапланированных запросов. Она отличается от "расширенных" моделей данных (ER, RM/T) тем, что позволяет задавать правила семантической оптимизации и учитывать, помимо ограничений ссылочной целостности, дополнительные ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов.
2. Предложен контекстно-ориентированный подход к управлению знаниями, отличающийся применением контекста для отбора только тех ограничений, которые актуальны для исследуемой в текущий момент модели предметной области. Это позволяет декларативно описывать и оперативно анализировать как ограничения, общие для всего класса допустимых моделей, так и специфичные для конкретной предметной области.
3. Предложен метод семантических преобразований и анализа незапланированных запросов на основе контекстов, отличающийся от методов поиска Semantic Web тем, что область поиска сужается с учетом ограничений на данные моделирования. Это позволяет выявлять некорректность запроса до стадии его исполнения и гарантировать соответствие результатов запроса указанным ограничениям. Метод дает возможность выявлять ошибки в работе системы моделирования, возникающие в результате подключения новых программных модулей.
4. Разработана алгебра условных кортежей, которая, в отличие от реляционной алгебры и алгебры кортежей, позволяет использовать в качестве значений атрибутов отношений не только константы и одноместные предикаты, но и двуместные предикаты, и, соответственно, расширить возможности автоматизации логического анализа данных.
Научная новизна работы подтверждена включением ее результатов в исследования по Программе фундаментальных научных исследований
Отделения нанотехнологий и информационных технологий РАН (проект 2.3) и Программе № 3 Президиума РАН (проект № 4.3 "Интеллектуальные базы данных").
Обоснованность и достоверность
Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечивается за счет тщательного анализа состояния исследований в данной области, подтверждается корректностью предложенных решений, а также всесторонней апробацией основных теоретических положений диссертации в печатных трудах и докладах на Всероссийских научных конференциях, положительными результатами практического использования разработанной системы в различных отечественных организациях.
Практическая ценность работы
На этапе проектирования системы моделирования предложенные программные средства способствуют ускорению разработки инструментов контроля корректности. С использованием предложенной модели базы знаний представление ограничений на модель предметной области становится декларативным и появляется возможность применять их не только для анализа самой модели, но и при проверке незапланированных запросов. Модификация контекстно-ориентированного подхода для управления знаниями в системах моделирования дает возможность учитывать и оперативно анализировать как ограничения, общие для всех допустимых моделей, так и ограничения, специфичные для конкретной предметной области.
В процессе эксплуатации системы моделирования разработанные методы и алгоритмы позволяют организовать автоматическую проверку модели предметной области на уровне ее структуры и выявлять некорректности при обращении к данным со стороны подключаемых программных модулей. Разработанный метод семантического анализа незапланированных запросов на основе контекстов позволяет исключить некорректные обращения к реляционной СУБД.
Использование семантического интерфейса способствует уменьшению трудозатрат на модификацию и ввод ограничений в систему моделирования.
В основу диссертационной работы положены результаты, полученные автором в ходе исследований по планам научно-исследовательских работ Института информатики и математического моделирования Кольского научного центра РАН в период 2006-2009 гг.: «Ситуационный синтез стратегий устойчивого развития региональных промышленных комплексов с учетом техногенно-природных рисков», гос.рег. № 01.20.06 03210, «Модели и методы координации решений по управлению региональным промышленно-природным комплексом» гос.рег. № 01.2.00 951211.
Апробация работы
Основные результаты и положения диссертационной работы докладывались и обсуждались на пятой и седьмой Всероссийской школе-семинаре "Прикладные проблемы управления макросистемами" (Апатиты, 2004 г. и 2008 г.), второй и третьей Всероссийской научной конференции "Теория и практика системной динамики" (Апатиты, 2007 г. и 2009 г.), одиннадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2008 (Дубна, 2008 г.), четвертой школе молодых ученых «Сбалансированное природопользование» (Апатиты, 2007 г.), девятнадцатой конференции молодых ученых, посвященной памяти члена-корреспондента, профессора К.О. Кратца «Геология и геоэкология: исследования молодых» (Апатиты, 2008 г.).
Публикации По теме диссертации опубликовано 14 печатных работ (из них 4 - в списке ВАК).
Структура и объем работы
Диссертация состоит из введения, четырех глав, заключения, списка литературы (123 наименования). Общий объем - 159 печатных страниц, в том числе 15 рисунков, 11 таблиц и 1 приложение.
Заключение диссертация на тему "Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей"
8. Результаты работы апробированы при решении следующих задач: моделирование и прогнозирование безопасности на опасном объекте (хвостохранилище) АНОФ-2 ОАО "Апатит"; оперативное и перспективное управление ЦЭС ОАО "Колэнерго"; оценка современного состояния рудника "Карнасурт" ООО "Ловозерский ГОК"; в учебных курсах Кольского филиала Петрозаводского государственного университета.
Представляется целесообразным развивать проведенные исследования в следующих направлениях:
• динамический синтез контекстных ограничений в зависимости от ситуации, складывающейся на реальном объекте и/или в процессе имитации;
• исследование закономерностей и взаимосвязей между ограничениями на уровне концептуальной модели и на уровне вычислительной сети;
• расширение алгебры условных кортежей для моделирования многоместных отношений более общего вида, чем логические формулы над элементарными одно- и двуместными предикатами.
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие основные результаты:
1. Разработана модель базы знаний, специализированная для анализа незапланированных запросов и содержащая семантическую модель данных, ограничения на данные, правила оптимизации запросов. Используемая семантическая модель данных является расширением ER-модели, ее отношения дополнительно типизированы, для них определены правила ссылочной целостности. Концептуальная схема строится на основе семантической модели и описывает базу данных в виде классов объектов, организованных в иерархию включения и связанных ассоциативными отношениями. На отдельные отношения, а также на их наборы могут накладываться ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов. С целью устранения избыточности и выявления «скрытых ограничений» в запросе обеспечена возможность построения пользовательских правил его оптимизации. Формализация ограничений и правил оптимизации запросов осуществляется с помощью аппарата многосортных алгебр.
2. Предложен контекстно-ориентированный подход к управлению знаниями, отличающийся применением контекста для отбора только тех ограничений, которые актуальны для исследуемой в текущий момент модели предметной области. Это позволяет декларативно описывать и оперативно анализировать как ограничения, общие для всего класса допустимых моделей, так и специфичные для конкретной предметной области.
3. Разработана процедура автоматической синхронизации модели предметной области, открытой для редактирования, и структур реляционной базы данных с использованием информации, которая хранится в базе знаний. На основе концептуальной схемы осуществляется генерация базы данных. Для проверки корректности содержимого базы данных применяются контекстные ограничения, представленные на языке SQL.
4. В качестве технологии доступа к данным предложено использовать путевые запросы, структура которых адекватно отображает абстракции описанной расширенной модели данных. Это позволяет формулировать запрос к базе данных в терминах ее концептуальной схемы, что облегчает сопоставление запроса с ограничениями на данные моделирования.
5. Разработан метод семантических преобразований и анализа незапланированных запросов на основе контекстов, гарантирующий соответствие результатов запроса ограничениям на данные моделирования. До непосредственного наложения контекстов запроса и БД предложено выполнять преобразования незапланированных запросов в виде процедуры логического вывода, которая основана на применении двух видов правил (правил «склейки» вершин графа запроса и правил доопределения ситуации) с целью оптимизации запроса либо выявления некорректности его структуры. Правила преобразования запроса записываются в форме системы продукций, для которой сформулированы и доказаны условия корректности.
6. Автоматизированы процедуры' проверки корректности незапланированных запросов. С этой целью разработана алгебра условных кортежей, которая, в отличие от реляционной алгебры и алгебры кортежей, позволяет использовать в качестве значений атрибутов отношений не только константы и одноместные предикаты, но и двуместные предикаты, и, соответственно, расширить возможности работы с логическими формулами. Такие формулы описывают условия фильтрации запросов и ограничения на данные моделирования.
7. Спроектирован программный компонент, реализующий семантический интерфейс баз данных системы моделирования и обеспечивающий синтез баз данных по их декларативному описанию, а также семантический анализ незапланированных запросов. Компонент может настраиваться на различные модели предметной области и взаимодействовать с различными реляционными СУБД.
Библиография Зуенко, Александр Анатольевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Автоматизация информационного обеспечения научных исследований / ' Стогний А.А., Каширин Ю.П. и др. Киев: Наукова думка, 1990. - 296 с.
2. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. М.: Финансы и статистика, 2006. - 424с.
3. Арзамасцев Д.А., Елохин В.Р., Криворуцкий Л.Д., Мардер Л.И., Мызин
4. A.Л. Имитационное моделирование развития систем энергетики. Иркутск: СЭИ, 1988.
5. Ахо А., Ульман Д. Теория синтаксического анализа, перевода и компиляции. М.: Мир, 1978, т.1, 2.
6. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский СПб.: Питер, 2001.-384 с.
7. Банержи С. Использование XML Schema в реляционных базах данных. Режим доступа: http://www.ubs.ru/ws/xmlxmlschemal.html.
8. Баранов С.Н., Домарацкий А.Н., Ласточкин Н.К. Автоматизация процесса управления проектом ПИ.// Программные продукты и системы. М. 1998:№ 4. - с.46-48.
9. Баранов С.Н., Домарацкий А. Н., Ласточкин Н.К., Морозов В.П. Процесс разработки программных изделий. М.: Наука, "Физматлит", 2000. - 176с.
10. Богданов Д.В., Бржезовский А.В., Жаков В.И, Засимович М.А., Казанцев
11. B.Н., Мазаков Е.Б., Неилко О.Б., Саушкин В.П., Щекин С.В., Фильчаков В.В. Концептуальное моделирование информационных систем / Под ред. Фильчакова В.В. СПб:СПВУРЭ ПВО, 1998. - 356 с. .
12. Богословская Н.В., Бржезовский А.В. О подходе к созданию обобщённой модели программного обеспечения // Теоретические и прикладные модели информатизации региона. Апатиты: КНЦ РАН, 2000. - С. 27-29.
13. Бойков С.А., Фридман А .Я., Зуенко А. А., Соловьев А.В., Македонов Р.А., Зайцев А.В., Тарова Е.С. Программно-алгоритмическая организация системы ситуационного управления промышленно-природными комплексами //
14. Труды ИСА РАН. Прикладные проблемы управления макросистемами. Том 8. — М.: Едиториал УРСС, 2004. С. 199-210.
15. Бржезовский А.В., Жаков В.И., Путилов В.А, Фильчаков В.В. Синтез моделей вычислительного эксперимента. СПб: Наука, 1992. — 231 с.
16. Бржезовский А.В., Жаков В.И., Фильчаков В.В. CASE-технология разработки пакетов прикладных программ // Вычислительный эксперимент и моделирование в системах "Технологические процессы природные комплексы" - Апатиты, 1992. - С. 15-23.
17. Бржезовский А.В., Фильчаков В.В. Концептуальный, анализ вычислительных систем: учеб. Пособие/ ЛИАП Спб, 1991. 78 с.
18. Бржезовский А.В., Фильчаков В.В. Программная система для разработки концептуальной модели в области обработки информации // Методы и средства вычислительного эксперимента. — Апатиты: Изд. КНЦ АН СССР, 1990.-С. 24-28.
19. Бурбаки Н. Теория множеств. М.: Мир, 1965. - 240с.
20. Бусленко Н.П., Калашников В.В., Коваленко И.Н. Лекции по теории сложных систем. -М.: Сов.радио, 1993. 439 с.
21. Буч Г. Объектно-ориентированный анализ и проектирование: с примерами приложений на С++. "Издательство Бином", "Невский диалект", 1998.-560 с.
22. Введение в теоретическое программирование (беседы о методе). А.П.Ершов. Главная редакция физико-математической литературы изд-ва "Наука", М., 1977.-288 с.
23. Веселов В., Долженков А. XML-ориентированные базы данных: обзор состояния и опыт разработки. Режим доступа: http://synthesis.ipi.ac.ru/sigmod/seminar/s20030227.
24. Виноградов А.Н., Жилякова Л.Ю., Осипов Г.С. Динамические интеллектуальные системы. 4.1. Представление знаний и основные алгоритмы // Известия РАН. Теория и системы управления. - М.: Наука, 2002.
25. Доддз JI. XML и базы данных? Доверьтесь своей интуиции. Режим доступа: http://www.iso.ru/cgi-bin/main/journal.cgi?dowhat=details&id=206.
26. Документация по PostgreSQL 8.0.1. Всемирная группа разработчиков PostgreSQL. Частичный перевод с английского.
27. Дрибас В.П. Реляционные модели данных. — Минск: Изд-во Белорус, ун-та, 1982.-182 с. •
28. Емельянов С.В., Олейник А.Г., Попков Ю.С., Путилов В.А. «Информационные технологии регионального управления» — М.: Едиториал УРСС, 2004. — 400 с.
29. Замулин А.В. Системы программирования баз данных и знаний. -Новосибирск: Наука, 1990. 352 с.
30. Зуенко А.А., Македонов Р.А. Логическая структура базы данных системы ситуационного моделирования // Информационные технологии врегиональном развитии. Апатиты: Изд-во КНЦ РАН, 2006. — Bbin.VI. - С.52-55.
31. Зуенко А.А. Формализация метаданных для хранилищ информации, поддерживающих открытую концептуальную модель // Информационные технологии в региональном развитии. Апатиты: Изд-во КНЦ РАН, 2007. — Вып.VII. - С.82-86.
32. Зуенко А.А., Фридман А.Я. Контекстный подход в системах сопровождения открытых моделей предметной области // Искусственный интеллект и принятие решений. 2008. №3. С. 41-51.
33. Зуенко А.А., Фридман А.Я. Развитие алгебры кортежей для. логического анализа баз данных с использованием двуместных предикатов // Известия РАН. Теория и системы управления. 2009. №2. С.95-103.
34. Ивахненко A.F. Долгосрочное прогнозирование и управление сложными системами. Киев: Техника, 1975. — 312 с.
35. Кандрашина Е.Ю., Литвинцева Л.В., Поспелов. Д.А. Представление знаний о г времени и пространстве в интеллектуальных системах / Под ред<. Д.А: Поспелова. М.: Наука. Гл. ред. физ.-мат. лит. — 328 с. — (Пробл. искусств, интеллекта).
36. Клещев А.С. Реализация экспертных систем на основе декларативных моделей представления знаний: Препринт. Владивосток: ДВО АН СССР, 1988. -45 с.
37. Клещев А.С. Роль метазнаний при создании экспертных систем: Препринт. Владивосток: ИАПУ ДВО АН СССР, 1989. 25с.
38. Крёнке Д. Теория и практика построения баз данных, 8-е изд. СПб.: Питер, 2003.-800 с.
39. Кузнецов В.Е. Представление в ЭВМ неформальных процедур: продукционные системы / С послесловием Д.А. Поспелова. М.: Наука. Гл. ред. физ.-мат. лит. 1989. - 160 с.
40. Кузьмин И.А., Путилов В.А., Фильчаков В.В. Распределенная обработка информации в научных исследования. Л.:'Наука, 1991 - 304с.
41. Кулик Б.А. Анализ надежности систем с многими состояниями на основе алгебры кортежей // Автоматика и телемеханика, 2003. № 7. С. 13-18.
42. Кулик Б.А. .Вероятностная логика на основе алгебры кортежей // Изв. РАН. ТиСУ. 2007. № 1. С. 118-127.
43. Кулик Б.А. Возможности параллельной обработки данных и знаний с помощью алгебры кортежей. // Труды IV международной конференции "Параллельные вычисления и задачи управления" Москва, 27-29 октября 2008. -С. 190-202.
44. Кулик Б.А. Математическое отношение как основная структура логики // Труды междунар. научной школы "Моделирование и анализ безопасности и риска в сложных системах 2008" СПб.: ГУАП, 2008. - С. 190-192.
45. Кулик Б.А. Обобщенный подход к моделированию и анализу интеллектуальных систем на основе алгебры кортежей. // Труды VI Международной конференции «Идентификация систем' и задачи управления» SICPRO'07. М.: ИПУ РАН, 2007. С. 679-715.
46. Кулик Б.А. Теория отношений как математическая основа логики // Труды международной научной конференции «Философия математики: актуальные проблемы». М., Изд. Савин С.А., 2007. — С. 111-113.
47. Македонов Р.А., Зуенко А.А. Описание программно-алгоритмической организации ситуационной системы моделирования // Информационные технологии в региональном развитии. Апатиты: Изд-во КНЦ РАН, 2006. — Вып:У1. - С.48-51.
48. Мартин Дж. Организация баз данных в вычислительных системах. — М.: Мир, 1980.-664 с.
49. Медницкий Г.В. Декомпозиция и итеративное агрегирование в задачах линейного программирования с блочно-треугольной или ступенчатой структурой ограничений'// Изв. АН СССР. Техн. кибернетика. 1990. №6. - С. 14-27.
50. Месарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем. М.: Мир, 1993. - 344 с.
51. Михаленко П., Язык онтологий в Web. // Открытые системы, № 2, 2004. Режим доступа: http://www.osp.ru/os/2004/02/183921/p2.html.
52. Молчанов А.А. Моделирование и проектирование сложных систем. — Киев: Выща шк., 1989. 234 с.65.-Молчанов А.Ю. Системное программное обеспечение: Учебник для вузов СПб.: Питер, 2006. - 396 е.: ил.
53. Мусаев А.А. Алгоритмы. аналитического управления производственными процессами. // Автоматизация в промышленности. №1, 2004,-с.З 0-35.
54. Мусаев А.А., Шерстюк Ю.М. Автоматизация* диспетчеризации производственных процессов промышленного предприятия. //Автоматизация в промышленности, №9, 2003. с. 36-43'.
55. Мусаев А.А., Шерстюк Ю.М. Информационное хранилище промышленного предприятия: концепция системы хранения производственного опыта. // Автоматизация в промышленности. №6, 2004. с. 12-15.
56. Нагао М., Катаяма Т., Уэмура С. Структуры и базы данных: Пер с япон. -М.: Мир, 1986-197 с.
57. Олейник А.Г., Фридман А.Я. Генерация базы данных вычислительного эксперимента на основе концептуальной модели1 // Региональные информационные системы. 4.1. Апатиты: КНЦ РАН, 1995. - С.47-57.
58. Олейник А.Г., Фридман А.Я., Олейник О.В1. Программная система, информационной- поддержки региональной' энергетики // Региональные информационные системы. 4.1. Апатиты: КНЦ РАН, 1995. - С. 14-24.
59. Осипов Г.С., Смирнов И.В., Тихомиров И:А. Реляционно-ситуационный метод поиска и анализа текстов и его приложения* // Искусственный интеллект и принятие решений. №2, 2008.- С. 3-10.
60. Охтилев М.Ю., Соколов Б.В., Юсупов P.M. Интеллектуальные технологии мониторинга и управления структурной динамикой сложных технических объектов М.: Наука, 2006. - 410 с.
61. Парасюк И.Н., Сергиенко И.В. Пакеты программ анализа данных: технология разработки. М., Финансы и статистика, 1988. — 159 с.
62. Петров В. Н. Информационные системы. СПб.: Питер, 2002.
63. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. М.: Радио и связь, 1989. — 184 с.
64. Преобразование концептуальной модели к спецификациям алгоритмов / Фильчаков В.В., Бржезовский А.В., Жаков В.И., Дегтярев А.В. // Вычислительный эксперимент в задачах прогнозирования. Апатиты, изд-во КНЦРАН, 1994-С. 180-186.
65. Провост У., За пределами W3C XML Schema. Режим доступа: http ://www.iso.ru/j ournal/articles/174.html.
66. Путилов В. А., Фильчаков В.В., Фридман А .Я. CASE-технологии вычислительного эксперимента. — Апатиты: Изд-во КНЦ РАН, 1994. Т.1 249 с. Т.2. - 169 с.
67. Рекуц М. Виды ограничений целостности в базах XML-данных. Режим доступа: http://www.modis.ispras.ru/publications.html.
68. Рихтер Дж. Windows для профессионалов: создание эффективных "\Ут32-приложений с учетом специфики 64-разрядной версии- Windows / Пер. с англ. 4-е изд. СПб: Питер; М.: Издательско-торговый дом "Русская Редакция", 2004. - 749 с.
69. Самарский А.А. Введение в численные методы. М.: Наука, 1987. — 288с.
70. Семенов Н.А. Программы регрессивного анализа и прогнозирования временных рядов. Пакеты ПАРИС и МАВР. М.: Финансы и статистика, 1990. -111с.
71. Сетевые операционные системы / В.Г. Олифер, Н.А. Олифер. СПб.: Питер, 2003.-539 с. .
72. Скардина М. Модели хранения XML-данных: единственного варианта на все случаи нет. // Oracle Magazine RE Январь/Февраль 2004. Режим доступа: http://www.citforum.ru/internet/xml/storagemodels/.
73. Сконнард А. Понимание XML Schema. Режим доступа: http://ms-lozhech-1 .hosting.parking.ru
74. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Онтологии в системах искусственного интеллекта: способы построения и организации. // Новости искусственного интеллекта, 2002. № 1. Часть 1. С. 3—13. № 2. Часть 2. С.З—9.
75. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Управление онтологиями. // Известия РАН. Теория и системы управления, 2003. Часть 1 -№ 4. С. 132—146. Часть 2.-№5.-С. 89—101.
76. Страуструп Б. Язык программирования С++, 3-е изд./ Пер. с англ. -СПб., М.: Невский диалект Издательство БИНОМ, 1999 г. - 991 с.
77. Суслов А. Языки запросов для XML-данных. // Открытые системы, № 2, 2001. Режим доступа: http:www.osp.ru/os/2001/02/1799947/p2.html.
78. Тыугу Э.Х. Концептуальное программирование. М.: Наука, 1984. -255с.
79. Фридман А.Я. Классификация ситуаций и сопоставление альтернативных структур модели в ситуационной системе вычислительного эксперимента. // Имитационное моделирование в исследованиях проблем регионального развития. Апатиты: КНЦ РАН, 1999. - С. 14-24.
80. Фридман А. Я. Ситуационный подход к моделированию' состояния пространственного объекта. // Системы информационной поддержки регионального развития. Апатиты: изд. КНЦ РАН, 1998. С 45-49.
81. Фридман А.Я., Фридман О.В. Контроль корректности вычислений и управление выводом в системах продукций // Имитационное моделирование в исследованиях проблем регионального развития. Апатиты: КНЦ РАН, 1999. -С.93-100.
82. Цаленко М.Ш. Моделирование семантики в базах данных. М.: Наука, 1989.-288 с.
83. Цикритзис Д., Лоховски Ф. Модели данных / Пер. с англ: М.: Финансы и статистика, 1985.-420 с.
84. Шилдт Г. Теория и практика С++: пер. с англ. СПб.: БХВ-Петербург, 2001.-416 с.
85. Ширшов А., Использование XML совместно с SQL. // RSDN Magazine. № 1. 2003. Режим доступа, http://www.rsdn.ru/article/db/xmlsql.xml.
86. Шонинг X. Tamino СУБД, созданная для XML. // Открытые системы, № 5, 2002. Режим доступа: http://www.osp.ru/os/2002/05/181463/.
87. Чемберлин Д. XQuery: язык запросов XML. // Открытые системы, №1, 2003. Режим доступа: http://www.osp.ru/os/2003/01/061.htm
88. Яхно Т.М. Системы продукций: структура, технология, применение. — Новосибирск: Изд-во ВЦ СО АН СССР, 1990. 128 с.
89. An Interview with Chris Date by Tony Williams. 07/29/2005. Режим доступа: http://www.oreillvnet.eom/pub/a/network/2005/07/20/cidate.html
90. Borland С++ Builder. Для профессионалов / B.A. Шамис. СПб.: Питер, 2003.-798 е.: ил.
91. Brezillon P. Context in Artificial Intelligence: II. Key Elements of Contexts // Computer & Artificial Intelligence, 1999. Vol. 18. - № 5. - Pp. 425— 446.
92. Christiansen H., Rekouts M. Integrity Checking and Maintenance with Active Rules in XML Databases, BNCOD '07. 24th British National Conference on, Glasgow, 3-5 July 2007. P 59-67.
93. Codd E.F. A relational model of data for large shared data banks. Comm. ACM, 1970, v. 13, N 6, - p. 377-387.
94. Codd E.F. Extending the Database Relational Model to Capture More Meaning. ACM Transactions on Database Systems, Vol. 4, # 4, December 1979.
95. Codd. E.F. Normalized Data Base Structure: A Brief Tutorial Proc. 1971 ACM SIGFIDET Workshop on Data Description, Access and Control. P. 1-17.
96. Codd E.F. Relational completeness of data base sublanguages. Data Base Systems: Proc of Courant Computer Science Symposia 6, New York City, May 2425. 1971. Prentice Hill, 1972. - p. 33-64.
97. Engles R. W., An Analysis of April 1971 Data-Base Task Group Report, Proc, ACM SIGFIDET Workshop on Data Description, Access and Control, 1971.
98. Forrester, Jay W. 1958. "Industrial Dynamics A Major Breakthrough for Decision Makers." Harvard Business Review, Vol. 36, No. 4. — pp. 37-66.
99. Kim W. and Lochovsky F. Object-Oriented Concepts, Applications, and Databases. Microtrend Books, 1989.
100. Knuth D. E. The Art of Computer Programming, Vol. 1, Fundamental Algorithms, Addison-Wesley, Reading Mass., 1968.
101. National Bureau of Standards Handbook 113. CODASYL Data Description Language Journal of Development, U.S. Department of Commerce, National Bureau of Standards, Washington, D.C., 1974.
102. OWL, язык веб-онтологий. Руководство. Режим доступа: http://www.sherdim.rsu.ru/pts/semanticweb/REC-owl-quide-20040210ru.html.
103. Powersim 2.5 Reference Manual. — Herndon, USA: Powersim Press, 1996. 427 pp.
104. Smirnov A., Pashkin M., Shilov N., Levashova T. Constraint-driven methodology for context-based decision support // Journal of Decision Systems -2005.-№ 14(3).-P. 279-301.
105. Smirnov A., Pashkin M., Shilov N., Levashova Т., Kashevnik A. Context-Aware Operational Decision Support, Proceedings of the 10th International Conference on Information Fusion (Fusion 2007), Quebec, Canada, 9—12 July, 2007.
106. ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ1. Использованные сокращения1. АК — алгебра кортежей
107. АУК — алгебра условных кортежей1. БД база данных1. БЗ база знаний
108. ГИС геоинформационная система ГТС — гидротехническое сооружение КМ - концептуальная модель
109. КМИС — концептуальное моделирование информационных систем
110. ЛЭП — линии электропередач
111. МПО модель предметной области
112. ОДМ — обработка данных моделирования
113. ООП объектно-ориентированный подход
114. ООСУБД объектно-ориентированные СУБД
115. ООЯП объектно-ориентированные языки программирования
116. ОРСУБД объектно-реляционные СУБД1. ПО предметная область
117. ГГГК природно-технический комплекс
118. РКМ расширенная концептуальная модель1. РСУБД реляционные СУБД
119. СДУ служба диспетчерского управления1. СМ система моделирования
120. ССМ система ситуационного моделирования
121. СУБД система управления базами данных
122. ADO (ActiveX Data Objects) объекты данных стандарта ActiveX
123. COM (Component Object Model) многокомпонентная модель объектов
124. ER (Entity Relationship model) - модель «сущность - связь»
125. ODBC (Open Database Connectivity standard) открытый стандартсовместимости баз данных
126. OWL (Ontology Web Language) язык онтологий для Интернета
127. RM/T (Relational Model / Tasmania) расширение реляционной модели,предложенное на острове Тасмания
128. SQL (Structured Query Language) язык структурированных запросов XML (extensible Markup Language) - расширяемый язык разметки
129. Основные условные обозначения
130. В(М) множество всех подмножеств (булеан) множества «М» ::= - равенство по определению 0 - пустое множество
131. С—»D следует читать: "частичное функциональное отображение из С в D"dj ——> d2 следует читать: "из ситуации dj выводится ситуация d2"
132. А=>В следует читать: "из истинности А следует истинность В"
133. Attr операция добавления атрибутов в АК (АУК)-объект-Attr операция элиминации атрибутов из АК (АУК)-объекта
134. Пр операция взятия проекции АУК-объекта->Attr операция перестановки атрибутов в АК (АУК)-объектахоперация наполнения АУК-объекта значениями
135. Синтаксис языка путевых запросов (в нотации Бэкуса-Наура)
136. ВыражениелогическихИ> ::= £ <Фильтр> ) { and £ <Фильтр> ) <ВыражениелогическихИЛИ> ::= £ <Фильтр> } { or £ <Фильтр> ) <Переходсуровня> ::= <Сравнениепозначению> | <Переходпосвязи>
137. Переходпосвязи> ::= id <Имя связи> <Адресструктуры >л id <Имя связи> ::= <Идентификатор>
138. Сравнениепозначению> ::= <Леваячастьоператорасравнения> <оператор> <Праваячастьоператорасравнения>
139. Леваячастьоператорасравнения>: := <Имяполя> <Праваячастьоператорасравнения> ::= <Адрессвойства> | <3начение>
140. Оператор> ::= = | <= | >= | > | < |3начение>::= <Вещественнаяконстанта> | <Целочисленнаяконстанта> | <Строковаяконстанта> | <Логическаяконстанта>
141. Идентификатор> ::= ( | <Букваанглийскогоалфавита> ) { | <Букваанглийскогоалфавита> | <Цифра>158
-
Похожие работы
- Технология построения естественно-языковых интерфейсов к структурированным источникам данных
- Матрично-реляционная модель данных в организационно-производственных системах мониторинга и управления
- Методы визуального построения и сопровождения информационных систем на основе иерархического расширения реляционной модели данных
- Метод автоматизированного синтеза объектно-реляционной базы данных АСУП
- Семантическое программирование задач спектрального метода теории управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность