автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели

кандидата технических наук
Курганов, Владимир Юрьевич
город
Рязань
год
2005
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели»

Автореферат диссертации по теме "Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели"

На правах рукописи

КУРГАНОВ Владимир Юрьевич

РАЗРАБОТКА И ИССЛЕДОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ГИБРИДНЫМИ ДАННЫМИ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ НА ОСНОВЕ УНИВЕРСАЛЬНОЙ МОДЕЛИ

Специальность 05.13.11 - "Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей"

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Рязань 2005

Работа выполнена на кафедре вычислительной и прикладной математики ГОУВПО «Рязанская государственная радиотехническая академия».

Научный руководитель: доктор технических наук, профессор

Белов Владимир Викторович

Официальные оппоненты: доктор технических наук, профессор

Еремеев Виктор Владимирович

кандидат технических наук, доцент Баранчиков Алексей Иванович

Ведущая организация: Московский государственный

институт электроники и математики, г. Москва.

Защита диссертации состоится « 1 » июня 2005 г. в И часов на заседании диссертационного совета Д212.211.01 в ГОУВПО «Рязанская государственная радиотехническая академия» по адресу: 390005, г. Рязань, ул. Гагарина, 59/1.

С диссертацией можно ознакомиться в библиотеке ГОУВПО «Рязанская государственная радиотехническая академия».

Автореферат разослан « 30 » апреля 2005 г.

Ученый секретарь диссертационного совета к.т.н., доцент

В.Н. Пржегорлинский

ZOOfe-A-

-T2SS- /YYf&PP

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. В настоящее время огромное количество гетерогенной информации становится доступным в электронном виде. Очень часто одна и та же информация в разных информационных источниках может быть представлена в виде данных разной структуры. Примером таких информационных ресурсов могут служить электронные библиотеки и коллекции данных. Назначение систем такого рода как раз и состоит в том, чтобы хранить разнородные информационные ресурсы. В добавление к этому данные, интегрируемые из распределенных разнородных источников, очень часто являются слабоструктурированными, т.е. лишенными четкой, фиксированной структуры. Разработчикам при проектировании современных информационных систем (ИС) все чаще и чаще приходится сталкиваться с проблемой хранения и обработки одновременно структурированных и Слабоструктурированных данных (нерегулярные, несогласованные данные с явно выраженными структурными алогизмами) - гибридных данных, представленных с помощью различных форматов и моделей представления данных.

Структурированные данные - это данные, имеющие регулярную, фиксированную структуру, которая выявляется на этапе проектирования ИС, т.е. схема данных известна заранее и неизменна (статична). Задачи моделирования структурированных данных опираются на принцип фиксированной схемы.

Слабоструктурированные данные - это данные, которые не имеют постоянной, четко определенной структуры, т.е. их структура, тип и состав могут динамически изменяться. В слабоструктурированных данных можно выделить ту или иную структуру, однако эта структура заранее целиком или частично неизвестна или может потенциально измениться.

В последние несколько лет в научных исследованиях в области баз данных появилось новое направление, которому собственно и посвящена эта работа, - управление гибридными данными сложной нестабильной структуры. На сегодняшний день пока отсутствует полная и систематическая теория управления слабоструктурированными данными.

Несмотря на достаточно большое количество разнообразных моделей представления структурированных и слабоструктурированных данных, разработанных к настоящему времени, существует достаточно большой класс задач, связанных с моделированием гибридных данных сложной нестабильной структуры, синтезирующих структурированные и слабоструктурированные данные. Решение этих задач современными инструментами моделирования недостаточно эффективно. Для традиционных моделей представления структурированных данных (реляционная, объектная, объектно-реляционная модели представления данных) разработаны эффективные способы физического хранения и методы эффективного доступа к структурированным данным. В свою очередь модели представления слабоструктурированных данных (графовые XML) позволяют

1 ysragj

описать данные любой структуры, основное их назначение - нахождение общей схемы при интеграции данных из различных гетерогенных источников, извлечение схемы из слабоструктурированных данных. При этом такие модели не имеют возможности описать семантическую информацию о моделируемых объектах, следствием чего являются отсутствие механизмов эффективного хранения и эффективного доступа к данным и невозможность использования данных моделей в контексте управления базами данных с точки зрения теории баз данных.

Специфика разработки систем управления гибридными данными (СУГД) обусловливает необходимость создания новой модели представления гибридных данных сложной нестабильной структуры, которая позволила бы с единых концептуальных позиций изложить совместное представление данных жесткой и слабой структуры, выявить специфику семантической информации о моделируемых объектах с целью обеспечения эффективного (универсального) доступа к таким данным, эффективного хранения (с минимальной информационной избыточностью) и эффективной обработки (использования стандартных средств для обработки одновременно структурированных и слабоструктурированных данных).

Управление гибридными данными ставит проблемы их хранения, манипулирования и обработки. Отсутствие универсального механизма доступа к таким информационным источникам делает невозможным эффективное хранение, обработку и управление данными со сложной, а главное - нестабильной структурой. От того, как будет организована работа с такими данными, зависит эффективность хранения и извлечения информации в электронных библиотеках, корпоративных хранилищах, которые составляют основу большинства современных информационных систем.

Таким образом, необходимо универсальное, однородное представление (организация) гибридных данных с целью обеспечения эффективного универсального доступа к ним, хранения и дальнейшей автоматизированной программной обработки.

Наиболее полно теоретические вопросы моделирования структурно-нестабильных данных, а также концепции построения систем управления структурно-нестабильными данными изложены в научных работах Калини-ченко Л.А., Бунемана П., Уидома Д., Абайтбоула С., Винера Д., Линга Т., Мо И., Ульмана Д., Дэвидсона С. и других авторов.

Диссертационная работа посвящена вопросам разработки систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели.

Целью работы являются разработка и исследование способов проектирования систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели, позволяющей с единых концептуальных позиций изложить совместное представление данных с жесткой и слабой структурой в однородном каноническом виде с целью обеспечения унифицированного доступа, эффективного безызбыточного хранения и автоматизированной прб^йММиой'обработки.

, "«Й 'Уу* *

Для достижения поставленной цели решаются следующие задачи:

-формализация представления гибридных данных сложной нестабильной структуры;

-разработка формализованного описания слабоструктурированной схемы данных;

-разработка и исследование условно-нормальной формы для слабоструктурированной схемы данных;

- разработка эвристических алгоритмов реструктуризации слабоструктурированной схемы данных;

-создание методологии проектирования слабоструктурированных баз данных;

-создание технологии проектирования и разработка архитектуры систем управления гибридными данными на основе универсальной модели.

Методы исследования. Исследования осуществлялись на основе теории множеств, теории графов, теории баз данных, методов системного анализа, методов структурного и компонентно-ориентированного программирования.

Научная новизна

1.В диссертации разработана универсальная модель представления гибридных данных сложной нестабильной структуры, позволяющая с единых концептуальных позиций изложить совместное представление данных с жйсткой и слабой структурой.

2. На основе положений теории множеств и теории баз данных предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных, позволяющие в рамках единой концепции описать представление гибридных данных.

3. Разработана новая характеристика структуры слабоструктурированной схемы данных - условно-нормальной форма.

4. Разработаны эвристические алгоритмы реструктуризации слабоструктурированной схемы данных с целью исключения функциональных зависимостей, следствием которых является информационная избыточность, возникающая при хранении данных.

5. Разработан рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных на основе логической модели -слабоструктурированной схемы данных.

6. Предложена общая методология проектирования слабоструктурированных баз данных на основе универсальной модели представления гибридных данных сложной нестабильной структуры.

Практическая ценность. Результаты диссертационной работы являются основой для проектирования слабоструктурированных баз данных и систем управления гибридными данными. Предложенное в диссертации формализованное описание слабоструктурированной схемы данных, с единых концептуальных позиций излагающее совместное представление дан-

ных с жесткой и слабой структурой, позволяет осуществить унификацию процесса проектирования современных баз данных за счет снижения вероятности принятия ошибочных проектных решений и упрощения процесса сопровождения информационных систем. Проектирование слабоструктурированных баз данных с использованием предложенной методологии позволяет создавать хранилища гибридных данных, характеризующихся эффективным доступом, безызбыточным хранением и обеспечивающих эффективную обработку гибридных данных. Результаты исследований, проведенные в рамках диссертационной работы, были применены:

■ при проектировании и внедрении программно-информационной системы поддержки ремонтно-восстановительных работ энергооборудования «АРМ-СМЕТА» на предприятии федерального масштаба ОАО «Рязанская ГРЭС»;

■ при проектировании и внедрении программной системы управления нормативно-справочной информацией на ремонт энергооборудования на ОАО «Рязанская ГРЭС»;

• в учебном процессе ГОУВПО «Рязанская государственная радиотехническая академия» (для студентов специальностей 351400 «Прикладная информатика в экономике» и 220400 «Программное обеспечение вычислительной техники и автоматизированных систем» при изучении дисциплин, связанных с информационными технологиями в экономике).

Внедрение результатов. Разработанные в диссертационной работе теоретические и практические результаты внедрены на предприятии федерального масштаба ОАО «Рязанская ГРЭС», в учебный процесс ГОУВПО «Рязанская государственная радиотехническая академия».

Разработанные программные продукты имеют свидетельства об официальной регистрации программных систем и баз данных в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ):

1) программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА», свидетельство № 2003612625 от 02.12.2003;

2) программная система управления нормативно-справочной информацией на ремонт энергооборудования, свидетельство № 2003612626 от 02.12.2003;

3) база данных нормативно-справочной информации на ремонт энергооборудования, свидетельство № 2003620259 от 02.12.2003.

Достоверность основных положений и полученных результатов диссертационной работы подтверждается корректным использованием математического аппарата, моделированием на ЭВМ, разработкой действующих программных систем и слабоструктурированной базы данных, защищенных свидетельствами об официальной регистрации разработанных программ для ЭВМ и базы данных соответственно, и внедрением полученных результатов.

Апробация работы. Основные результаты диссертационной работы представлены и обсуждены на 10-й международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», г. Рязань, Рязанская государственная радиотехническая академия, 2001 г.; 11-й международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», г. Рязань, Рязанская государственная радиотехническая академия, 2002 г.; 8-й всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании» НИТ-2003, г. Рязань, Рязанская государственная радиотехническая академия, 2003 г.; 12-й международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», г. Рязань, Рязанская государственная радиотехническая академия, 2004 г.; 9-й всероссийской научно-технической конференции студентов, молодых ученых и специалистов, г. Рязань, Рязанская государственная радиотехническая академия, 2004 г.; 30-й межвузовской научно-практической конференции «Информационно-телекоммуникационные технологии», г. Рязань, РВВКУС, 2004 г.; а также на научных семинарах кафедры ВПМ, РГРТА.

Публикации по теме диссертации. По теме диссертации опубликовано 14 печатных работ, среди которых 2 статьи в центральной печати, 1 статья в межвузовском сборнике научных трудов, 8 тезисов к докладам на международных и всероссийской научно-технических конференциях и 3 свидетельства об официальной регистрации программ.

Основные результаты выносимые на защиту.

1. Универсальная модель представления гибридных данных сложной нестабильной структуры.

2. Формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных.

3. Новая характеристика структуры слабоструктурированной схемы данных - условно-нормальная форма.

4. Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных.

5. Рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, основных обозначений и сокращений, списка использованной литературы и приложений. Основной текст содержит 169 страниц, 19 таблиц, 42 рисунка. Список литературы состоит из 128 наименований. Приложения выполнены на 15 страницах.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, определены цели и задачи исследований, представлены основные положения диссертационной работы, которые выносятся на защиту.

Первая глава посвящена обоснованию темы диссертации. В главе определяются основные цели и задачи разработки систем управления гибридными (структурно-нестабильными) данными, проблемы манипулирования и хранения структурно-нестабильной информации, приводятся основные направления исследований данной проблемы и обзор работ. Особое внимание уделено моделям представления данных (структурированным и слабоструктурированным) как инструментам моделирования, приводятся их классификация и анализ, на основе которого обоснована актуальность проблемы совместного представления структурированных и слабоструктурированных данных и разработки новой универсальной модели представления гибридных данных. Предложена классификация свойств схем слабоструктурированных данных. Осуществлена классификация современных методов и способов хранения структурно-нестабильных данных. Предложены новые подходы к моделированию гибридных данных.

Во второй главе предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабострукгурированной базы данных на основе положений теории множеств и теории баз данных, позволяющие в рамках единой концепции описать представление гибридных данных. Определены основные типы ограничений, описанных в теории баз данных, применительно к универсальной модели представления данных - предложен формализм расширенных функциональных зависимостей как некоторое предположение относительно структуры схемы данных, позволяющий выявить расширенные функциональные зависимости на слабоструктурированной схеме данных. Введено понятие расширенной функциональной зависимости на слабоструктурированной схеме данных. Выделено и математически описано понятие иерархического ключа слабоструктурированного объекта.

Универсальная модель представления гибридных данных сложной нестабильной структуры основывается на трех основных концепциях: слабоструктурированные объекты, атрибуты (атомарные атрибуты, абсолютный иерархический ключ, относительный иерархический ключ, однозначные атрибуты, многозначные атрибуты, обязательные атрибуты, необязательные атрибуты, фиксированные атрибуты, нефиксированные атрибуты, атрибуты известной и неизвестной структуры) и связь типа «родитель-потомок».

Слабоструктурированный объект - это абстрактный объект, представляющий собой неоднородную схему, характеризующуюся нестабильной структурой (множество атрибутов экземпляра слабоструктурированного объекта не является фиксированным и регулярным).

Экземпляр слабоструктурированного объекта - это физически осязаемый, конкретный представитель определенного слабоструетурированного объекта в слабоструктурированной базе данных, атрибуты которого имеют вполне определенные значения. Экземпляр слабоструктурированного объекта является носителем слабоструктурированного объекта, в свою очередь слабоструктурированный объект по своей природе является схемой.

Слабоструктурированная схема данных - это шаблон слабоструктурированной базы данных моделируемой гетерогенной среды, который реализует логическую модель слабоструктурированной базы данных:

5 -<0,А,Р,Ь,М,Р,Я,г >, где О - конечное множество слабоструктурированных объектов на схеме данных 5;

А- конечное множество атрибутов, отделенных от множества О; Р- множество расширенных функциональных зависимостей на схеме данных 5;

¿-функция, определенная на множестве А, такая что А——>М; каждому атрибуту а е А ставится в соответствие кортеж из множества М\ М-множество, такое что Л/ = 0,х02х...х0„, где для /е {1,2,...,и} б, -множество метасвойств, образующих 1-ю группу метасвойств; Р-функция, определенная на множестве О, такая что О—о"',...,о*к\ где о,"' , г е {1,2,..., к} - дочерний слабоструктурированный объект, о"' еО; т^,...,тк - допустимая степень вложенности экземпляров дочерних слабоструктурированных объектов о1,...,ок для соответствующего экземпляра родительского объекта; т1 = 1 - обязательно имеется единственная дочерняя вершина, размеченная как о,; т, = + - обязательно имеется хотя бы одна дочерняя вершина, размеченная как о, (может быть и несколько дочерних вершин); т, = * - возможно наличие нескольких дочерних вершин, размеченных как о, (дочерние вершины могут и отсутствовать); т1 = ? -возможно наличие единственной дочерней вершины, размеченной как о, (дочерняя вершина может и отсутствовать);

Л - функция, определенная на множестве О, О——>А ; атрибут а определен для слабоструктурированного объекта оеО, если а е /?(о); г - корневой слабоструктурированный объект, г е О.

Рассмотрим в качестве примера слабоструктурированную схему данных 8=<0,А,Р,Ь,М,РЛ,г>\ 0 = {А,В,С,Щ,

ф)=[с+], р(с)=[], />(/>)=[],

г- А - корневой объект.

Абсолютные иерархические ключи объектов: к[А]={А.а^}, К[в]={А.а1,ВЬ1), к[с]={А.а„В.Ь,,С.с,}, А:[/>]= {Л.а„Ш,}.

Графическое представление схемы данных 5 в виде диаграммы приведено на рис. I.

Атрибуты

Хлабострукгурироваиный Спецификация свойств объест атрибутов:

____<У> -нефиксированный,

I <АР: ?>. I <Р> -фиксированный,

<Я> -обязательный, <Ы11> -необязательный, <БУ> -однозначный, <МУ>- многозначный, <5> -известной структуры, -^моеристика -неизвестной структуры

А - спецификатор ключевого атрибута

%1

Метасвойстаа

Рис. 1. Диаграмма слабоструктурированной схемы данных

Экземпляр слабоструктурированной базы данных, основанный на соответствующей слабоструктурированной схеме S =<0,A,F, L, М, Р, R,r >, обозначается Т> S - это дерево экземпляров слабоструктурированных объектов, определяемое как:

Т =< N, lab, obj, att,val, root >, где N- конечное множество вершин дерева; lab - функция разметки вершин дерева, N —>0\JA; если lab(n) е О, то вершина пе N представляет слабоструктурированный объект; если lab(n) е А, то вершина пе N представляет атрибут; obj - функция, частично определенная на множестве N, N— для пе N obj(rí) определена, если lab(ri) = о и оеО, т.е. вершина п представляет слабоструктурированный объект. Функция obj(n) возвращает последовательность вершин [«,,..,,/jj,] дерева Т. Каждая вершина дерева Г из последовательности [и,.....] называется дочерней вершиной и представляет собой дочерний слабоструктурированный объект. Если obj(n) = [я,,...,«*], то 1аЬ{п\\...,1аЬ(пк) должны быть в последовательности

[о"',. ], определенной через функцию Р(о) на слабоструктурированной схеме данных S;

att -функция, частично определенная на произведении множеств Nх А >N , такая что att(n,á) = nx, где neN, ае A, lab(n) = о, lab(n1¡) = а , оеО, n¡ е N и я е R(o);

val - функция, частично определенная на множестве N, такая что для

пе N, такого что lab(n) е А, val(n) возвращает атомарное значение атрибута;

root - единственная отличная от других вершина дерева Т, называемая корневой вершиной, для которой lab(root) = г .

Дерево Т экземпляра слабоструктурированной схемы данных, соответствующее схеме данных 5jpHc. 1), представлено на рис. 2.

^Экземпляры Если вершина и размечена

слабострунуртфомнных как слабоструктурированный объект о 6 О, тогда функции obj и all определяют дочерние вершины для вершины п, которые (М разделяются на дочерние слабоструктурированные объекты и атрибуты согласно функциям Р и R на слабоструктурированной схеме данных S.

Чп7) vfn.) у(П|,) Фи) Фи) Ф „)

v(n,), v(iu), v(n5), v(n7), v(n«), v(nio), v(nn), Чпц). vfoi»), v(nij), v(tl|6), v(nn) - Значения атрибутов экземпляров слабоструктурированных объектов, представленных соответствующими вершинами

Рис. 2. Дерево экземпляра слабоструктурированной базы данных

Путь р = ргр2-----р„ на слабоструктурированной схеме данных S =< О, A,F,L, M, P,R,r> - это последовательность в виде pvp2.,...,.pn,

п> 1, где рх = root, для всех /е {l,2.....л—l} р,еО, р„ е OijA. Если

р„еА, тогда р„ е R(p„_t). Если р,еО для iе {2,3,...,и}, тогда

Путь q = qvq2.---.qn на дереве Т =< N,lab,obj,att,val,root >, T> S, является экземпляром пути Р~Р\Рг-'"-Рп на схеме данных S -<0,A,F,LyM,P,R,r >, обозначается q> р, если справедливо утверждение: /6 {1,2,...,л} lab{q,)= р,.

Ps - множество всех путей на схеме данных 5, Рг - множество всех путей на дереве 7)

Кортежем на дереве Т =<N, lab, obj, att, val, root > называется поддерево Г, =< Nl,lab,obj,att,val,rootl >, обозначаемое Г,еГ и соответствующее схеме данных S, Тх > S ; 1) roetx = root ; 2) N, с N ; 3) для каждого пути на схеме данных S существует путь на дереве Tt, Являющийся его экземпляром: Vp б Ps (3g е Ph (q t> /))); 4) йа дереве Г, не существует путей

(7, е Р7[, д2 е Рт<, которые являются экземплярами пути />, е Р5 и рге Р$ соответственно на слабоструктурированной схеме данных 5, для которых Рх=Рг-

^ЧиЧг 6 Рт, ((<?! > Р,)л(?2 > />2)л(р, * р2)).

Два кортежа Т{,Т2еТ идентичны на х е 0\}А и обозначается как

л

Г, =Г2, если справедливо утверждение:

(Г[х] = {и | (я е /У) л (1аЬ{п) = *)}) л (3л, е Г, [*] Эл2 е Г2 [х] и, =л2).

Пусть Б =<0,А,Р,1;,М,Р,К,г> - слабоструктурированная схема данных и пусть X &ОиА и .уеОиЛ.

Ограничение слабоструктурированных баз данных «у функционально зависит от X (X функционально обусловливает у)» обозначается как X => у.

Дерево Т удовлетворяет ограничению вида X => у , если справедливо утверждение:

(7; е Т)л (Т2 е т)л{X с ОЦ А)л^/х € X Т{ ->• ^(у е 01) а)л\т, =Г2

т.е. если кортежи Г/ и 7% совпадают наЛГ, то они совпадают и на у.

X'=> у - расширенная функциональная зависимость.

Иерархический ключ слабоструктурированного объекта О определяется следующим образом:

1) если г -О, т.е. О - корневой слабоструктурированный объект слабоструктурированной схемы данных 5, тогда К является абсолютным иерархическим ключом слабоструктурированного объекта О, если

{К=>0)л{Ш1сК К,=>0);

2) если г *0, т.е. слабоструктурированный объект О не является корневым объектом и располагается на я-м уровне иерархии слабоструктурированной схемы данных 5, т.е. РАТН3(Оп)=О0.О1.О2......Ол_х.Оя, (п > 0)

- путь до объекта Оп на схеме данных 5, тогда: если Кп_х - абсолютный иерархический ключ объекта , причём Кп_, ф 0 и справедливо утверждение (К с я(0„))л(Ш1 сК О), то Кп = ЛГ„_, и К - абсолютный иерархический ключ объекта Оп; ключ К - относительный иерархический ключ объекта Оя.

Значение атрибута а экземпляра слабоструктурированного объекта о, представленного вершиной л дерева Т, т.е. 1аЬ{п)-о и ае /?(о), обозначается п.а\ последовательность значений атрибутов символизируется п[А\=[п.а.....,п.ак], где А = [аи...,ак], а,$1?{о), Iе{1,2,...,*}.

Дерево Г удовлетворяет ограничению ключей вида о[л]=> о, если

Дерево Т удовлетворяет ограничению ключей вида о,[л]с о2[я] и ог\в\=> о2 (ограничению внешних ключей), если

Уи,€Г[0]](ЭП2€Г[02] («,М=«2[В])).

Третья глава посвящена вопросам проектирования эффективного безызбыточного хранилища гибридных данных. Разработана концепция условно-нормальной формы (УНФ) для слабоструктурированных данных, представляющая собой совокупность некоторых заданных характеристик схемы данных, позволяющая свести к минимуму наличие информационной избыточности. Разработан набор эвристических алгоритмов устранения различных расширенных функциональных зависимостей на слабоструктурированной схеме данных с целью сведения информационной избыточности к минимуму.

Слабоструктурированная схема 5 =<0,А,Р,Ь,М,Р,Я,г> находится в условно-нормальной форме, если:

1) каждый слабоструктурированный объект оеО имеет иерархический ключ К[о]; К[о}=> у, уе д(о), ЛГ[о]Г)>> = 0 иЭАГс /ф] Х=>у;

2) для любого дочернего слабоструктурированного объекта Ос е Р{Ор) и для соответствующего родительского объекта 0Р:

2.1) при добавлении множества атрибутов К[0Р]Г}К[0С] к множеству атрибутов объекта Ос схема данных Sc, корневым слабоструктурированным объектом которой является Ос, также будет находиться в УНФ;

2.2) к\Ор\с АГ[<Эс] и атрибуты слабоструктурированного объекта Ос транзитивно не зависят от множества атрибутов к\ор\, где к]рР\ - абсолютный иерархический ключ объекта 0Р; к\рс\ - абсолютный иерархический ключ объекта Ос.

Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных

Алгоритм 1 (рис. 3). Случай: К.\о\^> х,х=> у, хФК\о\, хС\К\о\=0.

5 =< О, А, Г, Ь,М ,Р,Л,г >, 0={А,В,С}, А = {ах,Ьх,Ь2,сх,с2}, Р{а)=[в'],

/>(я)=[с'], ф)«[], Ф)={6„62}, /?(С)= {с,,с2}, г = А,

Р = {(л.а, => ВЬХ\{ВЬ, => ВЪ2\{Алх => ВЪг)}.

Алгоритм 2 (рис. 4). Случай: К\о\^> х,х у, х Ф К\о\, хеК\о\.

5 =< 0,А,Р,Ь,М,Р,Р,г >, 0 = {о,ох,о2}, А = {а,Ъ,с,<1,е,/},Р{о) = \>\,о'\

Р(0,) = [], Р(о2) = [], Я(о)={а,Ь,с, , ф )={«}, ф2)=(/},г = 0,

Алгоритм 3 (рис. 5). Случай: к\о\=> х,х у, хфК\о], хГ\к[о]ф0.

S =< 0,A,F,L,M ,P,R,r >, О = {o,o¡,o2}, A = {a,b,c,d,e,f}, />(о) = [о* P(0|)=[], ф2) = [], R(o)={k,a,b}, R{0l)={c,d}, R{oj={e,f},r k[o\= [k,a,b], F = {(о.к,o.a => o,\(o.k,ob =>o2)}.

В четвертой главе сформулирована общая методология проектирования систем управления гибридными данными на основе универсальной модели. Предложена архитектура системы управления гибридными данными сложной нестабильной структуры на основе универсальной модели и общей методологии проектирования СУГД (рис. 6).

Разработан рекурсивный алгоритм отображения формирования предварительных реляционных отношений на основе слабоструктурированных схем данных, представляющих структурированную часть гибридных данных.

Рис. 6. Архитектура системы управления гибридными данными

Спроектирована логическая модель справочника структурных показателей свободных цен на энергоремонт с помощью универсальной модели и приведена к условно-нормальной форме эвристическими алгоритмами реструктуризации. Изложены результаты внедрения программной системы поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА».

В заключении приводится обобщение основных результатов диссертационной работы.

В приложениях представлены результаты практической реализации системы управления гибридными данными, копии актов о внедрении результатов диссертации и копии свидетельств об официальной регистрации разработанных программ и слабоструктурированных баз данных.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Рассмотрены проблемы представления и обработки данных в современных информационных системах, в качестве наиболее актуальной про-

блемы выделена необходимость совместного представления данных жесткой и слабой структуры. Предложена классификация свойств схем слабоструктурированных данных. Приведен обзор теоретических и практических решений, обеспечивающих возможность обработки и манипулирования структурно-нестабильными данными, обусловливающий необходимость создания новой модели представления данных. Выявлены недостатки существующих инструментов моделирования применительно к гибридным данным. Осуществлена классификация современных методов и способов хранения структурно-нестабильных данных. Предложены новые подходы к моделированию гибридных данных.

2. Разработана универсальная модель представления гибридных данных сложной нестабильной структуры, представляющая собой инструмент моделирования структурно-нестабильной информации, позволяющая с единых концептуальных позиций изложить совместное представление структурированных и слабоструктурированных данных для приведения в однородный канонический вид, с целью обеспечения унифицированного доступа к таким данным, эффективного хранения и эффективной автоматизированной программной обработки таких данных.

3. Предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных на основе положений теории множеств и теории баз данных, позволяющие в рамках единой концепции описать представление гибридных данных. Определены основные типы ограничений, описанных в теории баз данных, применительно к универсальной модели представления данных. Предложен формализм расширенных функциональных зависимостей как некоторое предположение относительно структуры схемы данных, позволяющий выявить расширенные функциональные зависимости на слабоструктурированной схеме данных. Введено понятие расширенной функциональной зависимости на слабоструктурированной схеме данных. Определены расширенные функциональные зависимости не только между атрибутами слабоструктурированных объектов («атрибут-атрибут»), но и функциональные зависимости вида «объект-объект», «объект-атрибут», «атрибут-объект». Выделены и математически описаны понятия абсолютного и относительного иерархического ключа слабоструктурированного объекта.

4. Показано, что наличие различных расширенных функциональных зависимостей на слабоструктурированной схеме данных является причиной возникновения информационной избыточности, различных аномалий, в случае если слабоструктурированная схема данных спроектирована некорректно. Разработана концепция условно-нормальной формы для слабоструктурированной схемы данных, представляющая собой совокупность некоторых заданных характеристик схемы данных, позволяющая свести к минимуму наличие информационной избыточности.

5. Разработан набор эвристических алгоритмов устранения различных расширенных функциональных зависимостей на слабоструктурированной схеме данных с целью сведения информационной избыточности к миниму-

му Разработана алгоритмическая аппроксимация неформальной процедуры реструктуризации слабоструктурированной схемы данных (итерационный алгоритм). Сформулированы основные принципы и основные этапы процесса моделирования гибридных данных, образующие методологию проектирования слабоструктурированных баз данных на основе универсальной модели.

6. Сформулирована общая методология проектирования систем управления гибридными данными на основе универсальной модели. Предложена архитектура системы управления гибридными данными сложной нестабильной структуры на основе универсальной модели и общей методологии проектирования СУГД.

7. Предложена физическая модель хранения гибридных данных на основе реляционной СУБД. Разработан рекурсивный алгоритм формирования предварительных реляционных отношений на основе слабоструктурированной схемы данных, представляющих структурированную часть гибридных данных.

8. Спроектирована логическая модель справочника структурных показателей свободных цен на энергоремонт с помощью универсальной модели представления гибридных данных сложной нестабильной структуры. С помощью эвристических алгоритмов реструктуризации слабоструктурированная схема данных справочников структурных показателей приведена к условно-нормальной форме. Изложены результаты внедрения программной системы поддержки ремонтно-восстановительных работ на энергогенери-рующем предприятии «АРМ-СМЕТА».

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Курганов В.Ю., Блынский Л.Г. Моделирование иерархических структур // Приборы и системы. Управление, контроль, диагностика. 2003. №9.

2. Курганов В.Ю., Блынский Л.Г. Организация хранилища данных для передачи информации между уровнями АСУТП и АСУ СП // Автоматизация в промышленности. 2003. № 9. С. 56-59.

3. Курганов В.Ю. Современные тенденции развития и исследований в области реляционных систем управления базами данных // Математическое и программное обеспечение вычислительных систем: Межвуз. сб. науч. тр. / Под ред. Л.П. Коричнева. Рязань: Минобразования России, РГРТА, 2002. С. 118-124.

4. Курганов В.Ю., Белов В.В. Специфика построения базы данных типового справочника по материалам, запасным частям и трудозатратам // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Тез. докл. 10-й международной науч.-техн. конф, Рязань: РГРТА, 2001. С. 127-129.

5. Курганов В.Ю., Белов В.В., Ермаков В.В. Иерархическая система информационно-аналитической поддержки ремонтных работ на крупном энергогенерирующем предприятии // Проблемы передачи и обработки ин-

формации в сетях и системах телекоммуникаций: Тез. докл. 11-й международной науч.-техн. конф. Рязань: РГРТА, 2002. С. 27-29.

6. Курганов В.Ю., Белов В.В., Ермаков В.В. Проектирование подсистемы ведения нормативно-справочной информации для системы автоматизированного планирования и учета ремонтных работ на крупном энергоге-нерирующем предприятии // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Тез. докл. 11-й международной науч.-техн. конф. Рязань: РГРТА, 2002. С. 29-31.

7. Курганов В.Ю., Ермаков В.В., Уварова Е.А. Технология XML как формат обмена данными в распределенных информационных системах с изменяющейся структурой данных // Новые информационные технологии в научных исследованиях и в образовании НИТ-2003: Тез. докл. VIII всероссийской науч.-техн. конф. студентов, молодых ученых и специалистов. Рязань: РГРТА, 2003. С. 116-118.

8. Курганов В.Ю. Концепция построения и архитектура объектного хранилища информации сложной нестабильной структуры на основе универсальной модели представления данных // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Тез. докл. 12-й международной науч.-техн. конф. Рязань: РГРТА, 2004. С. 16-19.

9. Курганов В.Ю. Универсальная модель представления данных сложной нестабильной структуры // Новые информационные технологии в научных исследованиях и в образовании НИТ-2004: Тез. докл. IX всероссийской науч.-техн. конф. студентов, молодых ученых и специалистов. Рязань: РГРТА, 2004. С. 140-142.

10 Курганов В.Ю. Алгоритм трансформации универсальной модели данных в ОР-модель // Новые информационные технологии в научных исследованиях и в образовании НИТ-2004: Тез. докл. IX всероссийской науч.-техн. конф. студентов, молодых ученых и специалистов. Рязань: РГРТА,, 2004. С. 142-144.

11. Курганов В.Ю., Коричнев Л.П. Структурная характеристика слабоструктурированной схемы данных // Информационно-телекоммуникационные технологии: Тез. докл. 30-й межвузовской науч.-практ. конференции. Рязань: РВВКУС, 2004. С. 64-65.

12. Курганов В.Ю. Программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА» / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612625 от 02.12.2003.

13. Курганов В.Ю. База данных нормативно-справочной информации на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003620259 от 02.12.2003.

14. Курганов В.Ю., Белов В.В., Ермаков В.В. Программная система управления нормативно-справочной информацией на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612626 от 02.12.2003.

КУРГАНОВ Владимир Юрьевич

РАЗРАБОТКА И ИССЛЕДОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ГИБРИДНЫМИ ДАННЫМИ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ НА ОСНОВЕ УНИВЕРСАЛЬНОЙ МОДЕЛИ

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано в печать 29.04.05. Формат бумаги 60x84 1/16. Бумага офсетная. Печать трафаретная. Усл. печ. л. 1,0. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ. ГОУВПО «Рязанская государственная радиотехническая академия». 390005, Рязань, ул. Гагарина, 59/1. Редакционно-издательский центр РГРТА.

11-79 8 6

РНБ Русский фонд

2006-4 7255

Оглавление автор диссертации — кандидата технических наук Курганов, Владимир Юрьевич

ВВЕДЕНИЕ.

ГЛАВА 1. ПРОБЛЕМЫ ПРЕДСТАВЛЕНИЯ И МОДЕЛИРОВАНИЯ СТРУКТУРНО-НЕСТАБИЛЬНОЙ ИНФОРМАЦИИ ПРИ ПРОЕКТИРОВАНИИ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ.

1.1. Особенности обработки информации в современных информационных системах. Неоднородность информационных ресурсов.

1.1.1. Организация данных в современных информационных

Ф системах.

1.1.2. Гибридные данные. Основные понятия.

1.1.3. Классификация структурно-нестабильных данных.

1.2. Проблемы моделирования структурно-нестабильных данных.

1.2.1. Современные подходы к представлению структурно-нестабильных данных.

1.2.2. Классификация моделей представления данных.

1.3. Современные методы и способы хранения структурно-нестабильных данных. Классификация методов. Достоинства и недостатки.

1.3.1. Файловый метод.

1.3.2. Метод традиционных моделей представления данных.

1.3.3. Метод специализированных систем.

1.4. Новые подходы к моделированию структурно-нестабильных данных.

Основные результаты.

ГЛАВА 2. УНИВЕРСАЛЬНАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ГИБРИДНЫХ ДАННЫХ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ.

Предварительные замечания.

2.1. Структурная составляющая универсальной модели.

2.1.1. Структурные элементы универсальной модели.

2.1.1.1. Слабоструктурированные объекты. Экземпляры ^ слабоструктурированных объектов.

2.1.1.2. Связи.

2.1.1.3. Атрибуты. Свойства атрибутов (метасвойства).

2.2. Формализованное описание слабоструктурированной схемы данных.

2.3. Диаграмма слабоструктурированной схемы данных.

2.4. Формализованное описание экземпляра слабоструктурированной базы данных.

2.5. Диаграмма экземпляра слабоструктурированной базы данных.

2.6. Ограничения слабоструктурированных баз данных. Классификация ограничений.

2.6.1. Функциональные зависимости.

2.6.2. Формализм расширенных функциональных зависимостей.

2.6.3. Виды расширенных функциональных зависимостей.

2.6.4. Ключи. Внешние ключи.

2.6.5. Иерархические ключи. Абсолютные и относительные ключи.

2.6.6. Ограничения общего вида.

Основные результаты.

ГЛАВА 3. ПРОЕКТИРОВАНИЕ СЛАБОСТРУКТУРИРОВАННЫХ БАЗ ДАННЫХ НА ОСНОВЕ УНИВЕРСАЛЬНОЙ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ГИБРИДНЫХ ДАННЫХ.

3.1. Принципы проектирования слабоструктурированных баз данных на основе универсальной модели.

3.2. Аномалии, как следствие информационной избыточности на слабоструктурированной схеме данных.

3.3. Понятие условно-нормальной формы (УНФ) для слабоструктурированной схемы данных.

3.4. Реструктуризация слабоструктурированной схемы.

3.4.1. Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных.

3.4.1.1. Исключение транзитивной расширенной функциональной зависимости (случай 1).

3.4.1.2. Исключение транзитивной расширенной функциональной зависимости (случай 2).

3.4.1.3. Исключение транзитивной расширенной функциональной зависимости (случай 3).

3.4.1.4. Исключение некогерентной расширенной функциональной зависимости.

3.4.2. Итерационный алгоритм привидения схемы данных к условнонормальной форме.

Основные результаты.

ГЛАВА 4. ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ГИБРИДНЫМИ ДАННЫМИ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ.

4.1. Общая методология проектирования систем управления гибридными данными на основе универсальной модели.

4.2. Проектирование банка данных системы управления гибридными данными. Основные этапы.

4.2.1. Проектирование физической модели базы данных метаинформации.

4.2.2. Проектирование физической модели структурированной части гибридных данных.

4.2.2.1. Формирование предварительных реляционных отношений. Рекурсивный алгоритм.

4.2.2.2. Формирование таблиц базы данных.

4.2.3. Проектирование физической модели слабоструктурированной части гибридных данных.

4.2.3.1. Формирование предварительных реляционных отношений.

4.2.3.2. Формирование таблиц базы данных.

4.3. Архитектура систем управления гибридными данными. Основные компоненты системы.

4.4. Проектирование слабоструктурированной базы данных на примере справочников структурных показателей свободных цен на энергоремонт.

4.4.1. Специфика структуры документов нормативно-справочной информации на энергоремонт.

4.4.2. Проектирование логической модели справочника структурных показателей при помощи универсальной модели.

4.4.3. Проектирование базы данных структурированной части справочника структурных показателей.

4.5 Некоторые проектные решения.

4.5.1. Выбор средств разработки.

4.5.2. Технические и программные требования для создания и функционирования СУГД.

4.6. Результаты внедрения.

Основные результаты.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Курганов, Владимир Юрьевич

Актуальность проблемы. В настоящее время огромное количество гетерогенной информации становится доступным в электронном виде. Очень часто одна и та же информация в разных информационных источниках может быть представлена в виде данных разной структуры. Примером таких информационных ресурсов могут служить электронные библиотеки и коллекции данных. Назначение систем такого рода как раз и состоит в том, чтобы хранить разнородные информационные ресурсы. В добавление к этому данные, интегрируемые из распределенных разнородных источников, очень часто являются слабоструктурированными, т.е. лишенными четкой, фиксированной структуры. Разработчикам при проектировании современных информационных систем (ИС) все чаще и чаще приходится сталкиваться с проблемой хранения и обработки одновременно структурированных и слабоструктурированных данных — гибридных данных, представленных с помощью различных форматов и моделей данных.

Структурированные данные - это данные, имеющие регулярную, фиксированную структуру, которая выявляется на этапе проектирования ИС, т.е. схема данных известна заранее и неизменна (статична). Задачи моделирования структурированных данных опираются на принцип фиксированной схемы.

Слабоструктурированные данные — это нерегулярные, несогласованные данные с явно выраженными структурными алогизмами, которые не имеют постоянной, четко определенной структуры, т.е. их структура, тип и состав могут динамически изменяться. В слабоструктурированных данных можно выделить ту или иную структуру, однако эта структура заранее целиком или частично неизвестна или может потенциально измениться.

В последние несколько лет в научных исследованиях в области баз данных появилось новое направление, которому собственно и посвящена эта работа, - управление гибридными данными сложной нестабильной структуры.

На сегодняшний день пока отсутствует полная и систематическая теория управления слабоструктурированными данными.

Несмотря на достаточно большое количество разнообразных моделей представления структурированных и слабоструктурированных данных, разработанных к настоящему времени, существует достаточно большой класс задач, связанных с моделированием гибридных данных сложной нестабильной структуры, синтезирующих структурированные и слабоструктурированные данные. Решение этих задач современными инструментами моделирования недостаточно эффективно. Для традиционных моделей представления структурированных данных (реляционная, объектная, объектно-реляционная) разработаны способы эффективного физического хранения и методы эффективного доступа к структурированным данным. В свою очередь модели представления слабоструктурированных данных (графовые модели, деревья - OEM, XML) позволяют описать данные любой структуры, основное их назначение - нахождение общей схемы при интеграции данных из различных гетерогенных источников, извлечение схемы из слабоструктурированных данных. При этом такие модели не имеют возможности описать семантическую информацию о моделируемых объектах, следствием чего являются отсутствие механизмов эффективного хранения и эффективного доступа к данным и невозможность использования данных моделей в контексте управления базами данных с точки зрения теории баз данных.

Специфика разработки систем управления гибридными данными (СУГД) обусловливает необходимость создания новой модели представления гибридных данных сложной нестабильной структуры, которая позволила бы с единых концептуальных позиций изложить совместное представление данных жесткой и слабой структуры, выявить специфику семантической информации о моделируемых объектах с целью обеспечения эффективного (универсального) доступа к таким данным, эффективного хранения (с минимальной информационной избыточностью) и эффективной обработки (использования стандартных средств для обработки одновременно структурированных и слабоструктурированных данных).

Управление гибридными данными ставит проблемы их хранения, манипулирования и обработки. Отсутствие универсального механизма доступа к таким информационным источникам делает невозможным эффективное хранение, обработку и управление данными со сложной, а главное - нестабильной структурой. От того, как будет организована работа с такими данными, зависит эффективность хранения и извлечения информации в электронных библиотеках, корпоративных хранилищах, которые составляют основу большинства современных информационных систем.

Таким образом, необходимо универсальное, однородное представление (организация) гибридных данных с целью обеспечения эффективного универсального доступа к ним, хранения и дальнейшей автоматизированной программной обработки.

Наиболее полно теоретические вопросы моделирования структурно-нестабильных данных, а также концепции построения систем управления структурно-нестабильными данными изложены в научных работах Калиничен-ко JI.A., Бунемана П., Уидома Д., Абайтбоула С., Винера Д., Линга Т., Мо И., Ульмана Д., Дэвидсона С. и других авторов.

Диссертационная работа посвящена вопросам разработки систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели.

Целью работы являются разработка и исследование способов проектирования систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели, позволяющей с единых концептуальных позиций изложить совместное представление данных с жёсткой и слабой структурой в однородном каноническом виде с целью обеспечения унифицированного доступа, эффективного безызбыточного хранения и автоматизированной программной обработки.

Для достижения поставленной цели решаются следующие задачи:

- формализация представления гибридных данных сложной нестабильной структуры;

- разработка формализованного описания слабоструктурированной схемы данных;

- разработка и исследование условно-нормальной формы для слабоструктурированной схемы данных;

- разработка эвристических алгоритмов реструктуризации слабоструктурированной схемы данных;

- создание методологии проектирования слабоструктурированных баз данных;

- создание технологии проектирования и разработка архитектуры систем управления гибридными данными на основе универсальной модели.

Методы исследования. Исследования осуществлялись на основе теории множеств, теории графов, теории баз данных, методов системного анализа, методов структурного и компонентно-ориентированного программирования.

Научная новизна

1. В диссертации разработана универсальная модель представления гибридных данных сложной нестабильной структуры, позволяющая с единых концептуальных позиций изложить совместное представление данных с жёсткой и слабой структурой.

2. На основе положений теории множеств и теории баз данных предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных, позволяющие в рамках единой концепции описать представление гибридных данных.

3. Разработана новая характеристика структуры слабоструктурированной схемы данных - условно-нормальной форма.

4. Разработаны эвристические алгоритмы реструктуризации слабоструктурированной схемы данных с целью исключения функциональных зависимостей, следствием которых является информационная избыточность, возникающая при хранении данных.

5. Разработан рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных на основе логической модели - слабоструктурированной схемы данных.

6. Предложена общая методология проектирования слабоструктурированных баз данных на основе универсальной модели представления гибридных данных сложной нестабильной структуры.

Практическая ценность. Результаты диссертационной работы являются основой для проектирования слабоструктурированных баз данных и систем управления гибридными данными. Предложенное в диссертации формализованное описание слабоструктурированной схемы данных, с единых концептуальных позиций излагающее совместное представление данных с жёсткой и слабой структурой, позволяет осуществить унификацию процесса проектирования современных баз данных за счет снижения вероятности принятия ошибочных проектных решений и упрощения процесса сопровождения информационных систем. Проектирование слабоструктурированных баз данных с использованием предложенной методологии позволяет создавать хранилища гибридных данных, характеризующиеся эффективным доступом, безызбыточным хранением и обеспечивающие эффективную обработку гибридных данных. Результаты исследований, проведенные в рамках диссертационной работы, были применены: при проектировании и внедрении программно-информационной системы поддержки ремонтно-восстановительных работ энергооборудования (АРМ-СМЕТА) на предприятии федерального масштаба ОАО «Рязанская ГРЭС»; при проектировании и внедрении программной системы управления нормативно-справочной информацией на ремонт энергооборудования на ОАО «Рязанская ГРЭС»; в учебном процессе ГОУВПО «Рязанская государственная радиотехническая академия» (для студентов специальностей 351400 «Прикладная информатика в экономике» и 220400 «Программное обеспечение вычислительной техники и автоматизированных систем» при изучении дисциплин, связанных с информационными технологиями).

Внедрение результатов работы. Разработанные в диссертационной работе теоретические и практические результаты внедрены на предприятии федерального масштаба ОАО «Рязанская ГРЭС», в учебный процесс ГОУВПО «Рязанская государственная радиотехническая академия».

Разработанные программные продукты имеют свидетельства об официальной регистрации программных систем и баз данных в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ):

1) программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА», свидетельство № 2003612625 от 02.12.2003;

2) программная система управления нормативно-справочной информацией на ремонт энергооборудования, свидетельство № 2003612626 от 02.12.2003;

3)база данных нормативно-справочной информации на ремонт энергооборудования, свидетельство № 2003620259 от 02.12.2003.

Основные результаты выносимые на защиту

1. Универсальная модель представления гибридных данных сложной нестабильной структуры.

2. Формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных.

3. Новая характеристика структуры слабоструктурированной схемы данных - условно-нормальная форма.

4. Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных.

5. Рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных.

Структура диссертационной работы. Диссертационная работа состоит из введения, четырех глав, заключения, основных обозначений и сокращений, списка использованной литературы и приложений. Основной текст содержит 169 страниц, 19 таблиц, 42 рисунка. Список литературы состоит из 128 наименований. Приложения выполнены на 15 страницах.

Заключение диссертация на тему "Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели"

Основные результаты работы состоят в следующем.

1. Рассмотрены проблемы представления и обработки данных в современных информационных системах, в качестве наиболее актуальной проблемы выделена необходимость совместного представления данных жесткой и слабой структуры. Предложена классификация свойств схем слабоструктурированных данных. Приведен обзор теоретических и практических решений, обеспечивающих возможность обработки и манипулирования структурно-нестабильными данными, обусловливающий необходимость создания новой модели представления данных. Выявлены недостатки существующих инструментов моделирования применительно к гибридным данным. Осуществлена классификация современных методов и способов хранения структурно-нестабильных данных. Предложены новые подходы к моделированию гибридных данных.

2. Разработана универсальная модель представления гибридных данных сложной нестабильной структуры, представляющая собой инструмент моделирования структурно-нестабильной информации, позволяющая с единых концептуальных позиций изложить совместное представление структурированных и слабоструктурированных данных для приведения в однородный канонический вид, с целью обеспечения унифицированного доступа к таким данным, эффективного хранения и эффективной автоматизированной программной обработки таких данных.

3. Предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных на основе положений теории множеств и теории баз данных, позволяющие в рамках единой концепции описать представление гибридных данных. Определены основные типы ограничений, описанных в теории баз данных, применительно к универсальной модели представления данных. Предложен формализм расширенных функциональных зависимостей, как некоторое предположение относительно структуры схемы данных, позволяющий выявить расширенные функциональные зависимости на слабоструктурированной схеме данных. Введено понятие расширенной функциональной зависимости на слабоструктурированной схеме данных. Определены расширенные функциональные зависимости не только между атрибутами слабоструктурированных объектов («атрибут-атрибут»), но и функциональные зависимости вида «объект-объект», «объект-атрибут», «атрибут-объект». Выделены и математически описаны понятия абсолютного и относительного иерархического ключа слабоструктурированного объекта.

4. Показано, что наличие различных расширенных функциональных зависимостей на слабоструктурированной схеме данных является причиной возникновения информационной избыточности, различных аномалий, в случае, если слабоструктурированная схема данных спроектирована некорректно. Разработана концепция условно-нормальной формы для слабоструктурированной схемы данных, представляющая собой совокупность некоторых заданных характеристик схемы данных, позволяющая свести к минимуму наличие информационной избыточности.

5. Разработан набор эвристических алгоритмов устранения различных расширенных функциональных зависимостей на слабоструктурированной схеме данных с целью сведения информационной избыточности к минимуму. Разработана алгоритмическая аппроксимация неформальной процедуры реструктуризации слабоструктурированной схемы данных (итерационный алгоритм). Сформулированы основные принципы и основные этапы процесса моделирования гибридных данных, образующие методологию проектирования слабоструктурированных баз данных на основе универсальной модели.

6. Сформулирована общая методология проектирования систем управления гибридными данными на основе универсальной модели. Предложена архитектура систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели и общей методологии проектирования СУГД.

7. Предложена физическая модель хранения гибридных на основе реляционной СУБД. Разработан рекурсивный алгоритм формирования предварительных реляционных отношений на основе слабоструктурированной схемы данных, представляющих структурированную часть гибридных данных.

8. Спроектирована логическая модель справочника структурных показателей свободных цен на энергоремонт с помощью универсальной модели представления гибридных данных сложной нестабильной структуры. С помощью эвристических алгоритмов реструктуризации слабоструктурированная схема данных справочников структурных показателей приведена к условно-нормальной форме. Изложены результаты внедрения программной системы поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА».

ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

1НФ, 2НФ, Первая нормальная форма, вторая нормальная форма, третья нор

ЗНФ, 4НФ, мальная форма, четвертая нормальная форма, пятая нормальная

5НФ форма соответственно

АИК Абсолютный иерархический ключ

БД База данных

ГМ Графовая модель

ИС Информационная система мз Многозначная зависимость

НФ Нормальная форма

УНФ Условно-нормальная форма

НФБК Нормальная форма Бойса-Кодца оик Относительный иерархический ключ

ОСУБД Объектная СУБД

ОРСУБД Объектно-реляционная СУБД

О-модель Объектная модель

ОР-модель Объектно-реляционная модель

ООП Объектно-ориентированное программирование оод Объектно-ориентированный дизайн

ОС Операционная система

КОП Компонентно-ориентированное программирование

ПС Программная система

Р-модель Реляционная модель

РСУБД Реляционная СУБД

РФЗ Расширенная функциональная зависимость сед Слабоструктурированные данные

ССБД Слабоструктурированная база данных

ССГ Слабоструктурированный граф ссмд Слабоструктурированная модель данных ссо Слабоструктурированный объект сссд Слабоструктурированная схема данных

СУБД Система управления базами данных

СУГД Система управления гибридными данными

СУСД Система управления слабоструктурированными данными тз Транзитивная зависимость

УМД Универсальная модель представления гибридных данных

УНФ Условно-нормальная форма

ФЗ Функциональная зависимость

ЭВМ Электронная вычислительная машина

ЗАКЛЮЧЕНИЕ

Выполненная диссертационная работа включает исследования, направленные на разработку математического и программного обеспечения систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели.

Библиография Курганов, Владимир Юрьевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Abiteboul S. Querying semistructured data // In Proceedings of the International Conference on Database Theory. Delphi, Greece, 1997. P. 1-18.

2. Abiteboul S., Cluet S., Milo. T. A logical view over structured files // VLDB. 1998. V. 7. № 2. P. 96-114.

3. Abiteboul S., Cluet S., Milo T. Quering and updating the file // VLDB. 1993. P. 73-84.

4. Abiteboul S., Goldman R., McHugh J., Vassalos V., Zhuge Y. Views for semistructured data // Technical Report. Standford Universaty. 1997.

5. Abiteboul S., Quass D., Mchugh J., Widom J., Wiener J. The Lorel query language for semistructured data // International Journal on Digital Libraries. 1997. V. l.№ l.P. 68-88.

6. Abiteboul S., Christophides V., Cluet S., Scholl M. From structured documents to novel query facilities // SIGMOD RECORD. 2000. V. 23. № 2.1. P. 313-324.

7. Arocena G., Mendelzon A. WebOQL: Restructuring documents, databasesand Webs // In proceedings of the International Conference on Data Engineering: IEEE Computer Society, 1998. P. 23-33.

8. Ashish N., Knoblock C.A. Wrapper Generation for Semi-structured Internet Sources. Workshop on Management of Semistructured Data, May 1997.

9. Beech D., Lawrence S., Maloney M., Mendelsohn N., Thompson H. XML schema part 1: Structures. http://www.w3.org/TR/xmlschema-l/.

10. Biron P., Malhotra A. XML schema part 2: Datatypes // W3C Working Draft. http://www.w3.org/TR/1999/xmlschema-2/.

11. Borgida A., Brachman R. J., McGuiness D.L., Resnick L.A. CLASSIC: a structural data model for objects // In Proceedings of SIGMOD Conferenceon the Management of Data, 1989. P. 58-67.

12. Bouguettaya A., Benatallah В., Elmagarmid A. Interconnecting Heterogeneous Information Systems // Kluwer. Academic Publishers. 1998.

13. Bray Т., Hollander D., Layman A. Namespaces in XML // W3C Consortium Recommendation. http://www.w3.org/TR/REC-xml-names.

14. Bray Т., Paoli J., Sperberg-McQueen С. M., Maler E. Extensible markup language (XML) 1.0 (second edition) W3C recommendation. http://www.w3.org/TR/2000/REC-xml-20001006.

15. Buneman P. Semistructured data // In Proceedings of the Sixth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Tucson, 1997. P. 117-121.

16. Buneman P. Tutorial: Semistructured data // In proceedings of ACM symposium on Principles of Database systems, 1997. P. 117-121.

17. Buneman P., Davidson S., Fan W., Нага C., Tan W. The keys for XML // Proceedings of the 10th International World Wide Web Conference, 2001.

18. Buneman P., Davidson S., Fernandez M., Suciu D. Adding structure to unstructured data // In proceedings of ICDT, 1997.

19. Buneman P., Davidson S., Hilebrand G., Suciu D. A Query language and optimization techniques for unstructured data // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1996.1. P. 505-516.

20. Carey M.J. Towards heterogeneous multimedia information systems: The Garlic approach // In proceedings of RIDE-DOM Workshop, 1995.

21. Chawathe S., Garcia-Molina H., Hammer J., Ireland K, Ulman J., Widom J. The TSIMMIS project: Integration of heterogeneous information sources // Proceedings of the Tenth Anniversary Meeting. Information Processing Society of Japan, 1994. P. 7-18.

22. Chen P.P. The entity-relationship model: toward a unified view of data // ACM Trans, on Database Systems. 1976. P. 9-36.

23. Codd E.F. A relational model for large data banks // Comm. ACM. 1970. P. 377-387.

24. Codd E.F. Further Normalization of the Data base Relational Model // Data Base Systems. N.J.: Prentice-Hall. 1972. P. 33-64.

25. Cohen W. Integration of heterogeneous databases without common domains using queries based textual similarity // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1998.1. P. 201-212.

26. Cohen W.W. Integration of Heterogeneous Databases without Common Domains Using Queries Based on Textual Similarity // Proceedings of the ACM SIGMOD International Conference on Management of Data, 1998.1. P. 201-212.

27. Consens M. P., Milo. T. Algebras for querying text regions: Expressive power and optimization // Journal of Computer and System Sciences. 1998. № 3. P. 272-288.

28. Deutsch A., Fernandez M., Florescu D., Levy A., Suciu D. A query language for XML // In proceedings of the Eights International World Wide Web Conference (WWW8), Toronto, 1999.

29. Deutsch A., Fernandez M., Suciu D. Storing semistructured data with STORED // In proceedings of the ACM DIGMOD International Conference on Management of Data, 1999.

30. Dobbie G., Wu X., Ling T.W., Lee M. ORA-SS: An object-relationship attribute model for semistructured data. Technical Report TR21/00, School of Computing, National Universaty of Singapore. 2000.

31. Douglas B. The Object Data Standard: ODMG 3.0. Morgan Kauffmann Publishers. 2000.

32. Excelon, the ebusiness information server, http://www.odi.com/excelon.

33. Fernandez M., Florescu D., Kang J., Levy A., Suciu D. Catching the boat with Strudel: experiences with web-site management system // SIGMOD.1. P. 414-425.

34. Florescu D., Kossmann D. Storing and querying XML data using an RDBMS // IEEE Data Engineering Bulletin. 1999. № 3.

35. Fronckowiak J., Garcia M., Whalen E. SQL Server 7.0 Administrator's Companion // Prentice-Hall of India. 2001.

36. Gorskova E., Barashev D. Performance Evaluation of Different Representations of XML data in relational database. Extended abstract // In proceedings of International Conference On Databases and Information Systems. Bal-ticDB-2000, 2000.

37. Gravano L., Papakonstantinou Y. Mediating and Metasearching on the Internet // Data Engineering Bulletin. № 2. 1998.

38. Hammer J., Garcia-Molina H., Cho J., Aranha R., Crespo A. Extracting semistructured information from the Web // In proceedings of the Workshop on Semi-structured Data, Tucson, 1997.

39. Harman D., Fox E., Baeza-Yates R., Lee. W. Inverted files. In W. B. Frakes and R. A. Baeza-Yates, editors // Information Retrieval Data Structures and Algorithms. Prentice Hall. 1992. P. 28-43.

40. Himmeroder R., Lausen G., Ludasher В., Schlepphorst C. On a declarative semantics for web queries // In proceedings of the International Conference on Deductive and Object-Oriented Databases. Switzerland, 1997. P. 386-398.

41. Hull R., Zhou G. A framework for supporting data integration using the materialized and virtual approaches // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1996. p. 81-92.

42. IBM DB2 Universal Database XML Extender administration and programming // http://www-4.ibm.com/software/data/db2/extenders/xmlext/.

43. Kalinichenko L. A. Integration of Heterogeneous Semistructured Data Models in the Canonical One // In proceedings of the First All-Russian Conference on Digital Libraries. St. Petersburg, 1999.

44. Kalinichenko L. A. Integration of heterogeneous semistructured data modelsin the canonical One // In proceedings of the First All-Russian Conference on Digital Libraries. St. Petersburg, 1999.

45. Kalinichenko L.A. The Interoperable Environment Of Heterogenous Information Resources: A Generalization Perspective // In proceedings of The First International Workshop on Interoperability in Multidatabase Systems. Kyoto, 1991.

46. Kanne C., Moerkotte G. Efficient storage of XML Data // In proceedings of IEEE conference on Data Engineering. USA, California, 2000. P. 198-214.

47. Kimball R., Meta Data // DBMS magazine. 1998.

48. Konopnicki D., Shmueli O. W3QS: A query system for the World Wide Web // In Proceedings of the 21th International Conference on Very Large Databases, Zurich, 1996. P. 54-65.

49. Lahiri Т., Abiteboul S., Widom J. Ozone: integrating structured and unstructured data // In proceedings of the Eighth International Workshop on the Web and databases (WEBDB'2000), Dallas, 2000.

50. Lakshmanan L., Sadri F., Subramanian I. A declarative language for querying and restructuring the Web // In Proceedings of the 6th International Workshop on Research Issues in Data Engineering, 1996.

51. Levy A. Obtaining complete answers from incomplete databases // In proceedings of the International Conference on very large databases. Morgan Kaufmann Publishers Inc, 1996. P. 402-412.

52. Levy A.Y., Rajaraman A., Ordille J. Querying heterogeneous information sources using source descriptions // Proceedings of the International Conference on Very Large Data Bases, Morgan Kaufman Publishers, Inc., 1996. P. 251-262.

53. McBrien P., Poulovassilis A. A Semantic Approach to Integrating XML and Structured Data Sources // Proc. CAiSE'01, Springer-Verlag LNCS 2068, 2001. P. 330-345.

54. McBrien P., Poulovassilis A. Schema evolution in heterogeneous databasearchitectures // Proc. CAiSE'02. LNCS 2348. 2002. P. 484^99.

55. McHugh J., Abiteboul S., Goldman R., Widom J. LORE: A database management system for semistructured data // SIGMOD Record. 1997. V. 26. №3.

56. McHugh J., Widom J. Intergrating dynamically-fetched external information into a DBMS for semistructured data // Technical Report. Stanford Univer-saty. 1997.

57. Mendelzohn A., Mihaila G., Milo T. Querying the Word Wide Web // In proceedings of IEEE International conference on parallel and distributed information systems, 1996. P. 80-91.

58. Mendelzon A., Mihaila G., Milo T. Querying the World Wide Web // Digital libraries. 1997. № 1. P. 54-67.

59. Mendelzon A., Mihaila G., Milo T. Querying the World Wide Web. // Proceedings of the First International Conference on Parallel and Distributed Information System, 1996. P. 80-91.

60. Mendelzon A., Mihaila G., Milo T. Querying the WWW // International Journal on Digital Libraries. 1997. V. 1. № 1. P. 54-67.

61. Nayeem I. Distributed Objects Methodologies for Customizing Systems Software // IEEE Computer Society Press. 1996.

62. Nestorov S., Ullman J., Wiener J., Chawathe S. Representative objects: concise representation of semistructured hierarchical data // In proceedings of International Conference on Data Engineering, 1997. P. 79-90.

63. Object Management Group, http://www.omg.org/about/whorwe.htm.

64. Oracle XML SQL Utilities, http://otn.oracle.com/tech/mxl/oraclexsu/.

65. Paepcke A., Chang C., Garcia-Molina,H., Winograd T. Interoperability forф

66. Digital Libraries Worldwide // Communications of the ACM. 1998. № 4. P. 33-43.

67. POET content manager suit, http://www.poet.com/.

68. Quass D., Rajaraman A., Sagiv Y., Ullman J., Widom J. Querying semistructured heterogeneous information // Technical report. Stanford Universaty. 1995.

69. Robie J., Lapp J., Schach D. XML Query Language (XQL) // Workshop on XML Query Language. 1998.

70. Ryamond D, Tompa F., Wood D. From data representation to data models // ^ Computer standards and interfaces. 1996. № 1. P. 25-36.

71. Sahuguet A. Kweelt, the making-of: Mistakes made and lessons learned // Tecnical Report MS-CIS-00-23. University of Pennsylvania. 2000.

72. Scientific literature digital library, http://citeseer.ist.psu.edu/

73. Shanmugasundaram J, Shekita E., Barr R., Carey M., Lindsay В., Pirahesh H., Reinwald B. Efficiently publishing relational data as XML documents // In Proceedings of the 26th International Conference on Very Large Databases, VLDB'2000, 2000. P. 65-76.

74. Shanmugasundaram J, Tufte K., He G., Zhang C., DeWitt D., Naughton J. Relational databases for querying XML documents: Limitations and opporЩtunities // In Proceedings of the 25th International Conference on Very Large Data Bases, VLDB'99, 1999.

75. Shimura Т., Yoshikawa M., Uemura S. Storage and retrieval of XML documents using objectrelational databases // In Proceedings of the 10th International Conference on Database and Expert Systems Applications (DEXA'99), Florence, 1999.

76. Stonebraker M. Object-Relational DBMS: The Next Wave // Informix Software. С A. 1997.

77. Tamino An Internet database system, http://www.tamino.com.

78. The Araneus Project Web site. http://www.dia.uniroma3.it/Araneus.

79. Thompson H., Beech D., Maloney M., Mendelsohn N. XML scheme part 1: Structures // W3C Working Draft, 2000. http://www.w3.org/TR/xmlscheme-l/

80. Tseng F., Chen A., Yang W. Answering heterogeneous databases queries with degrees of uncertainty // Distributed and parallel databases. 1993. № 1. P. 281-302.

81. Ullman J. Principles of database and knowledge-base systems. Volumes 1, 2. // Computer Science Press. Rockville MD. 1989.

82. Wang K., Liu H.Q. Schema discovery from semistructured data // In proceedings of the International Conference on Knowledge Discovery and Data Mining, 1997.

83. XHTML 1.0: The extensible hypertext markup language // W3C Working Draft, http://www.w3.org/TR/1999/xhtml 1 -19990505/.

84. Y.Papakonstantinou, Garcia-Molina H, Widom J. Object Exchange across heterogeneous information sources // In proceedings of the 11th International Conference on Data Engineering, Taipei, 1995.

85. Zwol R., Apers P., Wilschut. A. Modelling and querying semistructured data with MOA // Workshop on Query processing for semistructured data and non-standard data formats. 1999.

86. Артемьев В.И. Обзор способов и средств построения информационных приложений // СУБД. 1996. № 6. С. 52-63.

87. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. М.: Финансы и статистика, 1999. 351 с.

88. Броди М. Интероперабельные информационные системы в науке. Сборник материалов семинара, Москва, Апрель 6-7, 1995.

89. Брюхов Д., Задорожный В., Калиниченко JI. Интероперабельные информационные системы: архитектуры и технологии // Системы управления базами данных. 1995. № 4.

90. Гарсиа-Молина Г., Ульман Дж., Уидом Д. Системы баз данных. Полный курс / Пер. с англ. М.: Издательский дом «Вильяме», 2003. 1088 с.

91. Д. Мей ер. Теория реляционных баз данных. М.: Мир, 1984.

92. Дейт К. Введение в базы данных. Изд. 6-е. Киев, «Диалектика», 1998.

93. Игнатович Н. Интеграция технологий управления данными в DB2 // Открытые системы. 2001. № 7.

94. Игнатович Н. Семейство реляционных баз данных IBM DB2 // Системы управления базами данных. 1997. № 2.

95. Калиниченко JI.A., Брюхов Д.О., Задорожный В.И., Курошев М.Ю., Шумилов С.С. Интероперабельные информационные системы: архитектуры и технологии // СУБД. 1995. № 4.

96. Когаловский М.Р. Абстракции и модели в системах баз данных // СУБД. 1998. №8.

97. Когаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика, 2002. 800 с.

98. Круглински Д., Уингоу С., Шефферд Д. Программирование на Visual С++ 6.0 для профессионалов. ИД «Русская редакция». 854 с.

99. Кузнецов С.В. Введение в информационные системы // Системы управления базами данных. 1997. № 2.

100. Курганов В.Ю. База данных нормативно-справочной информации на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003620259 от 02.12.2003.

101. Курганов В.Ю. Программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА» / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612625 от 02.12.2003.

102. Курганов В.Ю., Белов В.В., Ермаков В.В. Программная система управления нормативно-справочной информацией на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612626 от 02.12.2003.

103. Курганов В.Ю., Блынский Л.Г. Моделирование иерархических структур // Приборы и системы. Управление, контроль, диагностика. 2003. № 9.

104. Курганов В.Ю., Блынский Л.Г. Организация хранилища данных для передачи информации между уровнями АСУТП и АСУСП//Автоматизация в промышленности. 2003. № 9. С. 56-59.

105. Курганов В.Ю., Коричнев Л.П. Структурная характеристика слабоструктурированной схемы данных // Информационно-телекоммуникационные технологии: Тез. докл. 30-й межвузовской науч.-практ. конференции. Рязань: РВВКУС, 2004. С. 64-65.

106. Ладыженский Г.М. Архитектура корпоративных информационных систем. // Системы управления базами данных. 2001. № 6.

107. Луни К. Oracle 8. Настольная книга администратора. М.: Изд-во ЛОРИ, 1999. 500 с.

108. Марков А.С., Лисовский К.Ю. Базы данных: Введение в теорию и методологию. М.: Финансы и статистика, 2004. 511 с.

109. Некрестьянов И.С. Тематико-ориентированные методы информационного поиска: Дис. докт. техн. наук. СПбГУ. 2000.

110. Официальный сайт издательства «Открытые системы». http://www.osp.ru

111. Павлова Е.Ю. Некоторые аспекты поддержки целостности в базах данных: Дис. докт. техн. наук. СПбГУ. 2000.

112. Плесневич Г.С. Концептуальные схемы и модели данных // Изв. АН СССР. Техн. Кибернетика. 1984. № 5. С. 23-39.

113. Пржиялковский В. В. Абстракции в проектировании БД // СУБД. 1998. № 1. С. 90-97.

114. Пржиялковский В. В. Модели, базы данных и СУБД в информационных системах // Вычислительный центр РАН, М., 1996. С. 34-43.

115. Санблед С., Санблед П. Разработка масштабируемых приложений для Microsoft Windows. ИД «Русская редакция». 416 с.

116. Справочник структурных показателей для формирования свободных цен на энергоремонт в условиях перехода к рыночной экономике ч.1-8 // ЦКБ Энергоремонт. 1993.

117. Хоторн Р. Разработка баз данных Microsoft SQL Server 2000 в примерах. Вильяме, 2001. 464 с.

118. Шпеник М., Следж О. Руководство администратора баз данных Microsoft SQL Server 2000. 2001. 928 с.