автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Построение оптимального репозитория атрибутов и отношений для интеграции реляционных баз данных

кандидата технических наук
Попов, Сергей Геннадьевич
город
Санкт-Петербург
год
2010
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Построение оптимального репозитория атрибутов и отношений для интеграции реляционных баз данных»

Автореферат диссертации по теме "Построение оптимального репозитория атрибутов и отношений для интеграции реляционных баз данных"

004617592

На правах рукописи

Попов Сергей Геннадьевич

ПОСТРОЕНИЕ ОПТИМАЛЬНОГО РЕПОЗИТОРИЯ АТРИБУТОВ И ОТНОШЕНИЙ ДЛЯ ИНТЕГРАЦИИ РЕЛЯЦИОННЫХ БАЗ ДАННЫХ

СПЕЦИАЛЬНОСТЬ

05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук

1 5 ЛЕК 2013

Санкт-Петербург — 2010

004617592

Работа выполнена в государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный политехнический университет».

Научный руководитель: доктор технических наук, профессор

Заборовский Владимир Сергеевич

Официальные оппоненты: доктор технических наук, профессор

Гаврилова Татьяна Альбертовна

кандидат технических наук Волков Михаил Владимирович

Ведущая организация: Санкт-Петербургский институт ин-

форматики и автоматизации Российской академии наук

Защита состоится « 23 >> декабря 2010 года в 16 часов на заседании диссертационного совета Д 212.229.18 ГОУ ВПО «Санкт-Петербургский государственный политехнический университет» по адресу: 195251, Санкт-Петербург, Политехническая ул., д. 21, к. 9, ауд. 325.

С диссертацией можно ознакомиться в фундаментальной библиотеке ГОУ ВПО «Санкт-Петербургский государственный политехнический университет» по адресу: 195251, Санкт-Петербург, Политехническая ул., д. 29, Главное здание.

Автореферат разослан « 22_» иЛАиУр4,2010 года.

Учёный секретарь диссертационного совета, к.т.н., доцент

Васильев А. Е.

Общая характеристика работы

Актуальность темы диссертационной работы обусловлена значимостью проблемы минимизации объёмов метаданных и времени исполнения алгоритмов интеграции независимых реляционных баз данных.

Под интеграцией подразумевается решение комплекса задач по объединению наборов данных из не связанных между собой реляционных баз. В приложении к реляционным базам данных под метаданными понимается набор имён атрибутов схем. Оптимальное управление интеграцией данных обеспечивает минимизацию объёмов служебных данных и времени формирования интегрирующих запросов к объединённым данным. На практике реализация алгоритмов управления метаданными с заранее известными временами исполнения позволяет применять их в высоконагруженных системах интеграции данных информационно-управляющих систем.

Вопросы интеграции реляционных баз данных рассматриваются в сфере управления базами данных, интеллектуального анализа и аналитической обработки данных, интеграции разнородных данных и нашли практическое применение в программных пакетах, обеспечивающих федеральную интеграцию данных и формирование открытых репозиториев метаданных. Разработками в данной области занимаются специалисты: Л. А. Калиниченко, М.Ш. Цаленко, Ю.Г. Карпов, С. А. Ступников, М.Р. Когаловский, С. Д. Кузнецов, Б. А. Новиков, Д. Мейер, М. Франклин, Г. Гарсия Молина, Д. Ульман, а также ведущие IT компании: Microsoft, Oracle, IBM.

В настоящее время основным способом интеграции данных из реляционных баз является управление данными на основе метаданных. К метаданным относятся имена БД, отношений, атрибутов, описания функциональных, в том числе и многозначных, зависимостей, которые, в совокупности, составляют схему БД.

К трём главным проблемам интеграции данных на основе репозиториев можно отнести многообразие внутренних представлений репозиториев в различных РСУБД, распространение репозитория на одну РСУБД и отсутствие возможностей достоверной оценки времени функционирования алгоритмов управления репозиторием. Выявленные ограничения приводят к высокой трудоёмкости управления крупными интеграционными проектами на основе реляционных СУБД различных производителей в условиях больших объёмов интегрируемых данных. Решением данной проблемы является применение подсистемы интеграции реляционных баз данных на основе независимого, оптимизируемого на этапе эксплуатации реляционного репозитория с полным набором операторов управления схемами независимых баз данных.

Целью работы является построение оптимального репозитория метаданных на основе алгоритмов управления схемами интегрируемых баз данных с прогнозируемым временем отклика на произвольном наборе атрибутов и отношений интегрируемых баз данных.

Для достижения цели в диссертационной работе поставлены и решены следующие задачи:

— предложена классификация схем репозитория на основе анализа числа реляционных отношений и функциональных зависимостей;

— разработана методика оптимизации репозитория данных на этапе эксплуатации с гарантированными оценками времени выполнения операций;

— разработан функционально полный набор операций, обеспечивающий согласованную последовательность преобразований схемы репозитория;

— разработаны алгоритмы управления схемами репозитория, обеспечивающие адаптацию его структуры к изменяющимся наборам структур интегрируемых данных;

— разработана архитектура и реализована подсистема интеграции реляционных баз данных на основе реляционного репозитория и операторов управления схемами.

Объектом исследования являются схемы реляционных баз данных, схемы репозитория и алгоритмы управления данными в нём.

Предметом исследования является организация изменения схемы репозитория на этапе эксплуатации и алгоритмы управления атрибутами и отношениями в объединённой базе данных.

Основные методы исследования. В качестве методов исследования применялись методы теории оптимизации, использовался аппарат теории множеств, общей и реляционной алгебр, методы анализа алгоритмов.

Результаты, выносимые на защиту, и их научная новизна. Предлагаемая диссертация содержит следующие результаты:

— разработана методика оптимизации реляционного репозитория метаданных отличающихся от известных совместным использованием 2 критериев оптимизации, что позволяет получить оптимальный репозиторий, в котором минимизированы объём данных и время доступа;

— разработан полнофункциональный набор алгоритмов управления схемами репозитория позволяющий обрабатывать любую из существующих реализаций схем репозитория;

— показано, что для произвольной схемы репозитория объём и время обработки данных линейно зависит от числа атрибутов объединяемых баз, что позволяет эффективно управлять репозиторием с произвольным набором независимых баз данных.

Теоретическая значимость работы заключается в разработке методики построения оптимального репозитория с целью интеграции реляционных баз данных на основе полнофункционального набора операций над схемами средствами реляционной алгебры. Разработанная методика управления схемами позволяет эффективно интегрировать независимые базы данных.

Практическая значимость работы состоит в разработке подсистемы интеграции, состоящей из инструментальных средств анализа схем интегрируемых баз данных, компоненты реконфигурации репозитория, графического редактора доопределения связей и универсального интерфейса доступа к данным средствами системы интеграции.

Предложенный подход позволяет сохранить неизменными данные, операторы и схемы интегрируемых БД, что позволяет реализовать операторы управления схемами независимо от интегрируемых БД и получать подсистемы интеграции с заранее известными временами отклика. В ходе практической реализации получены следующие результаты:

— реализация методики обеспечивает синтез репозитория независимых баз данных для заданного времени доступа к данным в репо-зитории, что позволяет проектировать систему с известными эксплуатационными характеристиками;

— разработанные алгоритмы позволяют повысить производительность подсистемы интеграции баз данных при неизменных требованиях к аппаратной компоненте;

— реализованный универсальный пользовательский интерфейс, обеспечивает единую технологию доступа к независимым реляционным базам данных.

Разработанные инструментальные средства нашли применение в качестве составных частей системы интеграции независимых реляционных баз данных.

Реализация результатов работы. Разработанная информационная система внедрена в качестве подсистемы интеграции реляционных баз данных в информационной системе управления учебным процессом Санкт-Петербургского государственного политехнического университета и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона.

Апробация работы. Научные результаты и основные положения работы докладывались и обсуждались на конференциях: Международной научно-методической конференции «Высокие интеллектуальные технологии и интеграция знаний в образовании и науке» (Санкт-Петербург 2005), международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в образовании и науке» (Санкт-

Петербург, 2006), международной научно-практической конференции «Высокие интеллектуальные технологии в образовании и науке» (Санкт-Петербург, 2010).

Публикации. По теме диссертации автором опубликовано 14 работ, объёмом 5,81 п.л. в том числе в изданиях, рекомендованных ВАК - 2 работы, объёмом 1,05 п.л.

Личный вклад автора. Все основные результаты работы диссертации получены автором самостоятельно.

Структура и объём диссертационной работы. Диссертация состоит из введения четырёх глав и заключения, изложена на 132 страницах, включая перечень литературы из 70 наименований, 60 рисунков и 4 таблицы. К диссертации добавлено приложение на 4 листах, содержащее схемы работы предложенных и реализованных в диссертации алгоритмов.

Содержание работы

Во введении приводится обоснование актуальности работы, формируется цель, описывается предмет, приводится краткое содержание диссертационной работы, формулируются результаты, выносимые на защиту, отмечается их актуальность, новизна и практическая значимость.

Первая глава содержит обзор систем управления репозиториями схем реляционных баз данных, описание недостатков существующих способов интеграции и путей их устранения, формулировку критериев классификации репозиториев схем, и постановку задачи интеграции данных на основе оптимального реляционного репозитория.

Исследования методов интеграции данных, организованных на различных моделях данных — реляционной, сетевой, иерархической - показали, что, если под моделью данных 9Л, подразумевается четвёрка вида (Schi, Msi, Oi, Moi), где Schi — все возможные схемы в модели OTT,, отображаемые ЯОД, Oi, — все возможные операторы ЯМД iDXit Msi: Schi Bi — семантическая функция ЯОД ЗЛ«, а Мо»: Oi -> [Bi -> Bi\ — семантическая функция ЯМД ЗЛг, Bi — г-е состояние из пространства состояний данных модели ШТ^.

В диссертационной работе рассматриваются следующие дополнительные ограничения:

— модель данных единственна и является реляционной: ЯЯде/;

— схемы базы данных выбираются из одного множества реляционных схем Schnei;

— операторы Ояе(; ЯОД модели 9ЛRei, являются разномощностны-ми реализациями диалектов языков структурированных запросов,

основанных на реляционной алгебре.

Учитывая, что в современных СУБД репозитории реализованы в форме реляционных баз данных и уже содержат некоторые функции интеграции внутри одной СУБД, например в MySQL и Oracle, а операторы ЯОД управляют данными в этой схеме, то с практической точки зрения следует рассматривать ЯОД СУБД и базу данных репозитория как единую подсистему управления схемой хранимых БД.

Основными показателями эффективности применения интеграционной компоненты репозитория является объем хранимых метаданных и время выполнения операций управления репозиторием, которые зависят от схемы репозитория и набора исходных метаданных.

Анализ репозиториев современных СУБД показал, что их схемы фиксированы в соответствии со стандартами. Интеграция произвольных схем баз данных в репозиторий с фиксированной стандартом схемой, в общем случае, не обеспечивает гарантированной оптимальности хранения и управления схемами на этапе эксплуатации интегрирующего приложения.

Решением задачи повышения эффективности управления метаданными в ситуации заранее неизвестных наборов интегрируемых баз, является реконфигурация схемы репозитория в процессе эксплуатации системы с целью выбора оптимальных характеристик его функционирования.

Сформулируем новое требование оптимальности функционирования подсистемы интеграции. Это требование расширяет понятие правильного отображения моделей данных метода построения интероперабельных систем, введённое Калиниченко А. Л. В совокупности с требованиями интегрируемости, открытости и полнофункциональности выполнение требования оптимальности обеспечивает эффективность функционирования подсистемы на этапе эксплуатации.

Интегрируемость — формирование биективного отображения схем а: Sclij —>■ Schi, с целью объединения независимых баз данных.

Открытость — формирование набора отображений семантических функций диалектов ЯОД модели Шге1 Msi \ Schi Bit что обеспечивает отображение набора функций интеграции произвольных реляционных баз данных.

Полнофунщиональность — формирование полного набора семантических функций подсистемы интеграции Msuni. что аналогично предоставлению универсального интерфейса к функциям управления схемами и средствам интеграции.

Оптимальность — минимизация занимаемого объёма данных в репозитории Schuni и времени доступа в процессе реализации функций Msjjni интеграции баз данных.

Под интеграцией независимых реляционных баз данных понимается

построение базы данных ВИ^"^ со схемой 8сН^ипг\ которая содержит отношения

П{ипг) („(и-пг) Липг) ,-,([/ш)\

1 >°12 ' ' • ' '1x1 )

т}(С/т) (^{ипг) Лит) [/гаг)\

2 у ) °22 ' • ' • ' ^

П(ипг) (П(ипг) ипг) ^(С/гагЛ

языком манипулирования данными 0^ипг\ основанным на реляционной алгебре #е/(Т).

Доопределение связей в базах данных. Функциональные отношения интегрированной базы данных формируются двумя способами:

включением исходных функциональных отношений интегрируемых баз данных и дополнением новыми. Второй набор отношений отражает новые семантические связи между базами данных и вводится извне, определяя новую схему интегрируемой базы данных.

Представим схему интегрируемых баз данных в форме ориентированного псевдографа где V — множество атрибутов отношений схемы а N — множество рёбер, маркированных идентификатором отношения включения атрибута в отношение, Ь — множество троек вида (Хг,г,Уг), маркированных идентификатором функциональных зависимостей исходных баз данных в,, причём Хг — множество атрибутов детерминантов, Уг — множество атрибутов, функционально зависящих от детерминанта, г — маркер функционального отношения. Тогда доопределение связей в базе данных состоит в формировании графа С(У, ЛГ, Ь'), такого что V = (Ьи {Х',г',У'}\Х1 С У/ с в^гфз).

Постановка задачи оптимизации схемы репозитория. Пусть задан произвольный набор схем независимых интегрируемых баз данных 5 = яг,• • • )вга}. объединённых в набор ЗсН^ипг\ на котором доопределены новые зависимости в а множество всех возможных схем репозитория баз данных М = {гп1, тг, • • •, ?И2"}, где п - число атрибутов в схеме

Для каждой схемы mj е М определяется объём данных, как

п

У31 = ^«.ге(а«(я<))- (2)

¿=1

Для каждой схемы mj е М определяется время выполнения команд г(Б) = {гзе1еа(зг),г1п3ег^),г0е1е^(з^,гШедгцу(з1)} с частотами исполнения «(3 = {аЗе1ес1,а1пзеги аОеШе,0!1п1едгиу}, КЭК

к р = Ипге(У, Шг) + ^ Ыте(У, 1щ), (3)

¿=1 з = 1

где к — число отношений, р — число зависимостей в схеме в схеме пц, а функция Ыте() вычисляет время выполнения операции на каждом отношении схемы 5г-.

Определим меру = аУ5. + /ЗТу^., при условии а + (3 = 1.

Тогда задача оптимизации подсистемы интеграции баз данных на основе репозитория определяется как:

М-—> (4)

тгп|Л |

Нормированные параметры а и /3 выбираются пользователем исходя из стратегии оптимизации и используются при построении меры в минимизируемом выражении 4 для выбора оптимальной схемы я*.

В второй главе описана методика оптимизации схемы реляционного репозитория с оценкой максимального времени исполнения алгоритмов, определён полнофункциональный набор операторов: добавления, удаления, интеграции и декомпозиции схем БД в реляционном репозитории, приведено исследование свойств схемы репозитория, приведены оценки времени выполнения операций, изложены результаты исследования оценки объёмов данных и времени выполнения запросов к репозиторию.

Схема методики оптимизации репозитория и оценки времени отклика подсистемы интеграции на этапе эксплуатации, основанной на реляционном репозитории базы данных приведена на рисунке 1.

Объектами управления в информационной подсистеме репозитория являются схемы баз данных в = {K(A,db,T,F),Lfi,fj\\/fi,Fj е ^ из множества схем операции управления схемами репозитория Z(S) и консолидированные запросы на выборку данных q = {<7ь<72, • ■ •, <1п} к данным из объединённого репозитория.

С целью ограничения числа вариантов реализации схемы репозитория сгенерированы и классифицированы все варианты схем. Построение всех вариантов схем репозитория реализовано при помощи алгоритмов построения замыкания функциональных зависимостей РБСНЕМЕ^ и всех возможных схем репозиториев М = {тх,..., тг»}, основанных на аксиомах пополнения и транзитивности Армстронга. Программная реализация формирования множества наборов позволила сформировать 64 набора функциональных зависимостей, которые были классифицированы по числу отношений и связей между ними.

В качестве критерия классификации схем репозитория предложено правило размещения атрибутов по функциональным отношениям. Тогда

Начало

Рисунок 1. Схема алгоритма оптимизации репозитория

все схемы репозитория классифицируются по числу отношений. В результате анализа сформировано 5 классов схем. Общность схем каждого класса определяется равным числом операций просмотра всех отношений и естественного соединения отношений по первичному ключу. Для управления схемами в репозитории для каждой операции раз-

работаны четыре алгоритма управления схемами. Особенностью реализации алгоритмов является использование метаданных в качестве исходных данных, что позволяет применять их без изменений для любого класса репозитория.

1. Добавление новой схемы в репозиторий z/nsert-Require: sf, {схема базы для добавления} Ensure: DBuni + Si',

l: for all uni G scheme^ do 2: for all Ts G Si do 3: Ts -> Tuni, 4: for all Fs G Si do 5: Fs -> Funi',

2. Удаление схемы из репозитория с удалением доопределенных связей Z Delete-

Require: Si,XrK. {схема базы для удаления и набор доопределяемых связей} Ensure: DBuni ~ sf, 1: for all uni G schemei do 2: for all Ts G Si do 3: Ts -/» Tuni', 4: for all Fs G Si do 5: Fs Funi', 6: for all Fs G XTa , do

"г >sj

7: Fs -/» Xuni,

3. Доопределение семантических связей zjntegrity Require: ХГв. ,.; {набор доопределяемых связей} Ensure: DBVni + хтч,ч;

l: for all Fs G Xr„ , do 2: Fs —> Xuni',

4. Декомпозиция схемы zgeiect-

Require: q^atri, atr2, ■. ■ ,atrn)\ {запрос на декомпозицию данных} Ensure: F(si, s2,.. •, s»); {набор атрибутов из разных схем баз данных}

I: for all Tq G qi do 2: for all

Uni € schemei do 3: for all tUnii txi tunij € schemei do 4: FSi atrk;

Пусть в тестовой схеме внешней базы данных Sj определены: rs — число атрибутов в схеме Sj, су — коэффициент увеличения объёма данных при отсутствии нормализации, tr — время управления отношением,

tf — время управления зависимостью, 13 — число отношений запросе, с( — коэффициент времени на формирование избыточности в отношении. Проанализировав приведённые алгоритмы с учётом свойств схем репозиториев каждого класса, получим аналитические оценки времени исполнения и объёма данных в каждом классе схем. Результаты анализа времени исполнения и оценки объёма данных для различных вариантов реализации схем репозитория приведены в таблице 1.

Таблица 1. Анализ характеристик классов схем репозиториев

Класс схемы Оценка объё- Добавление, Удаление, Декомпозиция,

ма, V Zinsert ¿delete -гSelect

1 отношение

6cvrs bCttr tr+tj bet * ls * tr

2 отношения 1 Гз

зависимость Acttr +tf 2 tr + 21} 4ct*ls*tr+tf

3 отношения 2 Г _

зависимости ' 3 6cttr + 2tf 3tr + 2 tf 3ct*ls*tr + 2tf

4 отношения 3 Те

зависимости ' 8 4 Су 8cttT + 3tf 4tr + 3tf 2ct*ls*tr+3tf

5 отношений 4 rs

зависимости 5 cv lOcttr + 4tf 5tr + 4tj Is * tr +4tf

Представленные результаты позволили оценить объем данных и время выполнения алгоритмов при выполнении операций управления схемами в репозиториях разных классов, что позволило прогнозировать временные характеристики управления репозиторием при известном распределении времени исполнения запросов, и представить оценку среднего времени исполнения запроса как:

tuni ~ ®Insert * ^Insert ~f~ &Delete * t Delete + ClSeiect * ¿Seiect (5)

Максимальное время исполнения запроса декомпозиции tuni = t$eiect max len(qi), где len(qi) — функция определения числа естественных соединений в схеме репозитория schemeit а функцию оптимизации в форме нахождения минимума на дискретном наборе значений времени и

объёмов данных с весовыми коэффициентами кг и Ау соответственно:

\Х\ = к^ип1 + ку * У6Сьете (6)

Предложенная функция применяется в алгоритме принятия решения о необходимости изменения структуры репозитория баз данных.

Третья глава содержит описание подсистемы интеграции на основе оптимального репозитория, её функции, структурную и функциональную схемы подсистемы, описание реализации графического интерфейса доопределения связей и универсального интерфейса пользователя генератора отчётов с использованием данных реляционного репозитория.

Методика интеграции независимых РБД на основе оптимального репозитория реализует предложенный полнофункциональный набор операторов управления схемами, включающий в себя средства управления репозиторием, взаимодействия со внешними базами данных и прикладным ПО системы. Управление схемами внешних баз данных предполагает извлечение, преобразование и анализ схем — создание модели управления схемами, и обработку запросов пользователей в этой модели. Совокупность модели и методов и составляет автоматизированную систему интеграции баз данных.

На вход подсистемы поступают описания схем баз данных, запросы пользователей на интеграцию данных и критерии оптимизации подсистемы. Выходом подсистемы является описание декомпозиции интегрированных запросов пользователей с целью обращения ко внешним базам данных с учётом требований к объёму данных и времени доступа к ре-позиторию.

Подсистема позволяет пользователю до исполнения запроса оценивать временные затраты на декомпозицию запроса к независимым базам данных, что позволяет строить системы интеграции с заранее известными временами отклика.

В результате анализа информационных процессов выявлены и описаны 7 функций системы, свойства двух внешних источников данных и двух информационных хранилищ, выделены 10 управляющих потоков и 12 потоков данных.

Подсистема оптимизации репозитория организована по модульному принципу и состоит из модулей:

- интерфейса со внешними базами данных. Модуль осуществляет взаимодействие с внешними базами данных, преобразуя описание схемы с конкретного диалекта ЯМД РСУБД во внутренний формат программы;

- анализа оптимальности репозитория. Модуль вычисляет значение критерия эффективности текущего состояния базы данных, и в

Рисунок 2. Структурно-функциональная схема подсистемы интеграции

РБД

случае нахождения иного оптимального решения, формирует запрос на реконфигурацию репозитория;

— изменения схемы репозитория. Модуль принимает запрос на изменение структуры репозитория и формирует набор команд на языках управления ЯМД[/„, и ЯОД(/га4 с целью преобразования структуры репозитория;

— доопределения связей. Модуль взаимодействует с пользователем в интерактивном режиме с целью формирования новых семантических связей между атрибутами внешних баз данных;

— декомпозиции запросов пользователя. Модуль на входе получает запрос пользователя и осуществляет выделение частей запроса, относящихся к каждой независимой базе данных.

Структурно-функциональная схема подсистемы интеграции РБД приведена на рисунке 2.

Разработанная оптимизирующая подсистема интеграции данных на основе реляционного репозитория схем баз данных, обеспечивает единую форму представления репозитория для всех РБД, полнофункцио-

нальный универсальный язык управления содержимым репозитория с возможностью прогнозирования объёма и времени доступа к схемам.

В четвёртой главе содержится описание применения подсистемы интеграции независимых реляционных баз данных на основе оптимального репозитория при построении информационно-управляющих систем.

Программная реализация подсистемы интеграции применена в системе управления учебным процессом Санкт-Петербургского государственного политехнического университета и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона.

> t, с х 10"1

Стратегии оптимизации

..... минимизация евемеки

............ МИНИМИЗ.ЭЦИЯ сбьёмз

0,75--

0,50--

Схемы репозитория

ф -5 таблиц (S тип)

..........................................ф- -1 таблица (1 тип)

.....-information schema

................Z..........j V, Кбайт

1III11MMI1I1 1 11 1 i 111 ¡1 1 1 1 11 I 1 11 1 I i I 1 i»

10 20 30 40 50

60

70

80

Рисунок 3. Траектория изменения схемы репозитория в процессе интеграции подсистем системы управления учебным процессом

СПбГПУ

В процессе функционирования подсистемы оптимизации при каждом добавлении новой схемы интегрируемой базы производилась оценка занимаемого объёма и времени исполнения операции декомпозиции запроса. Результаты вычислений, траектория изменения состояния репозитория ¡п{огтаМоп_5сЬета и траектория изменения двух схем репозитория

при реализации стратегий «минимальный объём» и «минимальное время декомпозиции» приведены на рисунке 3. Из представленного графика видно, что в процессе добавления новых схем при реализации стратегий «минимальный объём» и «минимальное время» происходит переключение схемы репозитория с 1 типа на 5 и обратно. Такое переключение связано с добавлением новой схемы, имена атрибутов которой повторяют имена атрибутов других схем репозитория.

Заключение содержит описание результатов, полученных в работе.

Основные результаты работы

В диссертации получены следующие научные и практические результаты:

1. Проведён обзор существующих репозиториев реляционных СУБД, в результате чего установлено, что в существующих СУБД отсутствуют средства оптимизации схем реляционных репозиториев. Отсутствие средств оптимизации обусловлено отсутствием эффективных средств решения задачи интеграции, которая стала актуальна в последние 10-15 лет.

2. Сформулировано новое требование оптимальности репозитория, расширяющее существующий метод интеграции баз данных на основе отображения моделей данных.

3. Сформулирована постановка задачи оптимальной интеграции, новизна постановки связана с тем, что задача интеграции рассматривается для произвольных схем независимых баз данных в отличие от классического подхода к интеграции схем нормализованных баз.

4. Выработаны критерии классификации схем реляционных репозиториев. В основу классификации положены следующие критерии: число отношений и число функциональных зависимостей. Выделены 5 классов схем репозитория. Каждый класс объединяет схемы с одинаковыми оценками объёма данных и времени доступа к ним.

5. Разработана методика оптимизации схемы репозитория, которая синтезирует репозиторий с заданным временем исполнения алгоритмов преобразования и объёмов данных.

6. Предложен функционально полный набор операций, обеспечивающий согласованную последовательность преобразований схемы репозитория. Предложенный набор содержит 4 операции управления схемами, позволяющие впервые решать эту задачу на практическом уровне.

7. Реализованы четыре алгоритма управления схемами, инвариантные к текущей схеме репозитория.

8. Проведено исследование зависимости объёма данных от исходного набора схем в каждом классе репозитория. Исходный набор схем характеризуется числом отношений, числом атрибутов в каждом отношении и числом функциональных зависимостей. В результате анализа установлено, что объем данных линейно зависит от вышеперечисленных параметров. Линейность зависимости позволяет использовать все пять классов репозиториев при любых наборах исходных схем.

9. Проведено исследование зависимости времени исполнения операций из полнофункционального набора от исходного набора схем в каждом классе репозитория. В результате анализа установлено, что рост времени линейно зависит от исходного набора схем, что позволяет применять алгоритмы для произвольной схемы репозитория.

10. Разработана архитектура подсистемы интеграции реляционных баз данных на основе репозитория. Подсистема интеграции включает модули управления схемами, реконфигурации репозитория, универсальный генератор отчётов и редактор графического представления схем, реализующий полнофункциональный набор операций управления репозиторием.

11. Разработано программное обеспечение, реализующие подсистему интеграции. Подсистема интеграции данных включена в интегрированную информационную систему управления учебным процессом СПбГПУ и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона, что подтвердило правильность предложенной методики.

Публикации по теме диссертации

Научные статьи, опубликованные в изданиях, рекомендованных перечнем ВАК:

1. Курочкин М.А., Попов С. Г. Метод интеграции независимых баз данных // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Серия «Информатика. Телекоммуникации. Управление.» — СПб.: Изд-во СПбГПУ, 2006. — №4(46). — С. 28-32. С. Г. Попову принадлежит описание требования оптимальности и постановка задачи интеграции реляционных баз данных.

2. Попов С. Г. Методика построения оптимального репозитория схем реляционных баз данных // Научно-технические ведомости Санкт-

Петербургского государственного политехнического университета. Серия «Информатика. Телекоммуникации. Управление.» — СПб.: Изд-во СПбГПУ, 2010. - №5(108). - С. 91-98.

Научные статьи, опубликованные в иных изданиях:

1. Криулин К.Н., Попов С. Г., Рафиков Ш.М. Автоматизированная система управления контингентом СПбГПУ. // Высокие интеллектуальные технологии в высшей школе: Материалы XII Международной научно-методической конференции. — СПб.: Изд-во СПбГПУ, 2005. — С.65-71.

2. Орлов Е. А, Попов С. Г. Разработка подсистемы автоматизированной генерации структуры базы данных. // XXXIII Неделя науки СПбГПУ: Материалы Всероссийской межвузовской научно-технической конференции студентов и аспирантов. — СПб.: Изд-во Изд-во СПбГПУ, 2005. - Ч.ХИ. - С.21-23.

3. Попов С. Г., Слюнъков Н. В. Структура автоматизированной системы управления рабочими учебными планами. // X Всероссийская конференция по проблемам науки и высшей школы. — СПб, Изд-во СПбГПУ, 2006. - С.69-73.

4. Курочкин М.А., Попов С. Г. Методология проектирования системы управления учебным процессом университета. // Фундаментальные исследования в технических университетах: Материалы X Всерос. конф. по проблемам высшей школы. — СПб.: Изд-во СПбГПУ, 2006. — С.48-52.

5. Курочкин М. А, Попов С. Г. Постановка задачи интеграции независимых реляционных баз данных. // Международная научно-методическая конференция «Высокие интеллектуальные и инновации в образовании и науке». - Изд-во. СПбГПУ, 2006. - Т1. - С.161-165.

6. Попов С. Г. Постановка задачи автоматического построения графического представления схемы реляционной базы данных произвольной структуры // XXXVII Неделя науки СПбГПУ: Материалы Всероссийской межвузовской научной конференции студентов и аспирантов. — СПб.: Изд-во СПбГПУ, 2008. - Ч.ХУП. - С.46-84.

7. Курочкин М.А., Попов С. Г., Курочкин Л.М., Тимофеев Д. А., Радкевич М. М. Концепция построения электронной системы мониторинга технологических компетенцией предприятий Санкт-Петербурга // Высокие интеллектуальные технологии в образовании и науке: Сб. тезисов международной научно-практической конференции. — СПб.: Изд-во СПбГПУ, 2009. - С.56-67.

8. Попов С. Г. Исследование вариантов реализации схем реляционного репозитория схем баз данных. // Высокие интеллектуальные технологии в образовании и науке: Материалы XVII Международной научно-методической конференции. — СПб.: Изд-во СПбГПУ, 2010. — С. 71-74.

Лицензия ЛР № 020593 от 07.08.97

Подписано в печать 19.11.2010. Формат 60x84/16. Печать цифровая. Усл. печ. л. 1,0. Уч.-изд. л. 1,0. Тираж 100. Заказ 6774Ь.

Отпечатано с готового оригинал-макета, предоставленного автором, в Цифровом типографском центре Издательства Политехнического университета. 195251, Санкт-Петербург, Политехническая ул., 29. Тел.:(812)550-40-14 Тел./факс: (812) 297-57-76

Оглавление автор диссертации — кандидата технических наук Попов, Сергей Геннадьевич

Введение

1 Интеграция реляционных баз данных на основе репозитория схем

1.1 Анализ вариантов интеграции репозиториев в современных СУБД

1.2 Формирование требований к оптимальному репозиторию.

1.3 Постановка задачи построения оптимального репозитория.

1.4 Выводы.

2 Построение и исследование реляционного репозитория схем баз данных

2.1 Построение схем реляционного репозитория.

2.2 Классификация схем репозитория.

2.3 Методика оптимизации схемы репозитория на этапе эксплуатации

2.4 Операции управления репозиторием.

2.5 Выводы.

3 Формирование подсистемы интеграции реляционных баз данных на основе оптимального репозитория схем

3.1 Проектирование среды управления оптимальным репозиторием.

3.2 Проектирование и реализация универсального интерфейса пользователя генератора отчётов к репозиторию баз данных.

3.3 Реализация редактора графического представления схем реляционных баз данных репозитория схем

3.4 Выводы.

4 Применение подсистемы интеграции реляционных баз данных на основе оптимального репозитория схем

4.1 Реализация подсистемы интеграции в системе управления учебным процессом СПбГПУ.

4.2 Реализация подсистемы интеграции в электронной системе мониторинга технологических компетенцией.

4.3 Выводы.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Попов, Сергей Геннадьевич

В настоящее время наблюдается устойчивая тенденция интеграции независимых реляционных баз данных, что связано с увеличением числа задач, для решения которых требуются результаты, размещённые в удалённых друг от друга базах данных различных производителей. Под интеграцией подразумевается решение комплекса задач по объединению кортежей данных из независимых реляционных баз. К таким задачам относятся управление данными в информационных системах управления учебным процессом высших учебных заведений, получение аналитической информации в системах обработки статистических данных, управление конструкторской и технологической документацией машиностроительных производств. Отличительной чертой таких задач является интенсивный поток запросов на выборку данных из независимых баз данных, что предъявляет повышенные требования к эффективности управления подсистемой интеграции. Эффективное управление интеграцией данных обеспечивает минимизацию объёмов служебных данных, времени анализа и формирования интегрирующих запросов к объединённым данным.

Современные подходы к решению задач интеграции реляционных данных предполагают формирование запросов к объединяемым данным на основе метаданных, к которым в РБД относятся имена серверов, баз, таблиц, атрибутов и связей. Метаданные РБД хранятся в репозиториях — системных, реляционных базах данных в каждой СУБД. Схемы репозиториев определяются исторически сложившимися в процессе разработки соглашениями, как например в СУБД Oracle, DB2, или стандартами языка SQL, которые определяют форматы представлений метаданных INFOR-MATIONSCHEMA, как в MS SQL, MySQL или PostGreeSQL. Передача метаданных между СУБД может осуществляться на основе технологий, определённых протоколом передачи метаданных в рамках вычислительных кластеров по стандарту RFC5661.

В процессе формирования схем репозиториев существующих в настоящее время СУБД в большей мере учитывались технологические аспекты проектирования и функционирования конкретной РСУБД, чем требования высокой эффективности выполнения интеграционных задач. Сложившаяся практика проектирования схем данных на момент формирования стандарта на схему репозитория — начало 90-х годов ХХ-го века, определявшая высокую нормализацию как основной процесс построения схем малых и средних баз данных, также наложила отпечаток на представление схемы репозитория РСУБД.

Последовавшее в следующие десятилетия неуклонное увеличение объёмов данных в БД, числа учитываемых атрибутов, повышение сложности алгоритмов обработки данных, привело к появлению больших, ориентированных на уникальную задачу баз данных, отходящих от традиций высокой степени нормализации данных при построении их схем. Интеграция таких схем в репозиторий с фиксированной стандартом схемой, в общем случае, не может' обеспечить гарантированной оптимальности хранения и управления схемами на этапе эксплуатации интегрирующего приложения.

Решением проблемы потери эффективности управления метаданными в ситуации заранее неизвестных наборов интегрируемых баз, является реконфигурация схемы репо-зитория в процессе эксплуатации системы с целью выбора оптимальных характеристик его функционирования.

Целью работы является построение оптимального репозитория метаданных на основе алгоритмов управления схемами интегрируемых баз данных с прогнозируемым временем отклика на произвольном наборе атрибутов и отношений интегрируемых баз данных.

Для достижения цели в диссертационной работе поставлены и решены следующие задачи: предложена классификация схем репозитория на основе анализа числа реляционных отношений и функциональных зависимостей; разработана методика оптимизации репозитория данных на этапе эксплуатации с гарантированными оценками времени выполнения операций; разработан функционально полный набор операций, обеспечивающий согласованную последовательность преобразований схемы репозитория; разработаны алгоритмы управления схемами репозитория, обеспечивающие адаптацию его структуры к изменяющимся наборам структур интегрируемых данных; разработана архитектура и реализована подсистема интеграции реляционных баз данных на основе реляционного репозитория и операторов управления схемами.

Объектом исследования являются схемы реляционных баз данных, схемы репозитория и алгоритмы управления данными в нём.

Предметом исследования является организация изменения схемы репозитория на этапе эксплуатации и алгоритмы управления атрибутами и отношениями в объединённой базе данных.

Основные методы исследования. В качестве методов исследования применялись методы теории оптимизации, использовался аппарат теории множеств, общей и реляционной алгебр, методы анализа алгоритмов.

Результаты, выносимые на защиту, и их научная новизна. Предлагаемая диссертация содержит следующие результаты: разработана методика оптимизации реляционного репозитория метаданных отличающихся от известных совместным использованием 2 критериев оптимизации, что позволяет получить оптимальный репозиторий, в котором минимизированы объём данных и время доступа; разработан полнофункциональный набор алгоритмов управления схемами репозитория позволяющий обрабатывать любую из существующих реализаций схем репозитория; показано, что для произвольной схемы репозитория объём и время обработки данных линейно зависит от числа атрибутов объединяемых баз, что позволяет эффективно управлять репозиторием с произвольным набором независимых баз данных.

Теоретическая значимость работы заключается в разработке методики построения оптимального репозитория с целью интеграции реляционных баз данных на основе полнофункционального набора операций над схемами средствами реляционной алгебры. Разработанная методика управления схемами позволяет эффективно интегрировать независимые базы данных.

Практическая значимость работы состоит в разработке подсистемы интеграции, состоящей из инструментальных средств анализа схем интегрируемых баз данных, компоненты реконфигурации репозитория, графического редактора доопределения связей и универсального интерфейса доступа к данным средствами системы интеграции.

Предложенный подход позволяет сохранить неизменными данные, операторы и схемы интегрируемых БД, что позволяет реализовать операторы управления схемами независимо от интегрируемых БД и получать подсистемы интеграции с заранее известными временами отклика. В ходе практической реализации получены следующие результаты: реализация методики обеспечивает синтез репозитория независимых баз данных для заданного времени доступа к данным в репозитории, что позволяет проектировать систему с известными эксплуатационными характеристиками; разработанные алгоритмы позволяют повысить производительность подсистемы интеграции баз данных при неизменных требованиях к аппаратной компоненте; реализованный универсальный пользовательский интерфейс, обеспечивает единую технологию доступа к независимым реляционным базам данных.

Разработанные инструментальные средства нашли применение в качестве составных частей системы интеграции независимых реляционных баз данных.

Реализация результатов работы. Разработанная информационная система внедрена в качестве подсистемы интеграции реляционных баз данных в информационной системе управления учебным процессом Санкт-Петербургского государственного политехнического университета и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона.

Апробация работы. Научные результаты и основные положения работы докладывались и обсуждались на конференциях: Международной научно-методической конференции «Высокие интеллектуальные технологии и интеграция знаний в образовании и науке» (Санкт-Петербург 2005), международной научно-методической конференции «Высокие интеллектуальные технологии и инновации в образовании и науке» (Санкт-Петербург, 2006), международной научно-практической конференции «Высокие интеллектуальные технологии в образовании и науке» (Санкт-Петербург, 2010).

Публикации. По теме диссертации автором опубликовано 14 работ, объёмом 5,81 п.л. в том числе в изданиях, рекомендованных ВАК - 2 работы, объёмом 1,05 п.л.

Личный вклад автора. Все основные результаты работы диссертации получены автором самостоятельно.

Структура и объём диссертационной работы. Диссертация состоит из введения четырёх глав и заключения, изложена на 132 страницах, включая перечень литературы из 70 наименований, 60 рисунков и 4 таблицы. К диссертации добавлено приложение на 4 листах, содержащее схемы работы предложенных и реализованных в диссертации алгоритмов.

Заключение диссертация на тему "Построение оптимального репозитория атрибутов и отношений для интеграции реляционных баз данных"

4.3 Выводы

В четвёртой главе получены следующие результаты:

• Разработана архитектура подсистемы интеграции реляционных баз данных на основе репозитория. Подсистема интеграции включает модули управления схемами, реконфигурации репозитория, универсальный генератор отчётов и редактор графического представления схем.

• Разработан набор алгоритмов, реализующий полнофункциональный набор опера- • ций управления репозиторием. Предложенный набор инвариантен относительно изменяющихся схем репозитория.

• Разработано программное обеспечение, реализующие подсистему интеграции. Программный комплекс содержит 7 модулей и обеспечивает непрерывное управление схемами репозитория.

• Подсистема интеграции данных включена в интегрированную информационную систему управления учебным процессом СПбГПУ и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона, что подтвердило правильность предложенной методики.

Заключение

В ходе решения поставленных задач были получены следующие научные и практические результаты:

1. Проведён обзор существующих репозиториев реляционных СУБД, в результате чего установлено, что в существующих СУБД отсутствуют средства оптимизации схем реляционных репозиториев. Отсутствие средств оптимизации обусловлено отсутствием эффективных средств решения задачи интеграции, которая стала актуальна в последние 10-15 лет.

2. Сформулировано новое требование оптимальности репозитория, расширяющее существующий метод интеграции баз данных на основе отображения моделей данных.

3. Сформулирована постановка задачи оптимальной интеграции, новизна постановки связана с тем, что задача интеграции рассматривается для произвольных схем независимых баз данных в отличие от классического подхода к интеграции схем нормализованных баз.

4. Выработаны критерии классификации схем реляционных репозиториев. В основу классификации положены следующие критерии: число отношений и число функциональных зависимостей. Выделены 5 классов схем репозитория. Каждый класс объединяет схемы с одинаковыми оценками объёма данных и времени доступа к ним.

5. Разработана методика оптимизации схемы репозитория, которая синтезирует ре-позиторий с заданным временем исполнения алгоритмов преобразования и объёмов данных.

6. Предложен функционально полный набор операций, обеспечивающий согласованную последовательность преобразований схемы репозитория. Предложенный набор содержит 4 операции управления схемами, позволяющие впервые решать эту задачу на практическом уровне.

7. Реализованы четыре алгоритма управления схемами, инвариантные к текущей схеме репозитория.

8. Проведено исследование зависимости объёма данных от исходного набора схем в каждом классе репозитория. Исходный набор схем характеризуется числом отношений, числом атрибутов в каждом отношении и числом функциональных зависимостей. В результате анализа установлено, что объем данных линейно зависит от вышеперечисленных параметров. Линейность зависимости позволяет использовать все пять классов репозиториев при любых наборах исходных схем.

9. Проведено исследование зависимости времени исполнения операций из полнофункционального набора от исходного набора схем в каждом классе репозитория. В результате анализа установлено, что рост времени линейно зависит от исходного набора схем, что позволяет применять алгоритмы для произвольной схемы репозитория.

10. Разработана архитектура подсистемы интеграции реляционных баз данных на основе репозитория. Подсистема интеграции включает модули управления схемами, реконфигурации репозитория, универсальный генератор отчётов и редактор графического представления схем, реализующий полнофункциональный набор операций управления репозиторием.

11. Разработано программное обеспечение, реализующие подсистему интеграции. Подсистема интеграции данных включена в интегрированную информационную систему управления учебным процессом СПбГПУ и электронной системе мониторинга технологических компетенцией предприятий машиностроительного комплекса Северо-Западного региона, что подтвердило правильность предложенной методики.

Библиография Попов, Сергей Геннадьевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Аткинсон М. и др Манифест систем объектно-ориентированных баз данных Системы «Управления Базами Данных» — №4. — 1995. — с. 142-155.

2. Архипенков С., Голубев Д., Максименко О Хранилища данных. Издательство: Диалог-МИФИ., 2002 — 528 стр.

3. Ахо А., Сети Р., Ульман Дж. Компиляторы. Принципы, технологии, инструменты. Пер. с англ. — М.: Издательский дом "Вильяме", 2001. — 498с.

4. Братко И. Программирование на языке пролог для искусственного интеллекта: Пер. с англ. — М.: Мир, 1990. — 560 е., ил.

5. Буч Г. Объектно-ориентированное проектирование с примерами: Пер. с англ. — М.: Конкорд, 1992.

6. Венцель Е. С., Овчаров JI. А. Теория вероятностей и ее инженерные приложения. Учеб. пособие для втузов. — 2-е изд.,стер.— М.: Высш. шк., 2000. — 480 е.: ил.

7. Виснани, Викрам Полный справочник по MySQL.: Пер. с англ. — М.: Издательский дом "Вильяме", 2006. — 528 е.: ил.

8. Гарсия Молина Г., Ульман Дж., Уидом Д. Системы баз данных. Полный курс. Пер. с англ. — М.: Издательский дом "Вильяме", 2002. — 540с.

9. Гвоздев 10. Генератор отчетов Crystal Reports, http://firststeps.narod.ru/ sql/cryrep/il.html, 2003.

10. ГОСТ 17420-72. Единая система технологической подготовки производства. Операции механической обработки резанием. Термины и определения. Издательство: Государственный комитет по стандартам, Москва, 1980, 19с.

11. Гуляев А.И. Временные ряды в динамических базах, данных. — М.: Радио и связь, 1989 г. — 128с.

12. ДейтД.Дж. Введение в базы данных, 7-е издание. Пер. с англ. — М.: Издательский дом "Вильяме", 2001. — 1072 е.: ил.

13. Евменов В. П. Учебное пособие «Базы данных. Часть 1. Методология теории баз данных» Евменов В.П. СПб,СПбГПУ,2005. - 68 с.

14. Иванов А.Ю., Саенко И.Б. Основы построения и проектирования реляционных баз данных. СПб: ВАС. 1998 . - 80с.

15. Калиниченко JI.А. Методы и средства интеграции неоднородных баз данных. Клиниченко JI.A./Под ред. Л.Н. Королева. — М.: Наука. Главная редакция физико-математической литературы, 1983 — 424 с.

16. Ким ВГарза Ж.Ф., Грэхэм В. Пути развития объектно-реляционных технологий баз данных. Системы управления базами данных, №04, 1996.

17. Кирстен В., Иренгер И., Рёриг Б., Шулыпе П. СУБД Cache: объектно-ориентированная разработка приложений. — СПб: Питер, 2001.

18. Классификатор технологических операций машиностроения и приборостроения 1 85 151. Издательство: Государственный комитет по стандартам, Москва, 1986, 34с.

19. Классификатор технологических переходов машиностроения и приборостроения 1 89 187. Издательство: Государственный комитет по стандартам, Москва, 1990, 164с.

20. Кнут Д.Э. Исскуство программирования, Том 3: Сортировка и поиск. — М.: Издательский дом Вильяме, 2000.

21. Когаловский М.Р. Расширение реляционной модели баз данных временных рядов Управляющие системы и машины. 1994. — № 6.

22. Когаловский М.Р. Энциклопедия технологий баз данных — М.: Финансы и статистика, 2002. — 800 с.

23. Когаловский М.Р. Перспективные технологии информационных систем — М.: ДМК Пресс, 2003 288 с.

24. Компания MySQL АВ. MySQL. Руководство администратора.: Пер. с англ. — М.: Издательский дом "Вильяме", 2001. — 432с.

25. Компания MySQL АВ. MySQL. Справочник по языку.: Пер. с англ. — М.: Издательский дом "Вильяме", 2001. — 462с.

26. Криулин К. Н., Попов С. ГРафиков Ш. М. Автоматизированная система управления контингентом СПбГПУ. Высокие интеллектуальные технологии в высшей школе: Материалы XII Международной научно-методической конференции. — СПб.: Изд-во СПбГПУ, 2005. С.65-71.

27. Кузнецов С. Д. Базы данных. Модели и языки. — М.: Бином-Пресс, 2008. — 720 с.

28. Курочкин М.А, Попов С. Г. Постановка задачи интеграции независимых реляционных баз данных. Международная научно-методическая конференция «Высокие интеллектуальные и инновации в образовании и науке». — Изд-во. СПбГПУ, 2006. Т1. - С.161-165.

29. Мейер Д. Теория реляционных баз данных: перевод с англ. — М.: Мир, 1987. — 608с.

30. Олле Т. В. Предложения КОДАСИЛ по управлению базами данных. / Пер. с англ. В. И. Филиппова и С. М. Кругловой. — М.: Финансы и статистика, 1981. — 226с., ил.

31. Пек Д., 2005. CRYSTAL REPORTS 9. Полное справочное руководство. ЛОРИ, — 736 стр.

32. Попов С. Г., Слюньков Н. В. Структура автоматизированной системы управления рабочими учебными планами. X Всероссийская конференция по проблемам науки и высшей школы. — СПб, Изд-во СПбГПУ, 2006. — С.69-73.

33. Попов С. Г. Исследование вариантов реализации схем реляционного репозитория схем баз данных. Высокие интеллектуальные технологии в образовании и науке: Материалы XVII Международной научно-методической конференции. — СПб.: Изд-во СПбГПУ, 2010. С. 71-74.

34. Раскин Д. 2005. Интерфейс: новые направления в проектировании компьютерных систем. — Пер. с анг. СПб: Символ-Плюс, 2004. — 272с., ил.

35. Спирли Э., 2001. Корпоративные хранилища данных. Планирование, разработка, презентация. — Том 1. М.: Вильяме.

36. Смирнов В. Системы хранения данных- тенденции, решения, перспективы. //Корпоративные системы. 2002, - №3 - С. 24-29.

37. Цаленко М. Ш. Моделирование семантики в базах данных. — М.: Наука. Гл. ред. физ-мат.лит., 1989. — 228с.

38. Чемберлин Д. Анатомия объектно-реляционных баз данных Системы Управления Базами Данных, №1-2, 1998. с.3-24.

39. Шаша Д., Бонне Ф. Оптимизация баз данных: принципы, практика, решение проблем. М.: КУДИЦ-ОБРАЗ, 2004.

40. Энсор Д., Стивенсон Й. Oracle, Проектирование баз данных: Пер. с англ. — К.: Издательская труппа BHV, 1999 — 560 с.

41. Abrial J.-R. B-Technology: Technical overview. B-Core (UK) Ltd., 1993.

42. Batory D. et al. GENESIS: An Extensible Database Management System. IEEE Trans, on Software Engineering, vol. 14, no. 11, Nov. 1988.

43. Bertino E., Kim W., and Garza J. Compositie Objects Revisited. — Proc. ACM SIGMOD Intl. Conf. on Management of Data, Portland, Oregon, June 1989.

44. Bozkaya T., Ozsoyoglu M. Indexing Transaction Time Databases. — Information Sciences, 1998.

45. Chandra R., Segev A. Managing Temporal Financial Data in an Extensible Database. — Proceedings of the 19th Conference on Very Large Databases. 1993, pp. 302-313.

46. Chou H.T., Kim W. Versions of Schema for Object-Oriented Databases. — Proc. Intl. Conf. on Very Large Data Bases. Long Beach, Calif., Sept.

47. Dijkstra E. W. A Discipline of Programming. L.: Prentice Hall, 1976.

48. Easton M. Key-Sequence Data Sets on Indelible Storage. — IBM Journal of Research and Development, 30(3), 1986.

49. Faloutsos C, Sellis Tand Roussopoulos N. Analysis of Object-Oriented Spatial Access Methods. — Proc. ACM SIGMOD Intl. Conf. on Management of Data, San Francisco, Calif., May 1987. — p. 426-439.

50. Freytag J. A Rule-Based View of Query Optimization. Proc. ACM SIGMOD Intl. Conf. on Management of Data, pp. 173-180 San Francisco, Calif., 1987.

51. Greene D. An Implementation and Perfomance Analysis of Spatial Data Access Methods. — Proc. Data Engineering, 1989.

52. Graefe G. Query evaluation techniques for large databases // ACM Computing Surveys. N.Y., 1993. — Vol. 25, N. 2. — P. 73-170.

53. Katz R. Towards a Unified Framework for Version Modelling in Engineering Databases. ACM Computing Surveys, vol. 22, no. 4, Dec. 1990. - p. 375-408.

54. Kim W., Ballou N., Garza J., Woelk D. A Distributed Object-Oriented Database System Supporting Shared and Private Databases. — ACM Trans, on Office Infor- mation Systems, Jan. 1991. — pp. 31-51.

55. Kriegel H. Schiwietz M., Schneider R., Seeger B. Proc. Symp. On the Design and Implementation of Large Spatial Databases, Santa Barbara, —1989. — P.413-418.

56. Oraclelli Concepts. Release 2 (11.2.0.1). April 2010. Part No. A76965-01

57. Oraclelli Administrator's Guide. Release 2 (11.2.0.1). April 2010. Part No. A76956-0166. http://www.mark-itt.ru, Chapter 8. The Data Dictionary, URL http://www.mark-itt.ru/docs/oracle/SCN73/pt8.htm

58. Raskin, Jef. «Down with GUIs,» Wired pp. (December 1993).

59. Stonebraker M. The Design of the Postgres Storage System. Proc. VLDB Conf., 1987.69. http://help.sap.com/businessobject/productguides/boexi/en/crXIUserGde en.pdf, Chapter 1. Introduction to Crystal Reports XI.

60. Woelk D., Kim W. Multimedia Information Management in an Object-Oriented Database System. Proc. Intl. Conf. on Very Large Data Bases, Brighton, England, Sept. 1987, pp. 319-329.