автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Модельно-языковые средства управления данными

кандидата физико-математических наук
Гринев, Максим Николаевич
город
Москва
год
2003
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Модельно-языковые средства управления данными»

Оглавление автор диссертации — кандидата физико-математических наук Гринев, Максим Николаевич

Введение

1 Модельно-языковые средства управления данными и оптимизация запросов на модельном уровне

1.1 Семантически-ориентированные модели данных.

1.1.1 Основные понятия.

1.1.2 Эволюция моделей данных с повышенным уровнем семантики.

1.1.3 Перспективы моделей данных с повышенным уровнем семантики.

1.2 Оптимизация запросов к XML-данным

1.2.1 Основные принципы оптимизации запросов и оптимизация на модельном уровне.

1.2.2 Модель данных XML и язык запросов XQuery

1.2.3 Предварительное исследование возможностей логической оптимизации XQuery-запросов.

1.2.4 Обзор работ по оптимизации XQuery-запросов

1.3 Выводы.

2 Декларативный язык запросов данных в терминах UML

2.1 О необходимости разработки языка запросов к данным в терминах UML.

2.2 Язык UQL.

2.2.1 Модель данных языка UQL.

2.2.2 Система типов языка UQL

2.2.3 Операции над значениями агрегатных типов.

2.2.4 Операции над объектами классов.

2.2.5 Общая семантика UQL-запроса.

2.2.6 Сокращенные формы записи и правила разрешения неоднозначности.

2.2.7 О статической типизируемости языка UQL.

2.3 Реализация языка UQL через отображение в XQuery

2.3.1 Отображение модели UML-данных на модель данных XML.

2.3.2 Правила трансляции UQL-запросов в XQuery-запросы

2.4 Выводы.

3 Логическая оптимизация запросов на языке XQuery

3.1 Общий подход к логической оптимизации XQuery-запросов

3.1.1 Постановка задачи логической оптимизации XQuery-запросов и обоснование оправданности такой постановки

3.1.2 Использование техники перезаписи в качестве средства описания решения задачи логической оптимизации и как основы для реализации.

3.1.3 Классы правил перезаписи и этапы логической оптимизации

3.2 Логическое представление XQuery-запросов.

3.3 Расширение модели данных XML и логического представления XQuery-запросов

3.4 Семантическая оптимизация.

3.5 Открытая вставка тел XQuery функций.

3.6 Преобразование структуры запроса.

3.6.1 Привила для базовых операций.

3.6.2 Привила для И-операций.

3.6.3 Правила для поддержки запросов, обращающихся к динамическому контексту.

3.7 Повышение уровня декларативности представления запроса

3.8 Результаты использования логического оптимизатора

3.9 Выводы.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Гринев, Максим Николаевич

Актуальность темы

В настоящее время язык XML используется как основное средство унифицированного представления данных различной степени структурированности. Это приводит к росту объемов XML-данных, которыми необходимо управлять. Одним из ключевых компонентов технологии управления XML-данными является декларативный язык запросов XQuery. Однако имеющиеся средства, основанные на языке XQuery, характеризуются низкой эффективностью, что делает невозможным их практическое использование для управления XML-данными больших объемов. Кроме того, другой важной проблемой использования XML-данных является предоставление конечным пользователям средств доступа в терминах, приближенных к предметной области. Разработка таких средств стимулируется ростом популярности языка UML, который предназначен для описания модели предметной области и для которого существуют отображения на язык XML. Решение этих проблем и определяет актуальность диссертационной работы.

Цель и задачи работы

Целью диссертационной работы является исследование и разработка средств эффективной поддержки моделей данных UML и XML в рамках единой многоуровневой системы баз данных. Для достижения этой цели поставлены следующие задачи:

1. Разработка языка UQL, позволяющего формулировать запросы к данным в терминах диаграмм классов UML.

2. Разработка метода трансляции UQL-запросов в запросы на языке XQuery.

3. Разработка методов логической оптимизации выполнения XQuery-запросов.

Основные результаты работы

1. Разработан язык UQL, позволяющий формулировать запросы к данным в терминах диаграмм классов UML.

2. Разработан и реализован метод поддержки языка UQL через трансляцию UQL-запросов в запросы на языке XQuery.

3. Разработаны и реализованы методы логической оптимизации XQuery-запросов.

Научная новизна работы

Научной новизной обладают следующие результаты диссертационной работы:

• переопределена семантика языка OCL с целью создания языка запросов UQL, обеспечивающего доступ к данным в терминах концептуальных схем, которые определяются на языке диаграмм классов UML;

• разработан метод трансляции запросов на языке UQL в запросы на стандартном языке запросов к XML-данным XQuery;

• предложен оригинальный подход к логической оптимизации XQuery-запросов, основанный на использовании метода перезаписи, и методы такой оптимизации в рамках этого подхода.

Практическая значимость

Разработанный язык запросов UQL может служить основой для создания подсистемы поддержки запросов, определяемых в терминах диаграмм классов UML, в различных системах управления данными. К таким системам можно отнести СУБД и системы интеграции данных.

Разработанные методы логической оптимизации выполнения XQuery-запросов могут быть использованы для повышения эффективности подсистем поддержки XQuery-запросов в XML СУБД и системах интеграции данных на базе XML.

Разработан прототип системы, которая поддерживает UQL-запросы и XQuery-запросы на разных уровнях в единой системе баз данных и включает логический оптимизатор XQuery-запросов. Этот прототип был использован в качестве основы для создания в ИСП РАН промышленной системы виртуальной интеграции BizQuery.

Доклады и публикации

Основные положения работы докладывались на пятой и шестой международных конференциях Advances in Databases and Information Systems (ADBIS) (2001 г. и 2002 г.), на шестьдесят третьем, семьдесят третьем и семьдесят шестом семинарах Московской Секции ACM SIGMOD (2000 г., 2001 г., 2002 г.), на научном семинаре ИСП РАН (2002 г.), на семинаре "Современные сетевые технологии" (2002 г.), на втором семинаре "XML-академия" компании Software AG (2000 г.).

По материалам диссертации опубликовано пять печатных работ [47, 48, 49, 50, 51].

Структура и объем диссертации

Работа состоит из введения, трех глав, заключения и списка литературы. Общий объем диссертации 116 страниц. Список литературы содержит 51 наименование.

Заключение диссертация на тему "Модельно-языковые средства управления данными"

3.9 Выводы

Основным выводом из произведенного автором формального обоснования предложенных в работе методов логической оптимизации XQuery-запросов является то, что уровень оптимизируемости запросов различен в зависимости от рассматриваемого подмножества языка. Так, наиболее мощное и важное базовое подмножество языка характеризуется наиболее высоким уровнем оптимизируемости. Для этого подмножества возможно в полной мере осуществление всех выбранных в работе видов логической оптимизации за исключением открытой вставки тел XQuery-функций, определяемых пользователем. Реализация этого вида оптимизации возможна только для подмножества XQuery-функций, которое, тем не менее, имеет наибольшее значение для практики. Расширение базового подмножества языка XQuery операциями поддержки XQuery-контекста и операциями, основанными на наличии уникальных идентификаторов XML-узлов, приводит к снижению уровня оптимизируемости запросов,

Заключение

В диссертационной работе получены следующие результаты:

1. Разработан язык UQL, позволяющий формулировать запросы к данным в терминах диаграмм классов UML.

2. Разработан и реализован метод поддержки языка UQL через трансляцию UQL-запросов в запросы на языке XQuery.

3. Разработаны, формально обоснованы и реализованы методы логической оптимизации XQuery-запросов.

Библиография Гринев, Максим Николаевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. CODASYL DBTG Report, April 1971.

2. Codd E.F. "A Relational Model of Data for Large Shared Data Banks." Comm. of the ACM, 1970, v. 13, no. 6, pp. 377-387.

3. Chen RP. "The Entity-Relationship Model. Toward to Unified View of Data." ACM Trans, on Database Syst., v. 1, no. 1, 1976, pp. 9-36.

4. D. M. Campbell, D. W. Embley, B. D. Czejdo. "A Relational^ Complete Query Language for an Entity-Relationship Model." International Conference on Conceptual Modeling (ER), p. 90-97, 1985.

5. K. Subieta, M. Missala. "Semantics of Query Languages for the Entity-Relationship Model." International Conference on Conceptual Modeling (ER), p. 197-216, 1986.

6. J.M. Smith, D.C.P. Smith. "Database Abstractions: Aggregation and Generalization." ACM Trans, on Database Syst., v. 2, no. 2, 1977, pp. 105-133.

7. M. Hammer, D. McLeod. "Database Description with SDM: A semantic database model." ACM Trans, Database Syst., 19, 3, September 1987.

8. D. Jagannathan et al. "SIM: A Database System Based on the Semantic Data Model." ACM SIGMOD Conf. 1988.

9. R. Barker. "CASE*Method. Entity-Relationship Modelling." Addison-Wesley Publishing Co., 1990.

10. D.W. Shipman. "The Functional Data Model and the Data Language DAPLEX." ACM Trans, on Database Systems, Vol. 6, No. 1, March 1981, Pages 140-173.

11. D.H. Fishman, D. Beech, H.P. Gate et al. "IRIS: An object-oriented database system." ACM TYans. Off. Inf. Syst. 5, 1, 1987.

12. J. McHugh, S. Abiteboul, R. Goldman, D. Quass, and J. Widom. "Lore: A Database Management System for Semistructured Data." SIGMOD Record, 26(3), pp. 54-66, September 1997.13