автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Методы реализации семантических свойств данных в объектных доменно-ориентированных моделях

кандидата технических наук
Масленников, Алексей Анатольевич
город
Пенза
год
2003
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Методы реализации семантических свойств данных в объектных доменно-ориентированных моделях»

Оглавление автор диссертации — кандидата технических наук Масленников, Алексей Анатольевич

ВВЕДЕНИЕ

1 Анализ существующих подходов к проектированию баз данных

1.1 Обзор семантических моделей данных

1.2 Реляционные базы данных

1.2.1 Основные понятия реляционных баз данных

1.2.2 Анализ семантических свойств реляционных моделей данных

1.3 Объектно-ориентированные базы данных

1.3.1 Связь объектно-ориентированных баз данных с общими понятиями объектно-ориентированного подхода

1.3.2 Объектно-ориентированные модели данных

1.4 Темпоральные базы данных

1.5 Современные направления исследований и разработок

1.5.1 Расширенная реляционная модель

1.5.2 Базы данных, основанные на правилах

1.5.3 Доменно-ориентированные базы данных

ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ

2 Моделирование предметной области при помощи семантических доменно-ориентированных структур данных и способы организации доменноориентированных баз данных

2.1 Абстрактная семантическая доменно-ориентированная модель данных

2.1.1 Основные определения

2.1.2 Представление табличной информации в виде семантических доменно-ориентированных структур данных

2.2 Операции над семантическими доменами

2.2.1 Конструктивные операции над семантическими доменами

2.2.2 Семантические операции над семантическими доменами

2.2.3 Декомпозиция семантических доменов

2.2.4 Композиция семантических доменов

2.3 Моделирование предметной области с помощью семантических доменно-ориентированных структур данных

2.4 Основные способы организации доменно-ориентированных баз данных

2.5 Использование семантики предметной области при проектировании доменно-ориентированных распределенных информационных систем

2.5.1 Структура доменно-ориентированной распределенной базы данных

2.5.2 Программа распределения внутренних системных номеров

ВЫВОДЫ ПО ВТОРОЙ ГЛАВЕ

3 Разработка объектно-ориентированного интерфейса домена с учетом структурных свойств элементов домена и использование доменов в доменно-ориентированных базах данных.

3.1 Объектно-ориентированный интерфейс домена

3.2 Иерархия классов доменов

3.2.1 Нулевой уровень конкретизации

3.2.2 Первый уровень конкретизации

3.2.3 Второй уровень конкретизации

3.2.4 Третий уровень конкретизации

3.2.5 Четвертый уровень конкретизации

3.2.6 Домен таблиц

3.2.7 Адаптация домена таблиц под Borland С++ Builder

3.2.8 Домен таблиц с визуальной компонентой

3.3 Реализация доменно-ориентированной информационной системы

3.4 Сравнительный анализ эффективности обработки табличной информации при реляционном и объектном доменно-ориентированном подходах к организации данных

ВЫВОДЫ ПО ТРЕТЬЕЙ ГЛАВЕ

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Масленников, Алексей Анатольевич

Актуальность работы. Обеспечение эффективного функционирования информационных систем требует выбора наилучшей, с точки зрения конкретного приложения, организации данных. При этом большое значение имеет учет семантических свойств используемых данных, который создает основу эффективной реализации механизмов поддержки целостности баз данных (БД), а также позволяет предложить типовые информационные и программные компоненты для разработки информационных систем, что особенно важно при разработке глобальных баз данных, использующих общие информационные ресурсы.

В настоящее время в связи с быстрым развитием аппаратного обеспечения все большее значение приобретают приложения, работающие с большими объемами данных сложной структуры. Для них требуется модель данных, которая в наиболее естественной форме выражает структуру отдельных объектов, отношения между ними и их поведение. Задание указанных свойств данных непосредственно в их описании, а не в использующих их приложениях, позволяет избежать возможной избыточности или несогласованности, а также позволяет упростить работу разработчикам приложений и администраторам БД. Разнообразие моделей, применяемых в базах данных, связано с различием используемых парадигм информационного моделирования. С этой точки зрения различают реляционные, иерархические, сетевые, расширенные реляционные, объектно-ориентированные, объектно-реляционные и другие модели.

Прикладное программное обеспечение (ПО) ориентировано на решение конкретных задач и предполагает использование сведений о разнообразных объектах предметной области, которые обладают определенным содержанием (смыслом). Следовательно, объекты характеризуются определенными семантическими свойствами. Однако реализация семантических свойств в прикладном программном обеспечении требует создания механизма их программной и информационной поддержки. Обеспечение поддержки семантических свойств данных при разработке прикладного программного обеспечения является серьезной проблемой. Разработчик программного обеспечения при создании механизма поддержки семантических свойств данных распределяет отдельные части этого механизма между прикладным программным обеспечением, схемой, хранимыми процедурами и триггерами БД. Это приводит к децентрализации механизма поддержки целостности и дублированию программного кода. Кроме того, использование в системах управления базами данных (СУБД) хранимых процедур и триггеров усложняет переносимость прикладного программного обеспечения.

В настоящее время в проектировании информационных систем все большее значение приобретают компонентные методы разработки программного обеспечения. Большое значение для разработки информационных систем имеет создание моделей и методов, обеспечивающих для совокупности однотипных объектов учет семантики путем интеграции данных, описания данных (метаданных) и управления данными в одном программном компоненте (домене). В диссертационной работе предлагается использовать компонентные методы, основанные на рассмотрении в качестве элемента совокупности однотипных объектов. Домен рассматривается как самостоятельная простейшая информационная система, характеризуемая набором операций.

Объектом исследования является организация хранения и обработки сложных структур данных в базах данных с учетом семантики предметной области.

Предметом исследования являются методы эффективной реализации семантических свойств сложных структур данных в системах управления базами данных для информационных систем.

Цель работы. Цель диссертационной работы заключается в создании модели и методов, обеспечивающих эффективную поддержку семантических свойств совокупностей данных сложной структуры. В работе исследуются структурные отношения между объектами, и предлагается алгоритм внутренней системной идентификации объектов на основе иерархических взаимосвязей между сущностями.

Задачи исследования. Для достижения поставленной цели решаются следующие задачи.

Заключение диссертация на тему "Методы реализации семантических свойств данных в объектных доменно-ориентированных моделях"

ВЫВОДЫ ПО ТРЕТЬЕЙ ГЛАВЕ

1. Разработан способ реализации семантических объектных домен-но-ориентированных структур в виде домена с единственной точкой входа, обеспечивающий независимость приложений от организации хранения элементов домена.

2. Предложена и реализована иерархия классов доменов, иллюстрирующая поэтапный переход от абстрактного представления домена к конкретному, что позволит использовать свойства и операции уже разработанных доменов в реализации новых доменов и тем самым ускорить процесс их создания.

3. Дана спецификация классов доменов, входящих в предложенную иерархическую классификацию. Определен перечень типовых выполняемых операций для каждого из этих классов, что позволит обеспечить принципы открытости и переносимости доменов при реализации приложений, позволяющие в 2-3 и более раз ускорить разработку информационных систем за счет использования ранее подготовленных доменов.

4. Применение семантической объектной доменно-ориентированной модели данных в реализации распределенной информационной системы сбора и обработки образовательной статистики позволило обеспечить высокую степень поддержки целостности данных и уменьшить объем прикладного программного обеспечения за счет исключения из приложения программного кода для поддержки целостности, реализованного непосредственно в теле доменов.

5. Сравнительный экспериментальный анализ эффективности обработки данных при использовании реляционного и объектного доменно-ориентированного подхода к реализации баз данных показали уменьшение среднего времени доступа к данным более чем в 10 раз.

ЗАКЛЮЧЕНИЕ

Диссертационная работа посвящена вопросам разработки методов повышения эффективности представления и реализации семантических свойств сложных структур данных.

Основным результатом диссертационной работы является разработка абстрактной семантической доменно-ориентированной модели данных.

Результаты диссертационной работы сводятся к следующему.

1. На основе анализа моделей данных предложена семантическая доменно-ориентированная модель данных.

2. Предложенная модель позволила детально учитывать свойства и отношения, присущие объектам предметной области, через использование сложных структур данных (массивов, записей, множеств, таблиц и т.д.). Это позволило разработать систему управления данными, которая обеспечила высокую эффективность обработки и высокий уровень поддержки целостности данных.

3. Разработаны операции, позволяющие манипулировать доменами с учетом семантики данных. Это позволило специфицировать методы манипулирования данными в доменно-ориентированных информационных системах.

4. На основе предложенной модели показана возможность реализации структур данных, построенных на основе реляционной модели данных. Учет семантических свойств предметной области в доменно-ориентированных распределенных информационных системах позволяет добиться уменьшения объема памяти, требуемого для хранения информации, более чем в 1,5 раза и повысить быстродействие по сравнению с традиционной организацией данных.

5. Предложен метод представления табличной информации при помощи доменно-ориентированных структур данных. Разработан язык описания информационной части семантического домена, содержащего табличную информацию, применение которого позволяет точно специфицировать свойства элементов домена и тем самым обеспечить поддержку семантики.

6. Разработаны методы описания предметной области при помощи предложенной семантической доменно-ориентированной модели данных. Предложены методы организации баз данных на основе семантической доменно-ориентированной модели.

7. Предложен метаязык описания иерархии сущностей, разработан метод и алгоритм идентификации объектов в соответствии с иерархией сущностей, обеспечивающий эффективное кодирование иерархических отношений.

8. Предложены методы проектирования и разработки прикладного программного обеспечения с использованием объектного доменно-ориентированного подхода. Разработан метод реализации семантических доменно-ориентированных структур в виде домена с единственной точкой входа. Построена иерархия классов доменов, иллюстрирующая поэтапный переход от абстрактного представления домена к конкретному. Это позволило реализовать принципы открытости информационного обеспечения доменно-ориентированных баз данных и переносимости прикладного программного обеспечения, позволяющие в 2-3 и более раза ускорить разработку информационных систем за счет использования ранее подготовленных компонентов (доменов).

9. Осуществлена реализация классов доменно-ориентированной системы управления данными для объектов сложной табличной структуры. Система управления данными была использована в реализации распределенной информационной системы сбора и обработки образовательной статистики.

10.Проведен сравнительный анализ эффективности обработки данных при использовании реляционного и объектного доменно-ориентированного подхода к реализации баз данных. Результаты эксперимента показали уменьшение среднего времени доступа к данным более чем в 10 раз.

СПИСОК ОСНОВНЫХ СОКРАЩЕНИЙ

БД - база данных

ВСН - внутренний системный номер ООБД - объектно-ориентированная БД ПО - программное обеспечение СУБД - система управления базами данных

Библиография Масленников, Алексей Анатольевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Белоусов А.Л. Применение временных баз данных при многоэтапном проектировании сложных систем / А.Л. Белоусов, А.А. Дружаев, М.А. Иванцов // Сучасш проблеми математики: MaTepiann м1жнародно1 науково1 конференци.-Чершвщ: Рута, 1998.- Частина 4.-С.9-11.

2. Бел сон Дон. Внутренний мир Огас1е8. Проектирование и настройка / Белсон Дон, Гокмен Марк, Ингрем Джонатан. К.: "ДиаСофт", 2000. - 800 с.

3. Вьюкова Н.И. Информационная безопасность систем управления базами данных / Н.И. Вьюкова, В.А. Галатенко // СУБД.-1996.-№1.-С.29-54.

4. Голосов А.О. Аномалии в реляционных БД // СУБД.-1996.-№3.-С.2328.

5. Грабер Мартин. Введение в SQL. М.: "ЛОРИ",1996.

6. Грачев А. Объектно-реляционная СУБД Informix Universal Server // СУБД.-1998.-№1-2.

7. Григорьев Е. Представления идентифицируемых сложных объектов в реляционной базе данных // Открытые системы. 2000.- №1-2.-С.79.

8. Давид Бич. К объектным базам данных // СУБД.-1994.-№4,- С.50-55.

9. Ю.Дарвин X. Третий манифест / Дарвин X.,. Дэйт К // СУБД.- 1996.-№1.~1. С.110-123.

10. Дейт К. Дж. Введение в системы баз данных.:Пер. с англ.- 6-е изд.- К.: Диалектика, 1998.

11. Дехтярь М.И. Восстановление ограничений целостности за счет наименьших достаточных изменений / М.И. Дехтярь, А.Я. Диковский, Н. Спиратос // Программирование.-1998.-№2.-С.27-37.

12. Джон М. Смит. Абстракции баз данных: Агрегация и обобщение / ДжонМ. Смит, Диана К. Смит//СУБД- 1996.-№2.-С. 141.

13. Доменно-ориентированная нумерационная система управления базами данных // Отчет о научно-исследовательской работе. №63-1-8. Пенза: ПГУ.-1999.

14. Доменно-ориентированная система управления данными / В.М. Линьков, В.В. Дрождин, В.И. Горбаченко, А.А. Дружаев, М.А. Иванцов, А.Л. Белоусов и др. // Отчет о НИР, № гос. регистрации 01.9.70.006285. Пенза: ПГУ.- 1999.

15. Дружаев А.А. Правила поведения доменно-ориентированной системы управления данными // Экономика, менеджмент, информатика, иностранные языки: Ежегодн. Межвуз. сб. научн. ст. Пенза: ПГПУ им. В.Г. Белинского. 2001.-С.92-95.

16. Калиниченко Б.О. Асинхронное тиражирование данных в гетерогенных средах. // СУБД.-1996.-№3.-С.118.

17. Ковтун И.И. Матрично-реляционная модель данных для преставления и обработки информации в автоматизированных системах мониторинга и управления. // Программирование.- 1997.- №6,- С.58-72.

18. Кодд Е.Ф. Реляционная модель данных для больших совместно используемых банков данных // СУБД.-1995.-№1.-С.145-160.

19. Колгановский М.Р. Абстракции и модели в системах баз данных // СУБД.-1998.- №4-5.

20. Коржов В. Базы данных идут в тираж. Обзор известных механизмов тиражирования и их доступность в SQL Server 7.0 //СУБД.- 1998.- №3.

21. Кришнамурфи Вишу. Объекты и SQL в ORACLE8// Русское издание ORACLE MAGAZINE.-1997.-№2(4).

22. Кузнецов С. Безопасность и целостность, или Худший враг себе это ты сам //Открытые системы,-1997,- №5.

23. Кузнецов С. Объектно-ориентированные базы данных основные концепции, организация и управление: краткий обзор //Открытые системы.-1997.-№6.

24. Кузнецов С. Основы современных баз данных. М.:"Финансы и статистика", 1997.

25. Кузнецов С. Третий манифест Дейта и Дарвена. //Открытые системы,-2000.- №4.

26. Кузнецов С. Третий манифест Дейта и Дарвена: немного формализма. // Открытые системы,- 2000.-№7-8.

27. Ладыженский Г. Распределенные информационные системы и базы данных// Открытые системы.- 1997.-№7-8.

28. Линьков В.М. Домен с единственной точкой входа как элемент домен-но-ориентированной базы данных /В.М. Линьков, А.А. Масленников/ Материалы II всероссийской научно-технической конференции,- Пенза: ПГПУ,- 2002. С.15.

29. Линьков В.М. Интервальные вычисления и поддержка целостности БД. / В.М. Линьков, А.А. Дружаев // Сборник докладов межвузовской конференции "Математические методы решения прикладных физико-технических задач". Пенза: ПАИИ.-1999.

30. Линьков В.М. Использование семантики в реализации запросов к БД /В.М. Линьков, А.А. Масленников, Е.А. Породников // Материалы IV международной научно-технической конференции.- Пенза: ПГУ, 2000.

31. Линьков В.М. Категорная модель данных и проектирование открытых информационных систем // Тезисы докладов.- Пенза: ПДЗ.- 2000.

32. Линьков В.М. Метаязык описания иерархии сущностей /В.М. Линьков, А.А. Масленников/ Материалы всероссийской научно-технической конференции.- Пенза: ПГПУ.- 2001. С.51.

33. Линьков В.М. Нумерационная доменно-ориентированная методология построения баз данных // Материалы всероссийской научно-технической конференции.- Пенза.- 1997. С.З.

34. Линьков В.М. Нумерационные методы в проектировании систем управления данными.- Пенза: ПГТУ, 1994.

35. Линьков В.М. Представление табличной информации в виде семантических доменно-ориентированных структур данных /В.М. Линьков, А.А. Масленников, Е.А. Породников/ Информационный листок №54-158-03, УДК 0025.002.5, серия Р 20.53.19. Пенза, 2003.

36. Линьков В.М. Реализация и использование в доменно-ориентированной базе данных доменов с единственной точкой входа /В.М. Линьков, А.А. Масленников/ Материалы II всероссийской научно-технической конференции.- Пенза: ПГПУ.- 2002. С. 17.

37. Линьков В.М. Структура системы распределения внутренних системных номеров /В.М. Линьков, А.А. Масленников/ Материалы всероссийской научно-технической конференции.- Пенза: ПГПУ.- 2001. С.45.

38. Лисовский К. IBM DB2 и объектно-ориентированные информационные системы // СУБД.-1997.-№6.

39. Лоран Д. Детерминированное поддержание ограничений целостности / Лоран Д., Спиратос Н., Стамат Д. // Программирование 1998.-№2.-С.38-57.

40. Масленников А.А. Семантические доменно-ориентированные структуры данных // Компьютеризация обучения и проблемы гуманизации образования в техническом вузе: Сборник материалов международной научно-методической конференции. Пенза: ПГСА, 2003. С. 184-189.

41. Мартин Дж. Организация баз данных в вычислительных системах. Изд. 2-е М: "Мир", 1980.

42. Михаэл Стоунбрейкер. Объектно-реляционные системы баз данных// СУБД.-1994.-№4.-С.43-44.

43. Пржиялковский В. Абстракции в проектировании БД // СУБД.-1998.-№01.02.

44. Пржиялковский В. Новые одежды знакомых СУБД: новая реальность данная нам // СУБД.-1997.-№4.-С.88.

45. Распределенная информационно-аналитическая система сбора и обработки статистики по вузам Пензенской области. /В.М. Линьков, В.В. Дрождин, А.А. Дружаев, А.А. Масленников и др./ Отчет по проекту №3309. № гос. регистрации 01.20.00.06408. Пенза: ПГУ, 2000.

46. Реализация ассоциаций между классами в среде активных баз данных / Topee X., Мартин О., Тройано Х.А., Торо М. // Программирование.- 2000.- №4, с. 42-54.

47. Системы баз данных третьего поколения: Манифест // СУБД.-1995.-№2.-С.143-159.

48. Цаленко М.Ш. Реляционные модели баз данных.-В сб.: Алгоритмы и организация решения экономических задач. Выи 9. М. "Статистика", 1977.

49. Цаленко М.Ш. Моделирование семантики в базах данных.- М. Наука1989.

50. Цикритзис Д. Модели данных / Цикритзис Д., Лоховски Ф. -М.:"Финансы и статистика", 1985

51. Чемберлин Д. Анатомия объектно-реляционных баз данных // СУБД,-1998.-№1-2.

52. Эйзенберг Эндрю. SQL:1999, ранее известный как SQL3 / Эйзенберг Эндрю, Мелтон Джим. // Открытые системы 1999.- №1.- с.52

53. SEQUEL 2: унифицированный подход к определению, манипулированию и контролю данных. Д.Д. Чамберлин, М.М.Астрахан, К.П.Эсваран, П.П.Грифитс, Р.А.Лори, Д.В.Мел, П.Райшер, Б.В.Вейд //СУБД,- 1996.- №1.-с144-159

54. Alejandro P. Buchmann, Alin Deutsch, and Juergen Zimmermann. The REACH Active OODBMS. Technical report, Technical University Darmstadt, 1995.

55. Ashish Gupta, Sanjai Tiwari. Constraint Management On Distributed Design Databases // Data Engeneering, June 1994,Vol. 17, №2.

56. C.J. Date. Persistence Not Orthogonal to Type/ Database Programming & Design On Line October 1998

57. C.J.Date 1987. What is distributed database? InfoDB, 2:7

58. Catriel Beeri. A Formal Approach to Object-Oriented Databases // Data and Knowledge Eng.- 5.- 1990.- 353-382

59. David Wells. Will Oracle8 Be Universal? //Oracle View, October 1997

60. DBMS, August 1996. Integrity Control

61. Donald D. Chamberlin Anatomy of an Object-Relational Database. DB2 Online Magazine, Winter 1996

62. Eric N. Hanson and Jennifer Widom. An Overview of Production Rules in Database Systems. Technical report, University of Florida, Department of Computer and Information Sciences, October 1992.

63. IDEA at Bonn: Chimera Model and Language, 1996. Bonn.

64. J. D. Ullman. Principles of Database and Knowledge-Base Systems 1 and 2. CSP, 1989.

65. Paul W.P.J. Grefen Rolf A. de By Peter M.G. Apers. Integrity Control in Advanced Database Systems// Data Engeneering, June 1994,Vol. 17, №2

66. Paul W.P.J. Grefen, Rolf A. de By, Peter M.G. Apers. Integrity Control in Advanced Database Systems//Data Engeneering, June 1994,Vol. 17, №2.

67. S. Ceri, P. Fraternali, S. Paraboschi, L. Tanca. Active Rule Management in Chimera//Active Database Systems, Morgan-Kaufmann, 1996

68. S. K. Lellani, N. Spiratos. Towards a Categorical Data Model Supporting Structured Objects and Inheritance // Proc. 1st Int. East/West Database Workshop, Kiev, Oct. 1990, Lect. Notes Comput. Sci.- 540.- 1991

69. SQL Reference//IBM DB2 Universal Database: Online Books, 1998

70. Stefano Ceri, Piero Fraternali, Stefano Paraboschi. Constraint Management in Chimera// Data Engeneering, June 1994,Vol. 17, №2.

71. Stonebraker M.R., Wong E. Access Control in Relation Data Base Manag-ment System by Query Modification // Proc. ACM National Conference.-1974

72. Subhasish Mazumdar, David Stemple. Helping the Database Designer Maintain Integrity Constraints// Data Engeneering, June 1994,Vol. 17, №2

73. Sudarshan S. Chawathe, Hector Garcia-Molina, and Jennifer Widom. Flexible Constraint Management for Autonomous Distributed Databases // Data Engeneering, June 1994,Vol. 17, №2.

74. The PostgreSQL Development Team. Edited by Thomas Lockhart// Post-greSQL is copyright (C) 1998 by the Postgres Global Development Group.

75. Umeshwar Dayal. Active Database Management Systems. In Proceedings of the Third International Conference on Data and Knowledge Bases, pages 150-169, Jerusalem, June 1988.