автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Анализ методов и средств представления и обработки баз данных на основе ненормализованных реляционных моделей данных
Автореферат диссертации по теме "Анализ методов и средств представления и обработки баз данных на основе ненормализованных реляционных моделей данных"
РГ6 од
1 ¡нОНиЕВШя ГОРОДСКАЯ ГОСУДАРСТВЕННАЯ АДМИНИСТРАЦИЯ НАУЧНО-ПРОИЗВОДСТВЕННОЕ ОБЪЕДИНЕНИЕ "ГОРСИСТЕМОТЕХНИКА"
На правах рукописи УДК 681.3
ГРАБОВЕЦКИГГ ЮРИИ ВИКТОРОВИЧ
АНАЛИЗ МЕТОДОВ И СРЕДСТВ ПРЕДСТАВЛЕНИЯ И ОБРАБОТКИ БАЗ ДАННЫХ НА ОСНОВЕ НЕН0РМАЛИ30ВАШХ РЕЛЯЦИОННЫХ МОДЕЛЕЙ ДАННЫХ.
|Специальность 05.13.17 - Теоретические основы информатики
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук.
Киев - 1992
Работа выполнена в научно-производственном объединении "ГОРСИСТЕМОТЕХНИКА"
Научный руководитель: член-корреспондент АН Украины, доктор физико-математических наук, профессор A.A. Стогний
Официальные оппоненты:
доктор физико-математических наук, профессор Цегелик Г.Г.
кандидат физико-математических наук Басараб И.А.
Ведущая организация: Институт программных систем АН Украины
Защита состоится « /7» _ Ш-С-£оЦ> 1993 г. в на заседании специализированного совета- Д 166.01.01 при НПО Торсистемотехника" по адресу 252004, Киэв-4, ул. Красноармейская 23-6
С диссертацией можно ознакомиться в научно-технической библиотеке НПО ТОРСИСТЕМОТЕХНИКА".
Автореферат разослан «1983 г.
Ученый секретарь Специализированного Совета С.Д. МихновскиЯ
Д 166.01.01
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.
Актуальность проблемы. Теоретические исследования в облести моделей данных, широкая практика создания и эксплуатации БД, построенных на их основе, принесли наряду с другими популярность и реляционной модели данных, впервые предложенной Э.Ф. Коддом в 1970 г. Дальнейшее развитие работ позволило создать развитый математический аппарат теоретического анализа РБД с одной стороны и ряд промышленных реляционных СУБД с другой. Однако, наряду с положительными свойствами реляционная модель данных в ее классическом понимании и СУБД на ее основе обладают рядом существенных недостатков. Среди них можно выделить следующие:
1. Низкая семантическая выразительность реляционной модели данных; большинство методов проектирования РБД порождают "плоскую" БД, т.е. семейство отношений с неопределенными между ними семантическими связями.
2. Недостаточная адекватность отображения реального мира в соответствующую информационную модель, поскольку требование первой нормальной формы, (т.е. атомарности значения атрибута в отношении), в общем случае с точки зрения семантики предметной области, носит исскуственный характер.
3. Спроектированные и функционирующие РБД, как правило, обладают определенной избыточностью представлений, что является одной из причин возникновения аномалий обновления БД и приводит к неэффективному использованию ресурсов ЭВМ.
4. В традиционных РБД возникают зачастую трудности навигационного характера, обусловленные низкой связностью отношений в БД..
5. Отсутствуют эффективные средства представления неполной, нечеткой информации, временных параметров, текстовых данных и т.д.
Следовательно проблема адекватного расширения традиционной реляционной модели данных с целью устранения указанных выше недостатков является актуальной как в теоретическом так и зрикладном аспектах.
Цель диссертационной работы заключается в разработке теоретических и прикладных вопросов, проектирования, представления и обработки БД на основе ненормализованных реляционных моделей данных.. Исходя из этого, исследования проводились по следующим основным направлениям:
- аналитическая оценка основных результатов в области ненормализованных реляционных моделей данных;
- интеграция различных подходов к ненормализованным реляционным моделям данных и построение расширенной реляционной модели данных с гнездованием. Разработка при этом унифицированной системы основных^понятий, определений и обозначений;
- выделение основных точек концентрации исследовательских усилий по ликвидации указанных недостатков традиционной реляционной модели данных;
- построение языков, описания и манипулирования данными для ШВД как средств проектирования, представления и обработки БД на их основе;
- построение исследовательского прототипа СУБД на основе расширенной НЩД.
- анализ возможных практических приложений БД на основе расширенной ШВД;
Научная новизна - диссертации ощюделяется следующим: представлена расширенная реляционная модель данных с гнездованием, разработана унифицированная система понятий и определений. Представлен языки описания и манипулирования данными для расширенной НБЗД как средства проектирования, представления и обработки БД на основе расширенной НЕВД. Разработаны принципы, методы и алгоритмы построения программного комплекса исследовательского прототипа СУБД на основе НЩД.
Методы исследования базируются на основных положения^ теории отношения, формальной алгебры и алгебраических систем, теории графов, теории предикатов, теории информационного анализа, а 'Также математической теории баз данных.
Достоверность основных научны^ результатов обеспечивается строгим математическим доказательством сформулирова1шых утверждений и теорем, путем решения практических задач и их внедрения в конкретных информационных системах.
Практическая ценность диссертации. Результаты диссертационных исследований проверялись на практике в процессе выполнения договорных и .госбюджетных работ. Разработанные средства и, методы, алгоритмы и программы' могут использоваться:
- при построении обобщенной методики проектирования БД;
- при разработке промышленных СУБД на основе НРВД;
- при разработке САПР баз данных;
- в учебном процессе при подготовке специалистов в области прикладной математики, системного анализа, АСУ и т.д.
- а также при разработке прикладных информационных систем различных классов для промышленной эксплуатации.
Реализация результатов исслеягтаггей. _ В плане реализации основных концепций диссертации разработаны методика проектирования, представления и обработки ненормализованных реляционных БД, исследовательский прототип СУБД на основе расширенной НРМД. Данные' результаты использовались при выполнении госбюджетных и договорных работ для Ровенского областного госпиталя инвалидов Великой отечественной войны, Ровенской ЦРБ, Красиловского сахарного завода, Бориславской фабрики нетканых материалов, Бориславского экспериментального литейно-механического завода, Ивано-Франковского завода КСМ, Львовского университета, Львовского объединения "Ювелирпром", Львовской кондитерской фирмы "Свиточ" и т.д. По результатам диссертационных■ исследований были подготовлены и изданы во Львовском политехническом институте методические указания по изучению раздела"Ненормализованные реляционные модели данных" в курсе "Базы и банки данных и знаний". Результаты исследований использованы при проектировании баз данных коллективного пользования во Львовском региональном центре компьютерных телекоммуникаций для использования в региональных компьютерных сетях.
Апробация работы. " Результаты диссертационной работы докладывались на всесоюзных школах-семинарах по системам баз
данных и знаний в 1989, 1990 гг. (г. Львов - Славск), на ежегодных научных конферейциях профессорско-преподавательского состава Львовского политехнического института (факультет, компьютерной техники и информационных технологий, 1989-1992 гг.), на республиканском научном семинаре "Интеграция информационных систем" в НПО "Горсистемотехника", на научном семинаре института "Программных систем" научного комплекса "Институт кибернетики имени В.М Глушкова АН Украины", кафедре "Теории программирования"
Киевского госуниверситета.
/
Шйжкашш. По теме диссертационной работы опубликовано шесть работ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка основной использованной
г\ ттг>т»*1гт)гт . ... ...............................
ЖЧ"—/ ^ ^уишхц V/
текста, список литературы - из 126 наименований, страницы
приложений. Общий объем диссертации" страниц.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ.
До ввепении обоснована важность и актуальность проблем, решению которых посвящена диссертация. Сформулированы цель исследования, его научная новизна, а также основные положения, которые выносятся, на защиту. Дано краткое содержание диссертации по главам.
и первой главе представлена расширенная ненормализованная реляционная модель данных. Рассмотрены основные понятия и определения расширенной НРВД, исследованы ее свойства. Предложена соответствующая расширенная реляционная алгебра. Рассмотрены некоторые аспекты теории' зависимостей данных в НРМД. Структурная схема основных понятий и определений для расширенной НРМД представлена на рис. I.
Пусть задано некоторое множество атрибутов - и. Исходя из семантики предметной 'области, объекты которой характеризуются заданным множеством атрибутов, между элементами и фиксируются определенные взаимосвязи. Данные семантические взаимосвязи могут
быть произвольной природы, отображать различные соотношения между оъектами, их характеристиками, процессами "жизнедеятельности" объектов и т.д.. Более того, они могут изменяться с течением времени. Желательным представляется учет в схеме РБД и этих существующих взаимосвязей. Среди них выделяем специальный класс так называемых структурных зависимостей, отображающих структурные взаимосвязи мевду объектами предметной области. Структурные зависимости позволяют добиться унифицированного представления схем отношений и играют важную роль при . анализе структур ненормализованных БД.
Рис. I.
Схему отношения определим как тройку И = <и-,Г,Е>, где и -множество атрибутов, Г - множество структурных зависимостей, 2 -множество зависимостей данных. Данное представление схемы
отношения является более естественным,чем традиционное определение И = {Ш так как, - во-первых, зависимости наследуют семантические взаимосвязи между объектами предметной области, к адекватному отображению которых должен стремиться каждый проектировщик, и, во-вторых, они отражают те ограничения, которые вводит сам проектировщик. То есть система зависимостей является внешней по отношению к информационному наполнении РБД. Схема БД определяется как совокупность схем, отношений 8 = ( Н1, Н2, ..., Нп). Для представления схем используется основанное на идеях Джакобса представление в виде множества правил вида 11 = (А*,.. .,а\,2. ), где объекты А^ являются либо правилами приведенного выше вида, либо атрибутами. При этом объект (имя) - высшего порядка, если он встречается в левой части некоторого из правила, в остальных случаех - нулевого порядка, объект (имя) и является внешним, если оно находится только в левой части одного из правил, все остальные объекты являются внутренними. Все внутренние объекты высшего и нулевого порядков называются атрибутами высшего и нулевого порядков (обозначаются Н(Я) и I(Н) ) соответственно. Внешнее имя Н является именем схемы БД. Каждое правило определяет некоторую гнездовую подсхему.
Схема Н является реляционной схемой БД, если выполняются следующие условия:
1. Существует единственное внешнее имя Б - имя схемы;
2. Не существует двух различных правил с одинаковыми именами в левой части.
3. В правых частях двух различных правил не может встретиться одинаковое имя.
Аналогичным образом определяются и схемы отношений в БД.
Автором введено понятие иерархической схемы-дерева, которое играет важную роль при анализе структур . ненормализованных отношений. Иерархической схемой-деревом Т(й) называется дерево, вершинами которого- являются атрибутами, а дуги соответствуют отношениям вложенности между нир, где отношением вложешости называется отношение между именем' в левой части правила и именем в правой части данного правила. Уровень вложенности не
ограничивается. На основе понятия иерархической схемы-дерева отношения с гнездованием на множестве атрибутов вводятся отношения частичного порядка.
Предложены расширенные определения информационного отношения, его экземпляра и структуры: информационным отношением с гнездованием (отношением) называется некоторое отображение i тожества атрибутов U схемы R на декартово произведение' их доменов, такое, что его элементы, г удовлетворяют . множеству зависимостей 2. Элементы г. называются экземплярами отношений. Совокупность схемы и экземпляра <Н,г> называется структурой.
Вводйтся следующее"* понятие домена 'атрибута в НМД: доменом Dom (А.) атрибута L является:
1. Множество допустимых конечных подмножеств множества domiAJ, если £« Z(RJ, где cLomiA-J - множество допустимых атомарных значений атрибута А. ;
2. Dom (А. ) = х Dom(A.), если А.е H(R), где С (А.) -
1 . Ак* С (А. )
множество потомков вершины At иерархической схемы Т (R) -
При построении расширенной реляционной алгебры для НИЩ было . проведено рекурсивное расширение алгебраических ; операторов традиционной реляционной алгебры: объединения, пересечения, разности, декартового произведения, естественного соединения и селекции, также построено соотввтсвугацее расширение специфических операторов реструктуризации отношений с гнездованием NEST и IfflNEST. Использование предложенной алгебры позволяет формулировать запросы к данным, находящимся на различных уровнях иерархической схемы отношения с гнездованием, избегая дополонительных .операторов переструктуризации и' существенно облегчая навигацию то базе данных, что в конечном итоге щлгаодат к возможности построения эффективных трансляторов для языков обработки БД с гнездованием.
При анализе алгебраических свойств структур отношений с гнездованием основное внимание было уделено вопросам корректных,, (информационно-беспотерьных) их преобразований. Представлен ряд таких критериев:
I. UNNESTy.(NESTY(<R,r>)) = <R,r>
2. UNNESTx(UNJffiSTY(<R,r>)) = UNNESTv(UNNESTx(<R,r>))
3. NESTy(UNNESTv.(<r,r>)) 3 PD: (U - Y' ) -> Y'
4. Оператор NEST свойством коммутативности не обладает.
Кроме того исследованы свойства взаимодействия операторов, NEST и UNKEST и соответствующих расширений традиционных операторов реляционной алгебры.
Введены расширения. понятий функциональной и многозначной зависимостей данных в ненормализованных структурах. Представлены их свойства. Из анализа свойств зависимостей данных можно сделать вывод, что их наличие накладывает существенные ограничения на структуру гнезд в ненормализованных отношениях, и что в этом случае существует довольно жесткая связь между исходным отношением в I® и эквивалентным ему отношением с гнездованием, что приводит к уменьшит™ яф^ективности представления отношений в ненормализованном виде применением последовательностей NEST и UNNEST операторов.
Во второй главе проанализированы процессы информационного моделирования проблемных областей и проектирования баз данных реляционного типа на основе расширенной КРМД. Предложены методы концептуального и логического проектирования схем БД на основе предложенной расширенной НРМД. ,
Проектирование баз данных на основе расширенной ненормализованной ' реляционной модели данных рассматривается с точки зрения концепции трехуровневого представления БД. Основное внимание уделено вопросам концептуального и логического проектирования схем ненормализованных баз данных. Главным принципом такого проектироания концептуальных и логических схем является концепция проектирования- "сверху-вниз". На концептуальном уровне предложена методика анализа предметных областей и построения концептуальных иерархических схем для предметной области. Для достижения указанной цели необходимо последовательное проведение следующих шагов:
- определение множества классов объектов предметной области;.
- определение множества храктеристик каждого объекта;
- построение системы структурных зависимостей на классах
ю
объектов;
- определение множества - домэноз значений характеристик каздого объекта и функций отображения;
- выяснение- существующих семантических взаимосвязей между объектами предметной области и построение системы зависимостей адекватно апроксимиругацей данные взаимосвязи;
- построение множества ограничений целостности;
- определение динамических характеристик предметной области;
- определение классов задач, возникающих в предметной области в процессе ее жизнедеятельности;
- определение групп пользователей проектируемой ИБС на основе
* ненормализованной БД.
- определение классов задач групп пользователей.
Укрушенно этапы концептуального проектирования информационной системы 'на основе расширенной НРМД можно представить в виде дерева целей, представленного на рис. 2.
Рис. 2.
Отображена классификация и специфика основных типов задач, решаемых в реализации информационной системы, моделирующей жизнедеятельность предметной области:
- задачи поддержки относительно постоянной информации • в предметной области ( справочники, структуры объектов, зависимости данных и т.д.);
■ - задачи поддержки ввода, коррекции динамически изменяющихся
оперативных данных;
- задачи выделения групп пользователей и. поддержки их фрагментов предметной области;.
- задачи получения итоговых данных и отчетов;
- непосредственные задачи груш пользователей;
- ведение архивных задач; ■
- задачи поддержки целостности БД,
На логическом уровне проектирования производится адекватное отображение концептуальной схемы' предметной области в схемы отношений с гнездованием. Определяются типы и конкретный вид зависимостей ■ данных. Строятся множества атрибутов высшего и нулевого порядков согласно иерархическим схемам отношений с гнездованием, фиксируются связи между отношениями. Результатом является схема ненормализованной БД, представленная корректным множеством правил. Диаграмма целей, представляющую данную задачу изображено на рис. 3. Данное отображение желательно проводить использую синтаксические и семантические конструкции конкретной СУБД. 1
После построения логической схемы ненормализованной БД проводится анализ полученной схемы с точки зрения требования нормализации и введения дополнительных ограничений целостности проектировщика, при этом решаются задачи:
- определения адекватности логической схемы БД концептуальной схеме предметной области;
- анализ наличия избыточности представлений и проведение необходимой коррекции схем отношений с гнездованием и структурных связей между ними;
- описания решения выделенных на концептуальном уровне групп задач в терминах имен атрибутов, . зависимостей данных и их обработки.
С точки зрения применения нетрадиционных методов анализа при проектировании схем отношений с гнездованием предпринята попытка использования основных положений и методов информационного
Рис. 3
анализа, где в качестве информационной меры предлагается использовать энтропию Шеннона, заданную "на множестве атрибутов.
Энтропией Н(А) атрибута А структуры <Н,г> является :
Я(А)= -.¡:j]tf[A]=a[| р(а) log р(а), где a« Dom (А),
к = ü Dom(A)|j, tfe <P(A),f(A)>.
Однако на практике, достаточно затруднительным представляется определение априорных вероятностей элементов. доменов- атрибутов. Поэтому, исходя из предположения, что в каждый ..конкретный момент времени структура <R,r> адекватно описывает состояние предметной области, которую она моделирует, то в качестве Dom(А) можно использовать активный домен (т.е. множество Dom(A) п ПА(<Н,г>)) атрибута А данной структуры. С другой стороны энтропия атрибута А высшего порядка очевидно равна сумме энтропий гнездовых структур, определенных на множестве атрибутов С(А). Таким образом можно
рекурсивно определить эмпирическую энтропию, заданную на атрибутах ненормализованной структуры и устраняющей необходимость вычисления сложных вероятностей элементов доменов атрибутов высших порядков:,
1. Н(А) = - SjKaUog р(а), v а ^ <F(A),f(A)>, А * Z(R);
2. Н(А) s.SH(At) + H(Ak), V Ak^C(A)nH(R),V A.eC(A)nZ(R)
v t e <F(A),f(A)>, A <s H(R).
Отметим, что для произвольного множества атрибутов одного и того же порядка X его энтропия равна сумме энтропий его элементов, Н(в)=0. Пусть X,Y s и, X n Y * о. Рассмотрит«! условную энтропию множеств атрибутов X и У : H(XiY)=-2xy р(ху) log p(xiy). Данная мера H(X|Y) представляет количество неопределенности в множестве атрибутов X после получения значений по множеству атрибуте:) Y. Тогда Н(л)-Щлй') представляет собой количество информации в множестве' атрибутов X, если известны значения по множеству атрибутов Y. Эта мэра называется ' взаимной информативностью X,Y и записывается:
I(X,Y) = Н(Х) + H(Y) - H(XY)
Данные соотношения проиллюстрированы рис 4.
Лемма. Пусть заданы вероятности Р.а о, 2iPv = 2А= 1' Tor^a -^P.log рс £ -\plog достигается тогда и только тогда, если vi р.=
А-
о,
и
1=1,1, И равенство
' Рис. 4
Теорема 1. Пусть заданы некоторые попарно-непересекающиеся
множества атрибутов X, У, г и Р(Х)=Р(У)=Р(г), тогда выполняются ••¡ледупцие утверждения:
1. 1(У,?|Х) > О
2. н(хуг) < Н(НУ). + н(хг) - П(Х)
3. 1(Х,У) > о
4. ЩХ) < Н(ХУ)
Энтропия структуры отношения с гнездованием определяется как:
Н(<Й,Г>) = 2Н(А.) + Н(\), V А,^ С(ЕООТ(Н)) г, Н(й), V а. е с(коот(Н)) 'п гаи, V г е <и,г>
Мерой структуризации заданной структуры <й, г> отношения с гнездованием будем называть величину Меэ(Н,г) = Н(Л,г) - Н(И' ,г* ), гдэ <Р/ ,г' > соответствующая <Н,г> структура отношения в ШФ.
Очевидно, что для более адекватного определения меры структуризации необходимо стремиться к исследованиям экземпляров отношений, наиболее полно представляющих предметную область.
Мера структуризации может выступать в качестве показателя эффективности построения иерархической схемы отношения. 'Так при МеБДИ.г) * о построенная схема отношения дополнительной информации практически не- несет и возможно, что при' проектировании недостаточно полно была проделана работа по учету семантических взаимосвязей в предметной области и может потребоваться перепроектирование схемы БД.
Система зависимостей 2 имеет менее глобальный характер, чем множество структурных зависимостей Г, представлямых в правилах отношениями вложенности. Однако выявление таких зависимостей и точный их учет в схемах на этапе проектирования позволяет исключать избыточную информацию в экземплярах и проводить адекватный _ контроль целостности представляемых данных. Так как зависимости данных выражают определенные взаимосвязи на множестве атрибутов, а не в целом для структур, то очевидно, что наиболее удобным для их выявления и исследования является рассмотремый аппарат информационного анализа с использованием условных энтропий множеств атрибутов.
Действительно, если множество~. атрибутов X определенным образом связано зависимостью с множеством атрибутов У то
Л5
справедливо, что мера информации H(Y|X> является также 'мерой зависимости множества атрибутов Y от множества X. Так, если H(Y|X) = H(Y), то очевидно, что множества атрибутов X и Y являются независимыми. При H(Y|X) < H(Y) . - X и Y связаны определенной зависимостью данных. Предложенный подход достаточно эффективно можно использовать для идентификации зависимостей данных, не выявленных на этапе проектирования схем отношений. При тщательном анализе условных энтропий для различных множеств атрибутов исследуемой структуры можно выделять специфические зависимости данных отражающие более тонкие семантические взаимосвязи объектов заданной' предметной области, которые практически невозможно получить, используя методы традиционного реляционного анализа.
Для функциональных (F) и многозначных (MV) зависимостей данных были получены следующие основные результаты, связанные с информационными характеристиками отношения с гнбздованием. Пусть задана некоторая ненормализованная структура <R,r>.
Теорема 2. Следующие утверждения эквивалентны;
1. На <R,r> поддерживается FD: X -> Y;
2. atiXY] = ху» = иt£ХЗ = х»; t e <R,r>
3. H(Y|X) = 0;
4. H(XY) = Н(Х);
5. I(X,Y) = H(Y).
Теорема 3. Эквивалентными являются утверждения :
1. На <R,r> поддерживается MVD: X ->> Y;
2. nttXY] = ху» »ttXZl = xz» = «t[X] = xii, t е <R,r>;
3. I(Y, ZIX) =0;
4. H(XYZ) = H(XY) + H(XZ) - H(X);
5. H(YZIX) = H(Y|X) + H(ZIX)
.Доказательства эквивалентностей данных теорем следуют из определений зависимостей и результатов ■ теоремы I. На основе приведенных результатов строится алгоритм эффективной проверки наличия Г и ИТ зависимостей в данном экземпляре отношения с гнездованием.
В третьей главе разработаны основные структурные компоненты языков описания и манипулирования данными с использованием
предложенного базиса алгебраических операций над реляционными структурами, описываемыми при помощи формализмов расширенной НРМД. Приведен синтаксис основных структурных единиц рассматриваемых языков.Рассмотрены вопросы трансляции данных языков в расширенную реляционную алгебру. Введены новые типы данных.
Предложен высокоуровневый SQL-подобный язык описания данных дкя расширенной ненормализованной реляционной модели данных. При построении данного языка введены новые типы семантические типы атрибутов:
- ATOMIC - значение атрибута атомарное;
- LIST - значением атрибута является список;'
- NEST - значением атрибута является Структура;
Допускается рекурсия семантических типов LIST и NEST", т.е. LIST(NEST ...), NEST(LIST ...).
С точки зрения базовых значений атомарных атрибутов введены два новых типа:
- FUNCTION - значением атрибута 'является результат выполнения некоторой функций;
- FORMULA .— данный тип аналогичен типу 'FUNCTION, но отличается механизмом описания и обработки.
Введение данных 'типов' атрибутов повышает семантическую выразительность расширенной НРМД, предоставляет доплнительные возможности при проектировании БД, а .также закладывает механизмы ( адаптации структуры самой БД.
При построении языков описания и манипулирования данными, средств запросов для расширенной НРМД реализованы следуюоие основные' требования:
- ортогональность выражений: везде, где допустимо имя отношения допустимым является и SFW-выражение;
- необязательная реструктуризация отношений ..посредством NEST и UNNEST операторов;
- ортогональность функций: функции допустимы к отношениям, атрибутам высшего порядка, к атрибутам нулевого порядка;
- использование'" механизма описания типов и ссылок для
упрощения синтаксиса, реализации запросов, - повышения читабельности;
- исключение традиционных конструкций GROUP BY / HAVING -достаточно трудных для понимания и использования;
- совместимость "снизу-вверх" с .традиционным SQ1 для традиционной реляционной модели денных.
Рассмотрены механизмы трансляции данных языков для использования при построении исследовательского, прототипа СУБД на основе расширенной НРНД. Заметам, что главная трудность использования SQ1 - подобных, языков для ненормализованных моделей данных заключается в программировании интерфейса самого языка, а также в том, что все инструментальные типовые языки программирования - являются записеориеЕтированные.
Проведен сравнительный анализ БСЦ-подобных языков для ненормализованных реляционных моделей данных, в частности языков GEM, DAPLEX, UQBE, GSQL, HDBI, SQL/MP, X-SQL/NF.
В четвертой главе описан исследовательский прототип СУБД на основе расширенной НРВД. Приведено описание
программно-алгоритмических средств, обеспечивающих поддержку основных функций и свойств исследовательского прототипа СУБД. На реальных примерах, выполненных научно-исследовательских разработок показана реализация полученных автором результатов в практических приложениях. Рассмотрены некоторые элементы САПР БД реляционного типа на основе расширенной НРМД.
При разработке исследовательского прототипа СУБД преследовалась реализация следующих основных целей:
- поддержка структур \ расширенной ненормализованной реляционной модели данных;
- обеспечение совместимости "снизу-вверх" при работе с базами данными на основе традиционной реляционной модели;
- введение новых базовых типов атрибутов нулевого порядка, поддерживаемых СУБД;
- поддержка автоматизированного инструментария проектирования
схем отношегий БД;
- поддержка макроязыка описания задач групп пользователей;
i
- обеспечение типовой структуры программно-алгоритмического комплекса подеержки БД и решения задач групп пользователей;
- обеспечение удобного высокоуровневого интерфейса конечного пользователя как в плане проектирования БД так и подержки готовых информационных систем;
- поддержка прикладного программного интерфейса для специализированной обработки данных;
- обеспечение механизма автоматизации написания основных модулей реализации операций селекции, дополнения и модификации ненормализованных структур в терминах выбранной конкретной промышленной СУБД поддержки;
- возможности доступа к внутренним генерируемым схемам структур поддержки ненормализованных отношений и словарям типов атрибутов различных уровней;
В целом, проект создания данного прототипа СУБД на дальнейших этапах ставит целью исследовать возможность использования технологи БД как средства интеграции данных различных типов. Функциональная схема исследовательского прототипа СУБД на основе расширенной НРВД приведена на рис. 5.
При реализации исследовательского прототипа СУБД на основе расширенной ненормализованной реляционной модели данных в качестве промышленной СУБД для физической поддержки использовались СУБД DBASE-семейства.
На примерах, представленных из реальных практических разработок автора, продемонстрированы методы, возможности и средства tro проектированию, реализации и поддержке конкретных информационных систем в различных предметных областях.
С точки зрения разработки САПР БД на основе НРМД представлены элементы разработанного автором инструментария проектирования ненормализованных БД и генератора программ поддержки информационной системы на основе спроектированной БД.
•РИС. 5
и яятсллпчйншт сформулированы основные выводы и результаты, полученные в период выполнения диссертационных исследований. Предложены и проанализированы возможные направления дальнейших исследований и основные возможные предложения.
в приложении приведены документы, подтверждающие внедрение результатов диссертации.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ
1. Разработана и исследована расширенная ненормализованная реляционная модель данных.
2.-Разработана унифицированная система понятий и определений расширенной ненормализованной реляционной модели данных.
3. Предложены рекурсивные расширения операторов. реляционной алгебры для обработки структур БД на основе НРМД. Исследованы их
го
основные свойства.
4. Разработаны и исследованы ясыки описания и манипулирования ■ данными для расширенной НРВД как формальные программно -алгоритмические средства информационного моделирования предметных областей, проектирования, представления и обработки БД на ее основе.
0. Разработаны принципы, методы и алгоритмы построения программного комплекса исследовательского' прототипа СУБД на основе расширенной НРВД.
в. Разработаны программно-алгоритмические средства проектирования, формирования и обработки ненормализованных реляционных баз данных и прототипов прикладных информационных систем на их осноБв для конкретных практических' приложений.
ОсноЬные результаты диссертации изложены в работах:
1. Ю.В. Грабовецкий..-Расширение семантической выразительности реляционной базы данных путем' использования "отношений с гнездованием. // Вестник Львовского политехнического института, .4 248, "Технические средства автоматизации измерений и управления научными исследованиями", 1990, с. 38-41. -
2. Пас1чрик В.В., Грабовецький Ю.В. Методичн! вказ1вки до самост!йяого вивчення теми "Ненорма л 1 зован 1 релящйш моде л 1 даних" курсу "Бази та Банки даних 1 знань" // ЛШ. - Лв1в, 1990.
4.1. - 43 с.
3. Пас1чник В.В'., Грабовецький Ю.В. Методичш ' вказгвки до самост!йного Еивчейня теми "Нвнормал1зован1 реляц1йн! модел! даних" курсу "Бази та Банки даних I знань" // ЛШ. - Лв1в, 1990.
4.2. - 43 е..
4. Розробка елемент1в автоматизовано! системи обробки баз даних та знань реляц1йного типу на основ! персональних ЕОМ" профес!йного класу. : Зв1т про НДР (заверш.) // ЛШ; Кер1вшк Пас1чник В.В. - ; 01890057488. - Лв1в, 1991. 320 с. - В1дп. викон.; Грабовецький Ю.Б. та ин. .
5. РеляЩйШ модел! баз даних: Зв1т про НДР (заверш.) // ЛШ;
Кер1вник Паучник В.В. - ; 01890009052. - Льв1в, 1990. - 327 с. -В1дп. Викон. Грабовецький Ю.В. та га.
6. Створення програмно-математичного комплексу розширення функц1ональних можливостей систем баз даних I знань релящйного . типу на основ1 апарату нетрадшцйних лог1к: Зв1т про НДР (завер.) // ЛП1. Кер1вник' Пас1ЧНИк В.В. - ; 01910041765. - Льв1в, 1991. 257 с . - В1дп. викон. Грабовецький Ю.В. та ш.
Щдл. ДО друку , 3 о* 93 . формат бОхв^/'б. , Пап1р друк. ¡е 2, Друк.^офс. Умовн.друк.арк. Умовн.фарб.-в}дд» Обл.-вид.арк.
Тираж 4оо прйм. Зам. ¡>4. . Безплатно
_ЛД1 290646 Льв{в-13. Ст.Вандери, 12
Дхльниця оперативного друку ЛП1 Львгв, вул. Городоцька, 286
\
-
Похожие работы
- Метод построения эффективной информационно-вычислительной системы
- Методы и средства информационной базы анализа энергосистем
- Методика обработки темпоральной реляционной базы данных в миварном пространстве
- Метод автоматизированного синтеза объектно-реляционной базы данных АСУП
- Интеграция объектных систем обработки информации и реляционных серверов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность