автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка логического процессора реляционных данных и методики его использования в океанологическом банке данных
Автореферат диссертации по теме "Разработка логического процессора реляционных данных и методики его использования в океанологическом банке данных"
■9 0 3 9 $
^ о - - российская академия наук
дальневосточное отделение институт ангоматики и процессов управления
На праиах рукописи
Петров™ Евгений Александрович
разработка логического процессора реляционных даншх и (методики его использования в океанологическом нанке данных
05.13. И - математическое и программное обеспечение вычислительных маски, ¡телексов, систем и сетей
Автореферат диссертации на соискание ученой степени кандидата технических наук
ВЛАДИВОСТОК-)992
- г -
Работа выполнена в Институте автоматики и процессов управления Дальневосточного отделения РАН.
Научный руководитель: кандидат технических наук
А. КХ Гвильдис.
Официальные оппоненты: доктор фиаико-математических наук
A.C. Клещэв,
кандидат технических наук R К. Бломроз.
Ь-дущее предприятие: Институт прикладной математики
ДЮ РАН (Владивосток)
Защита состоится 'К ^ " ^■ А-т <г 1592 года в / О часов на ьаседании Специализированного совета К 003.30.01 в Институте автоматик и процессов управления Дальневосточного отделения РАН по адресу:
690032, г. Владивосток, ул. Радио, 5.
С диссертацией можно ознакомиться в библиотеке Института автоматики и процессов управления ДБО РАН.
Автореферат разослан 1992 г.
Т~ у
Ученый секретарь ссвета
к. н. cr\C-i 9-м ^ Е. И. Коггл
'Я^РС^'^^Г,! - 3 -
ивг. \ ОШАЯ характеристика работы
- -4
СТД,,ЛВ '.таг научных исследованиях, где приходится обрабатывать боль-ссодвздийдличестзо информации, эффективным средством автоматизации могут выступать банки данных. Современный банк данных представляет собой слоотый комплекс средств хранения, поиска и обработки информации. Основными компонентами программного обеспечения ( ПО ) банка являэтся:
- система управления баяаш данных (СУБД), обеспечивающая основные функции управления данными;
- пользовательасая оболочка, представляющая собоЯ набор инструментальных програмшых средств, предназначенных для автоматизации разработки прикладного ПО:
- прикладные программные системы, созданные для решения конкретных задач пользователей банка данных, с использованием СУБД и оболочки.
Для эффективного применения банков данных при автоматизации научных исследования, связанных с обработкой больших обгонов природных данных, необходимо создавать пользовательские оболочки, которые учитывали бы следующие специфические особенности как самих данных, так и способов их обработки:
- данные в большинстве однородны, имеют числовой харшстер и объем до 100-1000 1-С;
- решаемые задачи требуют мощных средств как числовой, так и литеральной обработки данных, причем процесс обработки может носить итеративный характер;
- заранее нельзя предсказать, какие конкретно задачи будут решаться на основе данных банка.
.Примером задач, связанных с обработкой больших данных, являются задачи океанографии, в которых, основываясь на данных элементарных замеров, необходимо проводить классификацию, районирование, выделение различных полей и объектов, поиск неоднородностей и т. д. Аналогичные задачи есть в геологии, метеорологии, обработке космических снимков и других областях науки, связанных с изучением природных систем.
Можно выделить три основных группы задач:
- классические банковсга« задачи выполнения тематических Еыбо-рок данных по разным районам, когда необходимо производить манипулирование большими исходными малашами данных;
- задачи многоаспектного представлена;; ккфо;>садик, которые актуальны в банках данных благодаря тому, что существует разрыв иек-ду представлением о природной система, формируешь при сборе экспериментальных данных и представлением специалистов. Преодоление этого разрыва, т. е. обеспечение пользователя информацией в необходимом ему виде, является одной из главных целей обработки данных;
- создание логических моделей тех теорий, которые используются прикладными специалистами для задач обработки и интерпретации данных, хранящихся в банке, и их проверка средствами оболочки банка;
Для рс-Еонии таких задач программное обеспечение оболочек банков данных долкно;
- предоставлять возможности для разработки пакетов прикладных программ, т. е. яэьвси для манипулирования даиными, средства модификации, агрегировала, сложные глтстатические функции обработки и т. д:
- обеспечивать средства для организации систем мдогоаспектиого представления информации, т. е. обеспечивать раал>. шые представления одной и той же исходной информации для разных пользователей, представлять в единой фэрме как исходные данные, так и данные, полученные в результате обработки исходных, обеспечивать одинаковые возможности для работы с первичными iï с вычисленной дилнымл;
- предоставлять простые механизмы для расшрения и модификации прикладных систем, построенных на основе оболочки.
При разработка пользовательских оболочек применяются -два основных подхода Первый подразумевает организации оболочки в виде пакета прикладных программ ( ППП ), который обеспечивает все необходимые пользователю функции. При этом подходе создаваемые прикладные системы обладает высокой производительностью, но оказывайся жестко настроенным:! на решение конкретного крута еадач и требует больших затрат на разработку и сопровождение. Процесс разработки ПО для таких систем трудно автоматизировать, а готовые программные комплексы плохо поддаются модифшеацпи и расширению.
Второй подход предполагает использование методов искусственного интеллекта (НИ), в частности, технологии продукционных систем (ПС). При этом оболочка реализуется icaK совокупность трех компонентов:
- базы данных ( БД), которую можно интерпретировать как совокупность известных фактов;
- логического процессора для обработки информации;
- базы знаний ( БЗ), которая содержит инструкции для процессора.
Из этих трех компонентов оболочки активную роль играет процессор. Основываясь на хранязщхся в ЕД фактах, он выполняет дедуктивный вывод новой информации, используя при этом инструаши, хранящиеся з БЗ. Эти инструкции, их обычно называют правилами базы знаний, составляются ira специальном языке, возможности которого являются отражением возможностей логического процессора, т. е. запросы языка транслируются в те, и только те функции, которые поддерживает процессор. Разработка прикладного ПО заключается в составлении набора правил БЗ, которые описывают ганкретную предметную область. Возможности прикладных систем, созданных на основе таких оболочек, определяются только объемом и содержанием БЗ и БД. Правила независимы друг от друга, а алгоритм, по которому процессор выбирает правила из БЗ, не зависит от содержания ЕД и БЗ. Благодаря этому, база знаний, т. е. прикладное программное обеспечение, может сравнительно легко расширяться либо модифицироваться. Продукционные системы, функционирующие как интеллектуальные оболочка! над базой данных, успесно применяются в качестве средств автоматизации разработки ПО, предназначенного для решения ряда задач в медицине, химии и других областях.
Главным недостатком этих систем является их низкая производительность по сравнению с более тралиплонны?.!:: основанными на технологии пакетов прикладных программ 11ШП). Это обусловлено внутренним алгоритмом работы ПС, реализованных на язькзх искусственного интеллекта ( ПРОЛОГ, ЛИСП и т.п. ). Характеристики алгоритма таковы, что при линейном росте размера базы данных время ответа может расти экспоненциально. Наличие экспоненты плохо не только тем, что нельзя работать с большими данными, но и тем, что нельзя предсказать, при каких объемах наступит комбинаторный взрыв. Видимо, по этой причине, использование продукционных систем в обработке больсих баз данных не нашло в настоящее время широкого применения.
Одним из актуальных исследований б области создания интеллектуальных оболочек банков данных, использующих продукционный подход, является расширение области их применения за счет повышения быстродействия. К этому направлению относится настоящая работа.
Целью диссертационной раооти является разработка и создание интеллектуальной оболочки научного банка данных, рассчитанной на работу с большой базой данных. В рсоуж ?ате исследований предлага-
ется метод создания логического процессора оболочки, обеспечивающий высокую производительность, разработана и реализована система, рассчитанная на работу с базой данных в миллион и более строк.
Основные задач;:, решенные автором и представленные в работе:
- проведен анализ функционирования ГО и исследована связь между внутренним формализмом и быстродействием ПС;
- определено влияние выбора формализма языка описания правил БЗ на область применения;
- исследована возможность применения реляционного исчисления в качестве формализма для систем, рассчитанных на обработку больших объемов данных;
- определены состав и функции элементов, составляющих логический реляционный процессор, принципы реализации, основные алгоритмы и структуры данных;
- на основании проведенных исследований выполнена программная реализация основных компонентов логического процессора реляционных данных, рпзраОотана методика его нспольвоб&пня и апробировано применение для г у 20 ния задачи классификации ъодных ыасс oiosaisa.
Научная новизна Предлогам новый подход к построению интеллектуальной оболочки банка данных, заключающийся в реализации ее в виде реляционной СУБД с дедуют'лшыш-еозьюдностями, что позволяет использовать реляционное исчисление в качестве внутреннего формализма. Для поддержки реляционного исчисления можно применить алгоритмы, которые имеют большее быстродействие, чем алгоритмы универсальных Ш и таким образом обеспечить эффективную работу с базой данных. Показано, что применительно к большим обгемам. данных 'ограничение, накладываемое формализмом реляционного исчисления, незначительно сужает класс решаемых задач, а выйгриш за счет повышения быстродействия позволяет расширить область примзнения ПС. Нормой реализации дедуктивных возможностей предложен аппарат подсхем (АП). В отличие от известных реализаций аппарата подсхем (SQL/DS и др. ), в частности, предлолено в качестве подсхем применять прикладные программы, что дает возможность создавать структуры подсхем, включающие алгоритмы математической обработки информации.
Практическая ценность, lia основании анализа задачи построения реляционной СУБД с дедуктивными возможностями выработаны требования к характеристикам производительности СУБД, языку запросов и языку описания подсхем, рехошу взаимодействия аппарата подсхем и
СУБД. С учетом этих требований а средэ CEJ ЕС 3E.Í реализована система ДОРД/ЕМ, позволяемая создавать интоллоетуа-пыше банки дан-¡¡ых для различных областей иаучких исследований.
Лпробацич робот Основные рэзул*>таты диссертаниош'ой работы дс^адкпгп'сь па Совоцзшч ртЯочэй группы РГ25 по проблем*»* и ипструкзнтаркэ иятэграцни ивфде/зшюнних екзтои Ко!.п:сс:ш по научным вопросам ВТ Акаде^о наук соистраи (Глав, 1969), на VII исосошком сого-зяня "Азто)аткг-щин упр-звтенил телничесюгуа средствами кгмэ;;оы®та l'::ponöro океана" (Кг^ятшград, 1929), на ВоосовзкоЯ математической атлв (Нзходк?, 19Q3), на научних cer.t--парах в ГОККе, ВШС'СИ, КАПУ.
ПУБЛИКАГЩ. По материалам проведенной работ» опублшювага -1 пе-чатпчч* труда.
Струкз-ура и объем диссертант?. Диссертация состоит из введения, 4 г л 13, заключения и списка литературы, niccraici^ro 121 наименование. Работа содэргягс 115 страчпц каашопкоусго тскс?п, G ргсупков.
Содержание работа
Бо уьедеиии рассматриваются причины успешного пр;п.;зпег.ия продукционных систем в различных областях и отличие ПС от традиционных систем обработки информации, основанных на технологи'.; паюгтов прикладных программ. Выделяются три основных элемента структуры продукционной системы:
- база знаний (БЗ);
- база данных (БД);
- управляющая программа, или процессор логического виводз.
Приводится обтая схемл функционирования продукционных систем. В
качестве одной из"основных трудностей, которая возникает при распространении технологии ПС называется низкая производительность. В то хе врет указывается на актуальность применения продзащионного подхода в научных исследованиях, характеризующихся болъши'.гл объемами данных.
Формулируется основная цель диссертационной работы, кратко излагается содержание по главам.
В" первой главе делается постановка задачи, показывается, что в ПС, созданных с применением современных языков Ш1, основанных на
исчислении предикатов первого поряди (11ПШ), применяются универсальные алгоритмы подарки, которые и«еют верхнюю оценку вро-ыс-ни работы, пропорциональную экспоненте от.п, где п - риамор Сазы данных. Такая оценка па позволяет применить ПС к решении аад-ч боль сой размерности. Предлагается изменить фсрха&ъх ПС и за счет этого использовать более эффективные алгоритмы. В качества тагаго формализма рассматривается реляционное исчислон;;о ( РИ ). Показывается, что в приложила», характеризуют,чхся бояыакки объема:-,^! данных, такое изменение формализма не пр:шодит к сужении области применения продукционных систем. На основании этих выводов формулируется задача построения ПО, предназначенной для обработки больших объемов и: 5 формации с реляционным исчисленной в качестве внутреннего формаллама. В результата дальнейссго анализа делается вывод о том, что рол< такой ПС кат^у выполнять реляционная СУЕД с дедуктивными возможностями, реализованными в ьздэ аппарата подсхем базы данных.
Для этого необходимо р^'-згаботат?''.! реализовать:
- СУЕД, способную по сесйм скоростным у а ракт ерпст ккь м выполнять дедуктивны.! синод;
- язык,описания подсхем реляционной базы данных, соответствующей поставленной задач?;
- програмыу-шнктор управления подсхемой;
- сродства пользователя длл работы с подсхемами.
1» п-сорэй главе рассматривается требования, прэдглвдяемые но ьегн континентам дедуктивной СУБД и продпаг густея способы их реализации.
При обсуждении вопроса о выборе СУБД анализируются возмоыше варианта се функционирования, задачи, Боеникаюуге при. выводе и ак-туалшации подсхем, харагстср запросов п регта их выполнешт, выра-батьша-оген .требования . к языку. В результате обсуэдешш для СУБД выдвигался следующее требования:
- возможность храпения больгл.:х ебте-мов информации;
■- высокое быстродействие при выполнении итеративных запросов;
- наличие развитого языка описания и манипулирозанил данными, включающего возможности работы с массивами данных;
- сохранение высокого быстродействия при интенсивном изменении схемы и содержимого БД.
.При сравнении выработанных требований и характеристик современных коммерческих СУБД делается вывод о невозможности их исполъзо-
вкшя глк базовой СУБД продукционной систеиы. В качества решения предлагается для разработки СУБД с двдугтттья возможностями применить метод доступа (РЭД. Р!Щ основан на алгебре цепей и обеспечивает высокую скорость обработки итеративных к большой басе данных. В качестве языл. пользовато.*;; предлагается язык SOL, адаптированный для тниаулттрозгугил бо,тгм:7*?'!1 обмизыи информа-цш! и расширенный еозмозкностыэ работы с егссгрла'гл.
В результате анализа предтлпляеют к языку описания
подсхем, бито предлоявно в качестве psssmsi использовать комбинация языков SQL и ПЛ/1. Такой подход обеспечивает кгк достаточна олгорптмичгскуп ютплость, так г. "ффогаизпоо использование СУБД. Применение двух iratraв не нагслзд.'сазт сугрсТЕэтшу. ограничений на программ- поде а о;,и, что позволяет кспольсасать в качестве подсхемы пра'лнчески любую nporpa?,:vy обработал дачшсс, которая читает данные из БД. обрабатывает их и заносит обратно в БД.
Обосновывается необходимость развитого языка роботы с подсхема-га и формулируется требования к :ie;sy. Для этих целей так.«© предлагается использовать SOL. Ji"-?,i.i3a';Tc;i, что применение одного и того т языка в качестве языка гзпросоп СУБД к язкка работы с подсхема -№1 дает дополнительное пре;:муп>стгз. Для польгователэй работа с такой системой полностью аналогична работе с обычной базой дачных. Благодаря межггору управления погсхемжи, который в дашго;.» случае выступает кок оболочка СУБД, вся работа по выводу необходимого представления скрывается от пользователя и он не видит разницы ке.улу реальными я выводимыми отношениями.
Совокупность программ-подсхем образует базу знаний логического монитора, которую он использует для актуализации поцехеко:, тогда встречает ее а диалоговом запросе или программ. Подсхемы могут быть структурированы в виде графа представлений базы данных. Под графом представлений понимается граф, з качестве вершин которого выступают группы отношений, соответствующие отдельным подсхема!.«, а роль ребер выполняют программы-подсхемы.
Работа логического монитора, управляющего дедуктивным выводом подсхем, аналогична поиску в графе представлений пути из вершины, соответствующей реальным таблицам БД, в верзилу, таблицы которой яеляются целью. Определен гчд свойств графа, облегчаших актуализацию подсхем:
- iiC-т изолированных Берж;н. т.к. любое представлен;:® полу\'эется только при наличии соотрйтстг.укцегс прос^риговгиая;
- ребра графа направление;
- нет петель, т. г- реляционное исчисление нз допускает рекурсивного определения подсхем.
Таким образом, граф представлений гакно охарактеризовать ¡сзк связанный, ориентированный . граф. Из свойств графа представлений следует, что у него должен существовать:
- корень ( корни ), т.е. узел (узлы), из которого маяно попасть во все другие углы;
- листья, т. е. тупиковые узлы, из которых не выходит ни одно ребро.
Ib содержанию корень графа соответствует базовому представлению предметной области, а листья - конечным представлениям пользователей. В логическом мониторе реализована стратепы обратного Бывода. Приводится обоснование такого вывода исхода из свойств графа представлений. Описываются справочники БД н БЗ, необходимый для хранения информации о структуре графа представлений.
В третьей главе приведено описание реша:зац.1и программного комплекса ЛОРД/ЕУ, который BjuacwrieT в ееба:
- реляционный метод доступа ( РЦЦ );
- средства мс^эсшннной коьэднпкацки длл связи виртуальных ¡а-шии;
- транслятор языка SQL/ЛОРД-,
- подсистему поддерма; представлений (аппарат подсхем);
- препроцессор для обработки прикладных программ;
- сродства диалоговой обработки данных.
Описываются основные характеристики и гозмозиюстн, представлена ■схема взаимодействия компонентов. ГМД и сродства коыцуншсацип является базовыми подсистемами, на которых осиован комплекс Л0РД/Е1 Комплекс состоит i;s несгальких виртуальных машин (EU) в среде СЕМ FC ЭЫ1 В состав комплекса входит БЫ данных, ¿;ааша управления и произвольное число пользовательских машп. Средства кокмуникащш осуществляют связь ыааду БЫ пользователей и машиной данных и поддерживают многопользовательский реэтш работы. Средства комыуника-ции обеспечивает поддери;/ очереди запросов и установку флагов ра-бота/олевдание на всех виртуальных машинах.
Основой реализации СУБД ЛОРД/BU является реляционный метод доступа (Pita). СУБД поддерживает реляционную модель данных и предназначена для хранения и манипулирования большими объемами информации ( 100-1000 Ï,ir6 ). СУБД работает с информацией, представлен-
пол з сходугс?« форматах:
- нет,ов дзоячноэ число длзпгсЛ 2 Сайта;
- цзлоэ двоичкоэ число длиной 4 байта;
- двоичное число з плавасцец ^ортто длиной 4 байта;
- двоичное ч::сло в плапа^зы форллзто длиной 3 байт.
Для подлер:*зси пакта SQL был разработан транслятор, переводгпдлй дчрегтпгсы языка в шгогзство операцнЛ К'Д. Транслятор языка SQL/ХОРД позволяет работать с базоЛ дачных как из прикладных программ, тш: и в диалоговом рвждо. Цри разработка транслятора било Рэеэно внести в язш два дополнения. Первое дополнение связано с тем, что общепринятый построчив метод сбмэиа даишлги, тогда со-доргтаюе одной строки таблицы БД пс-рссилзетсп в набор скалярных перененна* пртпсгадноЯ прогрели, по подход? .т для обработки больших таблиц, поэтому синтаксис пптзса SQL/ЛОРЛ допусгает применение шссиеос ( в качестве програ'слак порешенных) >? пользователь мотет получить в програ"-.*з сразу всю таблицу л:гбо се -чагть. Второе дополнение связано с том, что Fid позволяет од»;сзрекзн::о с результате» яапроса строить ч индекс для рззультнруь^гй табгши. Дгл эффективного »гсво^ьзовзпйл отоя £сз«злггости в опарятор SELJ'j'JT языка SQL била добавлена опция INDEX, юторел указывает на необходимость построения индекса таблицы-результата
Оба ДОНОДЯОН!:1 соответствует ССГ^Л СПОЦИйи-СУБД SSU? cüGTonj, предназначено;* для глттоденгтл .'яюгскэтсвоЛ, итерационной обработки болыэте сбгег.'оз жЯщгзциа.
Транслятор лзигл SQL реа!тзс?аи по стгялзртлоЛ днухлатовой схе-:;отор:а гл^ттеот:
- синтшссическнЛ анализ;
- семантический анализ и генерацию SQLj !о;(ул:я.
Осковол сгажиштгоснэго аткшгттора яздтотся регулярная однозначная rpaj гматгаса нзисз, г.отор";л ошгекзао? reo е.'нггзкаичоскн правильна запросы языка SQL. IIa базе-этеЯ пй1Е.г>тпки реализован де-тер»дшнроЕШ1!!ыЛ автомат, распознавай коррогсгяо построенное запросы. Автомат производит разбор дкректиш язи:«» и одновременно формирует ее описание во внутренней фор;гате. Это описание используется семантическим анализатором для гене раин; i набора операций Р)!Д. В результате процесса генерации создается SQLj-одуль, в историй транслятор заносит получений список операция и их аргументы.
Перечень операций, ютгорыэ могут входить в SQLj.iOiyjb, созданный транслятором, еклечш*т гак»элеизнтзрнда операции типа SELECT,
PROJECT, так н операция, г.)шэ.ш;як55э сразу несколько функций.
1а следуйте u isare работы транслятора SQL_KOflyja> подвергается настройке, что ке является обязательный отапом работы, хотя в больЕяпстЕО случаев это позволяет увеличить скорость выполнения запроса, а иногда, при сложных запросах, - могдт сократить число операций в 2-3 раза. Настройка проводится по двум направления«:
- удаление праьидутачяых операций;
- объединение и замена операций.
Удаление промежуточных операций чашэ всего применяется для операции RENAME - переименование отношений, оно че дает большого выигрыша, но позволяет провести дальнейзуа настройку путей объединения и замены операций.
Настройса путем объединения и замены выполняется в том случае, если несколько элементарных операций ькдаю заменить одной многофункциональной. Так практически с любой другой элементарной операцией можно объед1шить операцию INDEX - построение индекса, либо UNIQUE - удаление дубликатов.
Для таблиц больших размеров совместное выполнение операций производится быстрее, чем раздельное и этот шаг настройки позволяет значительно уменьшить время' выполнения сложых запросов и избежать построения промежуточных результатов.
Для поддержки пакетного режима работы с БД был разработан препроцессор для программ, написанных на яэьпее ПЛ/1 с использованием директив SQL. Препроцессор производит обработку текста программы и заменяет все директивы SQL на операторы язы;:а Ш1/1 и вызовы подпрограмм связи с СУБД Таким образом, после работы препроцессора программа пользователя разделяется на две части: текст на языке ПЛ/1 и набор SQLj-ю дулей. Текст на языка ПЛ/1 нужно оттранслировать стандартным образом, a SQL_moju^i готовы к выполнению и сохраняются до запуска программы.
Для выполнения дедуктивного вывода, организации и поддержи системы пользовательских представлений в СУБД ЛОРД/ВМ разработан аппарат подсхем ( АН ). АП включает три компонента:
- набор программ-подсхем;
- каталог подсхем;
- програму - монитор для управления выводом подсхем.
Программы-подсхемы пишутся на языке ПЛ/1 расширенным языком
SQL, они активио работает с базой данных и выполняют преобразование таблиц БД к новому виду. Практически любая прикладная програм-
ма обработки дaiuux ;гглет Сигь оформгэаэ я ппл? годсчопл 3 СУБД поддорхиваэтся каталог подели, когориа еодврпя wn ей грог-pmejy-подсхска и сп::сок еэ-вгодгшх я в1по,т.ъл отно^г-^. Прсгра!.:-ка-монитор аьполгглт гыгол по^о.^ц з с00тгйтсгг2«п о зоарссотл, гозишеагго-'л у по^ьзовагогэй. Процесс ш.тюда качшггэтея, как тохь-f® пользователе сбрптт.'сч к тг&гяп, !«тсрля отсутствует з дпчяыЛ могяиг в баго дз.»ш!Я, по ьгггэ? Gits гогугенз с по:юп?.я одкол г:-, прогршм-подеяем. Е«зод гехгз&ггтеа з тем, что сг.пзгл, о справочника БД и катг'ога помехе).*, ояр-эдгллот подс/.-'»<7 ,•:.!-
бо псслсдог-атольиссть подсхем, гатср~я привод!!? :: иеоб:;с>"^!.'':7 результату, а ?.а*ем послэдозотвльяо ""-vpyms? п nporpa>i-¡лл-подсго!!и. Иоя-ггор ::опоЕьзуст стр"-;о"Г"?з сСрятяого :.'-г.ола, пр».;»-чпя для зтого рокурзттзиуп ироц*дуР7.
'■рэдетавлеш»"», молю стзагь, '»о tr-irn'Op г. кз sep.—ar.«!
з ворггг'У, ктрлпгл с д^л^вс-Л, пека '¡о i-сл, кос, ог-
гетс'лует тзг.у~,л::у ссэтс::'-. е
В чятг.оптсЗ г.л--,г-> ■■::>;cc;.'!'jг;.-.! ;"с:ог;1!л ч ^тодтугд
прпиэязшп система ЛО?;[/ВЧ novn.'s.J'.:.": что .-угаг" с лето:.» яз-лзэтея уз'хспец^аясщхтзпгсЗ "i EGSVCV? ез поасаг-т-ач^э stfjcurrn-::о топко при рэггнпз! s?a,vVt сгрс-гг.чгогэ кхасса. К згеггу классу строятся задач::, п ¡хтср:::::
7 ¡«юЗхсд::;'" с5рзбот?п бог-:г.;.: сЗгг.'ЭЗ Л—'
- походя:-э дал::::? пс^т?
- требуете:! Сютров х-;.:галног;:,^ по;:с;'а, сор?яров:-ч, агрегирования, выделения подгрдел ебкктез л "^Т'.'Х опсрзц".Т| кпд ¡точны::*!.
Продсчгаится нес1*ол?.ко спсзсЗоз кр'шэссзия сисяек-п ЛОРД/РЧ, раздота-г^хся как по области при окзггл, так и по иопользузпз!
1. Гфгл'гнвикз ;:c?;]/i::i rip:i рпзработг-з спешгшга'ировааннх- язкэтов прикладных програ-ч по обрз(?г/г:э ?о.*2г:пг баз дгшшх. Грздлггается создавать пакеты *лз прогр">"<, изписл;::::::з Ocpve noncz-зм система ЛОРД/LM, т. е. программ, котор'з взаж'-эт-с^етпупг только с таблицами БД. В качестве сродства прогрет, тфоваиил прэд"лгается ПЛ/1, ррзпи-ренныЯ языком SQL. Зги nporpatau roraio рассг.атрнвпгь кзк инструкции для логического процессора и сдаивать из сбсуго программного модуля стандартным способом чэрс-з CALL-yrrspr^ema. 'faitort способ работы с программами-подсхегл»з» лссоляет по составлять опиезяия подсхем и не регистрировать их ь басе пнанкй, т.о. нозш не использовать дедлстивцие eosi^oshocth сгстеш. Приюнэнио систе>.ш
Ж>РД/К,1' дш р&аг!СлГ,отш пзглтоа оправдаю только а той случао, когда требуется схожая обработка богьгах объемов данных, которую но-иоьмояко ь;лкшгсть в оперативкой пажи традиционный способом. До-но£шггольныз удобства даат то, что во-порЕЬК, пршэпспне средств СУВД гарантирует высокую скорость тагах операций, как поиск, фильтрация к т.д. , к, во-втсриг, поскольку программ-подсхеиц но имеют параметров и ЬЕг;:.\;адойству:-л' годьк/ через хабящы ДД, то они ока-»ьншет к!шш£.гшюе друг па друга, что облегчает процесс
создания и модернизации ШП.
'¿. Пги',:сеиен):о ЛОРД/ЕИ л качзствз срсдс-ва поддерем многоаспектного предетавлзпяя информация при разрабоисе, вадешш и использовании больших банкоь дшпплс. При этом не требуется дополнительных щх)гра5гл:ых средств, т.к. система ЛОРД/Ш обеспечивает все необхобкак функции по вадзшю банка данных, в той числе функции СУБД. Кроиэ этого, в рехимэ банка данных ЛОРД/ЕМ позволяет организовывать структуры взаимосвязанных программ-подсхем, каждая из которых поддоргааает собственное прздставлэкие дакиьк. Для подсхем, пходякдх в структуру, составляется справочки: описаний, [который используется системой как база зпашшй. Саш программы-подсхемы выступаягг г, роли каталогизированных запросов. Для актуализации подсхем используются дедуктивные возможности системы, благодаря которым выполнение подсхем инициируется при Бознтзгове-нии запроса к представлению, поддерживаемому зтой подсхемой. Пользователь кояет рассматривать представление как реально хранящиеся в банке данные и работать с ним с помощью стандартных средств системы ЛОРД/Ж Использование ЛОРД/ЕМ в качестве средства многоаспектного представления данных-имеет смысл тогда, когда объем исходной информации очень велик и нет возможности хранить все необходимые представления в виде реальных отношений. При этом неизбежной компенсацией за экономию места для хранения данных является временная задержка при обращении к "выводимым данным, в течение которой выполняется вычисление требуемой информации.
3. При решении различных задач обработки информации (классификация, 'агрегирование и др.) предлагается использовать систему ЛОРД/ЕМ для создания экспертных систем (ЗС) с реляционным исчислением в качестве внутреннего формализма. В качестве БЗ такой ЭС будет выступать набор взаимосвязанных программ - подсхем, а аппарат поддержки подсхем будет играть роль логического реляционного процессора, который по этим правилам выполняет дедуктивный вывод.
Таблицы, ползгсэйьтл п. результате рабогы прсцсееерз, польговатвгь могет обрабатывать как с па!?л^ьп пгьзса SQL, так и друг::.А<и средствами. Крс;.п этого, прггге.чпя дла списания прагил пгр?интр:гао-ванииэ програ-^и-подсгеш, исзет .создавать ЭС," предказначозниз длл отладки качостгэншх тоорггЛ, уточогзшп нзлячзстненЕых пзра«втроз экспертных правил, выявления палСолгэ зпа'пвгшт критериев классификации и т. д. Ограниченна при псстрозпкп ЭС сводятся к тетсгшя-иости формулзгравализ рекурсивных правил. Ео если рекурсия ¡ккет фиксгфованпуз глубину агзглггггссти, го это ограпичзшге trarao преодолеть соадаапеи гсвоютагалыиз псдсге'Л
Разработка прикладная скстсии roScro га трзх преддокэниих типов вклэчает в себя два зтога.
Шрвый этап прэдстазлаег ссбой разработку лог:г;осг,".Ч структуры описания предшигаЛ облюти 2 пяот с?ль» крэдсгазглиио схпгртшж знаний р виде снстсе.и подсгем поазсватзлзД. C:i п сзс;>:
■ Еьйор начальной cxoj-ti базовых errrcmriitf;
- кормалкзац^э басовых огпкгжчД;
- определено с г: .-и прэдстаз^с.'пй roaaoEare-^-crs.-rpra;
- разработку крограиа-по^сгга ncjEsprsm зрелстзхлэмя пользователя. .
Второй отел рзлраСэткц. ктсеэтся рзализапа ccîcrrcrro ггог-ргг:г.1-подсх5« пс2"о того, ics:« спрзделгси tu а стг-1"»УРУ
ВГ.ОДИЫХ И ЕШ'ОДПШ СТИО£ЗШЙ1 ОССбСО ВЯПЯЯЙО удолэио SUCcp/ алгоритма, cooTEsxcT'jyrr?ro спецгласзахгдп! системы и пакСолзг полио испольвуте»его еэ всн^спюета. Гр:^:одптся слздутплэ критерия сг::"ск алгоритма:
- использование языка SQL для попета данных, фальтрацки и других возмогших операций чад даяш^ст;
- ра^иэры isecirsoa, npuitsaneisa дм côtissa гпфоризцяеа с БД;
- вовиожкссть ьногокрзтпого ксаогьзоваяия прошауточшгх дашшх.
Исходя нэ этих критериев, ^актсл рэдаиеядядал по пр;п,:е::е:гп>э
конструкций языка SQL, выбору опткагыах рагмгрсв изсстаов даа-nra, раабиеннэ алгоритмов обработал гл несколько подсхем.
Бея методика излагается на приоре разработка экспертной енотами "Классификации водных масс па основе анализа TCjcp:'2ic: ", созданной на базе системы ЛОРД/П'. Суть прзблеш в «ратЕ&зж;«! Северо-Западной части Тш:сго прЗдСтав^гнЕсй в гиде ГЛ из 1200 тыс. зашров, в запшоюсти сг xapaxrepucTisc кривых игуе^нкз температуры и солености по глубине. Описано уелоьгэ задачи и
обоснован выбор се в качестве примера. Далее приводятся соображении но поводу выбора схемы базовых отношений и схемы представления пользователя. Разрабатывается алгоритм программы-подсхемы и аргументируется целесообразность создания отдельной подсхемы для каждого этапа обработки информации. Описана реализация трех программ-подсхем системы ТС_классификации, каждая из которых может поддерживать самостоятельное представление. Показано, что эти программы могут быгь использованы в любом из трех способов, т.е. или как независимые подпрограммы, или как система взаимосвязанных подсхем, или как основа экспертной системы. Приведено описание диалоговых средств, которые предназначены для ввода параметров и отображения результатов в графическом виде. Отмечается, что для систем, работающих с большими объемами данных, создание таких средств является почти всегда обязательным условием, т. к. как исходные данные, так и результаты работы представляют собой большие числовые массивы и неудобны для восприятия. Средства графического отображения системы ТС-классификации позволяют вводить параметры района, определять критерии классификации и отображать результаты в виде карты. На карте отображаются:
- сетка координат;
- суша, попадающая в район классификации;
- океанические станции, т. е. точки океана, в которых были выполнены измерения.
Каждая океаническая станция' отображается в виде точки определенного цвета. Станции расцвечиваются либо одним цветом, если пользователя интересует обиея изученность данного района, либо в разные цвета согласно тому, к какому типу была отнесена ТС-струк-тура этой станции во время классификации. Соответствие значения типа ТС-структуры станции и цвета задается в одном из меню диалоговой оболочки.
С помощью системы ТС-классификации била выполнена работа по выявлению наиболее значимых критериев классификации при обработке многолетних сезонных наблюдений. В качестве исходных данных были взяты многолетние наблюдения, выполненные в Северо-Западном районе Тихого океана в квадрате 60x60 градусов с координатами нижнего левого угла 0% сев. широты, 120% вост. долготы.
Для определения наиболее значимых критериев из Бсей кх совокупности были выделены три группы:
1. температура и соленость поверхности;
2. иокотонность изк-енепия температуры и еолс'Посч'У! о глубиной;
3. расположение экстрбмумоз температуры л со-азнос! и и ;»-: акаче-ния;
Эти группы, 1салдая из которых есть набор логкчесют условий, были использованы для построения четырех систем класс ифгкацпи. Первая системз основана на группе 1, вторая на группе 2, -длл третьей системы испольэоваиа совокупность групп 1 ч 2. а '.четвертая система включала в себя все четыре группы критериев, ¡'л ссного систем классификации Сила созданы четыре базы зн-длий, юзтор¡1 применялись в процессе классификации.
Спредолеиио значимости различных групп критериев г„:гсс::>;г-с'ции выполнялось путем визуального анализа карты района.
Анализ показал, что:
- классификация, укгтызек^п только тзмпэряггуру и совесть поверхности, дает качественно верную корт:а1у распределения суг.тпои.!-ческой, субарктической и Фронтальной вен я ок.ж-.2;~
- классификация только по копотоапости нэ какоа-лкСо регулярной картины;
- классификация по совокупности двух предыдущих групп критериев дает картину, практически соЕппдогсцуя с первнм результатом;
- ¡'иг.асс;!ф:г.'^и:ч по полному • ¡¡оберу критериев является с сом строгой, т. е диапавепч глубины экстремумов и значений температуры и солености в них задали, еид;:ю, с.^гпсом Эхо протчло к точу, ЧТО бОЛЫТШ:СТСО СТЯНЦИЙ НЭ б К"! 5 'ЛГ.С С 7!' 'рс Б?.!! Ц, СИСТСМа НЗ
сгогла отпссти кх ин к одному г.з типоз.
На основании стих результатов делается £ 1:20л. что если производится структуры год бодьгэго района океана на основе много. :етних н;: Злыдений, то достаточно перно ее ш:лга проводить у;::тывая только темперУГ[ГРУ и содсиость пог.эрхчостн.
Основные результаты работа
В диссертации получены следуютдга основные результаты:
1. Исследована возможность и целесообразность построения ПО с реляционным исчислением в качестве внутреннего Формалн-зма. Показано, что применение Г!1 увеличивает скорость работы ПС и за счет этого позволяет применить ПС в ранее недоступные приложениях.
?.. Разработана архитектура специалюирогашюй реляционной сунд с дедуктивными возможностями, на основе которой ;.:згуч? Оьть созданы
[•аашгсодз прысьаднда с ноте ми по обработка больших объемов данных, ь том числе продукционные системы с реляционным исчислением в качестве внутреннего форизлкзма. Для этого:
- определены требования к скоростные характеристикам СУБД и обоснован вы£ор РЫД в качества базового ыетода доступа;
- предложено реализовать дедуктивные свойства СУБД в форме аппарата подсхем;
- определены специфшеекне требования к языку 1-лнипулирования данными СУБД, язшу описания подсхем, програмыо-иошпору поддержи подсхем, языку работы с подзхемами;
- определен характер ЕзаишдейстЕкя СУБД и АП и распределены функции по логическому выводу и выполнению подсхем
3. 11а основе реляционного метода доступа, иыекуэго цепочную алгебру в качества внутренней модели, разработана СУБД с дедукгивны-ш возможностями, рассыпанная на обработку большие объемов числовой информации н предназначенная для автоматизации научных исследовать.
Основные результаты диссертации опубликованы в работах:
1. Еачнев Е. А., Петровых Е. А. Организация подсхем пользователя
дет реляционной СУЩ ЛОРД: Препринт. Владивосток: ДВНЦ АН СССР, 1988. 30 С.
2. Гьильдас А. й., Денисов С. В.-, Кручинин Е. В., Петровых Е. А.,
ЕЬчнев Е. А. Система ЛОРД как средство создания океанографических банков данных // VII Всесоюв. совец. "Автоматизация управления техническими средствами исследования Ыирового океана"*: Тез. докл. Калшинград, 1989. С. 31-32.
а Гвильдие А. Л , Денисов С. Б., Петровых Е. А. Многоаспектное представление океанографической информации средствами СУБД ЛОРД // VII Всесого. совец. "Автоматизация управления техническими средствами исследования Мирового океана": Тез. докл. Калининград, 1989. С. 33-34.
4. Штровых Е. А. Яэьк запросов СУЩ ЛОРД // Системное программирование и автоматизация научных исследований : Сборник. Владивосток: ДЮ АН СССР, 1689. С. 21-26.
-
Похожие работы
- Методика обработки темпоральной реляционной базы данных в миварном пространстве
- Интеграция объектных систем обработки информации и реляционных серверов
- Нечисловая обработка информации на вычислительной машине нетрадиционной архитектуры потока данных
- Разработка методов организации вычислительного процесса при обработке данных, описываемых реляционной моделью
- Матрично-реляционная модель данных в организационно-производственных системах мониторинга и управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность