автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка логического процессора реляционных данных и методики его использования в океанологическом банке данных

кандидата технических наук
Петровых, Евгений Александрович
город
Владивосток
год
1992
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка логического процессора реляционных данных и методики его использования в океанологическом банке данных»

Автореферат диссертации по теме "Разработка логического процессора реляционных данных и методики его использования в океанологическом банке данных"

■9 0 3 9 $

^ о - - российская академия наук

дальневосточное отделение институт ангоматики и процессов управления

На праиах рукописи

Петров™ Евгений Александрович

разработка логического процессора реляционных даншх и (методики его использования в океанологическом нанке данных

05.13. И - математическое и программное обеспечение вычислительных маски, ¡телексов, систем и сетей

Автореферат диссертации на соискание ученой степени кандидата технических наук

ВЛАДИВОСТОК-)992

- г -

Работа выполнена в Институте автоматики и процессов управления Дальневосточного отделения РАН.

Научный руководитель: кандидат технических наук

А. КХ Гвильдис.

Официальные оппоненты: доктор фиаико-математических наук

A.C. Клещэв,

кандидат технических наук R К. Бломроз.

Ь-дущее предприятие: Институт прикладной математики

ДЮ РАН (Владивосток)

Защита состоится 'К ^ " ^■ А-т <г 1592 года в / О часов на ьаседании Специализированного совета К 003.30.01 в Институте автоматик и процессов управления Дальневосточного отделения РАН по адресу:

690032, г. Владивосток, ул. Радио, 5.

С диссертацией можно ознакомиться в библиотеке Института автоматики и процессов управления ДБО РАН.

Автореферат разослан 1992 г.

Т~ у

Ученый секретарь ссвета

к. н. cr\C-i 9-м ^ Е. И. Коггл

'Я^РС^'^^Г,! - 3 -

ивг. \ ОШАЯ характеристика работы

- -4

СТД,,ЛВ '.таг научных исследованиях, где приходится обрабатывать боль-ссодвздийдличестзо информации, эффективным средством автоматизации могут выступать банки данных. Современный банк данных представляет собой слоотый комплекс средств хранения, поиска и обработки информации. Основными компонентами программного обеспечения ( ПО ) банка являэтся:

- система управления баяаш данных (СУБД), обеспечивающая основные функции управления данными;

- пользовательасая оболочка, представляющая собоЯ набор инструментальных програмшых средств, предназначенных для автоматизации разработки прикладного ПО:

- прикладные программные системы, созданные для решения конкретных задач пользователей банка данных, с использованием СУБД и оболочки.

Для эффективного применения банков данных при автоматизации научных исследования, связанных с обработкой больших обгонов природных данных, необходимо создавать пользовательские оболочки, которые учитывали бы следующие специфические особенности как самих данных, так и способов их обработки:

- данные в большинстве однородны, имеют числовой харшстер и объем до 100-1000 1-С;

- решаемые задачи требуют мощных средств как числовой, так и литеральной обработки данных, причем процесс обработки может носить итеративный характер;

- заранее нельзя предсказать, какие конкретно задачи будут решаться на основе данных банка.

.Примером задач, связанных с обработкой больших данных, являются задачи океанографии, в которых, основываясь на данных элементарных замеров, необходимо проводить классификацию, районирование, выделение различных полей и объектов, поиск неоднородностей и т. д. Аналогичные задачи есть в геологии, метеорологии, обработке космических снимков и других областях науки, связанных с изучением природных систем.

Можно выделить три основных группы задач:

- классические банковсга« задачи выполнения тематических Еыбо-рок данных по разным районам, когда необходимо производить манипулирование большими исходными малашами данных;

- задачи многоаспектного представлена;; ккфо;>садик, которые актуальны в банках данных благодаря тому, что существует разрыв иек-ду представлением о природной система, формируешь при сборе экспериментальных данных и представлением специалистов. Преодоление этого разрыва, т. е. обеспечение пользователя информацией в необходимом ему виде, является одной из главных целей обработки данных;

- создание логических моделей тех теорий, которые используются прикладными специалистами для задач обработки и интерпретации данных, хранящихся в банке, и их проверка средствами оболочки банка;

Для рс-Еонии таких задач программное обеспечение оболочек банков данных долкно;

- предоставлять возможности для разработки пакетов прикладных программ, т. е. яэьвси для манипулирования даиными, средства модификации, агрегировала, сложные глтстатические функции обработки и т. д:

- обеспечивать средства для организации систем мдогоаспектиого представления информации, т. е. обеспечивать раал>. шые представления одной и той же исходной информации для разных пользователей, представлять в единой фэрме как исходные данные, так и данные, полученные в результате обработки исходных, обеспечивать одинаковые возможности для работы с первичными iï с вычисленной дилнымл;

- предоставлять простые механизмы для расшрения и модификации прикладных систем, построенных на основе оболочки.

При разработка пользовательских оболочек применяются -два основных подхода Первый подразумевает организации оболочки в виде пакета прикладных программ ( ППП ), который обеспечивает все необходимые пользователю функции. При этом подходе создаваемые прикладные системы обладает высокой производительностью, но оказывайся жестко настроенным:! на решение конкретного крута еадач и требует больших затрат на разработку и сопровождение. Процесс разработки ПО для таких систем трудно автоматизировать, а готовые программные комплексы плохо поддаются модифшеацпи и расширению.

Второй подход предполагает использование методов искусственного интеллекта (НИ), в частности, технологии продукционных систем (ПС). При этом оболочка реализуется icaK совокупность трех компонентов:

- базы данных ( БД), которую можно интерпретировать как совокупность известных фактов;

- логического процессора для обработки информации;

- базы знаний ( БЗ), которая содержит инструкции для процессора.

Из этих трех компонентов оболочки активную роль играет процессор. Основываясь на хранязщхся в ЕД фактах, он выполняет дедуктивный вывод новой информации, используя при этом инструаши, хранящиеся з БЗ. Эти инструкции, их обычно называют правилами базы знаний, составляются ira специальном языке, возможности которого являются отражением возможностей логического процессора, т. е. запросы языка транслируются в те, и только те функции, которые поддерживает процессор. Разработка прикладного ПО заключается в составлении набора правил БЗ, которые описывают ганкретную предметную область. Возможности прикладных систем, созданных на основе таких оболочек, определяются только объемом и содержанием БЗ и БД. Правила независимы друг от друга, а алгоритм, по которому процессор выбирает правила из БЗ, не зависит от содержания ЕД и БЗ. Благодаря этому, база знаний, т. е. прикладное программное обеспечение, может сравнительно легко расширяться либо модифицироваться. Продукционные системы, функционирующие как интеллектуальные оболочка! над базой данных, успесно применяются в качестве средств автоматизации разработки ПО, предназначенного для решения ряда задач в медицине, химии и других областях.

Главным недостатком этих систем является их низкая производительность по сравнению с более тралиплонны?.!:: основанными на технологии пакетов прикладных программ 11ШП). Это обусловлено внутренним алгоритмом работы ПС, реализованных на язькзх искусственного интеллекта ( ПРОЛОГ, ЛИСП и т.п. ). Характеристики алгоритма таковы, что при линейном росте размера базы данных время ответа может расти экспоненциально. Наличие экспоненты плохо не только тем, что нельзя работать с большими данными, но и тем, что нельзя предсказать, при каких объемах наступит комбинаторный взрыв. Видимо, по этой причине, использование продукционных систем в обработке больсих баз данных не нашло в настоящее время широкого применения.

Одним из актуальных исследований б области создания интеллектуальных оболочек банков данных, использующих продукционный подход, является расширение области их применения за счет повышения быстродействия. К этому направлению относится настоящая работа.

Целью диссертационной раооти является разработка и создание интеллектуальной оболочки научного банка данных, рассчитанной на работу с большой базой данных. В рсоуж ?ате исследований предлага-

ется метод создания логического процессора оболочки, обеспечивающий высокую производительность, разработана и реализована система, рассчитанная на работу с базой данных в миллион и более строк.

Основные задач;:, решенные автором и представленные в работе:

- проведен анализ функционирования ГО и исследована связь между внутренним формализмом и быстродействием ПС;

- определено влияние выбора формализма языка описания правил БЗ на область применения;

- исследована возможность применения реляционного исчисления в качестве формализма для систем, рассчитанных на обработку больших объемов данных;

- определены состав и функции элементов, составляющих логический реляционный процессор, принципы реализации, основные алгоритмы и структуры данных;

- на основании проведенных исследований выполнена программная реализация основных компонентов логического процессора реляционных данных, рпзраОотана методика его нспольвоб&пня и апробировано применение для г у 20 ния задачи классификации ъодных ыасс oiosaisa.

Научная новизна Предлогам новый подход к построению интеллектуальной оболочки банка данных, заключающийся в реализации ее в виде реляционной СУБД с дедуют'лшыш-еозьюдностями, что позволяет использовать реляционное исчисление в качестве внутреннего формализма. Для поддержки реляционного исчисления можно применить алгоритмы, которые имеют большее быстродействие, чем алгоритмы универсальных Ш и таким образом обеспечить эффективную работу с базой данных. Показано, что применительно к большим обгемам. данных 'ограничение, накладываемое формализмом реляционного исчисления, незначительно сужает класс решаемых задач, а выйгриш за счет повышения быстродействия позволяет расширить область примзнения ПС. Нормой реализации дедуктивных возможностей предложен аппарат подсхем (АП). В отличие от известных реализаций аппарата подсхем (SQL/DS и др. ), в частности, предлолено в качестве подсхем применять прикладные программы, что дает возможность создавать структуры подсхем, включающие алгоритмы математической обработки информации.

Практическая ценность, lia основании анализа задачи построения реляционной СУБД с дедуктивными возможностями выработаны требования к характеристикам производительности СУБД, языку запросов и языку описания подсхем, рехошу взаимодействия аппарата подсхем и

СУБД. С учетом этих требований а средэ CEJ ЕС 3E.Í реализована система ДОРД/ЕМ, позволяемая создавать интоллоетуа-пыше банки дан-¡¡ых для различных областей иаучких исследований.

Лпробацич робот Основные рэзул*>таты диссертаниош'ой работы дс^адкпгп'сь па Совоцзшч ртЯочэй группы РГ25 по проблем*»* и ипструкзнтаркэ иятэграцни ивфде/зшюнних екзтои Ко!.п:сс:ш по научным вопросам ВТ Акаде^о наук соистраи (Глав, 1969), на VII исосошком сого-зяня "Азто)аткг-щин упр-звтенил телничесюгуа средствами кгмэ;;оы®та l'::ponöro океана" (Кг^ятшград, 1929), на ВоосовзкоЯ математической атлв (Нзходк?, 19Q3), на научних cer.t--парах в ГОККе, ВШС'СИ, КАПУ.

ПУБЛИКАГЩ. По материалам проведенной работ» опублшювага -1 пе-чатпчч* труда.

Струкз-ура и объем диссертант?. Диссертация состоит из введения, 4 г л 13, заключения и списка литературы, niccraici^ro 121 наименование. Работа содэргягс 115 страчпц каашопкоусго тскс?п, G ргсупков.

Содержание работа

Бо уьедеиии рассматриваются причины успешного пр;п.;зпег.ия продукционных систем в различных областях и отличие ПС от традиционных систем обработки информации, основанных на технологи'.; паюгтов прикладных программ. Выделяются три основных элемента структуры продукционной системы:

- база знаний (БЗ);

- база данных (БД);

- управляющая программа, или процессор логического виводз.

Приводится обтая схемл функционирования продукционных систем. В

качестве одной из"основных трудностей, которая возникает при распространении технологии ПС называется низкая производительность. В то хе врет указывается на актуальность применения продзащионного подхода в научных исследованиях, характеризующихся болъши'.гл объемами данных.

Формулируется основная цель диссертационной работы, кратко излагается содержание по главам.

В" первой главе делается постановка задачи, показывается, что в ПС, созданных с применением современных языков Ш1, основанных на

исчислении предикатов первого поряди (11ПШ), применяются универсальные алгоритмы подарки, которые и«еют верхнюю оценку вро-ыс-ни работы, пропорциональную экспоненте от.п, где п - риамор Сазы данных. Такая оценка па позволяет применить ПС к решении аад-ч боль сой размерности. Предлагается изменить фсрха&ъх ПС и за счет этого использовать более эффективные алгоритмы. В качества тагаго формализма рассматривается реляционное исчислон;;о ( РИ ). Показывается, что в приложила», характеризуют,чхся бояыакки объема:-,^! данных, такое изменение формализма не пр:шодит к сужении области применения продукционных систем. На основании этих выводов формулируется задача построения ПО, предназначенной для обработки больших объемов и: 5 формации с реляционным исчисленной в качестве внутреннего формаллама. В результата дальнейссго анализа делается вывод о том, что рол< такой ПС кат^у выполнять реляционная СУЕД с дедуктивными возможностями, реализованными в ьздэ аппарата подсхем базы данных.

Для этого необходимо р^'-згаботат?''.! реализовать:

- СУЕД, способную по сесйм скоростным у а ракт ерпст ккь м выполнять дедуктивны.! синод;

- язык,описания подсхем реляционной базы данных, соответствующей поставленной задач?;

- програмыу-шнктор управления подсхемой;

- сродства пользователя длл работы с подсхемами.

1» п-сорэй главе рассматривается требования, прэдглвдяемые но ьегн континентам дедуктивной СУБД и продпаг густея способы их реализации.

При обсуждении вопроса о выборе СУБД анализируются возмоыше варианта се функционирования, задачи, Боеникаюуге при. выводе и ак-туалшации подсхем, харагстср запросов п регта их выполнешт, выра-батьша-оген .требования . к языку. В результате обсуэдешш для СУБД выдвигался следующее требования:

- возможность храпения больгл.:х ебте-мов информации;

■- высокое быстродействие при выполнении итеративных запросов;

- наличие развитого языка описания и манипулирозанил данными, включающего возможности работы с массивами данных;

- сохранение высокого быстродействия при интенсивном изменении схемы и содержимого БД.

.При сравнении выработанных требований и характеристик современных коммерческих СУБД делается вывод о невозможности их исполъзо-

вкшя глк базовой СУБД продукционной систеиы. В качества решения предлагается для разработки СУБД с двдугтттья возможностями применить метод доступа (РЭД. Р!Щ основан на алгебре цепей и обеспечивает высокую скорость обработки итеративных к большой басе данных. В качестве языл. пользовато.*;; предлагается язык SOL, адаптированный для тниаулттрозгугил бо,тгм:7*?'!1 обмизыи информа-цш! и расширенный еозмозкностыэ работы с егссгрла'гл.

В результате анализа предтлпляеют к языку описания

подсхем, бито предлоявно в качестве psssmsi использовать комбинация языков SQL и ПЛ/1. Такой подход обеспечивает кгк достаточна олгорптмичгскуп ютплость, так г. "ффогаизпоо использование СУБД. Применение двух iratraв не нагслзд.'сазт сугрсТЕэтшу. ограничений на программ- поде а о;,и, что позволяет кспольсасать в качестве подсхемы пра'лнчески любую nporpa?,:vy обработал дачшсс, которая читает данные из БД. обрабатывает их и заносит обратно в БД.

Обосновывается необходимость развитого языка роботы с подсхема-га и формулируется требования к :ie;sy. Для этих целей так.«© предлагается использовать SOL. Ji"-?,i.i3a';Tc;i, что применение одного и того т языка в качестве языка гзпросоп СУБД к язкка работы с подсхема -№1 дает дополнительное пре;:муп>стгз. Для польгователэй работа с такой системой полностью аналогична работе с обычной базой дачных. Благодаря межггору управления погсхемжи, который в дашго;.» случае выступает кок оболочка СУБД, вся работа по выводу необходимого представления скрывается от пользователя и он не видит разницы ке.улу реальными я выводимыми отношениями.

Совокупность программ-подсхем образует базу знаний логического монитора, которую он использует для актуализации поцехеко:, тогда встречает ее а диалоговом запросе или программ. Подсхемы могут быть структурированы в виде графа представлений базы данных. Под графом представлений понимается граф, з качестве вершин которого выступают группы отношений, соответствующие отдельным подсхема!.«, а роль ребер выполняют программы-подсхемы.

Работа логического монитора, управляющего дедуктивным выводом подсхем, аналогична поиску в графе представлений пути из вершины, соответствующей реальным таблицам БД, в верзилу, таблицы которой яеляются целью. Определен гчд свойств графа, облегчаших актуализацию подсхем:

- iiC-т изолированных Берж;н. т.к. любое представлен;:® полу\'эется только при наличии соотрйтстг.укцегс прос^риговгиая;

- ребра графа направление;

- нет петель, т. г- реляционное исчисление нз допускает рекурсивного определения подсхем.

Таким образом, граф представлений гакно охарактеризовать ¡сзк связанный, ориентированный . граф. Из свойств графа представлений следует, что у него должен существовать:

- корень ( корни ), т.е. узел (узлы), из которого маяно попасть во все другие углы;

- листья, т. е. тупиковые узлы, из которых не выходит ни одно ребро.

Ib содержанию корень графа соответствует базовому представлению предметной области, а листья - конечным представлениям пользователей. В логическом мониторе реализована стратепы обратного Бывода. Приводится обоснование такого вывода исхода из свойств графа представлений. Описываются справочники БД н БЗ, необходимый для хранения информации о структуре графа представлений.

В третьей главе приведено описание реша:зац.1и программного комплекса ЛОРД/ЕУ, который BjuacwrieT в ееба:

- реляционный метод доступа ( РЦЦ );

- средства мс^эсшннной коьэднпкацки длл связи виртуальных ¡а-шии;

- транслятор языка SQL/ЛОРД-,

- подсистему поддерма; представлений (аппарат подсхем);

- препроцессор для обработки прикладных программ;

- сродства диалоговой обработки данных.

Описываются основные характеристики и гозмозиюстн, представлена ■схема взаимодействия компонентов. ГМД и сродства коыцуншсацип является базовыми подсистемами, на которых осиован комплекс Л0РД/Е1 Комплекс состоит i;s несгальких виртуальных машин (EU) в среде СЕМ FC ЭЫ1 В состав комплекса входит БЫ данных, ¿;ааша управления и произвольное число пользовательских машп. Средства кокмуникащш осуществляют связь ыааду БЫ пользователей и машиной данных и поддерживают многопользовательский реэтш работы. Средства комыуника-ции обеспечивает поддери;/ очереди запросов и установку флагов ра-бота/олевдание на всех виртуальных машинах.

Основой реализации СУБД ЛОРД/BU является реляционный метод доступа (Pita). СУБД поддерживает реляционную модель данных и предназначена для хранения и манипулирования большими объемами информации ( 100-1000 Ï,ir6 ). СУБД работает с информацией, представлен-

пол з сходугс?« форматах:

- нет,ов дзоячноэ число длзпгсЛ 2 Сайта;

- цзлоэ двоичкоэ число длиной 4 байта;

- двоичное число з плавасцец ^ортто длиной 4 байта;

- двоичное ч::сло в плапа^зы форллзто длиной 3 байт.

Для подлер:*зси пакта SQL был разработан транслятор, переводгпдлй дчрегтпгсы языка в шгогзство операцнЛ К'Д. Транслятор языка SQL/ХОРД позволяет работать с базоЛ дачных как из прикладных программ, тш: и в диалоговом рвждо. Цри разработка транслятора било Рэеэно внести в язш два дополнения. Первое дополнение связано с тем, что общепринятый построчив метод сбмэиа даишлги, тогда со-доргтаюе одной строки таблицы БД пс-рссилзетсп в набор скалярных перененна* пртпсгадноЯ прогрели, по подход? .т для обработки больших таблиц, поэтому синтаксис пптзса SQL/ЛОРЛ допусгает применение шссиеос ( в качестве програ'слак порешенных) >? пользователь мотет получить в програ"-.*з сразу всю таблицу л:гбо се -чагть. Второе дополнение связано с том, что Fid позволяет од»;сзрекзн::о с результате» яапроса строить ч индекс для рззультнруь^гй табгши. Дгл эффективного »гсво^ьзовзпйл отоя £сз«злггости в опарятор SELJ'j'JT языка SQL била добавлена опция INDEX, юторел указывает на необходимость построения индекса таблицы-результата

Оба ДОНОДЯОН!:1 соответствует ССГ^Л СПОЦИйи-СУБД SSU? cüGTonj, предназначено;* для глттоденгтл .'яюгскэтсвоЛ, итерационной обработки болыэте сбгег.'оз жЯщгзциа.

Транслятор лзигл SQL реа!тзс?аи по стгялзртлоЛ днухлатовой схе-:;отор:а гл^ттеот:

- синтшссическнЛ анализ;

- семантический анализ и генерацию SQLj !о;(ул:я.

Осковол сгажиштгоснэго аткшгттора яздтотся регулярная однозначная rpaj гматгаса нзисз, г.отор";л ошгекзао? reo е.'нггзкаичоскн правильна запросы языка SQL. IIa базе-этеЯ пй1Е.г>тпки реализован де-тер»дшнроЕШ1!!ыЛ автомат, распознавай коррогсгяо построенное запросы. Автомат производит разбор дкректиш язи:«» и одновременно формирует ее описание во внутренней фор;гате. Это описание используется семантическим анализатором для гене раин; i набора операций Р)!Д. В результате процесса генерации создается SQLj-одуль, в историй транслятор заносит получений список операция и их аргументы.

Перечень операций, ютгорыэ могут входить в SQLj.iOiyjb, созданный транслятором, еклечш*т гак»элеизнтзрнда операции типа SELECT,

PROJECT, так н операция, г.)шэ.ш;як55э сразу несколько функций.

1а следуйте u isare работы транслятора SQL_KOflyja> подвергается настройке, что ке является обязательный отапом работы, хотя в больЕяпстЕО случаев это позволяет увеличить скорость выполнения запроса, а иногда, при сложных запросах, - могдт сократить число операций в 2-3 раза. Настройка проводится по двум направления«:

- удаление праьидутачяых операций;

- объединение и замена операций.

Удаление промежуточных операций чашэ всего применяется для операции RENAME - переименование отношений, оно че дает большого выигрыша, но позволяет провести дальнейзуа настройку путей объединения и замены операций.

Настройса путем объединения и замены выполняется в том случае, если несколько элементарных операций ькдаю заменить одной многофункциональной. Так практически с любой другой элементарной операцией можно объед1шить операцию INDEX - построение индекса, либо UNIQUE - удаление дубликатов.

Для таблиц больших размеров совместное выполнение операций производится быстрее, чем раздельное и этот шаг настройки позволяет значительно уменьшить время' выполнения сложых запросов и избежать построения промежуточных результатов.

Для поддержки пакетного режима работы с БД был разработан препроцессор для программ, написанных на яэьпее ПЛ/1 с использованием директив SQL. Препроцессор производит обработку текста программы и заменяет все директивы SQL на операторы язы;:а Ш1/1 и вызовы подпрограмм связи с СУБД Таким образом, после работы препроцессора программа пользователя разделяется на две части: текст на языке ПЛ/1 и набор SQLj-ю дулей. Текст на языка ПЛ/1 нужно оттранслировать стандартным образом, a SQL_moju^i готовы к выполнению и сохраняются до запуска программы.

Для выполнения дедуктивного вывода, организации и поддержи системы пользовательских представлений в СУБД ЛОРД/ВМ разработан аппарат подсхем ( АН ). АП включает три компонента:

- набор программ-подсхем;

- каталог подсхем;

- програму - монитор для управления выводом подсхем.

Программы-подсхемы пишутся на языке ПЛ/1 расширенным языком

SQL, они активио работает с базой данных и выполняют преобразование таблиц БД к новому виду. Практически любая прикладная програм-

ма обработки дaiuux ;гглет Сигь оформгэаэ я ппл? годсчопл 3 СУБД поддорхиваэтся каталог подели, когориа еодврпя wn ей грог-pmejy-подсхска и сп::сок еэ-вгодгшх я в1по,т.ъл отно^г-^. Прсгра!.:-ка-монитор аьполгглт гыгол по^о.^ц з с00тгйтсгг2«п о зоарссотл, гозишеагго-'л у по^ьзовагогэй. Процесс ш.тюда качшггэтея, как тохь-f® пользователе сбрптт.'сч к тг&гяп, !«тсрля отсутствует з дпчяыЛ могяиг в баго дз.»ш!Я, по ьгггэ? Gits гогугенз с по:юп?.я одкол г:-, прогршм-подеяем. Е«зод гехгз&ггтеа з тем, что сг.пзгл, о справочника БД и катг'ога помехе).*, ояр-эдгллот подс/.-'»<7 ,•:.!-

бо псслсдог-атольиссть подсхем, гатср~я привод!!? :: иеоб:;с>"^!.'':7 результату, а ?.а*ем послэдозотвльяо ""-vpyms? п nporpa>i-¡лл-подсго!!и. Иоя-ггор ::опоЕьзуст стр"-;о"Г"?з сСрятяого :.'-г.ола, пр».;»-чпя для зтого рокурзттзиуп ироц*дуР7.

'■рэдетавлеш»"», молю стзагь, '»о tr-irn'Op г. кз sep.—ar.«!

з ворггг'У, ктрлпгл с д^л^вс-Л, пека '¡о i-сл, кос, ог-

гетс'лует тзг.у~,л::у ссэтс::'-. е

В чятг.оптсЗ г.л--,г-> ■■::>;cc;.'!'jг;.-.! ;"с:ог;1!л ч ^тодтугд

прпиэязшп система ЛО?;[/ВЧ novn.'s.J'.:.": что .-угаг" с лето:.» яз-лзэтея уз'хспец^аясщхтзпгсЗ "i EGSVCV? ез поасаг-т-ач^э stfjcurrn-::о топко при рэггнпз! s?a,vVt сгрс-гг.чгогэ кхасса. К згеггу классу строятся задач::, п ¡хтср:::::

7 ¡«юЗхсд::;'" с5рзбот?п бог-:г.;.: сЗгг.'ЭЗ Л—'

- походя:-э дал::::? пс^т?

- требуете:! Сютров х-;.:галног;:,^ по;:с;'а, сор?яров:-ч, агрегирования, выделения подгрдел ебкктез л "^Т'.'Х опсрзц".Т| кпд ¡точны::*!.

Продсчгаится нес1*ол?.ко спсзсЗоз кр'шэссзия сисяек-п ЛОРД/РЧ, раздота-г^хся как по области при окзггл, так и по иопользузпз!

1. Гфгл'гнвикз ;:c?;]/i::i rip:i рпзработг-з спешгшга'ировааннх- язкэтов прикладных програ-ч по обрз(?г/г:э ?о.*2г:пг баз дгшшх. Грздлггается создавать пакеты *лз прогр">"<, изписл;::::::з Ocpve noncz-зм система ЛОРД/LM, т. е. программ, котор'з взаж'-эт-с^етпупг только с таблицами БД. В качестве сродства прогрет, тфоваиил прэд"лгается ПЛ/1, ррзпи-ренныЯ языком SQL. Зги nporpatau roraio рассг.атрнвпгь кзк инструкции для логического процессора и сдаивать из сбсуго программного модуля стандартным способом чэрс-з CALL-yrrspr^ema. 'faitort способ работы с программами-подсхегл»з» лссоляет по составлять опиезяия подсхем и не регистрировать их ь басе пнанкй, т.о. нозш не использовать дедлстивцие eosi^oshocth сгстеш. Приюнэнио систе>.ш

Ж>РД/К,1' дш р&аг!СлГ,отш пзглтоа оправдаю только а той случао, когда требуется схожая обработка богьгах объемов данных, которую но-иоьмояко ь;лкшгсть в оперативкой пажи традиционный способом. До-но£шггольныз удобства даат то, что во-порЕЬК, пршэпспне средств СУВД гарантирует высокую скорость тагах операций, как поиск, фильтрация к т.д. , к, во-втсриг, поскольку программ-подсхеиц но имеют параметров и ЬЕг;:.\;адойству:-л' годьк/ через хабящы ДД, то они ока-»ьншет к!шш£.гшюе друг па друга, что облегчает процесс

создания и модернизации ШП.

'¿. Пги',:сеиен):о ЛОРД/ЕИ л качзствз срсдс-ва поддерем многоаспектного предетавлзпяя информация при разрабоисе, вадешш и использовании больших банкоь дшпплс. При этом не требуется дополнительных щх)гра5гл:ых средств, т.к. система ЛОРД/Ш обеспечивает все необхобкак функции по вадзшю банка данных, в той числе функции СУБД. Кроиэ этого, в рехимэ банка данных ЛОРД/ЕМ позволяет организовывать структуры взаимосвязанных программ-подсхем, каждая из которых поддоргааает собственное прздставлэкие дакиьк. Для подсхем, пходякдх в структуру, составляется справочки: описаний, [который используется системой как база зпашшй. Саш программы-подсхемы выступаягг г, роли каталогизированных запросов. Для актуализации подсхем используются дедуктивные возможности системы, благодаря которым выполнение подсхем инициируется при Бознтзгове-нии запроса к представлению, поддерживаемому зтой подсхемой. Пользователь кояет рассматривать представление как реально хранящиеся в банке данные и работать с ним с помощью стандартных средств системы ЛОРД/Ж Использование ЛОРД/ЕМ в качестве средства многоаспектного представления данных-имеет смысл тогда, когда объем исходной информации очень велик и нет возможности хранить все необходимые представления в виде реальных отношений. При этом неизбежной компенсацией за экономию места для хранения данных является временная задержка при обращении к "выводимым данным, в течение которой выполняется вычисление требуемой информации.

3. При решении различных задач обработки информации (классификация, 'агрегирование и др.) предлагается использовать систему ЛОРД/ЕМ для создания экспертных систем (ЗС) с реляционным исчислением в качестве внутреннего формализма. В качестве БЗ такой ЭС будет выступать набор взаимосвязанных программ - подсхем, а аппарат поддержки подсхем будет играть роль логического реляционного процессора, который по этим правилам выполняет дедуктивный вывод.

Таблицы, ползгсэйьтл п. результате рабогы прсцсееерз, польговатвгь могет обрабатывать как с па!?л^ьп пгьзса SQL, так и друг::.А<и средствами. Крс;.п этого, прггге.чпя дла списания прагил пгр?интр:гао-ванииэ програ-^и-подсгеш, исзет .создавать ЭС," предказначозниз длл отладки качостгэншх тоорггЛ, уточогзшп нзлячзстненЕых пзра«втроз экспертных правил, выявления палСолгэ зпа'пвгшт критериев классификации и т. д. Ограниченна при псстрозпкп ЭС сводятся к тетсгшя-иости формулзгравализ рекурсивных правил. Ео если рекурсия ¡ккет фиксгфованпуз глубину агзглггггссти, го это ограпичзшге trarao преодолеть соадаапеи гсвоютагалыиз псдсге'Л

Разработка прикладная скстсии roScro га трзх преддокэниих типов вклэчает в себя два зтога.

Шрвый этап прэдстазлаег ссбой разработку лог:г;осг,".Ч структуры описания предшигаЛ облюти 2 пяот с?ль» крэдсгазглиио схпгртшж знаний р виде снстсе.и подсгем поазсватзлзД. C:i п сзс;>:

■ Еьйор начальной cxoj-ti базовых errrcmriitf;

- кормалкзац^э басовых огпкгжчД;

- определено с г: .-и прэдстаз^с.'пй roaaoEare-^-crs.-rpra;

- разработку крограиа-по^сгга ncjEsprsm зрелстзхлэмя пользователя. .

Второй отел рзлраСэткц. ктсеэтся рзализапа ccîcrrcrro ггог-ргг:г.1-подсх5« пс2"о того, ics:« спрзделгси tu а стг-1"»УРУ

ВГ.ОДИЫХ И ЕШ'ОДПШ СТИО£ЗШЙ1 ОССбСО ВЯПЯЯЙО удолэио SUCcp/ алгоритма, cooTEsxcT'jyrr?ro спецгласзахгдп! системы и пакСолзг полио испольвуте»его еэ всн^спюета. Гр:^:одптся слздутплэ критерия сг::"ск алгоритма:

- использование языка SQL для попета данных, фальтрацки и других возмогших операций чад даяш^ст;

- ра^иэры isecirsoa, npuitsaneisa дм côtissa гпфоризцяеа с БД;

- вовиожкссть ьногокрзтпого ксаогьзоваяия прошауточшгх дашшх.

Исходя нэ этих критериев, ^актсл рэдаиеядядал по пр;п,:е::е:гп>э

конструкций языка SQL, выбору опткагыах рагмгрсв изсстаов даа-nra, раабиеннэ алгоритмов обработал гл несколько подсхем.

Бея методика излагается на приоре разработка экспертной енотами "Классификации водных масс па основе анализа TCjcp:'2ic: ", созданной на базе системы ЛОРД/П'. Суть прзблеш в «ратЕ&зж;«! Северо-Западной части Тш:сго прЗдСтав^гнЕсй в гиде ГЛ из 1200 тыс. зашров, в запшоюсти сг xapaxrepucTisc кривых игуе^нкз температуры и солености по глубине. Описано уелоьгэ задачи и

обоснован выбор се в качестве примера. Далее приводятся соображении но поводу выбора схемы базовых отношений и схемы представления пользователя. Разрабатывается алгоритм программы-подсхемы и аргументируется целесообразность создания отдельной подсхемы для каждого этапа обработки информации. Описана реализация трех программ-подсхем системы ТС_классификации, каждая из которых может поддерживать самостоятельное представление. Показано, что эти программы могут быгь использованы в любом из трех способов, т.е. или как независимые подпрограммы, или как система взаимосвязанных подсхем, или как основа экспертной системы. Приведено описание диалоговых средств, которые предназначены для ввода параметров и отображения результатов в графическом виде. Отмечается, что для систем, работающих с большими объемами данных, создание таких средств является почти всегда обязательным условием, т. к. как исходные данные, так и результаты работы представляют собой большие числовые массивы и неудобны для восприятия. Средства графического отображения системы ТС-классификации позволяют вводить параметры района, определять критерии классификации и отображать результаты в виде карты. На карте отображаются:

- сетка координат;

- суша, попадающая в район классификации;

- океанические станции, т. е. точки океана, в которых были выполнены измерения.

Каждая океаническая станция' отображается в виде точки определенного цвета. Станции расцвечиваются либо одним цветом, если пользователя интересует обиея изученность данного района, либо в разные цвета согласно тому, к какому типу была отнесена ТС-струк-тура этой станции во время классификации. Соответствие значения типа ТС-структуры станции и цвета задается в одном из меню диалоговой оболочки.

С помощью системы ТС-классификации била выполнена работа по выявлению наиболее значимых критериев классификации при обработке многолетних сезонных наблюдений. В качестве исходных данных были взяты многолетние наблюдения, выполненные в Северо-Западном районе Тихого океана в квадрате 60x60 градусов с координатами нижнего левого угла 0% сев. широты, 120% вост. долготы.

Для определения наиболее значимых критериев из Бсей кх совокупности были выделены три группы:

1. температура и соленость поверхности;

2. иокотонность изк-енепия температуры и еолс'Посч'У! о глубиной;

3. расположение экстрбмумоз температуры л со-азнос! и и ;»-: акаче-ния;

Эти группы, 1салдая из которых есть набор логкчесют условий, были использованы для построения четырех систем класс ифгкацпи. Первая системз основана на группе 1, вторая на группе 2, -длл третьей системы испольэоваиа совокупность групп 1 ч 2. а '.четвертая система включала в себя все четыре группы критериев, ¡'л ссного систем классификации Сила созданы четыре базы зн-длий, юзтор¡1 применялись в процессе классификации.

Спредолеиио значимости различных групп критериев г„:гсс::>;г-с'ции выполнялось путем визуального анализа карты района.

Анализ показал, что:

- классификация, укгтызек^п только тзмпэряггуру и совесть поверхности, дает качественно верную корт:а1у распределения суг.тпои.!-ческой, субарктической и Фронтальной вен я ок.ж-.2;~

- классификация только по копотоапости нэ какоа-лкСо регулярной картины;

- классификация по совокупности двух предыдущих групп критериев дает картину, практически соЕппдогсцуя с первнм результатом;

- ¡'иг.асс;!ф:г.'^и:ч по полному • ¡¡оберу критериев является с сом строгой, т. е диапавепч глубины экстремумов и значений температуры и солености в них задали, еид;:ю, с.^гпсом Эхо протчло к точу, ЧТО бОЛЫТШ:СТСО СТЯНЦИЙ НЭ б К"! 5 'ЛГ.С С 7!' 'рс Б?.!! Ц, СИСТСМа НЗ

сгогла отпссти кх ин к одному г.з типоз.

На основании стих результатов делается £ 1:20л. что если производится структуры год бодьгэго района океана на основе много. :етних н;: Злыдений, то достаточно перно ее ш:лга проводить у;::тывая только темперУГ[ГРУ и содсиость пог.эрхчостн.

Основные результаты работа

В диссертации получены следуютдга основные результаты:

1. Исследована возможность и целесообразность построения ПО с реляционным исчислением в качестве внутреннего Формалн-зма. Показано, что применение Г!1 увеличивает скорость работы ПС и за счет этого позволяет применить ПС в ранее недоступные приложениях.

?.. Разработана архитектура специалюирогашюй реляционной сунд с дедуктивными возможностями, на основе которой ;.:згуч? Оьть созданы

[•аашгсодз прысьаднда с ноте ми по обработка больших объемов данных, ь том числе продукционные системы с реляционным исчислением в качестве внутреннего форизлкзма. Для этого:

- определены требования к скоростные характеристикам СУБД и обоснован вы£ор РЫД в качества базового ыетода доступа;

- предложено реализовать дедуктивные свойства СУБД в форме аппарата подсхем;

- определены специфшеекне требования к языку 1-лнипулирования данными СУБД, язшу описания подсхем, програмыо-иошпору поддержи подсхем, языку работы с подзхемами;

- определен характер ЕзаишдейстЕкя СУБД и АП и распределены функции по логическому выводу и выполнению подсхем

3. 11а основе реляционного метода доступа, иыекуэго цепочную алгебру в качества внутренней модели, разработана СУБД с дедукгивны-ш возможностями, рассыпанная на обработку большие объемов числовой информации н предназначенная для автоматизации научных исследовать.

Основные результаты диссертации опубликованы в работах:

1. Еачнев Е. А., Петровых Е. А. Организация подсхем пользователя

дет реляционной СУЩ ЛОРД: Препринт. Владивосток: ДВНЦ АН СССР, 1988. 30 С.

2. Гьильдас А. й., Денисов С. В.-, Кручинин Е. В., Петровых Е. А.,

ЕЬчнев Е. А. Система ЛОРД как средство создания океанографических банков данных // VII Всесоюв. совец. "Автоматизация управления техническими средствами исследования Ыирового океана"*: Тез. докл. Калшинград, 1989. С. 31-32.

а Гвильдие А. Л , Денисов С. Б., Петровых Е. А. Многоаспектное представление океанографической информации средствами СУБД ЛОРД // VII Всесого. совец. "Автоматизация управления техническими средствами исследования Мирового океана": Тез. докл. Калининград, 1989. С. 33-34.

4. Штровых Е. А. Яэьк запросов СУЩ ЛОРД // Системное программирование и автоматизация научных исследований : Сборник. Владивосток: ДЮ АН СССР, 1689. С. 21-26.