автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Математическое и программное обеспечение баз данных для долговременного хранения сверхбольших объектов сложной структуры

кандидата технических наук
Стефанский, Михаил Алексеевич
город
Москва
год
2005
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Математическое и программное обеспечение баз данных для долговременного хранения сверхбольших объектов сложной структуры»

Автореферат диссертации по теме "Математическое и программное обеспечение баз данных для долговременного хранения сверхбольших объектов сложной структуры"

На правах рукописи

Стефгнский Михаил Алексеевич

МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ

ОБЕСПЕЧЕНИЕ БАЗ ДАННЫХ ДЛЯ ДОЛГОВРЕМЕННОГО ХРАНЕНИЯ СВЕРХБОЛЬШИХ ОБЪЕКТОВ СЛОЖНОЙ СТРУКТУРЫ

Специальность 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва, 2005

Работа выполнена в Московской государственной академии приборостроения и информатики (МГАПИ).

Научный руководитель:

доктор технических наук, профессор Петров О.М.

Официальные оппоненты: доктор технических наук

Валентинов В.В.

кандидат технических наук Индюшкин В.А.

Ведущая организация: ФГУП Научно-исследовательский институт Космических систем

Защита состоится «17» января 2006 г. в 12 ч.ОО мин. на заседании совета Д 212.119.02 при Московской государственной академии приборостроения и информатики по адресу: г. Москва, ул. Стромынка, 20.

С диссертацией можно ознакомиться в библиотеке МГАПИ.

Автореферат разослан «16» декабря 2005 г.

Ученый секретарь диссертационного совета, к.т.н., доцент

Никульчев Е.В.

шч

ОБШАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Задача сохранения информации является одной из приоритетных в информационных технологиях, при решении которой необходимо обеспечить сохранность как накопленной, так и новой информации. Существуют виды информации, в том числе и научно-технической, для которой трудно указать сроки, когда эта информация потеряет значимость или станет ненужной, а во многих случаях ценность информации со временем будет возрастать. Примером может быть информация дистанционного зондирования Земли (ДЗЗ), которая позволяет объективно анализировать медленное изменение в окружающей среде.

Широкое представление информации в цифровом виде породила задачу обработки данных, организации долговременного хранения и создания специальных механизмов управления данными. Поэтому важной задачей системного программирования является создание программного обеспечения для баз данных (БД), содержащих сверхбольшие объекты сложной структуры: графические, картографические, мультимедийные объекты, т.к. эти данные требуют особых подходов к логическому и системно-техническому проектированию для хранения сотен гигабайт данных и доступа к ним.

Традиционные базы данных являются пассивными, т.к. объекты данных помещаются в базу данных пользователем или приложением, выборка объектов осуществляется под воздействием внешних источников. Правила, применяемые к содержимому базы данных, также исходят от внешнего воздействия. В то же время наличие скрытых неявных взаимосвязей между содержимым отдельных записей, позволяет использовать средства интеллектуализации в форме механизма логического вывода, для их обнаружения. Извлеченная таким образом информация, может быть использована для повышения эффективности функционирования СУБД.

Исследования логических аспектов представления функциональных зависимостей, развиваемые Дж. Греем, Р. Фагиным и др., ограничены рассмотрением взаимосвязей между атрибутами отношений и их группами. Исследования физических аспектов представления данных в БД, развиваемые А. Аи-ламаки, К. Россом и др., посвящены огггимизации хранения записей в стра-нично-ориентированных файлах БД, рассматривая значения атрибутов как атомарные, в соответствии с ограничениями первой нормальной формы.

Вопросы интеллектуализации БД в теоретическом и практическом смыслах рассмотрены в работах: А. Саймона, А. Тейза, К.С. Богданова, А.Н. Шевченко, А. Халеви, Дж. Ульмана, С. Терви и др.

Подсистема управления хранением атрибутов может быть эффективно обеспечена введением механизма логического вывода, использующего в качестве входных воздействий, информацию о происходящих событиях в БД и

РОС ( .

<. -

I: к *

срабатывании триггеров, отслеживающих условия, соответственно, не быть управляема пользователем или приложением. В качестве выхода - команды декомпозиции и синтеза значений атрибутов, направленные на их интерпретацию, обеспечивая тем самым оперативное управление данными в условиях постоянно увеличивающегося объема информации.

Для решения задачи создания долговременных архивов сверхбольших объектов сложной структуры требуется:

■ развитие средств интеллектуализации активных БД;

■ развитие способов построения интенсионального блока для анализа данных, на основе дедуктивного похода;

■ оценка влияния временной эволюции данных на принятие решения по актуализации или «старению» информации, выражающейся в перемещении данных внутри системы хранения;

■ оценка требований к ресурсам, необходимым для функционирования системы хранения.

Все вышесказанное дает основание рассматривать задачу разработки методов исследования отношений между данными и событий внутри БД, для того чтобы возложить непосредственно на БД выбор способа преобразования состояния системы, как актуальную научную и практическую задачу. Цели и задачи исследования

Целью диссертационной работы является разработка математического и программного обеспечения для построения активной БД, решающей задачи долговременного хранения сверхбольших объектов сложной структуры на основе использования методов интеллектуального анализа данных, а так же предоставления возможности оперативного использования накопленным материалом.

В соответствии с поставленной целью требуется решить следующие задачи:

1. Провести исследование и анализ систем управления, применяемых для решения задач долговременного хранения данных.

2. Разработать методику построения интеллектуальных баз данных, обеспечивающих долговременное хранение объектов сложной структуры, на основе активного управления событиями и условиями.

3. Разработать методику анализа данных, которая позволит исследовать и выделять параметры, оказывающие влияние на объекты хранения, на основе дедуктивного подхода.

4. Разработать методику оценки общего времени восстановления штатной работы после сбоя системы хранения, на основе активных БД, для заданной конфигурации аппаратных средств.

5. Решить практическую задачу построения информационной базы распределенного хранения данных на основе расширения использования сети ШегпеМп^апе!.

6. Внедрить и апробировать разработанное математическое и программное обеспечение активной БД для решения задачи долговременного хранения сверхбольших объектов сложной структуры.

Объект исследования. В качестве объекта исследования выбраны данные сверхбольшого объема (данные ДЗЗ, картографические, мультимедийные и др. объекты) сложной структуры, для которых необходимо обеспечить долговременное хранение.

Методы исследования основаны на теории искусственного интеллекта, теории баз данных, методах математической статистики объектно-ориентированном подходе программирования и принципе модульного построения программного кода. Научная новизна

1. Разработана методика организации баз данных, основанная на введении в СУБД модуля интеллектуального вывода для управления долговременным хранением сверхбольших объектов сложной структуры.

2. Предложена модифицированная модель дедуктивной БД, дополненная аксиоматически определенными правилами синтеза комплекса данных на основе хранимых значений.

3. Разработана методика оценки общего времени восстановления штатной работы системы хранения после сбоя, на основе активных БД, для заданной конфигурации аппаратных средств.

Практическая ценность работы Разработаны программные компоненты активной БД для решения задачи долговременного хранения объектов сложной структуры. Разработанный программный комплекс реализует методику построения активных баз данных (АБД), включает в себя приемы использования дедуктивных баз данных, основанные на аксиоматическом подходе и активную форму мониторинга событий и условий, которые воздействуют на данные.

Предложенная в настоящей работе методика интеллектуального анализа данных для управления событиями и условиями при долговременном хранении сверхбольших данных сложной структуры, способствуют сокращению расходов, необходимых на их постоянную поддержку, и, тем самым, повышает степень использования рассматриваемых данных в различных прикладных областях.

Реализация результатов работы

Результаты диссертационной работы внедрены при создании системы хранения комплекса долговременного хранения в Центре планирования, хранения, обработки и распространения информации (ЦПХОРИ) ГКНПЦ

им. М.В. Хруничева, предназначенного для работы с данными космического аппарата (КА) «Монитор-Э», а также могут быть использованы при построении глобальной системы наблюдения для сбора и обмена информацией, включающей мониторинг территорий и акваторий, между странами для выработки управленческих решений по устойчивому развитию, на основе спутниковых данных.

Апробация работы

По основным результатам работы были сделаны научные доклады на IV всероссийской научно-технической конференции «Новые информационные технологии» (Москва, МГАПИ, 2001г.) и научной конференции «Современные проблемы дистанционного зондирования Земли из космоса» (Москва, ИКИ РАН, 2003г.).

Публикации

По результатам диссертационного исследования опубликовано 7 печатных работ. На разработанный продукт получено свидетельство об официальной регистрации программ для ЭВМ в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ) - "Серверное программное обеспечение поддержки хранения данных. ACT MON-2004" №2005613178

Структура и объем работы

Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 108 наименований, содержит 129 страницы машинописного текста, 29 рисунков, 9 таблиц и приложения на 2 страницах.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность, поставлены цели и задачи исследований.

В первой главе проведен обзор и сравнение существующих информационных технологий, предназначенных для управления информацией в базах данных и применяемых в инфраструктуре систем хранения. Отмечены трудности, возникающие при использовании существующих способов хранения в связи со спецификой данных применительно к задаче долговременного хранения объектов сложной структуры.

Отмечено, что «гибридная» составляющая объекта хранения усложняет задачу хранения, т.к. кроме непосредственно самого изображения, необходимо хранить еще описательную составляющую данных.

Выполнен анализ свойств и характеристик специального программного обеспечения (СПО) систем хранения применяемых как для решения широкого спектра задач архивирования данных, так и ориентированных исключительно для решения задач хранения. Проведённое исследование дало возможность выявить ключевые группы и специфические черты системных, функциональных и потребительских характеристик.

Среди авторов научных трудов, послуживших теоретической основой информационных технологий долговременного хранения объектов сложной структуры, особо отмечены Е.А. Лупян, А.А.Прошин, В.П. Саворский, Е.Б. Кудашев, H.A. Арманд, Ю.А. Кравцов.

Среди нерешенных вопросов следует отметить:

■ развитие методов активной БД, которая позволит выделить прямые и косвенные связи между потоками хранимой информации для выработки управляющих воздействий;

■ определение взаимосвязи, между отношениями, связывающими комплексы данных, для выявления скрытых внутренних закономерностей с последующим практическим применением извлеченных знаний.

Рассмотрен программный продукт Oracle 10G, который является платформой для реализации и выполнения приложений в среде GRID. Основная идея GRID - обеспечить эффективное использование составляющих ее ресурсов. Для этого оборудование и программное обеспечение должно определять загруженность отдельных элементов GRID и балансировать нагрузки, направляя пользователей и приложения на менее загруженные узлы, при необходимости, подключая новые узлы и т. д.

Сделан вывод о том, что одним из ограничений на пути широкого использования систем долговременного хранения сверхбольших объектов сложной структуры, связаны с отсутствием предметно ориентированных программных продуктов, где управление данными строится через метаопи-сания. Такие описания являются одной из составляющих архивных материалов, что приводит к невозможности использования анализа связей между данными при решении ряда задач, требующих управления потоками данных.

Анализ основных недостатков СПО выявил, что работы в направлении разработки системы, способной обеспечить управление долговременным хранением объектов сложной структуры на основе содержания логики обработки данных в самой БД, являются, безусловно, актуальными.

Проведенный в первой главе анализ послужил обоснованием задач поставленных и решаемых в работе.

Вторая глава посвящена разработке методики построения активных баз данных, обеспечивающих долговременное хранение объектов сложной структуры, на основе использования методов интеллектуального анализа данных.

В отличие от имеющихся работ, в разработанной методике в качестве инструмента вместо традиционных пассивных БД, где вся процедурная логика координируется прикладным программным обеспечением (ППО) приложений, т.е. вне сферы управления данными, предложено использовать активные БД.

В соответствии с парадигмой активных баз данных в диссертационной работе, имеется в виду построение системы организации и управления данными, которая:

• содержит логику обработки в самой базе данных, так, что она управляется не (ППО) приложений, а самой СУБД;

■ обеспечивает некоторую форму мониторинга событий и условий, которые воздействуют на данные, и может инициировать обработку, управляемую базой данных;

■ включает в систему базы данных также средство, с помощью которого события способны запускать логику внутри базы данных.

Для построения баз данных, обеспечивающих долговременное хранение объектов сложной структуры, на основе активного управления событиями и условиями, разработана методика, структурная схема которой представлена на рис. I.

Рис. 1 . Структурная схема методики построения интеллектуальных БД на основе активного управления событиями и условиями.

Содержание методики заключается в том, что логика обработки данных инициализируется не прямыми действиями пользователя, а происходит непосредственно в базе данных, для чего используется мониторинг событий и условий, которые воздействуют на данные.

Активная база данных характеризуется как система, следующая правилам «Событие-Условие-Действие». Под событием следует понимать переход из одного состояния в другое. Приведенная триада означает интеграцию с данными некоторого множества правил, содержащих каузальную связь между отдельными отношениями, связывающими комплексы данных или предикатами. При этом система правил является представлением декларативной, а

не процедурной семантики, что дает возможность использовать в построении активных БД сложившихся методов искусственного интеллекта. Правила могут иметь продукционную или иную (например, фреймовую) форму представления, однако, не конкретизируя ее, можно перейти к формальнологической форме, которая может быть конкретизирована конструкциями символьно-логического языка. Продукционное правило, имеющее форму «образец-действие», активизируется, когда соответствует данным в рабочей памяти, и специфицированное действие модифицирует рабочую память. Образец может выступать как условие, выполнение которого приводит к истинности некоторой подцели или подмножества антацендентов правил.

Таким образом, конкретные правила запускаются (активируются) тогда, когда новые данные, находящиеся в рабочей памяти, соответствуют образцу.

Построение системы правил и интеграция в базу данных, связана с предварительным интеллектуальным анализом данных в ретроспективных данных. Методика интеллектуального анализа данных садится к решению нескольких важных проблем:

■ анализ данных с целью устранения избыточности, т.е. сокращения размерности вектора наблюдаемых параметров;

■ выявления логических функциональных отношений между данными;

■ построение продукционных правил

Основные этапы логического анализа данных отражены на рис. 2, представленная методика позволят исследовать и выделять параметры, оказывающие влияние на объекты хранения, на основе дедуктивного подхода.

Включение в процесс анализа возможно большего числа источников информации и параметров повышает точность и практическую ценность извлекаемых знаний. Однако, все методы интеллектуального анализа данных опираются на те или иные поисковые алгоритмы, т.е. являются комбинаторными методами, поэтому увеличение размерности анализируемой информации приводит к нелинейному росту пространства поиска и, соответственно, к резкому увеличению времени, необходимого для работы алгоритмов извлечения знаний.

На этапе определения набора исходных данных из множества доступных параметров N выделяется множество параметров для дальнейшего анализа и мониторинга.

При этом параметры оцениваются по критериям доступности, важности и информативности. Под доступностью понимается возможность получения информации по данному параметру в реальном времени. Важность параметра для анализа определяется экспертами предметной области и зависит от места параметра в общей структуре данных, характеризующих целевые функции обработки.

Рис 2 Структурная схема методики анализа данных на основе дедуктивного подхода

Под информативностью в данном контексте понимается пригодность данных параметра для автоматизированного интеллектуального анализа.

Методы интеллектуального анализа в основном являются статистически, поэтому в качестве критерия информативности или пригодности параметра могут использоваться стандартные статистические оценки. Так, если параметр изменяется крайне редко на заданном временном интервале, то он отбрасывается, т.к. расчет статистически значимых закономерностей для подобных параметров не представляется возможным.

С другой стороны, при некоторых априорных знаниях о логических отношениях между данными (предикатами), возможна редукция некоторой части предикатов, повторяющихся в разных продукциях. Это особенность дедуктивных баз позволяет в значительной степени редуцировать множество правил логического вывода.

После подобной фильтрации количество рассматриваемых параметров (сотни и более) может быть все еще существенным, что делает вычислительно затруднительным прямой анализ данных мониторинга. Это ставит вопрос о дальнейшем уменьшении размерности. В этой связи множество рассматриваемых параметров анализируется с позиций связности и избыточности.

В смысле связности в исходном множестве параметров выделяются относительно независимые группы параметров. Подобное выделение групп из множества параметров позволит значительно снизить суммарный объем вычислений и распараллелить процесс интеллектуального мониторинга.

Следует отметить, что разделение параметров по связности является в некоторых случаях обязательным шагом. Легко заметить, что при этом тривиальное разделение исходного множества параметров на две равные группы сразу уменьшает объем вычислений в два раза.

С позиции избыточности исходное множество параметров просматривается на предмет наличия групп сильно взаимосвязанных параметров. В случае обнаружения таковых имеет смысл заменить группу сильно связанных параметров отдельным ее представителем. Исключение подобной избыточности в данных уменьшает размерность данных.

Следующий этап анализа данных приводит к необходимости построения причинно-следственных отношений между комплексами данными. В этом случае использование экспертных знаний, или построение концептуальных решеток приводит к системе продукций, которые объективно характеризуют состояние системы данных.

Последний этап анализа сводится к привязыванию к множеству декларативных правил процедур, модифицирующих, или изменяющих состояние базы данных. Модификация, по существу, сводится к выполнению некоторой процедуры добавления новых данных, удаления старых. Простым, но чрезвычайно эффективным средством модификации, является представление модифицирующего правила в составе множества исходных правил.

Использование элементов интеллектуализации в компонентах управления данными информационных систем, на основе элементов анализа и обнаружения данных для осуществления вывода и получения фактов, отсутствовавших ранее, а так же внесение управляющих воздействий в саму БД при управлении долговременным хранением сверхбольших объектов сложной структуры, предлагаемых в настоящей работе, принципиально отличают этот подход, от аналогичных методик в других областях, так как стабильная структура связей сокращает жизненный цикл базы и ведет к созданию ограниченных фактографических баз данных.

Таким образом, система хранения становится средством размещения управляющих структур и правил, содержащих логику обработки, обеспечивая управление событиями и условиями, на основе интеллектуального анализа данных, что обеспечивает:

1. Совместное хранение данных и правил их обработки, позволяет реализовать активную базу данных, где в зависимости от состояния и предписанного набора правил принимается решение о дальнейших действиях.

2. Новые возможности формулировки критерия выборки при выполнении запросов - не с помощью явного указания множества интересующих данных, а посредством задания ограничения на атрибут, которое может включать значения, отсутствующие в базе данных в явном виде, т.е. восстанавливаемые с помощью логических выводов.

3. Устранение избыточности в данных, содержащейся в значениях осуществляется за счет исключения полей именуемых по-разному или определенных на разных доменах, но означающих одно и тоже.

4. Экспериментальные исследования показали, что устранение избыточности данных приводят к уменьшению размера объема исходной базы данных не менее 10%.

5. Применение дедуктивной модели БД, дополненной аксиоматическими правилами позволяет, избежать явного представления негативной информации.

В главе осуществлена постановка задачи оценки общего времени восстановления штатного режима системы хранения после сбоя в работе. Представлена модифицированная методика оценки общего времени восстановления штатной работы (рис. 3), на основе потоковой модели обработки данных:

Штатный УЛ. 0,0/ ур Штатный

режим сбой ремонт Обработка поступивших данных Обработка новых данных режим

Рис 3 Модель изменения состояния системы при отказе и восстановлении штатного режима работы.

Методика оценки времени восстановления, заключается в следующем:

1. На основе статистических данных оценить время 4, за которое обработка не производилась и время (¡, за которое обслуживающий персонал устранит возникшие неполадки;

2. определить время - время необходимое для обработки информации, поступившей в буфер М за промежуток времени между сбоем системы и ее восстановлением, т.е. полной переработки данных, накопленных в буфере М;

3. определить время (с, которое требуется для обработки вновь поступивших данных;

4. На основании пп.1-3, и известных скоростях поступления V, и обработки ур, вычисляется максимальное время восстановления штатной работы системы хранения ^:

После преобразований выражение (1) имеет вид:

х> у/2

(/, + ОН + ~Т+ ~

1 „У

УР V

ур

где /=1..«-процессы обработки, соотношение — < 1

V1

(1)

Таким образом, используя соотношение при заданных V, и ур и статистически измеренных и и определим время восстановления штатной работы системы С (рис. 4).

Для случая, когда время восстановления штатного режима работы жестко задано и известны V, и ур, получим выражение, для определения допустимого времени простоя и времени на устранение неполадок:

Разработанная методика оценки максимального времени возвращения работы в штатный режим позволяет на 10-15% снизить затраты на восстановление работы системы хранения.

В третьей главе диссертационной работы приведено описание и результаты разработки системы хранения для решения задачи долговременного архивирования спутниковых данных, реализованного в комплексе ЦПХОРИ, в основу, которой положены методики и подходы, предложенные автором во второй главе.

Одной из возможных областей использования данного комплекса -долговременное хранение спутниковых данных с КА «Монитор-Э», а так же последующих перспективных КА. Комплекс архивирования представляет собой информационную систему, которая осуществляет поддержку и взаимодействие программно-технических комплексов, входящих в состав ЦПХОРИ. Из основных задач, которые решает комплекс архивирования, следует отме-

(3)

*

Рис. 4. Зависимость общего времени восстановления от скорости обработки и времени простоя системы.

тить - оперативное хранение информации и архивирование информации, а так же предоставление по запросам потребителей изображений и метаданных из архива.

В главе рассмотрены этапы функционирования комплекса архивирования, которые были учтены при разработке структуры программного обеспечения комплекса.

Среди результатов, полученных автором в данной главе, следует отметить:

• разработана структура системы хранения объектов;

• созданы программные компоненты среды активной БД для решения задачи долговременного хранения объектов сложной структуры.

Для обеспечения полноты реализации системы хранения с использованием активных управляющих воздействий, автором предложено разделить информационную и метаинформационную части данных в системы хранения.

Разработана структура системы хранения, состоящая из взаимозависимых программных компонент (ПК), которые реализуют методы управляющих воздействий, каждая из которых с одной стороны выполняет свои специфические функции, а с другой - влияет на работу связанных блоков поддержки работы системы. Информационная система, использованная при разработке структуры активной системы хранения, показана на рис. 5.

Источим НкШМ

М»еиш мшу»

Систем* обработки

Активная База данньо

Система хранения данных

ДиоомА •оси* край* Дкнных (импорт)

библирма

долго временно г о &кюеый храним* «сема иршчш дани« (депорт)

Рис 5. Информационная система управления активной средой хранения

Разработан набор программных компонент, которые включают предложенные в работе методики, используемые для решения задач связанных с

возможностью интеллектуального управления объектом хранения на всем периоде его существования.

Программные компоненты включают как типовые блоки, так и разработанные автором (рис.6):

- Аннотирования и архивирования данных.

Аннотирование данных производится системой обработки, архивация данных производится процедурами, которые производят разбор, проверку и усвоение поступивших данных. Информация о данных хранения записывается в базу данных, а файлы данных в хранилище.

- Поддержки хранения данных.

Основной задачей при поддержке хранения является реализация механизмов хранения файлов, как в режиме непосредственного доступа, так и в режиме долговременного хранения.

- Обеспечения доступа к данным.

Решение задачи доступа пользователей и приложений к данным делится на задачи формирования поисковых запросов, которая базируется на основе логического вывода при получении данных, а так же доступа непосредственно к данным.

- Контроля за функционированием системы хранения.

В основе модуля контроля лежит активная мониторинговая программа (АМП), которая инициализирует действия при наступлении нового события, т.е. АМП - механизм контроля жизненных циклов для объектов хранения.

Данные для хранения

ПК начальной загрузки ваауль „

ПК аннотации и архива« [дш данных

Обработка данных

ш

ПК визуализация данных и

|У»1у1ГУти-тр

ПК контроля I I фуккционирова-**ния системы хранения

ПК обеспечения доступа к данным

Предостав- пение данных Вы*>л ■уттЬ-с,

99* программа

Типы программных компонент'

О

Типовая ПК

Прквне-* сенная ПК

Рис 6 Обобщенная структура системы, ориентированной на решение задач долговременного хранения

Разработанное программное обеспечение позволяет реализовать целостную активную систему хранения данных, сформулировать порядок работы с данными с целью сокращения затрат на отслеживание данных и их поиск в условиях постоянно увеличивающегося объема информации.

Четвертая глава посвящена проведенным исследованиям построения системы доступа удаленных пользователей к данным.

Анализ особенностей функционирования систем доступа к данным позволил установить, что большинство архивов данных создавалось либо в расчете на их локальное использование, либо на использование специальных выделенных высокоскоростных каналов связи для доступа к ним, такие архивы содержат, как правило, информацию по одному типу данных. Для получения наиболее полной информации по конкретной тематике необходим поиск по каждому серверу-архиву, что требует немало времени и не гарантирует получения ожидаемого результата.

Исследована задача развития способов построения информационной базы распределенного хранения данных на основе расширения использования сети ЫегпеМпй-апе! для доступа удаленных пользователей к информации о наличии, составе, актуальности и местонахождении данных и задачи поиска по распределенным архивам информации.

Сформулированы основные требования к структуре программного обеспечения каталогов данных на основе долговременного архива данных, которые предоставляют оперативный доступ к информации.

Разработаны программные средства, для организации обновления по сети Интернет баз данных Веб-каталога на основе вновь поступивших в архив данных, которые предназначены упростить и формализовать процедуры по передаче информации между системой хранения данных и Веб-интерфейсом каталога.

Сделан вывод о том, что решение задачи интеграции распределено -хранимой информации, может бьггь, создано на основе компонент для обмена данными между отдельными архивами.

Особо отмечено, что при обмене информацией, между архивами различных типов данных, расположенных в центрах хранения, обработки и распространения данных, и средствами общего каталога не потребуется физически перекачивать в специализированные информационные системы исходные данные. При этом нет необходимости наращивать мощности такой системы специально для организации хранения всего объема архива.

1

I

I

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Проведено исследование и анализ систем управления, применяемых для решения задач хранения данных, выявлены их недостатки и ограничения при решении задачи долговременного хранения

2. Разработана методика построения интеллектуальных баз данных, обеспечивающая долговременное хранение объектов сложной структуры, на основе активного управления событиями и условиями.

3. Разработана и развита методика анализа данных, позволяющая исследовать и выделять параметры, оказывающие влияние на объекты хранения, на основе дедуктивного подхода.

4. Разработана методика оценки общего времени восстановления штатной работы после сбоя системы хранения, на основе активных БД, для заданной конфигурации аппаратных средств.

5. Решена практическая задача и апробированы методы построения информационной базы распределенного хранения данных на основе расширения использования сети 1п1егпе1\1п1гапе1.

6. Внедрено и апробировано разработанное математическое и программное обеспечение активной БД для решения задачи долговременного хранения объектов сложной структуры в ЦПХОРИ ГКНПЦ им. М.В. Хруничева,

г предназначенного для работы с данными КА «Монитор-Э».

7. Разработанная методика используются в учебном процессе на кафедре «Автоматизированные системы управления и обработки информации» МГАПИ.

8. Получено свидетельство об официальной регистрации программ дня ЭВМ в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ) №2005613178.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ:

1. Стефанский М.А. Проблемы архивирования данных дистанционного зондирования и оперативного доступа к информации // Материалы IV всероссийской научно-технической конференции «Новые информационные технологии».^.: МГАПИ, 2001, с. 158-162.

2. Стефанский М.А. Организация информационной системы для доступа удаленных пользователей к спутниковым данным // Сб. трудов молодых ученых и специалистов, вып. 3, ч.1. /Под общ. ред. В.В. Стерлядкина.-М.: МГАПИ, 2001, с. 44-47.

3. Шкарин В.Е., Стефанский М.А., Космический комплекс дистанционного зондирования Земли "Монитор-Э" //VIII Всероссийский форум "Геоинформационные технологии. Управление. Природопользование. Бизнес. Образование". Тезисы докладов. - М.: РАГС, 2001, с. 27-28.

4. Шкарин В.Е., Стефанский М.А. Система дистанционного зондирования Земли на базе малых космических аппаратов. //Материалы международной научно-практической конференции «ГИС-форум».- К., 2001, с. 141145.

5. Стефанский М.А., Клевцов М.В. Организация архитектуры системы накопления, хранения и распространения спутниковых данных // Сб. научных трудов "Математическое моделирование и управление в сложных системах". Вып. 5. / Под общ. ред. С.Н. Музыкина.-М.: МГАПИ, 2002, с. 144145.

6. Стефанский М.А., Клевцов М.В. Проблемы архивирования и сжатия данных дистанционного зондирования в перспективной системе "Монитор", разработки ГКНПЦ им. М.В. Хруничева // Материалы научной конференции «Современные проблемы дистанционного зондирования Земли из космоса».-М.: ИКИ РАН, 2003, с. 131.

7. Стефанский М.А. Основные аспекты хранения и организации доступа пользователей к данным, получаемым оптико-электронной аппаратурой КА "Монитор-Э" // Труды РогосееЛтщБ НА,- Москва, Зеленоград, ЗАО «Оптэкс», 2003, с. 126-131.

ЛР № 020418 от 08 октября 1997 г.

Подписано к печати 13.12.2005 г. Формат 60x84.1/16. Объем 1,0 п.л. Тираж 100 экз. Заказ 194.

Московская государственная академия приборостроения и информатики

107996, Москва, ул. Стромынка, 20

у ✓л ^

РНБ Русский фонд

2007-4 8184

Л1 ИНВ 2006

Оглавление автор диссертации — кандидата технических наук Стефанский, Михаил Алексеевич

ВВЕДЕНИЕ

ГЛАВА 1. СРАВНИТЕЛЬНЫЙ АНАЛИЗ СИСТЕМ УПРАВЛЕНИЯ ХРАНЕНИЕМ 9 щ СВЕРХБОЛЬШИХ ОБЪЕКТОВ ДАННЫХ.

1.1. ОПРЕДЕЛЕНИЕ СВЕРХБОЛЬШИХ ОБЪЕКТОВ СЛОЖНОЙ СТРУКТУРЫ

1.2. ОБЗОР ПРОГРАММНЫХ ПРОДУКТОВ, ИСПОЛЬЗУЕМЫХ ДЛЯ ХРАНЕНИЯ 13 ДАННЫХ

1.3. ОБЗОР СИСТЕМ ХРАНЕНИЯ СПУТНИКОВЫХ ДАННЫХ

1.4. ОСНОВНЫЕ ОГРАНИЧЕНИЯ И НЕДОСТАТКИ СУЩЕСТВУЮЩИХ 37 ПРОГРАММНЫХ РЕШЕНИЙ ДЛЯ ХРАНЕНИЯ СВЕРХБОЛЬШИХ ОБЪЕКТОВ

СЛОЖНОЙ СТРУКТУРЫ

ГЛАВА 2. РАЗРАБОТКА МЕТОДИКИ ПОСТРОЕНИЯ АКТИВНЫХ БАЗ ДАННЫХ, 40 ОБЕСПЕЧИВАЮЩИХ ДОЛГОВРЕМЕННОЕ ХРАНЕНИЕ ОБЪЕКТОВ СЛОЖНОЙ СТРУКТУРЫ

• 2.1. ПОСТАНОВКА ЗАДАЧИ ПОСТРОЕНИЯ АКТИВНЫХ БАЗ ДАННЫХ

2.2. РАЗРАБОТКА МЕТОДИКИ ПОСТРОЕНИЯ АКТИВНОЙ СРЕДЫ БАЗ ДАННЫХ

2.3. РАЗРАБОТКА МЕТОДИКИ ПОСТРОЕНИЯ СИСТЕМЫ ИНФОРМАЦИОННЫХ 71 РЕСУРСОВ ДОЛГОВРЕМЕННОГО ХРАНЕНИЯ СВЕРХБОЛЬШИХ ОБЪЕКТОВ СЛОЖНОЙ СТРУКТУРЫ

2.4. ОЦЕНКА ТРЕБОВАНИЙ К РЕСУРСАМ, НЕОБХОДИМЫМ ДЛЯ 76 ФУНКЦИОНИРОВАНИЯ СИСТЕМЫ ХРАНЕНИЯ, НА ОСНОВЕ АКТИВНЫХ БАЗ ДАННЫХ ф

ГЛАВА 3. РАЗРАБОТКА СИСТЕМЫ ДОЛГОВРЕМЕННОГО ХРАНЕНИЯ

СВЕРХБОЛЬШИХ ОБЪЕКТОВ СЛОЖНОЙ СТРУКТУРЫ, НА ОСНОВЕ АКТИВНОЙ БАЗЫ ДАННЫХ

3.1. НАЗНАЧЕНИЕ ЦЕНТРА ПЛАНИРОВАНИЯ, ХРАНЕНИЯ, ОБРАБОТКИ И 85 РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ

3.2. РАЗРАБОТКА СТРУКТУР ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ 92 ХРАНЕНИЯ

3.3. РЕАЛИЗАЦИЯ ПРОГРАММНЫХ КОМПОНЕНТ СИСТЕМЫ ХРАНЕНИЯ

ГЛАВА 4. РАЗРАБОТКА СИСТЕМЫ ДОСТУПА К ДАННЫМ, ОРИЕНТИРОВАННОЙ 116 НА УДАЛЕННЫХ ПОЛЬЗОВАТЕЛЕЙ ф 4.1. ЗАДАЧА КОНСОЛИДАЦИИ ДАННЫХ, ПРИ ОБЕСПЕЧЕНИИ ДОСТУПА К

ПРОСТРАНСТАЕННО-РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИИ

4, 4.2. АРХИТЕКТУРА ПОСТРОЕНИЯ КАТАЛОГА ДАННЫХ С ВОЗМОЖНОСТЬЮ

ДОСТУПА УДАЛЕННЫХ ПОЛЬЗОВАТЕЛЕЙ

4.3. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ АКТУАЛИЗАЦИИ 126 ИНФОРМАЦИИ МЕЖДУ ДОЛГОВРЕМЕННЫМ АРХИВОМ ДАННЫХ И У/ЕВ-КАТАЛОГАМ

4.4. ПРИНЦИПЫ СОЗДАНИЯ ОБЩЕГО РЕПОЗИТАРИЯ ДАННЫХ НА ОСНОВЕ 130 РАСПРЕДЕЛЕННЫХ АРХИВОВ

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Стефанский, Михаил Алексеевич

Задача сохранения информации является одной из приоритетных в информационных технологиях, при решении которой необходимо обеспечить сохранность как накопленной, так и новой информации. Существуют виды информации, в том числе и научно-технической, для которой трудно указать сроки, когда эта информация потеряет значимость или станет ненужной, а во многих случаях ценность информации со временем будет возрастать. Примером может быть информация дистанционного зондирования Земли (ДЗЗ), которая позволяет объективно анализировать медленное изменение в окружающей среде.

Широкое представление информации в цифровом виде породила задачу обработки данных, организации долговременного хранения и создания специальных механизмов управления данными. Поэтому важной задачей системного программирования является создание программного обеспечения для баз данных (БД), содержащих сверхбольшие объекты сложной структуры: графические, картографические, мультимедийные объекты, т.к. эти данные требуют особых подходов к логическому и системно-техническому проектированию для хранения сотен гигабайт данных и доступа к ним.

Традиционные базы данных являются пассивными, т.к. объекты данных помещаются в базу данных пользователем или приложением, выборка объектов осуществляется под воздействием внешних источников. Правила, применяемые к содержимому базы данных, также исходят от внешнего воздействия. В то же время наличие скрытых неявных взаимосвязей между содержимым отдельных записей, позволяет использовать средства интеллектуализации в форме механизма логического вывода, для их обнаружения. Извлеченная таким образом информация, может быть использована для повышения эффективности функционирования СУБД.

Исследования логических аспектов представления функциональных зависимостей, развиваемые Дж. Греем, Р. Фагиным и др., ограничены рассмотрением взаимосвязей между атрибутами отношений и их группами. Исследования физических аспектов представления данных в БД, развиваемые А. Аиламаки, К. Россом и др., посвящены оптимизации хранения записей в странично-ориентированных файлах БД, рассматривая значения атрибутов как атомарные, в соответствии с ограничениями первой нормальной формы.

Вопросы интеллектуализации БД в теоретическом и практическом смыслах рассмотрены в работах: А. Саймона[59], А. Тейза, К.С. Богданова[7], А.Н. Шевченко[70],.А. Халеви, Дж. Ульмана, С. Терви и др.

Подсистема управления хранением атрибутов может быть эффективно обеспечена введением механизма логического вывода, использующего в качестве входных воздействий, информацию о происходящих событиях в БД и срабатывании триггеров, отслеживающих условия, соответственно, не быть управляема пользователем или приложением. В качестве выхода -команды декомпозиции и синтеза значений атрибутов, направленные на их интерпретацию, обеспечивая тем самым оперативное управление данными в условиях постоянно увеличивающегося объема информации.

Для решения задачи создания долговременных архивов сверхбольших объектов сложной структуры требуется: развитие средств интеллектуализации активных БД; развитие способов построения интенсионального блока для анализа данных, на основе дедуктивного похода; оценка влияния временной эволюции данных на принятие решения по актуализации или «старению» информации, выражающейся в перемещении данных внутри системы хранения; оценка требований к ресурсам, необходимым для функционирования системы хранения.

Все вышесказанное дает основание рассматривать задачу разработки методов исследования отношений между данными и событий внутри БД, для того чтобы возложить непосредственно на БД выбор способа преобразования состояния системы, как актуальную научную и практическую задачу.

Целью диссертационной работы является разработка математического и программного обеспечения для построения активной БД, решающей задачи долговременного хранения сверхбольших объектов сложной структуры на основе использования методов интеллектуального анализа данных, а так же предоставления возможности оперативного использования накопленным материалом.

В соответствии с поставленной целью требуется решить следующие задачи:

1. Провести исследование и анализ систем управления, применяемых для решения задач долговременного хранения данных.

2. Разработать методику построения интеллектуальных баз данных, обеспечивающих долговременное хранение объектов сложной структуры, на основе активного управления событиями и условиями.

3. Разработать методику анализа данных, которая позволит исследовать и выделять параметры, оказывающие влияние на объекты хранения, на основе дедуктивного подхода.

4. Разработать методику оценки общего времени восстановления штатной работы после сбоя системы хранения, на основе активных БД, для заданной конфигурации аппаратных средств.

5. Решить практическую задачу построения информационной базы распределенного хранения данных на основе расширения использования сети 1п1егпе1:\1п1хапе1:.

6. Внедрить и апробировать разработанное математическое и программное обеспечение активной БД для решения задачи долговременного хранения сверхбольших объектов сложной структуры.

Объект исследования. В качестве объекта исследования выбраны данные сверхбольшого объема (данные ДЗЗ, картографические, мультимедийные и др. объекты) сложной структуры, для которых необходимо обеспечить долговременное хранение.

Методы исследования основаны на теории искусственного интеллекта, теории баз данных, методах математической статистики объектно-ориентированном подходе программирования и принципе модульного построения программного кода.

Научная новизна работы, обусловлена следующими факторами:

1. Разработаны принципы организации баз данных, для управления долговременным хранением сверхбольших объектов, на основе математических методов активного управления событиями и условиями.

2. Предложена модифицированная модель дедуктивной БД, дополненная аксиоматически определенными правилами синтеза комплекса данных на основе хранимых значений.

3. Разработана методика оценки общего времени восстановления штатной работы системы хранения после сбоя, на основе активных БД, для заданной конфигурации аппаратных средств. Разработаны программные компоненты активной БД для решения задачи долговременного хранения объектов сложной структуры. Разработанный программный комплекс реализует методику построения активных баз данных (АБД), включает в себя приемы использования дедуктивных баз данных, основанные на аксиоматическом подходе и активную форму мониторинга событий и условий которые воздействуют на данные.

Предложенная в настоящей работе методика интеллектуального анализа данных для управления событиями и условиями при долговременном хранении сверхбольших данных сложной структуры, способствуют сокращению расходов, необходимых на их постоянную поддержку, и, тем самым, повышает степень использования рассматриваемых данных в различных прикладных областях.

Результаты диссертационной работы внедрены при создании системы хранения комплекса долговременного хранения в Центре планирования, хранения, обработки и распространения информации (ЦПХОРИ) ГКНПЦ им. М.В. Хруничева, предназначенного для работы с данными космического аппарата (КА) «Монитор-Э», а также могут быть использованы при построении глобальной системы наблюдения для сбора и обмена информацией, включающей мониторинг территорий и акваторий, между странами для выработки управленческих решений по устойчивому развитию, на основе спутниковых данных.

По основным результатам работы были сделаны научные доклады на IV всероссийской научно-технической конференции «Новые информационные технологии» (Москва, МГАПИ, 2001г.), научной конференции «Современные проблемы дистанционного зондирования Земли из космоса» (Москва, ИКИ РАН, 2003г.) и на VIII Всероссийском форуме "Геоинформационные технологии. Управление.

Природопользование. Бизнес. Образование.".

По результатам диссертационного исследования опубликовано 7 печатных работ. На разработанный продукт получено свидетельство об официальной регистрации программ для ЭВМ в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ) - "Серверное программное обеспечение поддержки хранения данных. ACTMON-2004" №2005613178.

Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 108 наименований, содержит 129 страницы машинописного текста, 29 рисунков, 9 таблиц и приложения на 2 страницах.

Заключение диссертация на тему "Математическое и программное обеспечение баз данных для долговременного хранения сверхбольших объектов сложной структуры"

ЗАКЛЮЧЕНИЕ

В результате проведения диссертационных исследований автором получены следующие результаты и рекомендации:

1. Проведено исследование и анализ систем управления, применяемых для решения задач хранения данных, выявлены их недостатки и ограничения при решении задачи долговременного хранения

2. Разработана методика построения интеллектуальных баз данных, обеспечивающая долговременное хранение объектов сложной структуры, на основе активного управления событиями и условиями.

3. Разработана и развита методика анализа данных, позволяющая исследовать и выделять параметры, оказывающие влияние на объекты хранения, на основе дедуктивного подхода.

4. Разработана методика оценки общего времени восстановления штатной работы после сбоя системы хранения, на основе активных БД, для заданной конфигурации аппаратных средств.

5. Решена практическая задача и апробированы методы построения информационной базы распределенного хранения данных на основе расширения использования сети 1п1егпе1;\1п1;гапе1;.

Г!

6. Внедрено и апробировано разработанное математическое и программное обеспечение активной БД для решения задачи долговременного хранения объектов сложной структуры в ЦПХОРИ ГКНПЦ им. М.В. Хруничева, предназначенного для работы с данными КА «Монитор-Э».

7. Разработанная методика используются в учебном процессе на кафедре «Автоматизированные системы управления и обработки информации» МГАПИ.

8. Получено свидетельство об официальной регистрации программ для ЭВМ в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ) №2005613178.

Библиография Стефанский, Михаил Алексеевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Анни П., Системы хранения Sun Microsystems: от начала до конца, Storage News, январь, 2002.

2. Ашинянц P.A., Логические методы в искусственном интеллекте, МГАПИ, 2000.

3. Бездушный А.Н., Жижченко А.Б., Кулагин М.В.Серебряков В.А., Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек, Программирование, 2000, №4, с. 13-14.

4. Багданов К., Интеллектуальная система программирования FramIX для предствления знаний в системах принятия решений: Дис. канд. техн. наук: 05.13.11, М., 2001.

5. Вагин В.Н.,Дедукция и обобщение в системах принятия решений,-М.:Наука,1988,-384с

6. Вашкевич Н.П., Зинкин и др., Коллективное поведение агентов в сетях хранения и обработки данных, Информационные технологии, №9, 2003.

7. Восьмирко С. Разработка математического и программного обеспечения среды моделирования искусственных нейронных сетей ориентированной на решение задач прогнозирования:Дис. канд. техн. наук: 05.13.11, М., 2004.

8. Галкин Г., Интернет-СУБД могильщик реляционной модели, «Сетевой журнал» №12, 2000.

9. Глинских А., Мировой рынок ПО для систем хранения: средства управления данными, Byte, № 1,2,3 2004.

10. Глинских А., Основные сегменты рынка ПО для систем хранения, Byte, № 8, 2004.

11. Глинских А., Мировой рынок ПО для систем хранения: средства управления ресурсами, Byte, № 6, 2003.

12. Грачев А.Ю., Введение в СУБД Informix, -М.:Диалог-МИФИ, 2000-272с.

13. Гройсберг Л.Б., Об оценке надежности отказоустойчивых систем м восстановлением рещерва, Автоматика и телемехоника, 1994, №3.

14. Дубова Н., Управление надежным хранением, Открытые системы, №06, 2002.

15. Дубова Н., Система резервирования ArcServe 2000. «Открытые системы», № 1, 2001.

16. Егоров A.M. Системы дистанционного зондирования Земли-эффективное средство контроля состояния окружающей среды, «Экос-Информ», №7, 2002.

17. Ершов Н., Королев JI. и др., Применение активных баз данных в прогнозировании, Вестник московского университета серия. 15, вычислительная математика и кибернетика, 1998, №1.

18. Захаров М.Ю., Лупян Е.А., Назиров P.P. Создание информационного центра для поддержки пользователей спутниковых данных. // Исследование Земли из Космоса. 1994. N 4. С. 88-91.

19. Захаров М.Ю., Лупян Е.А., Назиров P.P., Мазуров A.A., Флитман Е.В., Хохлова Н.Л. Организация системы оперативного доступа удаленных пользователей к спутниковым данным // Исследование земли из космоса 1996. N 5. С. 67-72

20. Захаров М.Ю.,Крашенинникова Ю.С.,Лупян Е.А.,Мазуров A.A., Назиров P.P., Флитман Е.В., Хохлова Н.Л. Открытая информационная система поддержки пользователей спутниковых данных // ПрепринтИКИ РАН. Москва. 1995. Р-1929. 38 с

21. Захаров М.Ю., Лупян Е.А. Организация формата записи данных, поступающих со спутников серии NOAA, для решения локальных задач // Исследование Земли из Космоса 1993. N3. С. 66 70.

22. Зубов М.Е. Математическое и программное обеспечение новых технологий проектирования виртуальных тренажеров // Автореферат диссертации на соискание ученой степени канд. техн. наук. -М., 2001. -17 е.: ил.

23. Качалов Г. Метаданные ключевой вопрос аудиовизуальных архивов, VII Международный конгресс HAT «Прогресс технологий телерадиовещания», 2004 г., Москва.

24. Клейнрок Л., теория массовго обслуживания, М. ¡Машиностроение, 1979,432с.

25. Когаловский М.Р., Энциклопедия технологий баз данных: Эволюция технологий; Технологии и стандарты; Инфраструктура; Терминология., М., Финансы и статистика,2002. 800 стр.

26. Коннолли Т., Бегг К., Базы данных. Проектирование, реализация и сопровождение. Теория и практика., BHV-Санкт-Петербург,2003.

27. Королев Ю.К., Тихонова Н.М., Данные дистанционного зондирования Земли на российском рынке., М, ГИС-информационный бюллетень, 1998, Вып №3(15)

28. Кошкарев A.B., Сорокин А.Д., Форматы и стандарты цифровой информации, М., ГИС- информационный бюллетень, Москва, 2000, Вып. №3 (25)

29. Крёнке Д., Теория и практика построения баз данных, Питер,2004.

30. Кудашев Е.Б.,Балашов А.Д., Филонов А.Н, Электронные библиотеки космической информации: от индивидуальных архивов данных к интеграции спутниковых коллекций в европейскую информационную систему INFEO, Материалы конф. "EVA 2003», Москва, 2003.

31. Кудашев Е.Б.,Арманд H.А.,Кравцов Ю.А., Интегрирование информационных ресурсов исследований из космоса. Труды Всероссийской конференции ТЕЛЕМАТИКА 99, с. 98-99.С-П6, 1999.

32. Кузнецов Л.А., Погодаев А.К., Овчинников В.В., Оптимизация запросов к базам данных информационных систем, Управление большими системами /Сборник трудов молодых ученых. Выпуск 4. М.:ИПУ РАН, 2003. 127 с.

33. Кузнецов Л.А., Погодаев А.К., Овчинников В.В., Оптимизация запросов к базам данных информационных систем, Управление большими системами /Сборник трудов молодых ученых. Выпуск 4. М. :ИПУ РАН, 2003. 127 с.

34. Кузнецов С., Управление услугами хранения данных: взгляд Hewlett-Packard, Storage News №4 (13), август, 2002.

35. Литовченко Д.Ц., Ческидова A.C., Методика создания баз данных характеристик пространственно-распределенных объектов на основе геоинформационных технологий, Экологические системы и приборы, №1, 2002.

36. Лупян Е.А. Построение информационных систем приема, обработки и распростарнения спутниковых данных с использованием технологий глобальных компьютерных сетей Интернет, Дис. докт. техн. наук: 05.13.11, М., 1998

37. Максимов С., Цифровые архивы это внутренний ресурс телерадиокомпаний или банк данных единого информационного пространства, VII Международный конгресс HAT «Прогресс технологий телерадиовещания», 3-5 ноября, 2003 г., Москва.

38. Матросов А. В, Сергеев А. О., Чаунин М. П. HTML 4.0. Новый уровень создания HTML-документов. С-Пб:-«БХВ-Санкт-Петербург», 2001,672с.

39. Меньшиков В.А., Принципы построения интегриированной системы государственного контороля за состоянием важнейших технико-экономинских объектов и источников природных ресурсов России, Двойные технологии, 2001, № 1

40. Моисеенко А., Tivoli Storage Manager- управление корпаративным системами хранения данных, Storage News, октябрь, 2000.

41. Мясницкий П., Защитите ваш самый ценный капитал, Storage News, декабрь, 2000.

42. Назаров JI.E. Назарова З.Т., Нейросетевой, фрактальный и JPEG алгоритмы сжатия изображений, Информационные технологии, №1,2001.

43. Нильсен Я. Веб-дизайн. СПб:- «Символ-Плюс», 2000,512с

44. Павлов A.C. CGI-программирование. С-Пб:- Питер, 2000, 416с.

45. Павлов В. Хранение больших объемов информации, Connect!, №3, 2002.

46. Паньженский В., Auto Jet комплекс видеоархивирования на базе роботизированных CD/DVD-библиотек, VII Международный конгресс HAT «Прогресс технологий телерадиовещания», 3-5 ноября, 2003 г., Москва.

47. Петров В., Непрерывный бизнес или системы высокойготовности, Storage News, март-февраль, 2001. Пол Мак-Федрис. Использование JavaScript. Специальное издание. Вильяме, 2002.

48. Прошин А., Технология построания автоматизированных систем хранения спутниковых данных: Дис. канд. техн. наук: 05.13.11,М.,2031.

49. Ривкин М., ORACLE и коммерческая GRID, Открытые системы, N 11,2002.

50. Саймон А.Р., Стратегические технологии баз данных:менеджмент на 2000 год,М.: Финансы и статистика, 1999.

51. Смирнов И, Тенденции рынка систем хранения, Storage News, август, 2003

52. Стефанский М.А. Основные аспекты хранения и организации доступа пользователей к данным, получаемым оптико-электронной аппаратурой КА «Монитор-Э», Труды Poroceedings IIA, Москва, Зеленоград, 2003.

53. Стефанский М.А. Организация информационной системы для доступа удаленных пользователей к спутниковым данным // Сб. трудов молодых ученых и специалистов, вып. 3, 4.1. /Под общ. ред. В.В. Стерлядкина.-М.: МГАПИ, 2001, с. 44-47.

54. Стефанский М.А. Организация информационной системы для доступа удаленных пользователей к спутниковым данным, Сборник трудов молодых ученых и специалистов МГАПИ, Москва, 2001.

55. Стефанский М.А., Проблемы архивирования данных дистанционного зондирования и оперативного доступа к информации. Материалы IV всероссийской научно-технической конференции, 2001.

56. Стефанский М.А. Свидетельство об официальной регистрации программ для ЭВМ в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ) "Серверное программное обеспечение поддержки хранения данных. ACTMON-2004" №2005613178.

57. Тарасов В., Infinite Mailbox for Lotus Notes архивное хранение почтовых сообщений в корпорациях, №2, Storage News, май-июль, 2003.

58. Фролов А. В., Фролов Г. В. Базы данных в интернете: практическое руководство по созданию Web-приложений с базами данных М.: Издательство «Русская Редакция», 2000, 448с

59. Шевченко А., Логический подход к разработке автоматизированной система формирования послеоперационных заключений и анализа в новых медецинских технологиях, Дис. канд. техн. наук: 05.13.11, М., 2001.

60. Шелли Пауэре. Динамический HTML. Издательство «ЛОРИ», г. Москва, 1999, 362с

61. Шишанов П., LEGATO: защита данных и приложений, Storage News, декабрь, 2001.

62. Шкарин В.Е., Стефанский М.А., Космический комплекс дистанционного зондирования Земли "Монитор-Э" //VIII Всероссийский форум " Геоинформационные технологии. Управление. Природопользование. Бизнес. Образование." Тезисы докладов. М.: РАГС, 2001, с. 27-28.

63. Криса Дейта (Chris Date) и Хайя Дарвена (Hugh Darwen)

64. Основы объектно/реляционных баз данных: третий манифест» («Foundation for Object/Relational Databases: The Third Manifesto»)

65. The Active Database ManagementSystem Manifesto:A Rulebase of ADBMS Features

66. Arms C.R. Historical Collections for the National Digital Library. D-Lib Magazine, April 1996.

67. Arocena G., Mendelson A. Viewing Web Information Systems as Database Applications. Comm. of the ACM, July 1998.

68. Arocena G.O., Mendelson A.O., Mihaila G.A. Applications of a Web Query Language. Department of Computer Science, University of Toronto, 1996

69. Balser W. Using open-source software and low-cost computers for earth-observation data processing.-ESA bulletin 103-august 2000.

70. BARGHOUTI, N. AND KRISHNAMURTHY, B. 1995.Using eventcontexts and matching constraints to monitor software processes. In Proceedings of the ICSE, 83-92.

71. BAYER, P. AND JONICER, W. 1994. A framework for supporting triggers in deductive databases. In Proceedings of the First InternationalWorkshop on Rules in Database Systems, N. Paton and M. Williams, Eds., Springer-Verlag, 316-330.

72. BEERI, C. AND MILO, T. 1991. A model for active object oriented database. In Proceedings of theSeventeenth International Conference on Very Large Data Bases (Barcelona), R. C. G. M. Lohman and A. Sernadas, Eds., Morgan-Kaufmann, San Mateo, CA, 337-350.

73. Colaiacomo J.L. Valero M.L., An implementation of XML and JAVA in a prototypal environment Standard for satellite information production&dissemination, Proceedings of DASIA, Conference, Lisbon, 1999.

74. DITTRICH, IC., GATZIU, S., AND GEPPERT, A. 1995. The active database management system manifesto: A rulebase of ADBMS features.In Rules In Database Systems: Proceedings of the Second International Workshop, T. Sellis, Ed., Springer-Verlag, 3-17.

75. Eisenberg A., Melton J. SQL J Part 0, now known as SQL/OLB (Object Language Bindings). SIGMOD Record, Vol. 27, No. 4, December 1998.

76. Eric Miller. An Introduction to the Resource Description Framework. D-Lib Magazine. May 1998.

77. FERNANDES, A., WILLIAMS, M., AND PATON, N. 1997. A logic-based integration of active and deductive databases. New Gen. Comput. 15, 2, p.205-244.

78. Folk M. An Introduction to HDF (Hierarchical Data Format) HDF Groupe University of Illonois at Urbana Champaign 1997. 63 p.

79. Foster, C. Kesselman, S. Tueclce. The Anatomy of the Grid: Enabling Scalable Virtual Organizations. // International Journal. Supercomputer Applications, 15(3), 2001.

80. Foster, C. Kesselman, J. Nick, S. Tueclce, The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration. // Open Grid Service Infrastructure WG, Global Grid Forum, June 22, 2002.

81. Griffin S.M. NSF/DARPA/NASA Digital Libraries Initiative. D-Lib Magazine, July/August 1998.

82. Logoze C., Fielding D., Defing Collections in distributed Digital Libraies, D-lib Magazine, 1998.

83. Logoze C., Fielding D., Defing Collections in distributed Digital Libraies, D-lib Magazine, 1998.

84. Luciano Foti, A new approach in Earth observation data distribution, Proceeding of DASIA,Conference, Lisbon, Portugal, 1999

85. Moeller H., Earth observation user information systems protoype interactive sattellite image server for user access, processing and retrieval architecture of a transcontinental demonstrator, Proceeding of DASIA,Conference, Sevillia,Spain, 1997.

86. Morgan Kaufmann, Khalid Sayood Introduction to Data Compression// publishers ISBN 1-55860-346-8 1996 475 p.

87. NAQVI, W. AND IBRAHAM, M. 1994. Rule and knowledge management in an active database system. In Proceedings of the First International Workshop on Rules in Database Systems, N. Paton and

88. M. Williams, Eds., Springer- Verlag, 58-69.

89. Oscar Diaz and Norman Paton, Active Databases, Library of Congress Cataloging-in-Publication Data Advanced database technology and design, 2000

90. PATON, N., ED. 1999. Active Rules in Database Systems. SpringerVerlag.

91. Penny Avril, Oracle Database lOg: A Revolution in Database Technology, An Oracle White Paper, December 2003.

92. Ramapriyan H.K. Eosdis Metadata Workshop, The earth observer, April 1-2, 1997.

93. Sobue Shinichi, Japanese advanced earth observing satellite www on-line services, The earth observer, April 1-2, 1998.

94. Sreedharan Suja, Sapede Patrick, Integrating and validating the inrastructure for earth observation data exchange, Proceedings of DASIA, Conference, Lisbon, 1999.

95. TIFF Revision 6.0. Aldus Corporation. Seattle. 1992.

96. Weibel S. Metadata: The Foundations of Resource Description. D-Lib Magazine, July 1995.