автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Система интеграции информационных ресурсов при моделировании природно-хозяйственных объектов

кандидата технических наук
Петухов, Валерий Васильевич
город
Санкт-Петербург
год
2009
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Система интеграции информационных ресурсов при моделировании природно-хозяйственных объектов»

Автореферат диссертации по теме "Система интеграции информационных ресурсов при моделировании природно-хозяйственных объектов"



На правах рукописи

ПЕТУХОВ Валерий Васильевич

Система интеграции информационных ресурсов при моделировании природно-хозяйственных объектов

Специальность 05.13.01 - Системный анализ, управление и обработка информации (технические системы)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

2 СЕН ^

Санкт-Петербург 2009

003477752

Работа выполнена в Учреждении Российской академии наук Санкт-Петербургский институт информатики и автоматизации РАН.

Научный руководитель

- доктор технических наук, профессор Воробьев Владимир Иванович

Официальные оппоненты

- доктор технических наук, профессор Марлей Владимир Евгеньевич

- доктор технических наук, доцент Балонишников Александр Михайлович

Ведущая организация

- Санкт-Петербургский Государственный Политехнический Университет

Защита диссертации состоится «15» октября 2009 \ в 14.00 часов на заседании Диссертационного совета Д 002.199.01 Учреждения Российской академии наук Санкт-Петербургском институте информатики и автоматизации РАН по адресу: 199178, Санкт-Петербург, В.О., 14 линия, 39.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Санкт-Петербургском институте информатики и автоматизации РАН

Автореферат разослан 14 сентября 2009 г.

Ученый секретарь

диссертационного совета Д 002.199.01 кандидат технических наук

А.Л.Ронжин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации. Одним из необходимых условий принятия эффективных решений при управлении сложными объектами, является своевременное обеспечение задействованных на разных уровнях управления лиц достоверной, полной и качественной информацией о текущем и прогнозируемом состоянии объекта. Это создает основу для выработки опережающих управленческих решений на базе прогнозных оценок состояния объекта управления.

Основные трудности при решении задач прогнозирования состояния природно-хозяйственных объектов обусловлены их сложностью, недостаточной изученностью протекающих в них процессов, ограниченными возможностями проведения активных экспериментов, сложностью и нескоординированностью процессов сбора исходных данных, их недостаточной доступностью, неадекватностью используемых моделей, а также рядом других причин. Данные, поступающие из различных источников, как правило, разнородны и для прямого использования, сопоставления и анализа, не пригодны.

В то же время разнообразие задач, для решения которых необходима информация о природных ресурсах и явлениях, разнообразие самих описываемых объектов, процессов и подходов к отображению информации о них не позволяют говорить о множестве информационных ресурсов данной группы как о единой системе.

Развитие концепции единого информационного пространства, научно-методологических основ информатизации, методов поддержки принятия решений в сложных организационно-технических системах, особенности формирования ведомственных и предметных ИС подробно рассмотрены в трудах ученых СПИИРАН (Юсупова P.M., Заболоцкого В.П.. Соколова Б.В.), теоретические основы гармонизации, интеграции и слияния данных, анализ и объединение данных для принятия решений (Городецкий В.И., Попович В.В.), онтологический подход к управлению знаниями (Смирнов A.B.). В ходе работы над диссертацией изучены и проанализированы труды отечественных и зарубежных ученых в областях: информатики, теории системного анализа и принятия решений, проектирования информационных технологий и систем (Багриновский К.А., Божко В.П., Гиляревский P.C., Глушков В.М., Ю.Г. Данилевский, П. Друкер, Э.В. Евреинов, A.A. Емельянов, В.М. Жеребин, Д. Захман, С. Катлип, В.Н. Квасницкий, В.В. Кульба, А.Г. Мамиконов, Д. Мако, М.Месарович, В.А. Мясников, А.П. Пятибратов, А.Н. Романов, Т. Саати, С.Н.Селетков, И. Такахара, Ю.Ф. Тельнов, В.П. Тихомиров, М. Хаммер, Э.Н. Хотяшев и др.), создания информационных систем управления регионом, городом (Г.И. Марчук, Ф.И. Перегудов, A.A. Стогний, Ю.М. Черкасов, Ю.А. Черенков и др.), классификации и управления информационными ресурсами (Антопольский А.Б., Белов Г.В., Громов Г.Р., Копылов В.А., Ларин М.В., Саков A.A., Семилетов С.И., и др.).

Несмотря на значительное число работ и проектов, посвященных проблеме управления данными и интеграции информационных ресурсов, и значительные усилия центров обработки данных сформировать универсальные системы представления и предоставления данных (SDSS в Fermilab, ВаВаг в SLAC, BIRN в SDSC, Entrez-PubMed-GenBank в NCBI), сохраняется разрыв между многочисленными источниками, архивами данных и моделями, в которых эти данные предполагается использовать, особенно при проведении междисциплинарных исследований. Не все модели поддерживают вывод результатов в унифицированных форматах, удобных для использования в геоинформационных системах или системах научной визуализации (GRADS, Ferret, Surfer, AVS, IRIS Explorer, IBM Data Explorer, OpenMV). Крупные научные центры и центры обработки имеют сложившиеся информационные технологии и внутренние стандарты представления данных (например, SILAM/FMI, FIMR, JINR, SMHI, ММБИ, NESDIS) изменять которые сложно или нецелесообразно.

Другой проблемой, является дробление информационного пространства разрозненными информационно-вычислительными системами, что приводит к дублированию данных и потере достоверности.

Разрастание файловых систем до петабайтных архивов с миллиардами файлов, отсутствие единых стандартов представления данных, многообразие источников и форматов данных, необходимость интеграции новых и сложившихся информационных технологий, использование ассимиляции данных в модели для корректировки их поведения обусловливают актуальность сформулированной темы исследования, направленной на повышение эффективности информационного обеспечения систем прогнозирования с использованием моделей: разработка и формирование единого информационного пространства систем природопользования.

Цель работы И задачи исследования: разработка системной модели интеграции информационных ресурсов и реализация информационных систем природопользования на основе единого информационного пространства при моделировании природно-хозяйственных объектов для предупреждения возможных неблагоприятных ситуаций. Для достижения поставленной цели поставлены и решены следующие задачи:

1) анализ информационных ресурсов информационных систем природопользования и методов их интеграции в единое информационное пространство;

2) разработка онтологической модели единого информационного пространства систем природопользования и модели единого информационного пространства;

3) разработка метода интеграции данных в единое информационное пространство и ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов;

4) реализация разработанного метода интеграции информационных ресурсов в решении практических задач.

Методы исследования

В работе использовались методы системного анализа, моделирования природных процессов, интеллектуального анализа данных, построения информационно-вычислительных систем, теории метаданных, онтологического анализа.

Положения, выносимые на защиту

1. Онтологическая модель информационных ресурсов систем природопользования, позволяющая определить основные понятия и связи между ними.

2. Метод интеграции информационных ресурсов в единое информационное пространство на основе онтологической модели;

3. Метод ассимиляции данных в задачах прогнозирования состояния природно-хозяйственных объектов и контроля качества данных;

Научная новизна

1. Разработана онтологическая модель информационных ресурсов систем природопользования, обеспечивающая взаимодействие разных групп пользователей (экспертов, ученых и ЛПР) на основе присвоенных им ролей.

2. Разработан метод интеграции информационных ресурсов в единое информационное пространство, отличающийся объективным анализом интегрируемых данных, модульной структурой моделей природно-хозяйственных объектов.

3. Разработан метод ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов, включающий обработку и контроль «сырых» данных для обеспечения работы в реальном времени и динамическую корректировку поведения моделей природно-хозяйственных объектов на основе контроля отклонений параметров системы.

4. Разработано персональное рабочее пространство пользователя системы, позволяющее анализировать накопленную информацию в базе знаний и повысить оперативность принятия решений.

Обоснованность И достоверность основных выводов и результатов обеспечивается за счет анализа состояния исследований в данной области, подтверждается результатами экспериментов с моделями ПХО и при решении прикладных практических задач, а также апробацией основных теоретических положений диссертации в печатных трудах и докладах на научных конференциях.

Практическая ценность работы.

Разработанная модель информационной системы природопользования позволяет портировать накопленный опыт построения информационных систем в современную среду интеграции.

Разработанный метод интеграции информационных ресурсов автоматизирует рутинные процессы предварительной подготовки данных и повышает качество научных исследований, освобождая исследователя от знания информационных технологий. Применение метода динамического выбора схемы ассимиляции данных в модели повышает достоверность прогноза.

Разработанное программное обеспечение (информационная поддержка) и единый интерфейс подсистем моделирования позволяет в автоматизированном режиме конфигурировать модель прогноза на основе модульного принципа моделей принимать более качественные решения по выходу из проблемных ситуаций и их предотвращению на основании сравнения последствий разных вариантов принимаемых решений. Результаты исследований могут быть использованы и в других предметных областях.

Реализация результатов работы

Основные результаты диссертационной работы внедрены в виде информационного, алгоритмического и программного обеспечения системы поддержки принятия решений «Информационно-аналитическая система «Охрана окружающей среды Ленинградской области» и «Система мониторинга и прогнозирования распространения лесных пожаров» в Комитете по экологии и природным ресурсам Правительства JIO, в ГМЦ Финляндии, в учебном процессе в СПбГУ и поддержана грантами: HYMNE - 2001-2002, Contract ICA-CT-2000-10034. Исследование влияния антропогенной нагрузки Санкт-Петербурга на состояние экосистемы Финского залива; INTAS/735 "The importance of sediments for the water quality of the gulf of Finland; INCO/516732, NISMIST. Management of environmental risk from landfills in seismic active regions in the New Independent States (NIS) of Central Asia, 2005-2008; Toxic wastes management /SIDA,2005-2006; An integrated monitoring and modelling system for wildland fires - IS4FIRES, FMI, 2007-2008.

Апробация результатов работы

Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях: Klaipeda Baltic Sea conference, June 2004. Конгресс ВестТейк-2007, Москва.

Международная конференция «Информационные технологии как основа управления в сфере природопользования и охраны окружающей среды». - СПб, 2007. XI Санкт-Петербургская международная конференция «Региональная информатика-2008», 22-24 октября 2008 г, Санкт-Петербург.

Публикации

Основные положения и результаты исследования по теме диссертации опубликованы и непосредственно отражены в 9 работах, в том числе в 5 статьях, из них 4 - в изданиях, входящих в список ВАК, 4 - в материалах и трудах конференций.

Структура и объем работы

Диссертация объемом 125 машинописных страниц содержит введение, 4 главы, заключение, список литературы (105 наименований), 4 таблицы, 14 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении приводится общая характеристика работы - обосновывается актуальность, формулируются цель и задачи исследования, перечисляются методы исследования, приводятся результаты, выносимые на защиту, отмечается их новизна и практическая значимость.

В первой главе проведен анализ существующих подходов к интеграции данных, проблем интеграции и использования информационных ресурсов в информационно-вычислительных системах и системах поддержки принятия решений в управлении природно-хозяйственными объектами в целях прогнозирования их поведения в нештатных ситуациях с применением моделей. Далее в главе формулируются требования, предъявляемые к единому информационному пространству систем природопользования.

В настоящее время основным подходом к построению ЕИП и обработке гигантских объемов данных, порождаемых научными инструментами и компьютерным моделированием, является создание сетей научных центров данных, обеспечивающих как доступ к данным, так и к приложениям, которые анализируют эти данные. Ведется много параллельных и конкурирующих работ по созданию таких инструментальных средств -по меньшей мере, по одной для каждой дисциплины (предметной области), - но ни один стандарт или инструмент не стал предпочтительнее других. Обмен данными между научными центрами не предусмотрен, что крайне необходимо при проведении междисциплинарных исследований.

Данные, генерируемые научными инструментам и моделями, хранятся в научных центрах в основном в форме числовых массивов. Для представления таких массивов и связей между ниш реализованы простые и удобные модели данных. Примерами таких моделей (стандартов) являются HDF, NetCDF и FITS. Каждый из них включает библиотеку, которая инкапсулирует файлы и обеспечивает плаформенно-независимый способ чтения подмассивов, а также создание и обновление файлов, и средства анализа и визуализации соответствующих высокоуровневых форматов файлов, но они обеспечивают лишь минимальные инструментальные средства для поиска и анализа данных.

Анализ данных в современных прикладных задачах на основе имеющихся в языках программирования средств (Fortran/C/Java/Python) в режиме "файл за файлом" при возрастании объемов данных занимает все большее время несмотря на повышение быстродействия вычислительных средств. Для ускорения анализа применяются средства параллельного программирования, однако эффективность их использования невелика. Выходом из такого положения и основным условием'совместного использования данных в разных научных дисциплинах и различных средствах анализа и визуализации становится наличие хороших метаданных и замена иерархии файлов базой данных, что обеспечивает непроцедурный и параллельный поиск данных, а также инструментальные средства для автоматического проектирования структур данных и управления ими.

Интеграция баз данных с языками программирования дает возможность применения объектно-ориентированных баз данных. Объектная модель с возможностями связывания и встраивания хорошо подходит для интеграции систем баз данных и

файловых систем - файлы рассматриваются как связанные объекты. Следующим этапом интеграции данных является Semantic Web, обеспечивающий совместимость приложений на семантическом уровне и независимость данных и приложений. Особенностью таких систем является функция поиска, а не обработки больших массивов данных. Предложенный подход отличается совмещением этих двух функций и учитывает особенность ИС природопользования - ассимиляцию данных в подсистемы моделирования для корректировки поведения моделей ПХО. Интеграция файловых систем, баз данных, языков программирования и моделей в единое информационное пространство позволяет создать управляемую метаданными систему анализа и управления потоками работ.

Таким образом, учитывая современные требования к методам обработки и управления данными, при разработке единого информационного пространства ИС природопользования необходимо учесть:

- использование существующих стандартов представления данных;

преемственность существующих программ (представления, динамически транслирующие данные в соответствующие форматы);

- конвергенцию файловых систем и баз данных;

- комбинирование с другими данными (сопоставимость данных из различных источников);

- использование разработанных (существующих) предметных онтологий и формирование онтологии общего назначения;

- приближение кода к данным для сокращения объема пересылаемых данных;

- организацию эффективной обработки в виде потоков работ,

- средства динамического отображения результатов моделирования и анализа;

- параллельную обработку данных;

- ассимиляцию данных в модели;

- создание персонального рабочего пространства.

Во второй главе предложена модель информационной системы природопользования и метод интеграции информационных ресурсов.

Модель рассматриваемой системы природопользования можно представить в виде:

Mn=(F,T,U,I,R), (1)

где F = {/„ | а=1,А } — множество функций системы;

Т = {tj I j =1 ,J } — множество задач обработки информации; U = | к =1, К } — множество пользователей; 1 = 1" YI"" — множество данных ЕИП;

/" = {if хе X"} — множество данных, необходимых для обеспечения информационных потребностей системы;

]"" = {i"'" | хе А"""} — множество данных, являющихся результатом взаимодействия пользователей и функций системы; R = {r,\I =\,L } — множество отношений между компонентами F, Т, U, /.

На основе (1) модель ИС природопользования включает:

- классификацию информационных ресурсов, выделение значимых объектов и определение отношений;

разработку общей информационной и функциональной моделей ■ ИС природопользования;

- разработку онтологической модели информационных ресурсов;

- формирование набора сервисов, реализующих функциональность системы;

- разработку методов ассимиляции данных моделями ПХО.

Структура ИС природопользования приведена на рис. 1. Подсистема управления данными включает:

1) средства описания информационных объектов и связей между ними с возможностью расширения описания по мере увеличения знаний об этих объектах с адекватным отображением в структуре БД;

2) средства обработки информации;

3) технологию миграции информации из информационных систем предыдущего поколения;

4) средства поддержки распределенных вычислений;

5) библиотеку приложений.

Рис.1. Структура ИС природопользования.

Подсистема формирования прогноза включает:

1) подсистему визуализации:

- средства динамической визуализации и анализа, сопоставление результатов прогноза по различным сценариям;

- средства выбора варианта решения.

2) подсистемы моделирования природно-хозяйственных объектов:

- модели объектов управления,

- средства динамической корректировки поведения моделей и контроля качества данных наблюдений, выбор метода ассимиляции;

- средства формирования архитектуры моделей (выбор варианта решения, формирование и выбор сценариев, сценарии решений, конфигурация моделей).

Функциональная модель и основные компоненты представлены на рис.2. Преобразования ^ ставят в соответствие множеству моделей данных на входе множество моделей данных ИС природопользования на множестве R. К ним относятся интерполяция, трансформация, фильтрация, масштабирование, преобразование проекций, сжатие, статистический анализ и другие.

На основе модели (1) разработана онтология информационных ресурсов: О = {С., A RC. Т. Д RA. F', где

С - {ci. ..., с„] - множество классов, описывающих понятия предметной области; А - (а;, ..., а„,} - множество атрибутов, описывающих свойства понятий и отношений: Rc = {rc|rc с Сх С} - множество отношений, заданных на классах; Г- множество стандартных типов значений атрибутов (string, integer, real, date)', D - множество доменов (множеств значений стандартного типа string)-,

FLA - RATV RAD, где RJT qAxT отношение, связывшшее атрибуты и жш данных, ИЗ которых они могу*! принимать свой значения.

Rjn £ /1 х О отношенопределяющеедля каждого атрибута его днекретое множество значений (домен);

F множество ограничений на значения атрибутов понятий я отношений

В разработанной онтологии классами являются «Модели ПХО», «Пользователи», «Инструменты», «Наборы даяных». «Типы данных». «Сервисы». Определены отношения совместимости (чежду Моделями и Результатами моделирования - что Оценивает модель), ассоциативности (междя Оригиналами и преобразованными наборами), фу нкциовальн уе ограничения.

Разработанная онтология ИР включает небольшое универсальное ядро (базис) я расширение со спецификой научных наборов данных (по предметным областям). В качестве базиса онтологии выбрано Дублинское ядро (Dublin Core), принятое в качестве стандарта для Госучреждений, и удовлетворяющее стандартам ISO 15836-2003, NISO Z39.K5-2007. Онтология разработана с расширениями для научных наборов данных (среда (вода, атмосфера, лес), оборудованиеттрибор. масштаб, разрешение, набор измеряемых параметров, единицы измерения, проекции, ...)

OWL-реализация разработанной онтологии обеспечивает .доступ к данным по интернет технологиям и предоставление данных структурам управления верхних уровней, и расширение включением разработанных онтологий время'дата/интервал, единицы физических величин и другие (рис.3).

<!DOCTYPE rdf: RDF PUBLIC "-//D'JBLIN COP.E//DCMES DTD 2001/07/31//EM"

"h ttp: //cub' in core. uiq/dGCUrfen-.7/2032/ С/ЗХ/ссп'.о.ч-хгЦ/с)';^",-/.::'! -d-d . о ',<:!"> <rdf :№F M!nln5:idf=http: //wwk,w3.org/1999/02/22-rdf-syriпая-n?* ?iml ns:dc / /purl.org/dc/elements/1,1/

Hmlns:dee &httpi//localhost/dee/elemends//> < rdf: Rescript ion rdf: about=,Thti:pi / /localhost/dee/r^sorces/ri> «"dc.-, titled Dublin Core Metadata F,?.t<?TiSi<jns</dc:title> <do¡descriptions-Extensions concerning scientific datasets (SDS} </dc:description>

<dcicreator>V. Petulthov</dc:creator> <de:publisher>SRCEE, 5Pb</de:publj?her> <dc:dat=>20f)9-0]-l 6</dr:dsre> <dc : forrnat>SJ?Sir/ dc : formats

Рис.3. Декларация пространства имен онтологии.

Классификация данных ИС природопользования:

- по природной среде (вода, воздух, лес),

- по источнику (поставщик, оборудование, точность),

- по уровню обработки (сырые, 1,2),

- по продукту (кто предоставляет),

- по предоставляемым сервисам,

- по наборам данных (что содержит каждый набор: параметры, период),

- по условиям предоставления данных,

- как данные разных источников соотносятся между собой,

- в каком формате и на каких условиях доступны.

По онтологии строятся:

- схема базы данных (логическая структура БД и ее ограничения целостности);

- формы для заполнения БД данными (информационными объектами, являющимися экземплярами понятий онтологии);

- схема навигации по информационному пространству (по отношениям онтологии),

- формы поисковых запросов,

- \\^еЬ-интерфейс.

Особенность формирования метаданных заключается в создании в среде СУБД средств связывания типов данных с потокам! работ. Концептуальная модель и схема базы данных приведена на рис.4. Для зарегистрированных классов новые экземпляры наборов данных регистрируются автоматически и управляются соответствующим потоком работ. Схемы потоков работ описывают последовательность программ обработки и их зависимости. Описание потоков реализовано в виде скриптов.

Корректировка метаданных, сценариев, свойств объектов осуществляется через диалоговые окна (ШеЬ-интерфейс).

Обмен данными с научными центрами (НОР, КеСОР) организован посредством предоставляемых ими сервисов, если организация входит в сообщество и имеет доступ к данным, ми получением «сырых» данных с последующей обработкой. Опыт показывает, что обработанные в центрах данные также нуждаются в дополнительной проверке. Для работы в реальном времени первичная обработка «сырых» данных осуществляется локально в целях экономии времени.

Рис.4.Концешуальная модель информационных ресурсов.

и

Предложенная модель ЕИП ИС природопользования базируется на:

- методолога» открытых систем (открытость спецификаций, масштабируемость, интероперабелыюсть, многоплатформность, мобильность)

- максимальном использовании проверенных свободно распространяемых программных продуктов (Open Source): операционных систем (linux), универсальных моделей данных, включая средства описания и преобразования; средств интеграции программного обеспечения (WINE, VME, ...); пакетов динамической визуализации и научного анализа; систем управления базами данных (MySQL); моделей с открытым кодом (SWAN, МОМЗ, EMBYR, ММ5, HIRLAM); средств поддержки параллельной обработки (MPI); среды разработки (Eclipse, NetBeans); генератор отчетов (FastReports);

- сохранении используемых информационных технологий (рекомендация UNESCO 2003);

- стандартах на имена элементов данных, имена файлов (привязка ко времени и географическому положению);

- модульной структуре моделей.

Важным свойством разработанной информационной модели является формирование персонального рабочего пространства, которое позволяет организовать, исследовать и использовать все имеющиеся данные и модели. Персональное рабочее пространство настраивается пользователем в соответствии с областью исследований (Area of interest). Запросы к данным, сформулированные в концептуальной среде онтологии предметной области преобразуются в запросы к серверу метаданных. В соответствии с этим формируется спектр необходимых наборов данных в соответствии с правилами организации данных в предметных центрах обработки данных или локальном архиве.

В третьей главе рассмотрен метод ассимиляции данных в модели природно-хозяйственных объектов, заключающийся в совместном применении ЕИП и моделей физических процессов.

Достоверность результатов моделирования и качества принимаемых решений определяется не только адекватностью модели объекту управления, но и качеством используемых данных. Поэтому данные, загружаемые в ЕИП из научных центров и непосредственно из источников в большинстве случаев требуют тщательной проверки перед их использованием в моделях. Проверка выполняется на предельные значения параметров, на пределы отклонен™ от средне статистических, ограничения по смыслу, проверка дублирования, ошибки формата, нарушений структуры данных (в том числе пустой файл), осуществляется отбраковка данных при контроле береговой линии и глубин.

В зависимости от типа источника данных применяются различные методы контроля качества данных. Например, для проверю! данных, снимаемых с буев, необходимо контролировать непрерывность во времени, формат и диапазон допустимых значений.

Соленость: 0 < SInMcp <Smax

Температура: Т„й„ < TImœp <T„m

Уровень, ветер и т.д.

Алгоритмы контроля качества данных регулярно модифицируются и дополняются в ядро ЕИП при включении новых источников данных.

Следующим этапом анализа данных является ассимиляции данных моделями в целях оценки точности и корректировки прогнозных расчетов. Под ассимиляцией, понимается техника объединения данных измерений/наблюдений с моделями, описывающими эволюцию системы.

Система ассимиляции данных в модель включает три компонента: набор наблюдений, динамическую модель, схему ассимиляции. Данные измерений, как правило, содержат ошибки. Модели также являются неточными и неполными, что приводит к ошибкам прогнозирования. Ассимиляция корректирует состояние модели на основе

данных наблюдений и обеспечивает наиболее вероятное состояние системы с учетом неопределенности в измерениях и прогнозных расчетах.

Восстановление полей данных температуры и солености гидродинамичеких моделей: основана на уравнениях движения вязкой несжимаемой жидкости в сферических координатах в приближениях Буссинеска и гидростатики [2]:

ди ё ё 8 ( „ , , ,.. , 8 . ди

\pdz + lv + ^-km^~+AM, (3)

8t rsin£ дЛ porsin0dAJ 8z ™ 8z

Wjp.= f\y,p,W,S)\. (5)

сР

Уравнение гидростатики: — = -pg , (6)

dz

Уравнение состояния в форме UNESCO: p = f(T,S,P). (7)

На базе результатов интегрирования (3-7) рассчитываются изменения координат частиц нефтеразлива на основе уравнений движения в форме Лагранжа:

{Ax,Yt = v;&tJ + (4,)i. (8)

(i =1,3 ; j = 1,2,.„М; kf= 1,2,...Л; f = 1,2,...,8) где (A*, )Jt - проекция приращения траектории kf частицы на j-шаге на х, -ось, -проекция вектора скорости течения на х,-ось; Д/у - шаг по времени; j - номер шага по времени; N, - число шагов по времени; Nf- число частиц )[ - случайное изменение координат Xj на j-шаге времени.

При восстановлении данных в задаче прогнозирования распространения пожара используются уравнения переноса тепла и влаги:

= (9)

+ = (10)

Эь СР

где М-скорость конденсации парообразной влаги, т.е. масса влаги, конденсирующаяся за единицу времени в единице массы почвенного воздуха, Ктп, Kqn - коэффициенты молекулярного переноса тепла и влаги. Величина М в условиях насыщения является функцией температуры и определяется с помощью (10) следующим образом: R + Ha +ST* =Нп,Еа =ЕП (11)

где R - поток коротковолновой и длинноволновой радиации, направленный вниз, Нп и Еп - потоки тепла и влаги в почву, ST* - длинноволновое излучение поверхности почвы. Аппроксимируя уравнения (9-11) конечным разностями получаем систему нелинейных алгебраических уравнений.

Качество восстановления данных и точности прогноза на основе (3-7) оцениваются по следующей методике. Обозначив прогностическое значение в момент tt w{ (вектор состояния, содержащий все параметры модели в каждом узле сетки) и предположив, что

отличается от истинного состояния и-) вследствие наличия смещения и модели gl. и случайной ошибки прогноза е^. имеющей норма.'! ыию распределение, получим

Все наблюдения (температуры, солености, уровня, горизонтальные векторы скорости ветра} объединены в вектор наблюдений и'° длиной р1 в момент . Тогда ошибка наблюдений е° - разность наблюденного и истинною состояния системы интерполированною к гонке наблюдения = иг° - И^(12) Где - включает ЙШЙбку измерений, ошибку репрезентативности и ошибке неадекватности модели. А,- иитсргюляшюпный полином результата анализа в результат

5/| |

наблюдения (по географическое положению и времени), // = 1 ! , .

Эн- ' •

Коэффициенты полинома определяются методом наименьших квадратов. В качестве примера восстановления пространственно-временного распределения метеорологических полей температуры и солености по данным наблюдений приведем

вводимые в правую часть уравнении поправочные члены:

********

где а - коэффициент релаксации (1'30 суток иди 1/60), 8ши осреднепнос измеренное значение для станций одной ячейки на равномерной сетке: дискретность по времени - I месяц, период: с 1948 года но настоящее время.

Результаты верификации модели с использованием Ассимиляции приведены на рис.5.6.

3 Ц З.И. 7.' >. 71 ГД II аз :и ПС

Рис.5. КоЕ1троль отклонений модели по ассимилированным данным (кислород). Ошибка не превышает 3%

} М11 Ь 111

Нитряты, исг-ЛТН'Л

. У

ПРЕМИИ

Рис.б. Верификация модели: сравнение ос ре дневных значений с данными измерений.

Рассмотренный метод ассимиляции данных применяется для подсистем моделирования с открытым кодом и модульной структурой моделей ПХО. Для информационных систем, не допускающих внесение изменений I! алгоритм их

функционирования, ассимиляция осуществляется формированием принятой в подсистеме моделирования структуры данных: оценка влияния пожаров на качество воздуха SILAM (FMI).

В четвертой главе описана практическая реализация предложенной методики формирования ЕИП в автоматизированных системах управления природно-хозяйственными объектами:

- информационно-аналитической системе «Охрана окружающей среды Ленинградской области» (интеграция информационных ресурсов Правительства Ленинградской области)

- мониторинг и моделирование распространения лесных пожаров на территории Ленинградской области (отдел мониторинга Комитета по экологии и природным ресурсам)

- ассимиляция данных по пожарам в модель HIRLAM FMI.

Использование разработанной модели единого информационного пространства, онтологической модели, метода интегрирования информационных ресурсов позволило решить научные и прикладные задачи:

1. Влияние изменений придонного слоя на состояние экосистемы Балтийское море -Финский залив (дноуглубительные работы, добыча марганцевых конкреций и др.)

2. Формирование системы оперативного мониторинга и прогнозирования развития ситуации с использованием спутниковых данных и данных, полученных средствами наземного наблюдения

3. Экспресс-прогноз развития неблагоприятных ситуаций с использованием моделирования (перенос примесей, дрейф нефтяного пятна, распространения лесного пожара)

4. Оперативная оценка риска и ущерба от полигонов твердых бытовых отходов

5.Исследование средств и методов хранения исходных данных, используемых при моделировании, и результатов моделирования: компактность хранения, скорость доступа.

6. Верификация моделей по натурным данным и сопоставление результатов, полученных по различным методикам решения той же задачи, включая моделирование на разных сетках.

В разработанную модель ЕИП ИС природопользования интегрированы следующие компоненты:

- унифицированные модели данных (NetCDF, HDF4, HDF5);

- библиотеки приложений (контроль данных, модели);

- средства описания интегрируемых в ЕИП источников данных (абстрактных моделей данных);

- средства преобразования форматов данных и манипулирования данными (предварительная обработка, аппликация или склейка фрагментов, вырезка области исследования, утилиты преобразования данных в grid-формат хранения расчетов для продолжения моделирования и отображения в ГИС);

- наборы скриптов автоматизированной загрузки данных и подготовки их к использованию;

- средства поддержки распределенной архитектуры (вычислительный сервер/кластер, параллельные вычисления);

- схемы ассимиляции данных наблюдений в модели,

- системы динамической визуализации наборов данных (GRADS, Ferret),

- средства выбора решения.

При апробации результатов исследований автором были модифицированы и использованы:

- трехмерная гидродинамическая модель для исследования морфологии дна, выбора фарватера в Лужской губе (естественное промывание и минимум изымаемого грунта) и мест депонирования изъятого грунта (минимальный размыв течениями);

- модель миграции нефтяного пятна;

- гидродинамическая и биохимическая модель экосистемы Финского залива;

- модель оценки влияния добычи железно-марганцевых конкреций на состояние экосистемы Финского залива;

- модель распространения лесного пожара.

В качестве примера можно привести оценку влияния пожаров на качество воздуха. Расчеты проводились по методу Ichoku и Kaufman. Учитывалась яркость излучения ТА (Afjm канал MODIS). Оценки были в 2-3 раза завышенными по сравнению с измеренными. Учет в прогнозах второго фактора - FRP (fire radiation power, 1 Xftm канал), корреляцию с ТА FRP=8.3338*10"5 *TA3-6.11707*10'2*TA2fl4.8674*TA-l 150.92 и выбор коэффициента эмиссии повысило точность прогноза в 2-3 раза. Однако, точные результаты были получены по осредненным значениям; расхождения в некоторых точках бьии до 20%, что можно объяснить плохим качеством данных инвентаризации лесного фонда и коротким рядом наблюдений (базы данных по пожарам GFEDv2 и RETRO).

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

На основе выполненных в диссертации исследований получены следующие основные результаты:

1. Проведен анализ и оценка информационных ресурсов и методов их интеграции в ЕИП. Показано, что интеграция файловых систем, баз данных, языков программирования и моделей в единое информационное пространство позволяет создать управляемую метаданным систему анализа и управления потоками работ.

2. Разработана онтологическая модель информационных ресурсов систем природопользования, обеспечивающая взаимодействие разных групп пользователей (экспертов, ученых и ЛПР) на основе присвоенных им ролей. По онтологической модели формируется структура базы знаний, схема навигации по информационному пространству, Web-интерфейс, формы поиска/запроса.

3. Разработан метод интеграции информационных ресурсов в единое информационное пространство, отличающийся объективным анализом интегрируемых данных, позволяющим классифицировать их по качеству и степени доверия.

4. Разработан метод ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов, включающий обработку и контроль «сырых» данных для обеспечения работы в реальном времени и динамическую корректировку поведения моделей природно-хозяйственных объектов на основе оценки отклонений параметров системы и качества данных.

5. Разработано персональное рабочее пространство пользователя системы, позволяющее анализировать накопленную информацию и повысить оперативность принятия решений, и единый интерфейс подсистем моделирования природно-хозяйственных объектов.

6. Разработан и реализован алгоритм настройки ЕИП для решения практических задач, включающий выбор и инсталляцию компонентов системы (средств динамической визуализации, анализа); выбор и адаптацию моделей (изменение структуры для интеграции схемы ассимиляции и средств организации параллельных вычислений, формирование базовых сценариев решений) и инструментарий интеграции информационных ресурсов и моделей.

7. На основе разработанной системы решены следующие прикладные задачи: интеграция информационных ресурсов Правительства Ленинградской области, мониторинг и моделирование распространения лесных пожаров на территории Ленинградской области, влияние лесных пожаров на качество воздуха.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

В рецензируемых журналах из списка ВАК

1. Петухов В.В. Информационная модель системы оперативного управления природно-хозяйственными объектами в чрезвычайных ситуациях. /«Информационно-измерительные и управляющие системы». - №4,2008 г. - с.51-54.

2. Петухов В.В. Ассимиляция данных в единое информационное пространство систем принятия решений по управлению природно-хозяйственными объектами. /«Информационно-измерительные и управляющие системы». -№10, 2008. - с.34-37.

3. Аксенов А.Ю., Александров В.В..Петухов В.В. и др. Программируемые инфокоммуникационные технологии. Под ред. Александрова В.В., Сарычева В.А. - М.: Радиотехника, 2008. - с.29-32. ISBN 978-5-88070-203-9.

4. М. Sofiev, R. Vankevich, М. Lotjonen, М. Prank, V. Petukhov, Т. Ermakova, and J. Kukkonen. An operational system for the assimilation of satellite information on wild-land fires for the needs of air quality modelling and forecasting. /Atmospheric Chemistry and Physics. MS-NR: acp-2008-0629. http://www.atmospheric-chemistry-and-physics.net 9,6483-6513, 2009

В других изданиях

5. Неелов И.А., Петухов В.В., и др. Система проектирования экологических ситуаций в восточной части Финского залива и Невской губы. // В сб. "Критерии экологической безопасности". - СПб.НЦ РАН, СПб., 1994. - с.160-162.

6. Алимов А.Ф., Андреев О.А., Астраханцев Г.П., Бударин В.Ф., Волосатое С.Э., Гришман З.М., Тройская Т.П., Гусева В.Н.,Дудин В.А., Ефремова Л.В., Игнатьева В.Н., Капустина Л.Л., Киселев В.Б., Кондратьев С.А., Коноплев В.Н., Левченко В.Ф., Малько A.M., Меншуткин В.В., Морозова И.А., Неелов И.А., Петрова Н.А., Петухов В.В., Полосков В.Н., Попов ВЛ., Руховец Л.А., Савостьянова Е.Г., Савчук О.П., Семенцов В.И., Скакальский Б.Г., Снеткова О.А., Соколов А.В., Степанов М.М., Умнов А.А., Флоринская Т.М., Чикидовская Н.Д., Шумилов П.Р., Юровская Т.Н. Интегрированное управление водными ресурсами Санкт-Петербурга и Ленинградской области / опыт создания системы поддержки принятия решений. - СПб.: Borey Print, 2001. - с.214-254. ISBN 8-7987-0367-1.

7. V.Donchenko, V.Petukhov, R. Vankevich, etal. Use of GIS and simulation models for research and decision support on environmental management. / NISMIST.Management of environmental risks from landfills in seismically active regions in the New Independent States (NIS) of Central Asia. // Selected publications. An EU-INCO STRT Project, #516732. - Hamburg-Harburg, Germany, 2008. - p.93-100.

8. Донченко B.K., Петухов B.B., Ванкевич P.E., и др. Разработка геоинформационной системы "Полигоны твердых отходов регионов Центральной Азии". // Материалы Конгресса ВестТейк-2007, - М, 2007. - с.56-57.

9. Sofiev, М; Vankevich, R; Lanne, М; Petukhov, V. Numerical modelling and forecasting of impact of wild-land fires on atmospheric composition. // Geophysical Research Abstracts. - Vol.

10. EGU2008-A-11647, 2008 SRef-ID: 1607-7962/gra/EGU2008-A-l 1647 EGU General Assembly 2008.

Оглавление автор диссертации — кандидата технических наук Петухов, Валерий Васильевич

Основные обозначения и сокращения.

Введение.

Положения, выносимые на защиту:.

Глава 1. Анализ информационных ресурсов, методов классификации и интеграции в единое информационное пространство систем природопользования.

1.1. Определение ЕИП и место в иерархии ЕИП России.

1.2. Цели и задачи информационных систем природопользования.

1.3. Классификация информационных ресурсов.

1.4. Методы описания данных (модели данных).

1.5. Интеграция и гармонизация данных.

1.6. Проблемы стандартизации и интероперабельности.

1.7. Проекты интеграции информационных ресурсов.

1.7.1. Особенности интеграции информационных ресурсов в государственных информационных системах.

1.7.2. ЕИП Агентства по охране окружающей среды США (ЕРА).

1.7.3. Проекты создания ЕИП научных центров обработки данных.

1.7.4. GRID-технологии: NextGRID.

Выводы по главе 1.

Глава 2. Методы формирования ЕИП ИС природопользования.

2.1. Формальное описание информационной системы природопользования.

2.2. Онтологическое преобразование данных.

2.3. Модель единого информационного пространства информационных систем природопользования.

2.4. Структура и компоненты подсистемы мониторинга и моделирования информационных систем природопользования.

Выводы по главе 2.

Глава 3. Ассимиляция данных в модели состояния природно-хозяйственных объектов.

3.1. Методы ассимиляции данных.

3.2. Контроль и верификация данных.

3.3. Подсистема визуализации. Универсальный рабочий стол.

Выводы по главе 3.

Глава 4. Особенности реализации проектов.

4.1. Информационно-аналитическая система «Охрана окружающей среды».

4.2. Прогнозирование состояния экосистемы финского залива.

4.3. Проектирование порта в Лужской губе.

4.4. Влияние реседиментации на качество воды.

4.5. Автоматизированная система «Мониторинг лесных пожаров на территории Ленинградской области.

4.6. Оценка влияния пожаров на качество воздуха.

Выводы по главе 4.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Петухов, Валерий Васильевич

Одним из необходимых условий принятия эффективных решений при управлении сложными объектами, является своевременное обеспечение задействованных на разных уровнях управления лиц достоверной, полной и качественной информацией о текущем и прогнозируемом состоянии объекта. Это создает основу для выработки опережающих управленческих решений па базе прогнозных оценок состояния объекта управления.

Основные трудности при решении задач прогнозирования состояния природно-хозяйственных объектов обусловлены их сложностью, недостаточной изученностью протекающих в них процессов, ограниченными возможностями проведения активных экспериментов, сложностью и нескоординированностью процессов сбора исходных данных, их недостаточной доступностью, неадекватностью используемых моделей, а также рядом других причин. Данные, поступающие из различных источников, ка:с правило, разнородны и для прямого использования, сопоставления и анализа, не пригодиы.

В то же время разнообразие задач, для решения которых необходима информация о природных ресурсах и явлениях, разнообразие самих описываемых объектов, процессов и подходов к отображению информации о них не позволяют говорить о множестве информационных ресурсов данной группы как о единой системе.

Развитие концепции единого информационного пространства, научно-методологических основ информатизации, методов поддержки принятия решений в сложных организационно-технических системах, особенности формирования ведомственных и предметных ИС подробно рассмотрены в трудах ученых СПИИРАН (Юсупова P.M., Заболоцкого В.П. Соколова Б.В.), теоретические основы гармонизации, интеграции и слияния данных, анализ и объединение данных для принятия решений (Городецкий В.И., Попович В.В.), онтологический подход к управлению знаниями (Смирнов А.В.). В ходе работы над диссертацией изучены и проанализированы труды отечественных и зарубежных ученых в областях: информатики, теории системного анализа и принятия решений, проектирования информационных технологий и систем (Багриновский К.А., Божко

В.П., Гиляревский Р.С., Глушков В.М., Ю.Г. Данилевский, П. Друкер, Э.В. Евреинов, А.А. Емельянов, В.М. Жеребин, Д. Захман, С. Катлип, В.Н. Квасницкий, В.В. Кульба, А.Г. Мамиконов, Д. Мако, М.Месарович, В.А. Мясников, А.П. Пятибратов, А.Н. Романов, Т. Саати, С.Н.Селетков, И. Такахара, Ю.Ф. Тельнов, В.П. Тихомиров, М. Хаммер, Э.Н. Хотяшев и др.), создания информационных систем управления регионом, городом (Г.И. Марчук, Ф.И. Перегудов, А.А. Стогний, Ю.М. Черкасов, Ю.А. Черенков и др.), классификации и управления информационными ресурсами (Антопольский А.Б., Белов Г.В., Громов Г.Р., Копылов В.А., Ларин М.В., Саков А.А., Семилетов С.И., и др.).

Несмотря на значительное число работ и проектов, посвященных проблеме управления данными и интеграции информационных ресурсов, и значительные усилия центров обработки данных сформировать универсальные системы представления и предоставления данных (SDSS в Fermilab, ВаВаг в SLAC, BIRN в SDSC, Entrez-PubMed-GenBank в NCBI), сохраняется разрыв между многочисленными источниками, архивами данных и моделями, в которых эти данные предполагается использовать, особенно при проведении междисциплинарных исследованияй. Не все модели поддерживают вывод результатов в унифицированных форматах, удобных для использования в геоинформационных системах или системах научной визуализации (GRADS, Ferret, Surfer, AVS, IRIS Explorer, IBM Data Explorer, OpenMV). Крупные научные центры и центры обработки имеют сложившиеся информационные технологии и внутренние стандарты представления данных (например, SILAM/FMI, FIMR, JINR, SMHI, ММБИ, NESDIS) изменять которые сложно или нецелесообразно.

Другой проблемой, является дробление информационного пространства разрозненными информационно-вычислительными системами, что приводит к дублированию данных и потере достоверности.

Разрастание файловых систем до петабайтных архивов с миллиардами файлов, отсутствие единых стандартов представления данных, многообразие источников и форматов данных, необходимость интеграции новых и сложившихся информационных технологий, использование ассимиляции данных в модели для корректировки их поведения обусловливают актуальность сформулированной темы исследования, направленной на повышение эффективности информационного обеспечения систем прогнозирования с использованием моделей: разработка и формирование единого информационного пространства систем природопользования.

Цель работы и задачи исследования. Основной целью диссертационной работы является разработка системной модели, метода интеграции информационных ресурсов и реализация информационных систем природопользования на основе единого информационного пространства при моделировании природно-хозяйственных объектов для предупреждения возможных неблагоприятных ситуаций.

Для достижения поставленной цели поставлены и решены следующие задачи:

1) анализ информационных ресурсов информационных систем природопользования и методов их интеграции в единое информационное пространство;

2) разработка онтологической модели единого информационного пространства систем природопользования и модели единого информационного пространства;

3) разработка метода интеграции данных в единое информационное пространство и ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов;

4) реализация разработанного метода интеграции информационных ресурсов в решении практических задач.

Методы исследования

В работе использовались принципы и методы системного анализа, моделирования природных процессов, интеллектуального анализа данных, построения информационно-вычислительных систем, теории метаданных, онтологического анализа. ,

Научная новизна

1. Разработана онтологическая модель информационных ресурсов систем природопользования, обеспечивающая взаимодействие разных групп пользователей (экспертов, ученых и ЛПР) на основе присвоенных им ролей.

2. Разработан метод интеграции информационных ресурсов в единое информационное пространство, отличающийся объективным анализом интегрируемых данных, модульной структурой моделей природпо-хозяйственных объектов.

3. Разработан метод ассимиляции данных в модели прогнозирования состояния природно-хозяйственных объектов, включающий обработку и контроль «сырых» данных для обеспечения работы в реальном времени и динамическую корректировку поведения моделей природпо-хозяйственных объектов на основе контроля отклонений параметров системы.

4. Разработано персональное рабочее пространство пользователя системы, позволяющее анализировать накопленную в базе знаний информацию и повысить оперативность принятия решений.

Обоснованность и достоверность основных выводов и результатов обеспечивается за счет анализа состояния исследований в данной области, подтверждается результатами экспериментов с моделями ПХО и при решении прикладных практических задач, а также апробацией основных теоретических положений диссертации в печатных трудах и докладах на научных конференциях.

Практическая ценность результатов работы.

Разработанная модель информационной системы природопользования позволяет портировать накопленный опыт построения информационных систем в современную среду интеграции.

Разработанный метод интеграции информационных ресурсов автоматизирует рутинные процессы предварительной подготовки данных и повышает качество научных исследований, освобождая исследователя от знания информационных технологий. Применение метода динамического выбора схемы ассимиляции данных в модели повышает достоверность прогноза.

Разработанное программное обеспечение (информационная поддержка) и единый интерфейс подсистем моделирования позволяет в автоматизированном режиме конфигурировать модель прогноза на основе модульного принципа моделей принимать более качественные решения по выходу из проблемных ситуаций и их предотвращению на основании сравнения последствий разных вариантов принимаемых решений.

Результаты исследований могут быть использованы и в других предметных областях.

Реализация результатов работы.

Основные результаты диссертационной работы внедрены в виде информационного, алгоритмического и программного обеспечения системы поддержки принятия решений «Информационно-аналитическая система «Охрана окружающей среды Ленинградской области» и «Система мониторинга и прогнозирования распространения лесных пожаров» в Комитете по экологии и природным ресурсам Правительства JIO, в ГМЦ Финляндии, в учебном процессе в СПбГУ и поддержана грантами: HYMNE - 2001-2002, Contract ICA-CT-2000-10034. Исследование влияния антропогенной нагрузки Санкт-Петербурга на состояние экосистемы Финского залива; INTAS/735 'The importance of sediments for the water quality of the gulf of Finland; INCO/516732, NISMIST. Management of environmental risk from landfills in seismic active regions in the New Independent States (NIS) of Central Asia, 2005-2008; Toxic wastes management /SIDA,2005-2006; An integrated monitoring and modelling system for wildland fires - IS4FIRES, FMI, 2007-2008.

Апробация результатов работы.

Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях: Klaipeda Baltic Sea conference, June 2004. Конгресс ВестТейк-2007, Москва.

Международная конференция «Информационные технологии как основа управления в сфере природопользования и охраны окружающей среды». - СПб, 2007.

XI Санкт-Петербургская международная конференция «Региональная информатика-2008», 22-24 октября 2008 г, Санкт-Петербург.

Публикации.

Основные положения и результаты исследования по теме диссертации опубликованы и непосредственно отражены в 9 работах, в том числе в 5 статьях, из них 4 - в изданиях, входящих в список ВАК, 4 - в материалах и трудах конференций.

Структура и объем диссертации.

Диссертация объемом 125 машинописных страниц содержит введение, 4 главы, заключение, список литературы (105 наименований), 4 таблицы, 14 рисунков.

Заключение диссертация на тему "Система интеграции информационных ресурсов при моделировании природно-хозяйственных объектов"

7. Основные результаты диссертации внедрены в Комитете по природным ресурсам и охране окружающей среды Правительства Ленобласти и в отделе взаимодействия океана и атмосферы ГУ «Арктический и Антарктический научно! исследовательский институт». I

8. Предложенный метод интеграции информационных ресурсов имеет достаточно универсальный характер и может быть использован для решения различных задач в экологии. Результаты исследований могут быть использованы в УРАН «НаучноI исследовательский Центр экологической безопасности РАН» и других природоохранных организациях, а также в научно-исследовательских центрах, использующих интенсивные вычисления.

I I

I I

Заключение

1. В процессе исследований был проведен анализ и классификация информационных ресурсов информационных систем природопользования, разработана онтологическая модель и модель единого информационного пространства, метод динамической коррекции поведения моделей, управляемый данными измерений и наблюдений, основанный на анализе регулярности, репрезентативности и качестве данных. На основе разработанной информационной модели реализован единый интерфейс подсистем моделирования.

Применено расширенное определение понятия «информационные ресурсы», включающее информацию и инструменты управления информацией (программные продукты различного функционального назначения).

На основе онтологии информационных ресурсов кроме Web-ориентированной задачи поиска и интеграции информации решена задача обработки колоссальных объемов научных данных, необходимых при моделировании природно-хозяйственных объектов, и организация их в базу знаний. Web-интсрфейс формируется по метаданным.

Управление решением прикладной задачи (моделью) включает выбор класса модели, индикатора (параметра, характеризующие состояние ПХО), блок определения превышения порога (для пятна - расстояние до береговой черты, для пожаров - расстояние до ближайших населенных пунктов, биодоступный кислород в воде, содержание серы и взвешенных мелкодисперсных частиц в атмосфере)

2. Предложен подход к постановке и решению задач природопользования в части мониторинга состояния природных объектов, прогноза развития неблагоприятных ситуаций и анализа возможных последствий.

3. Интерес, проявленный к выполненным исследованиям Комитетами Правительства Ленинградской области и ААНИИ, подтверждает актуальность ч темы диссертации. В реализованных проектах были использованы основные положения и результаты: онтологическая модель информационных ресурсов, метод интеграции источников данных, моделей природно-хозяйственных объектов и информационных систем в единое информационное пространство.

122 !

4. Результаты достаточно полно отражены в 9 статьях: 4 из списка ВАК; докладывались и обсуждались на научно-практических конференциях, использованы в действующих проектах.

5. Автор принимал непосредственное участие в действующих проектах, при выполнении которых решались различные прикладное задачи: интеграция информационных ресурсов Правительства Ленинградской области, мониторинг и моделирование распространения лесных пожаров на территории Ленинградской области, влияние лесных пожаров на качество воздуха. i

6. При выборе конкретной реализации проектов учитывались критерии: затраты в течение жизненного цикла ПО, реальное время обработки данных, минимизация используемых наборов данных, компактность хранения и другие.

Библиография Петухов, Валерий Васильевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Александров В.В. Интеллект и компьютер. - СПб, Анатолия, 2004. - 285с.

2. Аоки М. Введение в методы оптимизации. — М: Наука, 1977. —344 с.

3. Анфилатов B.C. и др. Системный анализ в управлении— М., 2002.

4. Ашихмина Т.Я. Экологический мониторинг, 4-е издание. — Академический проект, 2008. —416 с.

5. Воробьёв В. И., Монахова Т. В. Проектирование систем защиты с применением онтологий // Труды СПИИРАН. Вып. 2 — СПб, СПИИРАН, 2004.

6. Городецкий В.И., Карсаев О.В., Самойлов В.В. Обработка информации в системах анализа и понимания сложных ситуаций. // Третья Всероссийскаялнаучно-практическая конференция «Перспективные системы и задачи управления», Домбай, 7-13 апреля 2008.

7. Ю.Гришин A.M. Математические модели лесных пожаров, Томск:ТГУ. 1981. -277 с.

8. Данилов-Данильян В.И., Залиханов М.Ч., Лосев К.С. Экологическая безопасность. Общие принципы и российский аспект. — М., Изд. МНЭПУ, 2001. —243 с

9. Даичул А. О доступности информации. // Информационно-аналитические технологии и ситуационные центры. ГОСУДАРСТВЕННАЯ СЛУЖБА. 2004. -№ 4.-с. 131-138.

10. Дрейпер Н., Смит Г., Прикладной регрессионный анализ. Множественная регрессия, 3-е изд. — М.: «Диалектика», 2007. —912 с

11. Дюк В.А., Самойленко A. "Data Mining". Учебный курс. СПб.: Питер. 2001. -366 с.

12. Жигалов В. А., Загорулько ТО. А., Нариньяни А. С., Россева О. И. Предел однородности поиска в Интернете // Системная информатика. Сб. науч. тр. Новосибирск: Наука, 2002. —вып.8.: Теория и методология программирования. — 251с.

13. Заболотский В.П., Оводенко А.А., Степанов А.Г. Математические модели в управлении. Учебное пособие.// СПб ГУАП, СПб 2001. -196с.

14. Захаров М.Ю.,.Лупян Е.А, Назиров P.P. Создание информационного центра для поддержки пользователей спутниковых данных. // Исслед. Земли из космоса. 1994. №4.-с 88-91.

15. Захаров М.Ю., Лупян Е.А., Назиров P.P. Организация системы оперативного доступа удаленных пользователей к спутниковым данным. // Исслед. Земли изкосмоса. 1996. № 5. -с.67-72.

16. Иванищев В.В., Михайлов В.В. Автоматизация моделирования экологических систем. СПб.: СПбГТУ, 2000, -170с.

17. Иванов В.П. Метод сравнения и анализа систем. // «Инновации в науке и образовании -2008». VI юбилейная международная конференция. 4.2. -с.259-261. Калининград, 2008. 305 с.

18. Игнатьева А.В., Максимцов М.М. Исследование систем управления. — М., 2002. — 137с.

19. История развития информатики и кибернетики в Санкт-Петербурге (Ленинграде). Выпуск 1 / Отв.редактор член-корр. РАН Р.М.Юсупов. -СПб.:Наука, 2008. 540 с.

20. Информационные ресурсы России. Национальный доклад. М,. 1999.

21. Информационные технологии и интеллектуальные методы // Сборник научных трудов аспирантов / Рос. акад. наук, С.-Петерб. ин-т информатики и автоматизации ; Отв. ред. Р. М. Юсупов. СПб.: СПИИРАН, 1996.

22. Калыгип В.Г. Экологическая безопасность в техносфере. Термины и определения. — Химия, Колосс, 2008. —1-68 с.

23. Карповский Е.Я., Чижов С.А. Оценка показателей качества программных средств с использованием лингвистических переменных. / Управляющие системы и машины, N 2, 1987, — с 17-19.

24. Когаловский М.Р Перспективные технологии информационных систем. М.: ДМК Пресс, 2003. - 288 с.

25. Когаловский М.Р. Абстракции и модели в системах баз данных // Журнал "СУБД", Издательский дом "Открытые системы", 4-5/1998.

26. Когаловский М.Р Перспективные технологии информационных систем. М.: ДМК Пресс, 2003.- 288 с.

27. Константинов В.М., Челидзе Ю.Б. Экологические основы природопользования. — Академия, 2006. —208 с.

28. Королев М. А., Интегрированные системы обработки данных, М., 1980.

29. Кудашев Е.Б., Арманд Н.А., Кравцов Ю.А., Мясников В.П., Раев М.Д., Саворский В.П., Смирнов М.Т., Тищенко Ю.Г. Интегрирование информационных ресурсов исследований Земли из космоса. Труды Всероссийской конференции ТЕЛЕМАТИКА 99. -с. 98-99.

30. Кузнецов С. Д. Базы данных: модели и языки. Москва: Бином, 2008.

31. Лаишевская Р. Постижение смысла единого информационного пространства через дефиниции информация, информац ионная среда, информационное пространство. // Вестник Казанского государственного университета культуры и искусств. 2005. с.198-202.

32. Месарович М., Такахара Я. Общая теория систем. М: Мир, 1978.

33. Методы и средства информационной технологии в науке и производстве // Сб. ст. РАН, Санкт-Петербург, ин-т информатики и автоматизации; Отв. ред. Р. М. Юсупов. СПб.: Наука: Санкт-Петербург, 1992.

34. Моисеев Н.Н. и др. Методы оптимизации. М: Наука, 1978. - 351с.

35. Моисеев Н.Н. Математические задачи системного анализа. М: Наука, 1981, -488 с.

36. Мухин В.И. Исследование систем управления. — М., 2002.

37. Мыльпик В.В., Волочиенко В.А., Титаренко Б.П. Системы управления. — М., 2002. —151 с.

38. Наумов В.Б. Право и Интернет: очерки теории и практики. М.: Книжный дом "Университет", 2002. - 432 с.ISBN 5-8013-0155-0

39. Никифоров В.В., Шкиртиль В.И. Оценка времени отклика задач в системах реального времени с многоядерными процессорами. // Изв. ВУЗов. Приборостроение №12,2008. -с.40-45.

40. Новосельцев В.И. Теоретические основы системного анализа. —М.: Майор, 2006. — 592 с.

41. Охтилев М.Ю., Соколов Б.В., Р.М.Юсупов P.M. Интеллектуальные технологиимониторинга и управления структурной динамикой сложных технических объектов. М.:Наука, 2006. - 410 с.

42. Полонников Р.И. Основные концепции общей теории информации. СПб.: Наука, 2006. -204 с.

43. Пфанцагль И. Теория измерений. М: Мир, 1976. -166 с.

44. Рекомендации по качеству воздуха в Европе. Весь мир, 2004. — 312 с. ISBN 57777-0315-1

45. Симанков В. С., Луценко Е. В., Лаптев В. Н. Системный анализ в адаптивном управлении: Монография (научное издание). /Под науч. ред. В. С. Симанкова. -Краснодар: ИСТЭК КубГТУ, 2001. — 251с.

46. Смирнов А.В., Левашева Т.В., Шилов Н.Г., Кашевник A.M., Поддержка принятия решений в децентрализованной среде на основе сети Web-сервисов. // Таврический Вестник информатики и математики. Симферополь: КНЦ НАНУ, 2008 №2.-с. 186-194.

47. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Т.В. Левашова' Онтологии всистемах искусственного интеллекта: способы построения и организации (часть 1) // "Новости искусственного интеллекта" № 1 (49), 2002.

48. Smirnov A., Levashova Т., Shilov N. Ontology-driven Knoweledge sharing for ,

49. Network organization configuration // Enterprize Information System/ Eds by Manolopoulos J., Plipe P. Springer, 2008. pp.179-193.

50. Снакин B.B. Экология и природопользование в России. Энцеклопедический словарь. — Academia, 2008. —816 с.

51. Соколов Б.В., Юсупов P.M. Концептуальные основы оценивания и анализакачества моделей и полимодельных комплексов. // Изв:РАН. Теория и системы»управления, 2004. №6. — с.5-16.

52. Столяр С. Е., Владыкин А. А. Информатика представление данных и алгоритмы. Москва: Бином, 2007.1

53. Тимченко Т.Н. Системный анализ в управлении. —• М.!, 2007

54. Устойчивые статистические методы оценки данных. // Сборник. — М:I

55. Машиностроение, 1984, —232 с.

56. Юркевич Е.В. Введение в теорию информационных систем. — ИД Технологии, 2007. — 272с.

57. Юсупов P.M. Наука и национальная безопасность. СПб.:Наука, 2006. — 290 с.

58. Юсупов P.M., Заболотский В.П. Научно-методологические основы информатизации. СПб.: Наука, 2000. - 455с.

59. Baretta, J.W., Ebenhoh, W. and Ruardij, P., 1995. The European Regional Seas Ecosystem Model, a complex marine ecosystem model. Nether land Journal of Sea Research, 33, 233-246.

60. Daley, R. Atmospheric Data Analysis, Cambridge Atmospheric and Space Science series. Cambridge University Press, 1991. -457 pp.

61. Jarke M., Jelassi M.T., Stohr E.A. A data-driven user interface generator for generalized multiple criteria decision support system. "IEEE Workshop Lang. Autom., New Orleans, 1-3 Nov., 1984. " Silver Spring, 1984. -p.127-133

62. IOC, 2002. GOOS Data and information Management. Paris, 2002.

63. IOC, 2000. Meeting of the Ad Hoc Working Group on Oceanographic Data Exchange Policy, UNESCO Headquarters. -Paris, France, 15-17 May, 2000. Paris, UNESCO, 53 pp. (IOC/INF-1144)

64. IOC, 2003. GOOS Report #125. Объединенный стратегический план прибрежного модуля глобальной системы наблюдения за океаном. UNESCO IOC/INF-1183

65. Kudashev Е. В., Armand N.A., Kravtsov Yu.A., Myasnikov V.P. and Wyn Cudlip. Improving access to Russian Satellite Data. Proceedings of EOGEO 2000. Earth Observation (EO) & Geo-Spatial (GEO) Web and Internet Workshop. April 17-19, 2000, London, UK.

66. Lawson, L., Hofmann, E. and Spitz, Y., 1996. Time series sampling and data assimilation in a simple marine ecosystem model. Deep-Sea Research, 43, 625-621.

67. Levitus S., Climatological Atlas of the world ocean, NOAA Publ. 13,.U.S. Dep.Of Comm.,Washington, D.C.,1982. -173. pp

68. Rizki M.M., Rozenblit J.W. An experimental frame specification module. "Simul. and Model-Based Metodol.: Ottawa, July 26 - Aug.6,1982". Berlin e.a., 1984. -p.598-600.

69. Robinson, A. R. and Lermusiaux, P.F. Data assimilation for modeling and predicting coupled physical-biological interactions in the sea, Vol. 12. 2003. -p.37-42.

70. Strategy and Plan. Paris, UNESCO (IOC/INF-1168), 2004.

71. Transforming Remote Sensing Data into Information and Applications. Washington, D.C., National Academy Press, NRC, 2001. -75 pp.1. Интернет-ресурсы

72. Агошков В.И., Ботвиновский E.A., Гусев А.В Лебедев С.А., Пармузин Е.И., Шутяев В.П. Информационно-вычислительная система вариационной ассимиляции измерений данных ИВС-Т2. М, 2008. http://d33.infospace.rU/d33conf/2008confpdf/A/Agowkov.pdf

73. Анализ информационных ресурсов http://www.gotai.net/documents/doc-art-007-Q3.aspx

74. Веревченко А.П. О доступности информационных ресурсов http://www.it2b.ru

75. Гаврилова Т., www.big.spb.ru

76. ГОСТ 34.321-96 Информационные технологии. Система стандартов по базам данных. Эталонная модель управления данными.

77. ГОСТ Р ИСО/МЭК 7498-1-99 Информационная технология. Взаимосвязь открытых систем. Базовая эталонная модель. Часть 1. Базовая модель.

78. ГОСТ Р ИСО/МЭК 7498-4-99 Информационная технология. Взаимосвязь открытых систем. Базовая эталонная модель. Часть 4. Основы административного управления.

79. ГОСТ Р ИСО/МЭК 10165-1-2001 Информационная технология. Взаимосвязь открытых систем. Структура информации административного управления. Часть 1. Модель информации административного управления.

80. ГОСТ Р ИСО/МЭК 10165-7-2003 Информационная технология. Взаимосвязь открытых систем. Структура информации административного управления. Часть 7. Общая модель взаимосвязи.

81. ГОСТ Р ИСО/МЭК 10746-2-2000 Информационная технология. Взаимосвязь открытых систем. Управление данными и открытая распределенная обработка. Часть 2. Базовая модель.

82. ГОСТ Р ИСО/МЭК 10746-3-2001 Информационная технология. Взаимосвязь открытых систем. Управление данными и открытая распределенная обработка. Часть 3. Архитектура.

83. ГОСТ Р ИСО/МЭК МФС 10607-6-94 Информационная технология. Функциональный стандарт профилей AFTnn. Передача файлов, доступ к файлам и управление файлами. Часть 6. AFT3 услуги административного управления файлами.

84. Единый государственный фонд данных http://cliware.meteo.ru/egfdcatalogexp/ http://meteo.ru/data/

85. Информационные ресурсы России. Национальный доклад.М,. 1999. http://www.gsnti.ru/infres/

86. Каталог Единого государственного фонда данных о состоянии окружающей среды, ее загрязнении http://cliware.meteo.ru/egfdcatalogexp/search.html

87. Консолидация серверов и создание центров обработки данных https://msdb.ru/Downloads/docs/events/materials/270203/16.ppt

88. Концепция создание ЕИС РАИ. Вторая редакция http://www.ras.ru/scientificactivity/eis/eisconception.aspx

89. Концепция управления государственными информационными ресурсами http://portal.iac.spb.rU/mvccontroller/4.1 .l?iddocument=9

90. Концепция формирования и развития ЕИП России и соответствующих государственных информационных ресурсов, 1995. http://www-sbras.nsc.ru/win/laws/russkon.htm

91. К поиску технологий управления устойчивым развитием России http://emsu.ru/um/view.asp?c=392&p=l

92. Лопатенко А.Н. Guide to Metadata for Science and Research http://derpi.tuwien.ac.at/~andrei/MetadataScience.htm

93. Макаров В.П. Информационное общество, 2005, вып. 2, с. 65-68. http://emag.iis.ru/arc/infosoc/emag.nsf/BP A/f4e8b5f56abf2cadc32571d5002c9555

94. Обнинск, центр обработки данных http://www.obninskcity.ru/info/education/courses/?idcatalog=936 http://www.meteo.ru

95. Полный список программ, которые признаны отвечающими Техническим требованиям WMS: http://www.OpenGIS.org/resources/?page=products

96. Проект Digital Earth, NASA, http://digitalearth.gsfc.nasa.gov/

97. Ресурсы The World Radiation Data Centre (WRDC) обсерватория Воейкова (ГГО) http://wrdc.mgo.rssi.ru

98. Руководство по созданию WMS-серверов (сайт OGC): http://www.OpenGIS.org/resources/?page=cookbooks

99. Российская дифференциальная подсистема (на базе Глонас)http://sdcm.rniikp.ru/rdp/user/customer.htm http://sdcm.rniikp.ru/rdp/about/obzor.htm

100. Справочник по БД и информационным ресурсам России http://www.gsnti.ru/leading/bdlist.html http://www.gsnti.ru/leading/resources.html

101. Система визуализации и обработки двумерных данных AM Lab Hesperus www.amlab.ru

102. Система визуализации IP Lab www.iplab.com

103. Система визуализации Scionlmage www.scioncorp.com

104. Система визуализации Surfer www.goldensoftware.com

105. Система визуализации 3DField field.hvpermart.net

106. Система визуализации TecPlot www.amtec.com

107. Система визуализации Visio Pro www.dta.it

108. Технические требования WMS для работы с картами форматов ESRI иформата, разработанного в университете штата Миннесота: http://mapserver.gis.umn.edu

109. Технические требования OGC к стилям слоев (SLD): http://www.QpenGIS.org/docs/02-07Q.pdf

110. Технические требования OGC к контексту: http://www.QpenGIS.org/docs/03-036r2.pdf

111. Хохлов Ю.Е., Арнаутов С.А., Обзор форматов метаданных. М.: Институт развития информационного общества,http://www.elbib.ru/index.phtml?page=elbih/rus/methodology/mdrev

112. Центры обработки данных: стандарты в действии, 2006. http://citcitv.ru/14587122. 4D data environment Grid Analysis and Display System (GrADS) www.iges.org/grads

113. Aircraft Meteorological Data Relay (AMDAR)

114. Bourret R. XML and Databases, http://www.rpbourret.com/xml/XMLAndDatabases.htm

115. Committee on Data Management, Archiving, and Computing (CODMAQ, Data Level Definitions

116. DA intro http://www.atmosp.physics.utoronto.ca/~dbj/PHY2506/chl.pdf

117. David Snelling, Ali Anjomshoaa, Francis Wray, Achim Basermann, Mike Surridge, Philip Wieder. NEXTGRID ARCHITECTURAL CONCEPTS. http://www.gridclub.ru/librarv/publication.2008-03-17.8516156440

118. Extensible Markup Language (XML) 0 (Second Edition) W3C Recommendation 6 October 2000. http://www.w3.org/TR/2000/REC-xml-20001006

119. Foster I. and Kesselman C., Globus: A Metacomputing Infrastructure Toolkit, Journal of Supercomputer Applications and High Performance Computing, 1997.

120. Free data http://www.ncdc.noaa.gov/oa/mpp/freedata.html

121. Global spatial data infrastructure association http://www.gsdi.org/

122. GRID-архитектура www.grid.org

123. GRID инфраструктура для слияния данных, ИКИ РАН http://shadowinform.ikd.kiev.ua/index.php?path=/ru/projects/intas

124. Planish W. and NVO Metadata Working Group. Resource and Service Metadata for the Virtual Observatory: 2002, http://www.us-vo.org

125. Litzkow M., Livny M. and Mutka M., Condor A Hunter of Idle Workstations, International Conference of Distributed Computing Systems, 1988.146. "MapReduce: Simplified Data Processing on Large Clusters", J. Dean, S. Ghemawat, ACM OSDI, Dec. 2004

126. NASA Digital Earth Web Map Resourcer. Page, http://www.digitalearth.gov/wmt

127. NetCDF data model www.unidata.ucar.edu/softwarc/netcdf/

128. OpenGIS Consortium Initiatives Page: http://www.opengis.org/initiatives/

129. Open GIS Consortium Interoperability Program: http://ip.opengis.org

130. OpenGIS® Web Map Server Interfaces Implementation Specification Revision 1.1.1 'http://www.opengis.org/docs/01-068r2.pdf

131. Open Grid Services Architecture (OGSA). GRID-технологии. http://www.globus.org/ogsa

132. Globus Alliance Community of organizations and individuals open source software

133. OpenLink. Virtuoso virtual server, www.openlinksw.com/virtuoso/154. "Parallel Database Systems: the Future Or High Performance Database Systems", D. DeWitt, J. Gray, CACM, Vol. 35, No. 6, June 1992

134. RADAR data http://www.ncdc.noaa.gov/oa/radar/radardata.htmlhttp://www.ncdc.noaa.gov/oa/radar/radarproducts.html

135. Scientific Data Management in the Coming Decade, SIGMOD Record, Vol. 34, No. 4, Dec. 2005 (Управление научными данными в следующем десятилетии)

136. The Meteorological Assimilation Data Ingest System (MAD1S) -http ://madis.noaa. gov/

137. UNIDATA data model http://www.unidata.ucar.edu/

138. UNIDATA software http://www.unidata.ucar.edu/software/ldm/

139. Visualisation and Analysis Environment (data management tool) — FERRETferret.wrc.noaa.gov/Ferret/161. "When Database Systems Meet the Grid", M. Nieto Santisteban et. al., CIDR, 2005162. www.w3c.org