автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений

кандидата технических наук
Масютин, Виталий Викторович
город
Москва
год
2012
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений»

Автореферат диссертации по теме "Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений"

На правах рукописи

Масютин Виталий Викторович

Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений

05.13.01 - системный анализ, управление и обработка информации (химическая промышленность)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва 2012

Работа выполнена на кафедре Информационных технологий федерального государственного образовательного учреждения высшего профессионального образования «Московский государственный университет тонких химических технологий имени М.В. Ломоносова» (МИТХТ им. М.В. Ломоносова).

Научный руководитель кандидат технических наук, доцент

Дударев Виктор Анатольевич

Официальные оппоненты доктор технических наук, профессор

Заслуженный деятель науки Российской Федерации

Костров Алексей Владимирович,

профессор кафедры «Информационные системы

и программная инженерия»

ФГБОУ ВПО «Владимирский государственный

университет им. А.Г и Н.Г. Столетовых»

кандидат технических наук Медведков Максим Сергеевич, главный специалист отдела Специального программного обеспечения Информационно-аналитического центра ФГУП РосРАО

Ведущая организация Российский химико-технологический университет

им. Д.И. Менделеева

Защита состоится « 26 » « марта » 2013 года в 13.00 часов на заседании диссертационного совета Д 212.120.08 при Московском государственном университете тонких химических технологий имени М.В. Ломоносова по адресу: 119571, г. Москва, просп. Вернадского, 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, г. Москва, просп. Вернадского, 86).

Автореферат диссертации размещен на сайте ВАК http://vak.ed.gov.ru.

Автореферат разослан «_

»2013 г.

Ученый секретарь диссертационного совета, доктор технических наук

Колыбанов К.Ю.

РОССИЙСКАЯ

roi>;» v.-ч, i ВЬННАЯ

Р>1/1ЬЛ1/!Г)ТЕКА

?oi?

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Обеспечение химиков-технологов достоверной информацией о свойствах и технологиях получения современных веществ является необходимым условием развития современной промышленности. В настоящее время качественная информационная поддержка специалистов невозможна без использования специализированных баз данных (БД). Как правило, БД по свойствам веществ разрабатываются в разных организациях и даже в разных странах.

Наибольшего прогресса в этом добились США и Япония, которые на базе NIST (National Institute of Standards and Technology - Национальный институт стандартов и технологий, США) и NIMS (National Institute for Materials Science Technology - Национальный институт материаловедения, Япония) предлагают обширные комплексы материаловедческих баз данных.

В нашей стране существует ряд специализированных БД, разработанных различными организациями, и никак не связанных друг с другом. Одним из крупнейших разработчиков ИС по свойствам неорганических материалов в России является Институт металлургии и материаловедения РАН, в котором насчитывается шесть специализированных БД с доступом через Интернет: http://www.imet-db.ru.

Как правило, современные информационные системы (ИС) для обеспечения оперативности доступа к наиболее актуальной информации предоставляют различные интерфейсы доступа к данным из глобальной сети Интернет. Полная интеграция таких систем невозможна из-за различных форматов данных, разного уровня качества данных, хранящихся в разных БД, и режимов доступа к данным в ИС источников данных.

В последние годы наблюдается тенденция к кооперации в разработке ИС и к интеграции уже созданных ИС, как на национальном, так и на международном уровне. Актуальность решения этой задачи вызвана стремлением устранить необоснованное дублирование работ и уменьшить затраты на разработку и поддержку ИС.

Кроме того, интеграция информации, содержащейся в ИС по свойствам веществ и технологиям их получения, позволяет применять методы компьютерного анализа для поиска взаимосвязей в данных. Использование найденных взаимосвязей позволяет проводить компьютерное конструирование новых перспективных соединений, обладающих заданными свойствами. Получаемая с помощью интегрированной ИС обобщенная информация может быть использована специалистами для поддержки принятия решений при выборе того или иного вещества и технологии его получения для использования в изделиях современной промышленности.

Цель работы

Целью диссертации является обеспечение информационной поддержки принятия решений при компьютерном конструировании неорганических соединений на основе интеграции гетерогенных баз данных.

Для достижения поставленной цели в диссертации поставлены и решены следующие задачи:

• Проведен системный анализ технологий интеграции гетерогенных информационных систем;

• Разработан комплекс информационных моделей технологий интеграции гетерогенных баз данных;

• Выполнено прогнозирование кристаллической структуры неорганических соединений по данным, полученным из гетерогенных баз данных;

• Разработана схема защиты информационного обмена по открытым каналам связи сети Интернет при интеграции гетерогенных баз данных.

Объект исследования

Объектом исследования являются базы данных по свойствам неорганических соединений и технологии их интеграции.

Предмет исследования

Предметом исследования является применение технологий интеграции данных для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений.

Научная новизна

1. На основе проведенного системного анализа технологий интеграции данных разработана обобщенная схема интеграции данных;

2. Разработан комплекс информационных моделей для технологий интеграции данных;

3. Выполнено прогнозирование кристаллической структуры ряда соединений по данным, полученным из двух гетерогенных баз данных.

Практическая значимость работы

1. На основе разработанного комплекса информационных моделей предложена структура информационной системы для интеграции корпоративной информации;

2. Разработаны модели данных для предметного посредника интеграции данных двух баз данных по свойствам неорганических соединений;

3. Разработана схема защиты данных при интеграции корпоративной

информации;

4. Показана возможность интеграции разнородных данных для

прогнозирования кристаллической структуры ряда неорганических

соединений.

Методы исследования

В основу решения поставленных задач положены методы системного анализа (декомпозиция, классификация, иерархическое упорядочение, абстрагирование, формализация, композиция, моделирование), методология моделирования потоков данных DFD, методология функционального моделирования систем IDEF0, методология проектирования баз данных IDEF1X, теория реляционных баз данных, иерархическая модель данных XML, методология быстрой разработки приложений RAD.

Апробация работы

Результаты работы были представлены на научно-технических конференциях «Наукоемкие химические технологии 2011», МИТХТ им.М.В.Ломоносова, Москва, 2011; «Инновационные и информационные технологии в образовании, экономике, бизнесе и праве», МГУТУ, Волоколамск, 2010; «Приоритетные направления развития науки, технологий и техники», Российская академия естествознания, Москва, 2012.

Публикации

По материалам диссертации опубликовано 6 печатных работ, в том числе 2 статьи в журналах, рекомендованных ВАК РФ для опубликования результатов диссертационных работ, 4 публикации в сборниках трудов и тезисов докладов научно-технических конференций.

Структура диссертации

Диссертационная работа состоит из введения, 4 глав, заключения и приложения.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении рассмотрены актуальность и практическая значимость работы. Сформулирована цель работы и поставлены задачи, решение которых необходимо для достижения поставленной цели. Рассмотрены методы исследований, научная новизна, апробация работы. Приведена структура диссертации и краткое содержание основных разделов.

В первой главе «Системный анализ технологий интеграции гетерогенных информационных систем» рассмотрены базовые информационные процессы обработки информации в локальных и распределенных ИС, проведен

системный анализ технологий интеграции гетерогенных ИС, выявлены особенности информационного обмена при различных технологиях интеграции ИС, разработана обобщенная схема интеграции гетерогенных ИС и приведены рекомендации по выбору технологий интеграции.

Типовая структура ИС включает в себя ряд подсистем, реализующих базовые информационные процессы сбора, хранения, передачи, обработки и представления информации. На рис. 1 представлены информационные процессы, протекающие в локальной ИС. В ней реализуются все основные процессы (кроме информационного обмена с внешними ИС).

1. Формирование запроса к данным

2. Определение данных для извлечения

3. Извлечение данных

4. Обработка данных

5. Представление данных

. _ Управляющая информация

ИС источника данных

Рис. 1. Информационные процессы в локальной ИС.

Запрос от пользователя, сформированный при помощи интерфейса (1) поступает в модель управления, который на основе метаданных (2) обращается к подсистеме хранения данных. Далее выполняется непосредственное извлечение (3) и обработка данных (4). Результаты представляются пользователю при помощи интерфейса (5).

Переход от локальной БД к распределенной, но однородной БД требует минимальных изменений в схеме обработки информации. Метабаза должна быть дополнена сведениями о распределении данных по множественным источникам. Наличие гетерогенных ИС, обладающих различными форматами хранения данных и различными процессами их обработки, обуславливает необходимость модификации процессов обмена информацией и требует применения той или иной технологии интеграции ИС.

К наиболее распространенным технологиям интеграции гетерогенных ИС относятся технологии интеграции корпоративной информации (Ell - Enterprise Information Integration), интеграции корпоративных приложений (EAI -Enterprise Application Integration) и интеграции корпоративных данных (ETL -Extract, Transform, Load). В табл. 1 приведены критерии сравнения технологий интеграции гетерогенных ИС.

Таблица 1. Критерии сравнения технологий интеграции гетерогенных информационных систем

Критерий Локальные БД ЕТ1 Ell ЕА1

Объект интеграции — Исходные данные Исходные данные Приложения, обрабатывающие исходные данные

Объем извлекаемых данных Тольно запрашиваемые пользователем данные Все данные Только запрашиваемые пользователем данные Только запрашиваемые пользователем данные

Доступ к данным источника Требуется, частичный в момент запроса к данным Требуется, в полном объеме в момент извлечения данных Требуется, частичный в момент запроса к данным Не имеется

Актуальность извлекаемых данных Данные всегда антуальны Актуальны на момент последней загрузки Данные всегда актуальны Данные всегда актуальны

Хранение извлеченных данных Долговременное, в собственном хранилище данных Долговременное, в собственном хранилище данных Кратковременное, в оперативной памяти Кратковременное, в оперативной памяти

Формат извлекаемых данных Определяется ИС источника данных Определяется ИС источника данных Определяется ИС интеграции данных Определяется ИС источника данных

Извлечение данных Выполняет ИС источника данных Выполняет ИС интеграции данных Выполняет ИС источника данных Выполняет ИС источника данных

Преобразование формата данных — Выполняет ИС интеграции данных Выполняет ИС источника данных Выполняет ИС источника данных

Обработка данных Выполняет ИС источника данных Выполняет ИС интеграции данных Выполняет ИС интеграции данных Выполняет ИС источника данных

Представление данных Выполняет ИС источника данных Выполняет ИС интеграции данных Выполняет ИС интеграции данных Выполняет ИС источника данных и/или интеграции приложений

В ряде случаев возможно использование единственного варианта интеграции данных. Например, отсутствие доступа к исходным данным предопределяет использование технологии интеграции приложений ЕА1, а требование доступности данных независимо от работоспособности ИС источника данных - применение технологий хранилищ данных ЕТЬ.

При объединении ИС информационные процессы 1-5 (рис. 1) будут реализованы в различных ИС (множественных ИС источников данных либо в центральной ИС интеграции) при помощи специализированных программных компонентов (модулей). На основе системного анализа информационных потоков составлена обобщенная схема интеграции гетерогенных ИС (рис. 2). Пунктиром на схеме показаны условные границы интегрируемых ИС.

Рис. 2. Обобщенная схема интеграции гетерогенных ИС ИС источников данных могут работать автономно в локальном режиме верхняя часть схемы). Интеграция приложений ЕА1 требует применения в осредника интерфейсов, управляющего передачей сообщений между нтегрируемыми приложениями на основе метабазы внешних приложений. При том извлечение и обработка данных выполняются в ИС источников данных, а езультаты могут быть представлены как в интерфейсе ИС интеграции, так и в нтерфейсах исходных ИС.

Интеграция на основе технологий хранилищ данных ЕТЪ включает модули звлечения исходных данных в форматах ИС источников (на основе метабазы нешних данных), преобразование их к формату хранилища данных и загрузки локальное хранилище (на основе метабазы хранилища данных). Локальное асположение всех модулей обработки данных требует доступности ИС сточников только на момент первичного извлечения данных.

При использовании технологии интеграция данных Ell исключается трудоемкая стадия разработки и заполнения промежуточного хранилища данных, но требует постоянного доступа к ИС источников данных и размещения в исходных ИС адаптеров извлечения данных и преобразования к единому формату ИС интеграции.

При интеграции гетерогенных ИС (в отличие от локальной ИС) необходима реализация процессов внешнего информационного обмена. На обобщенной схеме интеграции (рис. 2) эти процессы представлены стрелками информационных потоков, пересекающими условные границы ИС. Также процессы передачи информации имеют место при реализации удаленного доступа пользователей к интерфейсу ИС интеграции.

Во второй главе «Информационное моделирование технологий интеграции данных» разработан комплекс информационных моделей, используемых для проектирования и разработки ИС интеграции данных. На основе проведенного в первой главе системного анализа технологий интеграции данных построены диаграммы потоков данных DFD в ИС интеграции данных, функциональные модели IDEF0 процессов обработки информации при интеграции данных, разработаны реляционная модель IDEF1X данных предметного посредника и иерархическая модель данных XML для обмена информацией с ИС источников данных.

Контекстная диаграмма потоков данных технологий интеграции данных приведена на рис. 3.

Источники дантх

Интеграция и обработка

Данные для пользователя

Рис. 3. Контекстная диаграмма потоков данных технологий интеграции данных Контекстная диаграмма представляет собой наиболее обобщенное представление процессов интеграции данных. Три различных абстрактных накопителя данных подчеркивают различие в форматах и назначении данных.

Диаграмма потоков данных первого уровня декомпозиции технологий интеграции данных, представленная на рис. 4, содержит более детальное представление процессов интеграции данных. Тем не менее, на ней не отражены некоторые существенные отличия технологий интеграции данных ЕИ и ETL, такие как расположение накопителей данных и модулей обработки данных (локальное или удаленное по отношению к ИС интеграции данных), а также связанные с ними различия в метаданных. Различия в технологиях интеграции данных отражены на более детальных представлениях второго уровня декомпозиции диаграмм потоков данных.

Рис. 4. Диаграмма потоков данных первого уровня декомпозиции технологий интеграции данных

Процесс извлечения данных при использовании технологии ETL выполняется в пакетном режиме программными модулями ИС интеграции, при этом необходим полный доступ к данным ИС источника. Извлечение данных по технологии Ell выполняется адаптерами данных в ИС источников данных в режиме реального времени с предоставлением доступа к небольшому объему извлекаемых данных.

Преобразование форматов данных осуществляется на основе метабазы внешних данных, однако по технологии Ell это выполняется адаптерами ИС источников данных, а по технологии ETL - модулями ИС интеграции. Хранение преобразованных данных в реальном накопителе данных (хранилище данных) предусмотрено только в случае использования технологии ETL.

Смена формата данных в ИС интеграции требует корректировки метаданных, а также внесения изменений во все модули (адаптеры) преобразования форматов. Смена формата данных в ИС источника данных может быть реализована более прозрачно для ИС интеграции, поскольку требует корректировки только адаптеров ИС источников данных и не затрагивает метаданные ИС интеграции.

Для интеграции гетерогенных баз данных «Фазы» и «Элементы» по технологии Ell был разработан предметный посредник с использованием иерархической модели данных XML. Это позволяет обойтись без разработки трудоемких процедур согласования форматов реляционных данных, фрагмент структуры которых показан на рис. 5, что было бы необходимо в случае использования хранилища данных.

ТШР1£_6ВДГ

. -И.ОХЧ«

Ми 5_Т1Ти

[ЮиВ1Е.СЯАР

Фазовые диаграммы (Графические данные}

РОиВ1£ ЕМР

н.ттичмпли

ь_ая*раию_нлш

Зисчериаденгальные данные (точки фазоиой диаграммы)

?5Г5йЙ"

1.ГШ

1_иП1 ц_нима

_ТЕМИ1иТии

£сшккмо_|им(

И [ии«А1 \ КЛ-

Экспериментальны« данные ¡точки границ области гомогенности лалуправодчпкоиых фаз)

Рис. 5. Фрагмент структуры реляционных данных БД «Фазы»

В главе 3 «Применение технологий интеграции данных для компьютерного конструирования неорганических соединений» рассмотрена структура информационной системы для компьютерного конструирования неорганических веществ, методика проведения вычислительного эксперимента, выполнено прогнозирование типа кристаллической структуры соединений различного состава и получена оценка достоверности прогнозов.

Халькогенидные шпинели состава АВ2Х^ (X = Б, Бе, Те) представляют интерес для поиска новых магнитных полупроводников, подобных известным фазам состава СсЮг^, Сс1Сг28е4, Н§Сг28е4, гпСг28е4, СиСг25е4, РеСг284 и т.д. Халькогенидные магнитные полупроводники со структурой шпинели нашли применение в полупроводниковых приборах с управлением магнитным полем, например, в управляемых МДП-структурах, в приборах, использующих гигантское (до 5 * 106 град/см) фарадеевское вращение плоскости поляризации в магнитном поле, в квантовых приемниках и элементах памяти, работающих на принципе сильного фотомагнетизма в магнитном поле. Халькогенидные шпинели могут использоваться также в узкополостных источниках света, управляемых магнитным полем. Перспективно применение халькошпинелей в интегральных схемах, в которых один участок используется как активное полупроводниковое устройство, а другой - как магнитный микроволновой прибор, а также в устройствах, где существенна взаимосвязь электрических, магнитных и оптических свойств. Интерес с хапькошпинелям вызывает и обнаружение слабой сверхпроводимости у некоторых из этих фаз. Халькошпинели рассматриваются как перспективные термоэлектрические материалы.

В БД «Фазы» хранится информация о более тысячи соединений состава АВ2Х4. Для -2/3 этих соединений существуют данные о кристаллической структуре (рис. 6). Наиболее распространенными являются структурные типы ТЬзР4, шпинели и СаРе204.

1001 901 80-1 701

бо|

501 401

30 201

1

||

и

■ •

|1_

II

1 л_

■ 0

11 \ш. 1Я ЯЧ1ТГ1Г1П

Эе

Те

®ТЬЗР4

■ шпинель

□ СаРе204

□ МСг2Б4

■ РЬБа28е4 ВМпЕг234

■ оливин

□ СаНо23е4

■ Сс)А1234

■ Ье(а-К2504

□ РЬСг2Э4

□ РЬВ|234

Рис. 6. Гистограмма распространенности типов кристаллической структуры тройных халькогенидов состава АВ2Х4 В последние годы были синтезированы и изучены сотни новых халькогенидных соединений подобного состава, что позволило уточнить прогнозы возможности образования новых соединений этого состава и типа их кристаллической структуры при обычных условиях за счет использования новых данных.

Поиск закономерностей образования различных кристаллических фаз проводился в многомерных пространствах свойств компонентов, перечень которых даны в таблице 2. Химические системы представлялись в виде набора значений свойств химических элементов А, В и X. Информация о свойствах химических элементов была взята из БД «Элементы».

Таблица 2. Свойства элементов, использованные для описания соединений состава АВ2Х4

м Свойство № Свойство

1 Псевдопотенцнальный радиус (поЦангеру) 13 Первый потенциал ионизации

■> Температура плавления 14 Второй потенциал ионизации

ч Ковалентный радиус 15 Третий потенциал ионизации

4 Квантовый номер 16 Химический потенциал Мидемы (только для элементов А и В)

5 Расстояние до внутренних электронов (по Шуберту) 17 Номер группы (только для элементов А и В)

6 Расстояние до валентных электронов (по Шуберту) 18 Регулярный номер (по Менделееву-Петтифору)

Ионный радиус (по Бокию и Белову) 19 Температура Дебая (только для элементов А и В)

8 Температура кипения 20 Молярная теплоемкость

р Энтальпия испарения 21 Энтропия твердого тела

10 Энтальпия плавления 22 Теплопроводность

11 Электроотрицательность (по Мартынову-Бацанову) 23 Количество валентных электронов (только для элементов А и В)

12 Энтальпия атомизации

Для обучения были использованы 835 примеров образования соединений (класс 1) и 154 отсутствия соединений состава АВ2Х4 (X = 8, ве или Те) (класс 2) в системах АХ-В2Хэ, АХ2-ВХ и А2Х-ВХ3 при обычных условиях. Экзаменационное распознавание проводилось на материале обучающей выборки в двух режимах: без скользящего контроля и со скользящим контролем. Информация была извлечена из БД «Фазы».

Для прогноза возможности образования еще неполученных соединений состава АВ2Х4 использовались лучшие по результатам экзаменационного распознавания методы принятии коллективных решений: метод Байеса, метод логической коррекции и методы, основанные на нахождении шаблонов принятия решений и областей компетенции. Результаты прогноза по этим четырем методам сравнивались. Далее для прогнозируемых соединений прогнозировался тип кристаллической структуры при нормальных условиях. Фрагмент результатов прогнозирования кристаллической структуры приведен в таблице 3.

Таблица 3. Прогноз типа кристаллической структуры соединений состава

А1УВ!128е4 при нормальных условиях

А В Т| Сг Мп № ве Ъг Мо Ю» Эй \У РЬ и

Ве 2 2 16 16 9

Щ #2 -> О -> т б #2 6

Са #2 *> -> 2 2 б л

Т1 9 #9 #9 9 9 9 9

V 9 #9 #9 #9 9 9 9 9 9 14

Сг #17 #9 9 #9 7 9 1 14 14

Мп #2 9 9 9 1 ->

Ге #9 9 9 9 2 9 9 1

Со 9 1 17

№ 17

Си 17 17 17

Ъп 15 15 #15 15 15 15 #17 15 Р Р

Са 17 *4 #17 #17 #5

С« 17 2 #17 17 17

Яг 12 б 12 12 12 12 6 6 б 12 6 6

Рс! 17 1 17 17

А« 17 17 17 Г 17 #17 #17 #17 Р

Сс1 #17 #17 17 17

Яп #Г

Ва 6 б б 6 б #12 6 б 6 6 б

Ьа 12 #8 12 12 12 16 16 16 16 12

Се 12 £8 12 12 12 12 12 12 12 12 12 12

Использованы следующие обозначения:

1 - прогноз структуры типа шпинели;

2 - прогноз структуры типа оливина;

3 - прогноз структуры типа MnEr2S4;

4 - прогноз структуры типа CdAI2S4;

5 - прогноз структуры типа PbGa2Se4;

6 - прогноз структуры типа P-K2S04;

7 - прогноз структуры типа CaFe204;

8 - прогноз структуры типа Th3P4;

9 - прогноз структуры типа NiCr2S4;

10 - прогноз структуры типа CaHo2Se4;

11 - прогноз структуры типа PbBi2S4;

12 - прогноз структуры типа GeSr2S4;

13 - прогноз структуры типа TISe;

14 - прогноз структуры типа PbCr2S4;

15 - прогноз структуры типа сфалерита;

16 - прогноз кристаллической структуры, отличной от приведенных выше;

17 - прогноз отсутствия соединения АВгХ^ при нормальных условиях.

Значком # отмечены объекты, использованные для обучения ЭВМ.

Пустые клетки - несовпадения прогнозов с применением разных коллективных методов или неопределенный прогноз.

В четвертой главе «Защита информации в технологиях интеграции данных» рассмотрены базовые принципы защиты информации в компьютерных сетях, выполнен анализ потенциальных угроз информационной безопасности, сформулированы критерии выбора технологических решений по защите информации. На основе проведенного анализа угроз и разработаны схемы защиты информационного обмена ИС интеграции данных с ИС источников данных и получателями данных.

К основным видам потенциальных угроз информационной безопасности относятся угрозы несанкционированного доступа к данным; угрозы потери, уничтожения, искажения и фальсификации данных; угрозы нарушения работоспособности информационной системы. Следует отметить, что данные типы угроз актуальны не только для информационной системы, но и для систем, в которых расположены источники данных - злоумышленник может использовать сервера системы в качестве плацдарма для атаки на источники данных.

Основу защиты данных при передаче по открытым каналам связи сети Интернет составляет применение технологии виртуальных частных сетей (VPN - Virtual Private Network), при помощи которой в открытых каналах связи

эмулируется защищенный туннель, недоступный для внешних (неавторизованных) пользователей.

Организация УРМ-туннеля между двумя сетевыми устройствами требует наличия специализированного программного либо аппаратного обеспечения с возможностью поддержки и использования одинаковых алгоритмов шифрования и аутентификации.

При выборе технологических решений по защите информационного обмена были рассмотрены и учтены следующие критерии:

• Объем передаваемых данных между участниками (влияет на величину сетевого трафика и на загрузку серверной подсистемы);

• Частота установления соединений между участниками (влияет на загрузку серверной подсистемы);

• Возможность или необходимость использования аппаратных решений (снижает нагрузку на программное обеспечение, но требует установки и настройки аппаратных средств);

• Системные требования к аппаратному и программному обеспечению (влияет на стоимость установки и сопровождения);

• Требования к квалификации участников информационного обмена;

• Степень защищенности информационной сети, в которой расположены взаимодействующие устройства;

• Вероятность компрометации учетной записи пользователя и заражения взаимодействующих устройств (внедрения вредоносного программного обеспечения, нарушающего информационную безопасность).

Схема защиты информационного обмена между источниками данных и ИС интеграции (рис. 7) разработана с учетом следующих требований:

• Источников данных относительно немного;

• Источники данных заранее определены;

• Количество соединений относительно небольшое;

• Частота установки соединений относительно высока;

• Объем передаваемых данных относительно большой;

• Допустимо применение специфических аппаратных решений;

• Допустимо применение специализированного программного обеспечения;

• Квалификация персонала достаточна для использования специализированных средств установки УРМ-соединений.

Рис. 7. Схема защиты информационного обмена между источниками данных и ИС интеграции

Использование технологии IPsec VPN позволяет предотвратить ряд угроз информационной безопасности и обеспечивает:

• подтверждение достоверности источника данных (аутентификацию источника данных);

• защиту передаваемых по открытым каналам сети Интернет данных от перехвата (алгоритмы шифрования данных);

• защиту передаваемых по открытым каналам сети Интернет данных от искажения (алгоритмы проверки целостности передаваемых данных).

• Конфиденциальность методов и технологии обмена данным;

Схема защиты информационного обмена между ИС интеграции и конечными пользователями (рис. 8) разработана с учетом следующих требований:

• Количества пользователей на порядки выше количества источников данных;

• Количество соединений, устанавливаемых одним пользователем, невелико;

• Объем передаваемых данных между ИС интеграции и пользователем относительно небольшой;

• Квалификация пользователя неизвестна (может быть любой);

• Степень лояльности и мотивы пользователя неизвестны;

• Тип оборудования, операционная система и установленное пользователем программное обеспечение неизвестны;

• Нежелательна установка специализированного программного обеспечения;

• Недопустимо применение специфических аппаратных решений.

Рис. 8. Схема защиты информационного обмена между ИС интеграции и пользователями

Использование технологии SSL VPN позволяет предотвратить ряд угроз информационной безопасности и обеспечивает:

• Проверку подлинности участников информационного обмена (посредством использования цифровых сертификатов);

• Защиту передаваемых по открытым каналам сети Интернет данных от перехвата (посредством использования алгоритмов шифрования данных);

• Защиту передаваемых по открытым каналам сети Интернет данных от искажения (посредством использования алгоритмов проверки целостности передаваемых данных).

Использование аппаратных межсетевых экранов с функцией терминации HTTPS/SSL-соединений снижает нагрузку на сервер интегрированной ИС.

Использование предложенных технологий защиты информационного обмена обеспечивает защиту от потенциальных угроз информационной безопасности, не снижает производительность ИС интеграции и обеспечивает возможность применения различных программных средств программной реализации информационных процессов.

Заключение

В диссертационной работе получены следующие результаты:

• На основе проведенного системного анализа технологий интеграции данных разработана обобщенная схема интеграции данных;

• Разработан комплекс информационных моделей для технологий интеграции данных, включающий диаграммы потоков данных DFD, функциональную модель процессов обработки информации IDEF0, иерархическую модель данных XML;

На основе разработанного комплекса информационных моделей предложена структура информационной системы для интеграции корпоративной информации;

Разработан предметный посредник для интеграции данных двух баз данных по свойствам неорганических соединений;

Показана возможность интеграции разнородных данных для прогнозирования кристаллической структуры ряда неорганических соединений;

Выполнено прогнозирование кристаллической структуры ряда соединений по данным, полученным из двух гетерогенных баз данных;

Разработана схема защиты данных при интеграции корпоративной информации по открытым каналам связи сети Интернет.

Публикации по теме диссертации

Статьи в журналах, рекомендованных ВАК для опубликования результатов диссертационных работ:

1. Дударев В.А., Масютин В.В. На пути к единой информационной системе по свойствам неорганических веществ // Интеграл, №6(50), 2010

2. Дударев В.А., Масютин В.В., Поляков A.A. Компьютерное конструирование неорганических соединений на основе интегрированной информационной системы // Прикладная информатика, №4(40), 2012

Статьи и тезисы докладов:

3. Масютин В.В. Информационное моделирование технологий интеграции данных. // Материалы II научно-практической конференции «Инновационные и информационные технологии в образовании, экономике, бизнесе и праве», МГУТУ, Волоколамск, 2010

4. Масютин В.В., Дударев В.А. Системный анализ технологий интеграции гетерогенных баз данных. // Материалы VII международной научно-практической конференции «Новейшие достижения европейской науки -2011», том 34, Математика, София, 2011

5. Масютин В.В., Дударев В.А. Компьютерное конструирование новых неорганических соединений состава AB2>U. // Материалы научно-технической конференции «Наукоемкие химические технологии 2011», МИТХТ им.М.ВЛомоносова, Москва, 2011

6. Масютин В.В. Защита информации в технологиях интеграции данных // Материалы научно-практической конференции «Приоритетные направления развития науки, технологий и техники», Российская академия естествознания, Москва, 2012

^ -2835

2012251434

2012251434