автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Информационная поддержка компьютерного прогнозирования неорганических соединений на основе интеграции международных информационных систем
Автореферат диссертации по теме "Информационная поддержка компьютерного прогнозирования неорганических соединений на основе интеграции международных информационных систем"
На правах рукописи
Шмакова Елена Германовна
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КОМПЬЮТЕРНОГО ПРОГНОЗИРОВАНИЯ НЕОРГАНИЧЕСКИХ СОЕДИНЕНИЙ НА ОСНОВЕ ИНТЕГРАЦИИ МЕЖДУНАРОДНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
05.13.01 - Системный анализ, управление и обработка информации (химическая промышленность)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва-2013
31 СКТ 2013
005536323
Работа выполнена на кафедре Информационных технологий ФГБОУ ВПО "Московский государственный университет тонких химических технологий им. М.В. Ломоносова".
Научный руководитель
Официальные оппоненты
кандидат технических наук, Дударев Виктор Анатольевич
доцент,
доктор физико-математических наук, профессор, заведующий кафедрой Информационных технологий ФГБОУ ВПО «Московский государственный университет технологий и управления им. К.Г. Разумовского» Краснов Андрей Евгеньевич
кандидат технических наук, начальник лаборатории автоматизированных систем радиационного и химического экологического мониторинга ОАО "ВНИИХТ" (Ведущий научно-исследовательский институт химической технологии)
Кожин Олег Владимирович.
Ведущая организация
ФГБОУ ВПО "Российский химико-технологический им. Д.И. Менделеева"
государственный университет
Защита состоится " 26 " " ноября " 2013 года в 16.00 часов на заседании диссертационного совета Д 212.120.08 при ФГБОУ ВПО "Московский государственный университет тонких химических технологий им. М.В. Ломоносова" по адресу: 119571, г. Москва, просп. Вернадского, 86.
С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, г. Москва, просп. Вернадского, 86).
Автореферат диссертации размещен на сайте ВАК http://vak.ed. gov.ru.
Автореферат разослан «££» « » 2013 г.
Ученый секретарь диссертационного совета, доктор технических наук
Колыбанов К.Ю.
Общая характеристика работы.
Актуальность темы исследования. Фундаментальной задачей современной химии является разработка методов, позволяющих надежно (с высокой степенью вероятности) прогнозировать физико-химические свойства новых, еще не синтезированных соединений, что создает предпосылки для целенаправленного конструирования соединений с заданными свойствами. Для обеспечения инновационного развития экономики страны необходима разработка новых материалов, обладающих заданными свойствами. Одним из наиболее перспективных методов решения этой проблемы является применение информационно-прогнозирующих систем, предназначенных для поиска информации об уже известных соединениях и прогнозирования еще не полученных фаз. На сегодня ни одна из разработанных информационных систем (ИС) по свойствам неорганических веществ и материалов не способна дать полную информацию обо всей совокупности свойств конкретного вещества. Чтобы найти все необходимые значения параметров заданного вещества специалисты должны просматривать материалы десятков информационных систем. Одним из путей решения проблемы является интеграция информационных ресурсов с целью предоставления полной совокупности данных о материалах, как пользователям, так и прикладным программам. Применение последних позволяет использовать методы компьютерного анализа для поиска взаимосвязей в данных. Использование найденных взаимосвязей позволяет проводить компьютерное конструирование новых соединений, обладающих заданными свойствами.
Актуальность интеграции в последние годы была осознана не только на национальном, но и на международном уровне, что вызвало появление специальной международной комиссии (Materials Task Group) в рамках известной организации CODATA (http://www.codata.org). целью которой является выработка стандартов для интеграции материаловедческих ИС. Однако, несмотря на предпринимаемые усилия, говорить о серьезных международных результатах, достигнутых в этой области, безусловно, рано.
Степень разработанности проблемы. Существенный вклад в решение задач интеграции ИС внесли: JI.A. Калиниченко, С.А. Ступников, В.А. Серебряков, А.Н. Бездушный, A. Halevy (Levy), W. Inmon, D. Calvanese, M. Lenzerini, G. Gottlob, T. Gruber и др. Работы по созданию и использованию ИС СНВМ выполняли: Е.М. Савицкий, В.Б. Грибуля, H.H. Киселева, B.C. Иориш, Ф.А. Кузнецов, Р. Villars, S. Le Clair, N. Chen, L. Bartolo, M. Yamazaki, Y. Xu и др. Задачи прогнозирования решали: JI.A. Растригин, В.П. Гладун, Н.Г. Загоруйко, Ю.И. Журавлев, В.В. Рязанов, О.В. Сенько, R. Duda, Р. Hart, К. Fu, L. Kuncheva и др.
Однако, несмотря на серьезные усилия, прилагаемые к решению проблемы учеными разных стран, методики интеграции информационных систем для компьютерного конструирования неорганических соединений с применением международных баз данных рассмотрены недостаточно.
Цель и задачи исследования: Целью работы является разработка информационной поддержки компьютерного конструирования неорганических соединений на основе интеграции международных гетерогенных информационных систем по свойствам веществ. Достижение указанной цели предполагает решение следующих задач:
- провести системный анализ этапов разработки структурной схемы системы принятия решений (СППР) при прогнозировании средствами компьютерного конструирования неорганических соединений;
- разработать теоретико-множественную модель поиска релевантной информации в информационных системах по свойствам неорганических веществ;
- разработать систему критериев объединения ИС на уровне пользовательских интерфейсов;
- провести системный анализ интеграционных технологий построения международных баз данных;
- разработать реляционную структуру метабазы для интеграции ИС: «Кристалл», «Фазы», «Диаграмма», «BandGap», «Elements» и «AtomWork» (Япония) для консолидации информации по свойствам неорганических соединений;
- разработать методику применения созданной интегрированной ИС для прогнозирования свойств неорганических соединений.
Объектом исследования являются информационные системы по свойствам неорганических веществ и материалов.
Предметом исследования является применение технологий интеграции распределенных информационных систем для консолидации информационных ресурсов по свойствам неорганических веществ и материалов при компьютерном конструировании неорганических соединений.
Наиболее существенные научные результаты, полученные автором:
1. на основе системного анализа разработаны этапы построения структурной схемы системы принятия решений (СППР) при прогнозировании средствами компьютерного конструирования неорганических соединений;
2. разработана теоретико-множественная модель поиска релевантной информации в информационных системах по свойствам неорганических соединений;
3. разработана система критериев оценки интегрируемых информационных систем по свойствам неорганических соединений;
4. разработана реляционная структура метабазы для описания информации, содержащейся в интегрируемых ИС по свойствам неорганических соединений;
5. разработана методика использования созданной интегрированной ИС для прогнозирования свойств неорганических соединений.
Практическая значимость работы состоит в том, что применение интегрированной ИС позволяет сократить время, затрачиваемое на поиск полной информации по свойствам неорганических веществ и материалов.
Проведена интеграция ИС, созданных на основе специализированных материаловедческих баз данных (БД), разработанных в ИМЕТ РАН: «Кристалл», «Фазы», «Диаграмма», «BandGap», «Elements» и БД «AtomWork» (NIMS).
Получены прогнозы образования неорганических соединений состава АВХг, перспективных для использования в качестве материалов для создания магнитных запоминающих устройств большой емкости.
Разработанные методики и информационные средства используются в учебном процессе кафедр "Материалы микро-, опто- и наноэлектроники" и "Информационные технологии" МИТХТ им. М.В. Ломоносова при чтении спецкурсов для магистрантов.
Теоретической, методологической и информационной базой исследования являются труды отечественных и зарубежных учёных и практиков, посвященные проблемам построения информационных систем, методы системного анализа, методологии семейства ICAM (IDEFO, IDEF1X) и DFD. При разработке интегрированной ИС использованы: теория построения баз данных, Web-технологии. Для иллюстрации применения ИС в интеллектуальных системах использованы методы компьютерного конструирования неорганических соединений, основанные на обучении ЭВМ распознаванию образов, методы онтологического моделирования, математический аппарат теории множеств, публикации в научной литературе и периодической печати. Положения, выносимые на защиту:
• системный анализ этапов разработки структурной схемы системы принятия решений при прогнозировании средствами компьютерного конструирования неорганических соединений;
• теоретико-множественная модель поиска релевантной информации в информационных системах по свойствам неорганических соединений;
• система критериев оценки интегрируемых информационных систем по свойствам неорганических соединений;
• реляционная структура метабазы для описания информации, содержащейся в интегрируемых ИС по свойствам неорганических соединений;
• методика использования созданной интегрированной ИС для прогнозирования свойств неорганических соединений.
Обоснованность и достоверность результатов исследования обусловлена: репрезентативностью статистической информации; научной методологией исследования, опирающейся на применение системного подхода, в том числе методов статистического анализа, публикациями по теме и обобщением научных исследований зарубежных и отечественных специалистов.
Апробация результатов работы: Основные результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах: «X Российская ежегодная конференция молодых научных сотрудников и аспирантов «Физика-химия и технология неорганических материалов», ИМЕТ РАН, Москва, 2013г., «Международная научно-практическая конференция», Тамбов, 2013г., «XV Международная научно-практическая конференция», Центр научной мысли, Таганрог, 2012г., «IV Всероссийская научно-практическая конференция с международным участием» Научно-инновационный центр, Красноярск, 2011г., «VIII Российская ежегодная конференция молодых научных сотрудников и аспирантов «Физика-химия и технология неорганических материалов», ИМЕТ РАН, Москва, 2011г., «Фестиваль научно-технического творчества молодежи ЗАО» Москва, МИТХТ, 2011г., «Инновационные и информационные технологии в образовании, экономике, бизнесе и праве» МГУТУ, Волоколамск, 2010г.
Публикации. По материалам диссертации опубликовано 9 работ, в том числе 3
статьи в изданиях из перечня ВАК.
Структура и объем работы. Диссертация включает введение, 4 главы, заключение, список литературы, содержит 120 страниц, 23 рисунка и 9 таблиц.
Во введении кратко рассмотрены актуальность и практическая ценность работы. Сформулирована цель работы и поставлены задачи. Кратко рассмотрены методы исследований, научная новизна, практическая значимость, результаты апробации и внедрения диссертационной работы. Приведена структура диссертации и краткое содержание основных разделов.
В 1-ой главе "Системный подход к построению информационной системы компьютерного конструирования неорганических соединений" дается постановка
задачи компьютерного конструирования неорганических соединений и прогнозирования их свойств.
Существует ряд наиболее известных методов конструирования неорганических веществ таких, как квантомеханические и эмпирические методы, различные методы поиска многомерных классифицирующих закономерностей, например, применение теории распознавания образов, методы искусственного интеллекта, автоматическая классификация, статистические и эвристические методы и др.
Благодаря компьютерному конструированию появилась возможность осуществлять поиск новых неорганических веществ, с требуемыми свойствами, автоматически. Благодаря полученным прогнозам при поиске значительно уменьшается количество исследуемых составов, перспективных для сегнетоэлектрических, полупроводниковых, пьезоэлектрических, акустооптических, электрооптических, магнитных, нелинейно-оптических и прочих применений.
Проведена формальная постановка задачи компьютерного конструирования неорганических соединений.
Предполагается, что каждое неорганическое соединение может быть описано
г_/-г0) г<0 _<0 г<2> г(2) <2) (1) (1) вектором 'Л2 >■■•>■«« ' 2 , ,...,Х, ,Х2 .....хм )^ где ^ _ количество
химических элементов в соединении, а М - количество параметров химических элементов. Каждое вещество также характеризуется принадлежностью к определенному классу: а(х) е {1,2,...,/Г}, где К - количество классов. Обучающая выборка состоит из N объектов: 5 = {*,,/ = 1,.. Обозначим подмножество объектов обучающей выборки из класса а,,У = \,...,К как = {х: а(х) = ау}. Цель обучения -построить классифицирующие правила, которые позволяют не только отличить объекты разных классов в обучающей выборке, но и обладают прогностической способностью образовывать новые комбинации химических элементов, которые не использовались для обучения, и относить их к одному из К классов. Таким образом, осуществляется переход к классической задаче распознавания образов по прецедентам. Особенностью предметной области является только формирование признакового описания, имеющего составную структуру: набор свойств элементов (компонентов неорганического вещества) повторяется Ь раз.
Для прогноза новых соединений, поиска оптимального режима получения и обработки требуемых материалов в ИМЕТ разработан кибернетико-статистический подход. В работе рассмотрено применение системного подхода для разработки структурной схемы системы принятия решений (СППР) при прогнозировании средствами компьютерного конструирования неорганических соединений (рис. 1).
Рис. I. Системный анализ этапов разработки структурной схемы системы принятия решений при прогнозировании средствами компьютерного конструирования неорганических соединений.
Для практической реализации компьютерного конструирования неорганических сослиисний необходимо создание интегрированной системы по свойствам неорганических веществ и материалов, объединяющей информационные системы (ИС), созданные на основе специализированных матсриаловелческих БД: БД по фазовым диаграммам систем с полупроводниковыми соединениями "Диаграмма". БД по свойствам акустооптических, элсюрооптических и нелинейно-оптических веществ "Кристалл", БД по свойствам тройных и четверных неорганических соединений "Фазы", БД по магнитной восприимчивости неорганических веществ «ЫетелВ», БД «ВшкЮар» по ширине запрещенной зоны. БД по свойствам неорганических соединений «ЛЮт\Уогк». Эта задача была решена с помощью создания интегрированной информационной системы ИМЕТ РАИ по свойствам неорганических веществ и материалов (Рис.2).
Рис. 2. Структура интегрированной системы ИМЕТ РАН В настоящее время разработало множество БД но свойствам веществ и технологиям их получения.
Наиболее крупными информационными ресурсами в области неорганической химии являются: «STN» (www.stn-intcrnational.dc). «Science-direct» (htip://www.sciencedircct.coin I. «American Chemical Socicty» (www.acs.org). БД патентов: «QuestcMwww.qpart.com). «United States Patent and Trademark Office» (wAsw.uspto.gov). а также российская ИС ВИНИТИ (www2.viniti.ru). Данные ИС предоставляют доступ по сети Интернет r основном к документальной информации, копиям статей, книг за определенную плату. Недостатком большинства этих ресурсов является отсутствие возможности поиска релевантной информации, так как пути решения связанны с применением методов искусственного интеллекта. Наиболее часто рассматриваются следующие классы БД:
• БД содержащие информацию по термодинамическим и термофизическим свойствам, представляют наиболее многочисленный класс;
• БД с кристаллической и кристаллохнмичсской информацией;
• БД содержащие сведения о механических (прочность, усталость, ползучесть и тд.) и электрических свойствах неорганических rciucctb и материалов.
Диаграмма по распределению основных классов БД по типу содержащейся в них информации представлена на (Рис.3)
Количество БД
Термодинамически« или термохимические свойства
Технические и технологические свойства
□ Химические и фтико-химические свойства
О Кристаллографические и кристаллохимическне свойсп
|<1чиическ1к (электрические, магнитные, оптические и т.д.) свойства 1 Другие свойства
Рис.3 Распределение БД по свойствам неорганических веществ по тематике, В работе для разработки информационной системы предложена следующая системная теоретико-множественная модель, представляющая собой иерархическое объединение ряда кортежей:
Разработка системы - <Цели. Рссурсы>(1) Здесь множество Цели включает как цели, задаваемые директивно извне, так и цели, формируемые внутри системы.
Множество глобальных целей Цгт6 разработки сложных информационных систем не достигается в результате осуществления какого-либо одного процесса; решение множества задач, приводящее к достижению пели, организуется путем их распределения (декомпозиции) по составляющим задачам системы:
Ц,т*г <//в~ш«. ¿/в»,г> (2)
<ц,. и......Цш>,
где каждое из множеств частных целей <Цм> - цели т-ой подсистемы; символ \/т обозначает отображение множества Ц,мь на множество всех т подсистем.
Множество Ресурсы обобщенно представляется в виде кортежа, состоящего из подмножеств, где ВБД- виды БД по свойствам, ПИ- проблемы интеграции, КИ -критерии интеграции и ТИ - технологии интеграции. Поэтому каждый из них в свою очередь разбивается на подмножества также описываемые в виде кортежей Тогда фрагмент системной модели в виде набора кортежей имеет вид:
Ру<урс». • ■ 8Д6. ПИ. КИ, Щ>
ебо - СТДТХ. т«г. х«*. •> / ТИ-«ГЯ-М. 1А»
/
ОЙ • <Ав. Рас. Гст> КИ . <ИК. ИО. Иит, ИА. ки>
Гсг- <МД Стр. Сс>л. МдиД Тс«.Сим»
Рис. 4. Теоретико-множественная модель в виде объединения кортежей.
(3)
где: ТДТХ - термодинамические или термохимические свойства, ТиТ -технические и технологические свойства, ХиК - химические и кристаллические свойства, Ф - физические свойства; Ав - автономность, Рас - распределенность, Гет -гетерогенность;
ИК - индекс качества программного интерфейса, ИО - индекс открытости программного интерфейса, Иинт - индекс интегрируемости приложения, ИА - индекс актуальности программного интерфейса, КИ - критерий интегрируемости;
МД - моделей данных, Стр - структурная, Сем - семантическая, МдиД -методов доступа к данным, Тех - техническая, Син - синтаксическая.
EAI - интеграция корпоративных приложений (Enterprise Application Integration), Ell -интеграция корпоративной информации (Enterprise Information Integration), ETL - программное обеспечение для извлечения, преобразования и загрузки данных (Extract, Transform, Load).
Во второй главе "Формализация консолидации информационных систем по свойствам неорганических соединений на уровне пользовательских интерфейсов" дан анализ состояния исследований в области разработки информационных систем по свойствам неорганических соединений. Выявлены основные предпосылки интегрируемости этих систем:
• доступ к информации в сети Интернет, который позволяет «доставить» необходимые и самые «свежие» данные непосредственно на рабочее место химика или материаловеда;
• экспертная оценка хранящейся информации, для которой привлекаются высококвалифицированные специалисты, что дает в руки пользователя не просто «сырую» информацию, а рекомендуемые значения;
• оснащение БД средствами анализа информации: от традиционных термодинамических расчетов и статистических процедур до современных средств поиска закономерностей в массивах данных, позволяющих прогнозировать поведение объектов и обеспечивающих принятие решений;
• интеграция БД с целью предоставления пользователю наиболее полной информации о свойствах конкретного вещества, а также для последующего анализа совокупной информации о веществах и материалах
Для оценки возможности интеграции нескольких информационных систем по свойствам неорганических соединений разработана система критериев объединения данных ИС на уровне пользовательских интерфейсов ( Табл. 1)
Таблица 1. Критерии интеграции.
Индексы Формулы Диапазон изменения Расшифровка предельных значений
индекс качества программного интерфейса (ИК) ОтО до 1 0 - отсутствие какого бы то ни было программного интерфейса
1 - наличия исчерпывающе полного (в смысле доступности прикладной функциональности) программного интерфейса
индекс открытости программного интерфейса (ИО) От 0 до 1 0 - интерфейс не опубликован
1 - опубликован интерфейс ко всем прикладным функциям приложения
Индекс интегрируемости приложения (Иинт) Иинт=ИК*ИО ОтО до 1 0 - не предусмотрено слияние с другими приложениями
1 - композитное приложение
индекс актуальности программного интерфейса (ИА) ОтО до 1 0 - программный интерфейс не соответствует текущей версии приложения
1 - полностью соответствует текущей версии приложения
критерий интегрируемости (КИ) КИ = Иинт*ИА ОтО до 1 0 - плохо интегрируемое приложение
1 - идеально интегрируемое приложение
Отметим, что, во-первых, созданная ИС по свойствам неорганических соединений должна быть оснащена интерфейсом прикладного программирования (API, Application Programming Interface), благодаря чему предоставляется возможность проведения обращений к ней извне как минимум на одном или нескольких языках программирования. Таким образом, можно ввести критерий качества программного интерфейса (ИК), который измеряется в диапазоне от О (отсутствие программного интерфейса) до 1 (исчерпывающе полный (в смысле доступности прикладной функциональности) программный интерфейс)
Во-вторых, данный программный интерфейс должен быть открыто опубликован, иначе им нельзя воспользоваться легально, таким образом, вводится индекс открытости программного интерфейса (ИО), диапазон значений данного критерия также варьируется от 0 (нет опубликованных сведений) до 1 (опубликованный интерфейс, детальность которого должна удовлетворять потребности специалиста)
В-третьих, необходимо оценить, способна ли данная ИС по свойствам неорганических соединений стать частью интеллектуальной информационной системы баз знаний, для этого необходимо умножить индекс качества программного интерфейса и индекс открытости программного интерфейса.
Иинт=ИК*ИО, где Иинт - индекс интегрируемости приложения, ИК - индекс качества программного обеспечения, ИО - индекс открытости программного интерфейса. Так как приложения по свойствам веществ и технологиям их получения постоянно модифицируются и дополняются различными функциями, то должен меняться и программный интерфейс, а изменения должны отражаться в документации по интерфейсу. Таким образом, вводится индекс актуальность программного интерфейса (ИА) с диапазоном от 0 до 1.
Следовательно, критерий интеграции (КИ) можно получить, перемножив три введенных ранее индекса, если критерий интеграции равен 1, то приложение является идеально интегрируемым.
ИС по свойствам веществ и технологиям их получения, как правило, не имеют качественной технической документации, либо она является не актуальной, что крайне затрудняет процесс интеграции подобных ИС
Выбор технологии интеграции зависит от архитектуры интегрируемой системы. Возникающие перед архитектором проблемы эффективной интеграции приложений значительно усложняются, когда в интеграционный сценарий вовлекаются уже существующие приложения.
На сегодня по литературным данным можно выделить 3 основных вида интеграции. Это интеграция корпоративных приложений (Enterprise Application Integration, EAI), интеграция корпоративной информации (Enterprise Information Integration, EII) и программное обеспечение для извлечения, преобразования и загрузки данных (Extract, Transform, Load - ETL). Принципы интеграции, заложенные в этих технологиях, используются для решения широкого круга задач: от интеграции в режиме реального времени до пакетной интеграции, и от интеграции данных до интеграции приложений. Показано, что для интеграции данных в режиме реального времени лучше всего подходит технология EII. Для пакетной интеграции данных -ETL. А для интеграции приложений, в режиме реального времени или пакетном, наиболее подходящим инструментом являются технологии, основанные на технологии EAI. Следует отметить, что ни один из существующих на сегодняшний день подходов к интеграции не способен решить все проблемы, возникающие при объединении ИС.
В третьей главе "Разработка реляционной струюуры метабазы на основе интегрируемых ИС по свойствам неорганических соединений" рассмотрена ИС для конструирования новых неорганических материалов для электронной промышленности с учетом возможности подключения японской ИС "AtomWork" посредством предложенного подхода интеграции на уровне пользовательских интерфейсов.
Разработана следующая структура (рис. 5) метабазы для объединения \Vcb-прнложеннй интегрированной ИС дня конструирования новых неорганических соединений для электронной промышленности.
В таблице 2 приведено описание таблиц метабазы.
Таблица 2. Описание таблиц метабазы.
Наименование таблиц Содержание таблиц
РВІпГо Информация об нитрируемых ИС
ІІ$сг5Іпїо, и$е«Асее$$ Информация о пользователях и их правах доступа
$умеш1пГо, РгорсгТ|Ып1о, ОВСопіспі Информация по химическим системам н нх свойствам, которая содержится в итерируемых ИС
Сі>траііЬіІіі>СІа&&е$. СотраііЬіІцу. 8уиет$2Соіш<5егІпСотраііЬіІі[у Информация об описанных в метабдое классах релевантности н определяющие релевантные хнмиїеские системы
Ме«я_ОВ8>-«ет5 Информация о химических системах и итерированных ИС. в которых есть данные системы
Меіа_5у5іет Имфсрмация о количестве химических элементов в системе
Меіа_5уяет8Ніегаг сЬу Иерархия химической системы опт минимального количества химических 'элементов до максимального
ПВЕхсМеСотраліЬіІІу 1 Информация для переключения между английской и русской версией
Загрузка информации в метабазу реализована посредствам обмена данными в формате JSON через протокол HTTP. Для разработки использовалась среда Microsoft Visual Studio 2008. Актуальность информации в метабазе поддерживается следующим образом: когда в интегрированной ИС происходят изменения, формируется JSON-документ, содержащий данную информацию. Каждый сеанс передачи данных сопровождается внесением изменений в метабазу, благодаря чему обновляется информация о пользователях и их правах, содержимом интегрируемых ресурсов,
способах доступа к ним.
Подключение японской ИС "AtomWork" вызвало необходимость модифицировать сервис поиска релевантной информации. Данный сервис предоставляет пользователям ответ на запрос релевантной информации на основе содержимого метабазы. Согласно требованиям безопасности, запрос инициируется только пользователем, имеющим права доступа на уровне метабазы, ответ - JSON-документ, который содержит найденную релевантную информацию в соответствии с уровнем прав доступа пользователя (рис. 6).
1 chemicalsystem:[{Elements:["as", "Ga"]5 , Л,
cheraicalsubstance: [[{p.arce:"As",value:1}, {name: "Ga ,value:l}] , ... J
}
Рис. 6. Фрагмент JSON-документа с описанием химических сущностей.
Ответ сервиса поиска релевантной информации, представляющей JSON-документ, выводится пользователю в виде списка гиперссылок на интегрированные ИС.
Безопасный переход пользователя из одного Web-приложения в другое осуществляется посредством системы шлюзов. Пользователь при наличии определенных прав доступа перенаправляется через шлюз метабазы (выполняет роль диспетчера безопасности) в шлюз интегрируемой ИС. Шлюз безопасности интегрируемой ИС необходим для предоставления безопасной прозрачной авторизации пользователя и предоставлении необходимой информации.
Отмечается, что схема интегрирования с использованием шлюзов является достаточно гибкой, так как политика "фильтрования" содержимого интегрируемого информационного ресурса задается настройками безопасности метабазы с последующим применением на шлюзовой странице целевой ИС в контексте конкретного Web-приложения ИС. Соответственно, учитываются модели безопасности, применяемые для индивидуальной информационной защиты интегрируемых ресурсов.
На данный момент интеграция на уровне Web-приложений проведена для российских ИС для конструирования новых неорганических материалов для
электронной промышленности: "ВагкЮар", "Диаграмма". "Кристалл", "Фгиы", "Элементы", "Кремний" н японской ИС "АЮтШогк". Благодаря интеграции японской ИС "АЮт\\'огк" удалось существенно расширить информационную базу по двойным и тройным химическим системам.
В 4-ой главе " Компьютерное конструирование неорганических соединений типа ЛЬМаСП]" рассматривается конструирование соединений состава АВХ; со структурой А1МпСи2 (фазы Гсйслсра), даннматсриалы являются перспективными магнитными материалами, так как применяются, например, при создании магнитных запоминающих устройств большой емкости.
Информационно-аналитическая система, разработанная для компьютерного анализа, включает базы данных по свойствам неор1аннческих веществ и материалов и комплекс программ распознавания образов. Анализировалась информация о 278 известных фазах Гсйслера состава АВХ}, 70 соединениях со структурой М§СиА1:, 38 соединениях со структурой ОсКпР»2, 37 соединениях со структурой У5|РЙ3. 20 соединениях со структурой N811, II соединениях со структурой РЮа(302, 10 соединениях со структурой У8|Ю»2, 16 соединениях со структурой, отличной от приведенных выше, и 486 примерах отсутствия соединений состава АВХ3 (А и В -разные элементы: X - А1, Рс, Со, N1, Си, Яи, ЯК, Рё, Ag, 1г. Р( или Ли), извлеченная из базы данных по свойствам неорганических соединений «Фазы» и «АютШогк».
Количество соединений
в А1МпСи2
■ МдСиАЛ
□ о^ЗпРгг
□ УЯР<12
■ МлТ1
в Рг<ЗаСо2
Тип структуры
Рис. 7. Диаграмма распространенности различных структурных типов интсрметаллических соединений состава АВХг
Решение поставлен ной задачи включало несколько этапов, которые представлены на рисунке 8.
Рис.8. ')1апы прогнозирования Для обучения ЭВМ использовался ряд программ распознавания образов. Процедура прогнозирования т«па кристаллической структуры иитерметаллических соединений включала два этапа
• прогнозирование химических систем А-В-Х (А и В - разные элементы: X -Мв. А1. Кс. Со. N1. Си. Ки. ЯЬ. Рё, А)*, 1г. Рт или Аи) с образованием и отсутствием соединений состава ЛВХ2;
- многоклассовое пропозирование типа кристаллической структуры (9 классов): фазы Гейслера, соединения со структурой Ыа'П, соединения со структурой соединения со структурой MgCuAІJ, соединения со структурой 0<15пР12, соединения со структурой УБ1Р<12. соединения со структурой РтОаСЧ»!. соединения со структурой, отличной от приведенных выше, и отсутствие соединений состава АВХ5. Фрагмент таблицы прогноза приведен в таблице 3.
Таблица 3. Фрагмент таблицы прогноза типа кристаллической структуры
соединений состава АВКи:
* н и в* ме Л1М «с т> V О Мп Ге Со Со /о Со Сс V 1х ■чь Л(ко М>
V Ь |5 3 9 3
и » 9 9 9 9 )
» ч •9 9 9 9 9 9 9 9 9 f9
1М 9 9 9 9 9 9 9 9 » 9 7 9 » 9
9 > »9 9 9 Ч 9 Ч ■9
|п » 1 9 9 9 9
Чл 9 ч «1 9 9
• 1 9 9 9 9 9 3 9 9
1 > 3 3 9 9 У р
9 7 3
Р, 3 7 7 3
N<1 » 7 3 3 7 3
Рш 1 9 3 7 3
5 т 3 3 7 7 3 3
Гц !. 1 5 7 7 3 3 _
Использованы следующие обозначения: 1 - соединение с кристаллической структурой фаз Гейслера; 2 - соединение со структурой NaTl; 3 - соединение со структурой YSiRh2; 4 - соединения со структурой MgCuAl2; 5 - соединения со структурой GdSnPt2, 6 - соединения со структурой YSiPd2; 7 - соединение со структурой PrGaCo2; 8 - соединения со структурой, отличной от приведенных выше, и 9 - отсутствие соединений состава АВХ2. Значком # обозначены изученные системы, информация о которых использована для обучения ЭВМ. Пустые клетки соответствуют несовпадениям прогнозов, полученным на разных этапах прогнозирования.
Возможности прогнозирования с использованием интегрированной ИС были продемонстрированы при решении задач компьютерного конструирования еще не полученных фаз Гейслера, перспективных для поиска новых материалов для магнитных запоминающих устройств.
Заключение
В диссертационной работе получены следующие результаты:
• проведен системный анализ этапов разработки структурной схемы системы принятия решений при прогнозировании средствами компьютерного конструирования неорганических соединений, что позволило модернизировать интегрированную систему;
• разработана теоретико-множественная модель поиска релевантной информации в информационных системах по свойствам неорганических соединений;
• разработана система критериев оценки интегрируемых информационных систем по свойствам неорганических соединений, которая позволила оптимизировать технологию разработки информационной системы;
• разработана реляционная структура метабазы для интеграции ИС: «Кристалл», «Фазы», «Диаграмма», «BandGap», «Elements» и «AtomWork» (Япония), позволившая консолидировать информацию по свойствам неорганических соединений;
• разработана методика использования созданной интегрированной ИС для прогнозирования свойств неорганических соединений, что позволило дать прогноз соединения АВХ2, для производства магнитных запоминающих устройств большой емкости.
Основные публикации по теме диссертации
СТАТЬИ В ЖУРНАЛАХ, РЕКОМЕНДОВАННЫХ ВАК ДЛЯ ОПУБЛИКОВАНИЯ
РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННЫХ РАБОТ
1. Шмакова Е. Г., Оптимизация поиска информации в БД по химии и химическим технологиям. Разработка механизма унификации химических систем. / Шмакова Е.Г., Корнюшко В.Ф. // Вестник МИТХТ, т.7, №1, 2012.
2. Киселева Е.Г. Интеграция информационных БД в химии и химических технологиях для оптимизации поиска информации// «В мире научных открытий», Выпуск 2, Красноярск, 2011.
3. Шмакова Е.Г. Методика компьютерного эксперимента с целью поиска перспективных неорганических веществ. / Шмакова Е.Г., Дударев В.А. // Технологии 21 века в легкой промышленности. №7 (2013) часть 1, часть 2.
СТАТЬИ И ТЕЗИСЫ ДОКЛАДОВ:
1. Киселева Е. Г. Подходы к интеграции информационных БД в химии и химических технологиях для оптимизации поиска информации. / Киселева Е. Г., Корнюшко В. Ф. // Инновационные и информационные технологии в образовании, экономике, бизнесе и праве. Под редакцией Федоровой И. Ю., Макеевой О. В. Сборник научных трудов, №6 М.:Издательство «Перо», 2011 - стр. 124-126.
2. Шмакова Е. Г., Комплексный подход к интеграции информационных БД в химии и химических технологиях для поддержки принятия решений при выборе
. используемого вещества. / Шмакова Е. Г. // VIII Российская ежегодная конференция молодых научных сотрудников и аспирантов «Физико-химия и технология неорганических материалов» - сборник материалов. — М: ИМЕТ РАН, 2011г., стр. 231-233.
3. Шмакова Е. Г., Интеграция баз данных. Классификация основных подходов. Консолидация понятий. / Шмакова Е. Г. // Актуальные вопросы современной науки. Материалы XV Международной научно-практической конференции: Сборник научных трудов / Под ред. Д. пед. Н., проф. И.А. Рудаковой. - М.: Издательство «Спутник +», 2012. стр. 291-293.
4. Шмакова Е. Г., Методы интеграции баз данных. / Шмакова Е. Г. // Наука, образование, общество: проблемы и перспективы развития: сборник научных трудов по материалам Международной научно-практической конференции 29 марта 2013г.: в 10 частях. Часть 1; М-во обр. и науки РФ. Тамбов: Изд-во ТРОО «Бизнес-Наука-Общество», 2013., стр. 165-166.
5. Шмакова Е. Г. Интеграции ИС в области химической промышленности. Проблемы интеграции. Индекс интегрируемости / Шмакова Е. Г. // Современные научные исследования и инновации. - Сентябрь 2013. - № 9 [Электронный ресурс]. URL: http://web.snauka.rii/issues/2013/09/26324
6. Шмакова Е. Г., Интеграция информационных баз данных в химии и химических технологиях. Единая точка входа. / Шмакова Е. Г. // X Российская ежегодная конференция молодых научных сотрудников и аспирантов «Физико-химия и технология неорганических материалов» - сборник материалов. - М: ИМЕТ РАН, 2013г.
Подписано в печать 15.10.2013 Объем: 1,0 п.л. Тираж: 100 экз. Заказ №209 Отпечатано в типографии «Реглет» 119526, г. Москва, пр-т Вернадского, д. 39 (495) 363-78-90; www.reglet.ru
-
Похожие работы
- Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ
- Интеграция баз данных для информационной поддержки принятия решений в области неорганического материаловедения на основе технологии хранилищ данных
- Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений
- Интеграция автономных источников данных для прогнозирования свойств неорганических веществ
- Интеграция данных по свойствам неорганических веществ из гетерогенных источников для информационной поддержки принятия решений при компьютерном конструировании неорганических соединений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность