автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Комплекс алгоритмов и программ для поиска структурных аналогов кристаллических веществ по дифракционным данным

кандидата технических наук
Ковязин, Сергей Афанасьевич
город
Красноярск
год
1993
специальность ВАК РФ
05.13.18
Автореферат по информатике, вычислительной технике и управлению на тему «Комплекс алгоритмов и программ для поиска структурных аналогов кристаллических веществ по дифракционным данным»

Автореферат диссертации по теме "Комплекс алгоритмов и программ для поиска структурных аналогов кристаллических веществ по дифракционным данным"

РГ6 од

~ ! Ш!! МИНИСТЕРСТВО НАУКИ, ВЫСШЕЙ школы

И ТЕХНИЧЕСКОЙ ПОЛИТИКИ РОССИЙСКОЙ ФЕДЕРАЦИИ КРАСНОЯРСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ

На правах рукописи

Ковазпн Сергей Афапасьевнч

УДК 548,734:681.3.0«

КОМПЛЕКС АЛГОРИТМОВ И ПРОГРАММ ДЛЯ ПОИСКА СТРУКТУРНЫХ АНАЛОГОВ КРИСТАЛЛИЧЕСКИХ ВЕЩЕСТВ ПО ДИФРАКЦИОННЫМ ДАННЫМ

05.13.18 — теоретические оеяошд математического моделирования, чнсяенлые методы п комплексы программ

АВТОРЕФЕРАТ диссертации па соискание ученой степени кандидата техигртескшс паук

Красноярск — 1993

Рабата вьшолпсна в Вычислительном центре СО РАН в г.Красноярск«

Научные руководители: доктор фазжсо-математнческпх наук,

профессор Федотов А.М.,

кандидат химических наук Киркк С.Д.

Официальные ониошшты: доктор технических наук,

профессор Охорзяп В.А.,

кандидат фшпко-математпчеекго: наук Месюль C.B.

Ведущая организация: Вычислительный дептр СО РАИ

(г. Новосибирск)

Защита состоится иШ» ШШ-тгг. в 'JJE час. Ой мин. на заседании Сяецналпзировашюго совета Д 034.54.01 при Красноярском политехническом институте (Красноярск 74, ул. Кпренского 26, КрПИ)

С диссертацией можно ознакомиться в библиотека Красноярского политехнического института.

Отзывы на автореферат о двух экземплярах, заверенные печатью учреждения, просим высылать по адресу: 660049, г. Крассоярск 49, ул. Ленина ТО, ученшу секретарю Спедсовста.

Автореферат разослан ^Я 1993г.

Ученый секретарь Спещштзировашюго совета

к.т.ч. Кочетков B.IÏ.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Большое количество накопленных экспериментальных пашшх реитгенструктурггого анализа делает необходимым разработку математических методов и пакетов программ, напелениых па использование этих данных й практических задачах. Развитие вычислительной техники позволило создать и активно использовать компьютерные хранилища экспериментальной информации, п, в частности, базы рептгепдпфракцштшх дацпьпс. Базы порошковых реитгенднфракциошшх дашшх чаще всего применяются для решения задач идентификации. Для этой цели п последппе десятилетия созданы многочисленные пакеты программ — автоматизированные системы идентификации, ориентированные па поиск компонент исследуемого материала среди известных веществ.

Прп шучеппл материалов, компоненты которых представляют собой нопые вещества н поэтому не представлены в известных базах дашшх, существующие системы идентификации неприменимы. 13 исследования таких материалов может ОЕазать большую помощь информация о структурных аналогах их компонент. Таким образом, возникает необходимость поиска структурных аналогов вещества по его реитгепдифракццоштаму спектру.

Автоматизированные поисковые системы в базах дифракционных дапшлх, способные найти структурные аналога исследуемого саде-ства, называются структурно-чувствительными. За рубежом предпринят ряд попытох создания тагах систем (в частности в работах Л.Фривела), что подтверждает актуальность данной проблемы. Такие системы могут быть использованы при решении самых разных задач, а том числа при расшифровке неизвестной структуры по спектру, идентификации твердых растворов, идентификации веществ, зарегистрированных п нестандартных условиях, и т.п. Отлинптельшй чертой подхода к создагово структурно-чувствительной поисковой системы, примененного в настоящей диссертационной работе, является использование феномена визуального сходства рептгепдпфракщгсппых спектров у близких по строению веществ.

Цель работы. Целью настоящей диссертационной работы является: I) разработка теоретических основ для определения подобия рентгепдпфракцпонпых спектров; 2) построение алгоритмов сравнения спектров, предназначенных для выявления подобия кристаллических

структур; 3) создание па базе указанных алгоритмов комплекса программ — автоматизированной структурно-чувствнтельпой поисковой системы, работ, .ощей с банком днфракцпоппых даппых.

Научная новизна результатов работы состоит в следующем.

1. Реализован алгоритмический подход к поиску структурных аналогов исследуемого вещества, опирающийся па подобие реятгеп-дифракцнояиых спектров.

2. Разработаны методы п алгоритмы количественной оценки степени сходства спектров.

С. Построены алгоритмы сравнения спектров ца основе теории распознавания образов.

4. Созданы две автоматизированные поисковые снстешл в базах релтгеыдифракцпояаых данных для БС ЭВМ к IBM PC, ко имеющие известных аналогов.

Основные научные иоложехшя, выносимые на защиту:

— теоретическое обоспгтатптс количественной оценки степени визуального сходства реиттагднфратащонных спектров;

— алгоритмы сравнения рентгенднфракщкшных снехтров, определяющие их подобие методами теория распознавания образов;

— методология п практическая реализация в виде ко2,шлехсоа программ структурно-чувствительных поисковых систем в базе рептгеп-днфракщюяных данных.

. Методы исследования. В диссертации использовались эвристические и статистические методы теоршх распознавания образов, методы математического моделирования процессов принятия решений, вычислительный эксперимент. Экспериментальные материалы (базы реЕтгскдифрахщюнаых дапхшх, тестируемые спектры, обучающие-выборки) были предоставлены для данной работы ИХХМП СО РАН в г.Красноярскс.

Практг icciii л ценность» Практический результатом диссертационной работы явилось создание поисковые структурно-чувства-телышх CHCTeivi для ЭВМ -ерхш ЕС н персонального компьютера IBM PC. Указанные системы прошли всестороннее испытание в ракк&х совместных работ с ЙХХМП СО РАН в г.Красноярске, о чем говорят соответствующие акты о присядке. Результаты расчетов были представлены с- согласия автора в ;.;оцограф;ш М.С.Нахмансона и В.Г.Феклнчева "Диагностика состава материалов рептгенддфрахцн-

опнымп и спектральными истодами" — JI.: Машиностроение. Ле-шшгр. отделение, 1990. — 357 с. Разработанные поисковые системы являются нопьш инструментом для исследования твердых материалов и могут быть применены в работе как научных учреждений, так и производственных предприятий.

Апробация работы. Основные результаты работы были дота-жены на международных и всесоюзных симпозиумах, конференциях п совещаниях. Среди ннх:

— 10 Всесоюзное сопегцапис во рентгенография минерального сырья, Тбилиси, 198G;

— 9 Всесоюзное совещание по физическим и математическим методам в координатной химии, Новосибирск, 1S8G;

— 2 Всесоюзная конференция "Аатоматшнрошшиме системы обработки изобразкетшй", Львов, 1986;

— 11 Всесоюзное совещание по рентгенографии минерального сирь-л, Свердловск, 108!);

— Всесоюзная конференция "Условно корректные задачи математической физики", Алма-Ата, 1989;

— 1 Всесоюзная конференция "Распознавание сбразоп п анализ изо бражепнн: новые информационные технологии", Минск, 1091;

— 12 Всесоюзное совещание по рентгенографии минерального сырья, Сочи, 1092;

— 0 Всесоюзная конференция "Химическая информатика", Черноголовка, 1992;

— 14 International Congress of Crystallography, Australia, Pert, 1087;

— 12 European Crystallograpliic meeting, Moscow, 1989;— 13 Hungarian diffraction conference, Budapest, 1989;

— 2 European Powder Diffraction Conference, Enscliede, Nether land.-?, 1992.

Работа докладывалась иа научных семинарах йпетитута физики СО РАН н Вычислительного центра СО РАН в г.Красноярске.

Публикации. По тема диссертации опубликовала 18 печатных работ. Список работ приведен в конце автореферата.

Структура и объем диссертации. Диссертация состоит нэ введения, четырех глав, заключения, списка литературы п двух приложений. Работа содержит 150 страниц машииоииспого текста, 23 рисунка, 3 таблицы, список литературы из 59 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Введение содержит общую характеристику, краткое содержание и выводы диссертации.

В ГЛАВЕ 1 дапа постановка задачи и сформулирован подход к ее решению, сделан обзор работ в области исследования.

Замечено, что рентгещшфракниошше спектры близких но строению соединений зачастую обладают визуальным подобном, проявляющемся в сходном чередовании линий, которое легко устанавливается '-иениалистом но расшифровке кристаллических структур. Эта особенность нашла применение в "методе подбора изоструктурного соединения" где, опираясь на визуальное подобие спектров, произ-в< интся перепое характеристик известного спектра на изучаемый. Полученная таким способом шгфор иадшг в значительной степени облегчает установление элементарной ячейки н полной кристаллической структуры. Главной трудностью данного метода является подбор подходящего аналога. Этот процесс включает не только трудно формализуемую деятельность исследователя, определяющего визуальное подобие спектров и формулирующего гипотезу о подобии структур, по и рутинный ручной перебор многих сотен и тысяч карточек эталонов и пх сопоставление.

В работах Финка (1970), Мортопа н Голда (1970), Штурмана (1974) бы: и созданы методы для облегчения поиска аналогов, но эти методы оставались "ручными" по характеру выполнения. Фрпвел с соавторами (1982, 1986) создали структурно-чувствительную поисковую процедуру, способную находить в базе дифракционных данных структурные аналоги изучаемого вещества, основанную на понятны парного индекса рептгещшфракшюдного спектра. Надо отметить, что в парной индексе заключена лишь небо-иная часть информации о спектре, не отражающая его визуальный образ в целом.

В диссертации ставится задача автоматизации поиска структурных аналогог изучаемого вещества па основе факта сходства спектров у близких по строению соединений. Требуется научить ЭВМ определять подобие спектров примерно так, как это делает человек, и отыскивать в базе дифракционных данных те спектры, которые наиболее похожи на исследуемый. Тем самым будут найдены вероятные структурные аа доги, саисок которых должен быть предъявлен специалисту для дальнейшей работы.

Отличительной чертой предлагаемого подхода является прп-менение методов теории распознавания образов для моделирования действий эксперта, сравнивающего спектры. Предлагается построить алгоритм, способный отнести пару сравниваемых спектров либо к Классу 1 - пар похожих спектров, либо к классу 2 - пар непохожих спектров, и дать количественную оценку степени сходства, которую можно было бы применить при отборе спектров из базы данных.

В в диссертация строятся б количественных критериев сходства спектров, каждый из которых выявляет какие-то частные аспекты подобия. Критерий сходства - это алгоритмически вычислимая функция, ставящая п соответствие любой паре спектров неотрицательное число между 0 и 1. Чем больше это число, тем менее похожи сравниваемые спектры.

Построены поисковые алгоритмы двух типов. Ллгорпти первичного отбора состоит в вычислении одного из критериев сходства для тестируемого спектра п спектров из базы данных и отборе заданного числа спектров с паимеиыиими значениями критерия. Алгоритм вторичного отбора обрабатывает не всю базу данных, а объединенный список спектров, выбранных с помощью разных критериев при первичном отборе. Прп этом осуществляется классификация пары из тестируемого п эталонного спектров в новом признаковом пространстве, в котором признаками служат значения критериев сходства. Кроме того, для этой пары вычисляется эпачение комбинированного критерия сходства и виде некоторой функции от значений исходных критериев. Спектры с наименьшими значениями комбинированного критерия передаются эксперту для выявления возможных структурных аналогов изучаемого вещества.

ГЛАВА 2 содержит описание критериев сходства спектров »'s, '"£> rJh гм> го fco и алгоритмов их вычисления.

Исходное описание спектра, содержащееся п базе рентгепди-фракднонных даппых, представляет собой последовательность нар чисел {(Xj,Yj)}, j=l,...,n. Число X,- - положение липни помер j, измеренное в ангстремах в шкале межплоскоетных расстояний, Yj -относительная интенсивность лишш помер j. Липни пронумерованы в порядке убывания их положений.

Первые два критерия, пазваппые "интегральным критерием" г$

п "критерием Лева" г/, осповапы па продставлеппи о спектре как о дискретном вероятностном распределении интенсивности я на сравнения функций распределения, соответствующих двум спектрам. Перед сравнением спектры подвергаются нормировке, в результате которой распределение линейными преобразованиями приводится к распределению с единичной суммарной интенсивностью, пулевым средним и единичной дисперсией.

В качестве критериев сходства двух спектров, которым соответствуют функции нормированных распределений интенсивности а ¡Г2 предлагаются вероятностные метрики т$ (интеграл модуля разности) и Г1 (рассто-тпие Леви). Критерии гх и т$ эффективны дг т определения сходства иизкосшлмстрпшшх соединении с большим числом линий, но чувствительны к р~вднчиям в способе регистрации п области съемки спектров. Для устранения этого предлагаются две их модификация - критерии г|.аг и г™г. Она позволяют определить сходство снсктров, если оно выражено в подобии правых частей спектров. В диссертации построены алгоритмы вычисления критериев Г1 и гд с числом оаеранпй, п ропорцион аль и ым общему числу линий сравниваемых спектров.

Перед вычислением остальных ..ритериев спектры подвергаются преобразованию, названному "цензурированием", которое состоит в слиянии некоторых очень близко расположенных линий п последующем отбрасывании лишш с относительно слабой интенсивностью. Цензурирование облегчает установление соответствия между лшшямп сравниваемых спектров. •

"Критерий Хаусдорфа" г я построен по отдаленной аналогии с расстоянием Хаусдорфа между замкнутыми множествами в метрическом пространство. Пусть } = 1,...,п, з = 1,..., п* - девзурировапные в нормированные описания двух спектров. В качестве значения критерия выбирается число гц = 1/(г1 + п)/2, где

» »*

гз = У) • щпрц, * = пипр<,-,

рц = - х:)3 4- (1 - 7)№ ~ г;)\ 0<7<1.

Число 7 - параметр к. итерия. При 7 близком к 1 критерий улавливает только сходство в расположении линий; при 7 близком * О критерий

определяет сходство и чередовании нитспспшгостей.

"Критерий пропорций" гм опирается на систему инвариантных признаков X} п Ту, характеризующих пропорции п относительном положении линий спектра. Пусть {(А'у,Ку)}, з — 1,...,п - преобразованное описание спектра, полученное п результате цензурирования. Введем обозначения:

^ ч+И 1 V (у V \

у. __¡Ху+1 - А',] г __ У^ 4- +

3 - + - Х,-нГ ; 1 V,3/,, , ,, , V /

У--1

Пусть для двух спеьтров числа Ь'?, Т/, 17у, 1Г,-, и

Лу, Ту, Уу*, И", ; — 1...., я * определены вышеуказанным обрадад. Пусть к = тт(п,п*), и предположим, что Ь > 3. Значение критерия г,ч определяется по формулам

Г« = [(1 - 7) Е ¡ъ - 2*\" ■ * + ^ Е № - г/Г • у=з у=|

4 „ +

- --, - ---.

Е + Ур" Е + *'/;)*

Параметры 7, р, д таковы, что 0 < 7 < 1, р > 1, q > 0. Параметр 7 имеет тот же смысл, что и в критерии Гц. Чем больше р, тем более критерий чувствителен к максимальному локальному несходству спектров. Чем больше q, гол больший вклад в критерии вносят несходство в чередовании питеясипных лилий.

Следующий критерий г с назван "критерием оптнмалыюго совмещения". Пусть {(А'/,У,)}, ¿«1,...,«, {(А';,У/)>, -делзурправашше описания двух спектров, к — пнв(л,п*), Выделим в ка;кдом из спектров к первых липпй и рассмотрим следующие векторы в пространстве Ц*: X = (Хи...,Хк), У = 1 = (1.-...1). Аналогично определяются векторы Xм и У* для второго спектра. Пусть и - двумерная полуплоскость в Л1:, содержащая подпространство, порожденное вектором 1, и луч, натянутый на вектор X, а

U* ~ аналогичная полуплоскость для вектора X*. Синус угла ах между полуплоскостями U a V являете* числовой характеристикой сходства спектров по наложению линий. Аналогично, si пак. где ау - угол между векторами Y и У* - это числовая характеристика сходства спектров по значениям интенсивностей. Значение критерия тс определяется как

re - \fl ■ »in3 ах + (1 - у) • sin3 ау (0 < j < 1),

В диссертации дан алгоритм вычисления критерия гр- Параметр -у имеет тот же смысл, что и в критерии гц.

Критерий тсо построен с целью сокращения» времепи поиска д/р тех баз данных, в которых спектры хранятся упорядоченными не по убыванию положений линий, ? по убыванию интенсивностей. Значение критерия г со равно значению критерия г с, вычисленному при условии, что взаташо-однозначное соответствие между линиями спектров установлено по рангу интенсивности.

Критерии Гц, тм, г с ш тсо оказались эффективными для определения подобия спектров с изолированными интенсивными линиями, характерными для высокосимметричных соединений. Наличие параметров позволяет гибко нацелйве :ъ эти критерии на выявление заданных аспектов скодства.

В ГЛАВЕ 3 описаны алгоритмы сравнения спектров, основанные на вычислении критериев из второй главы.

Предполагается, что имеется обучающая последовательность {ö»'}»=i,...,m aap спектров класса 1, которые эксперт классифицирует как похожие, и последовательность {6г}>ъi,.„,» пар спектров класса 2, влассафжшруешдх. как пары непохожих спектров."

Алгоритм первичного отбора, определяющий сходство двух спектров, состоит в вьхчиу-дешш одного пз вышеописанных критериев для этих спектров и сравнении полученного чис..а с некоторым пороговым значением. Если г .аченне критерия выше порога, алгоритм квалифицирует спектры как непохожие. В противном случае числовое значение критерия является количественной оценкой степени сходства.

Для определен?" оптимального, порога и араметров критерия г предлагается оценка его эффективности к2(г) = infs>o ¿че),

представляющая собой мишшум функции эмпирического риска от

использования порога е,

*(«> = £й(г(а<) _ е>+^ ¿(1 _ *(г(ь,) „ с)),

где 6 - функция Хевисайда: = 1 при х > 0 а в(х) = 0 при х < О, Л¿^ - потери "т отнесения нары к клессу *, при условии, что она принадлежит классу з% — оценка априорной вероятности появления пары класса »', Оптимальный порог для критерия г находится минимизацией функции &. Оптимальный набор нарыаетров критерия г находится путем мивнмнзашш оценки эффективности ¿3(г)

Многокритериальный алгоритм сравпехшя спектров, используемый на этапе вторичного отбора, состоит в отнесении пары снектров а к классу ¿(г»(а),...,г^(а)) и вычнследни комбинированного критерия сходства г(о) = /(Г}(а),... ,гц-(а)), где - фнксировантай набор критериев, с1 - некоторое решающее правило, а / - монотонная функция. В диссертации дается постановка задача пояска оптимального решающего правила, минимизирующего функционал

эмпирического риска в априорно заданном кд; осе монотонпых ре-о

шающих правил, а также постановка задачи пояска отго'мальноя фушпдш /. Для практического применения предложен эвристический подход к построению многокритериального алгоритма, иозссля'оншЛ технически облегчить эту задачу.

При этой подходе область определения функшш / делится на два множества - множество высокой степени <- ¡одета я дополнение ж нему £2г. Функция / определяется на них так:

Нал 31Ачь(хи. .,*»).

где А, В и С — неотрицательные константы в сумме равные .!. Функции <¿>1, 'рз и <р$ конструируются таким образом, чтобы фупхпия / обладала рядом заданных свойств: была моватопно пеубывающей, росла достаточно быстро с ростом своих аргументов, имела относительно малые значения в области » та! же в области группирования векторов обучающей последовательности, привадложанви к классу 1, и относительно большие значения в области группирования некторов класса 2. Для комбинированного критерия опредутиется

оьпшадышз порог, в соответствии с которым произподнтся классификация пари сиестров, таким же образом, как и в алгоритме первичного отбора.

В диссертации практически реализован многокритериальный алгоритм, основанный на трех критериях г д./, г<?, н г|аг. На контрольной выборке naji спектров показано, что значение оценки эффективности кампшшровч того критерии лучше соответствующих значений для исходных < рнтеркев.

ГЛА1ЛЛ 4 содержит оиисашю двух вариантов структурно-чув-стиптольиои поясьово! системы (по-английски — Stiucture-Sensitive Seaioh System, сокращение SSSS). Первая реализовака в виде комплекса программ дня ЭВМ ЕС-1001 с операционной системой ОС ЕС в режиме пасетпой обработки заданий. Система названа SSSS (ОС ЕС). Вторая система, назвгшиаа SSSS (IBM PC) представляет собой программу для персонального компьютера IBM PC/AT.

Структурно-чувствительная поисковая система SSSS (ОС ЕС) представляет собой комплекс программ н цаборов данных да магнитных дисках, работа с которыми. осуществляется средствами языка уцравленая заданиями одерацношюй системы ОС ЕС ЭВМ. Программы написаны на языке ФОРТРАН—4. В системе имеется возможность использования всех оаисашшх алгоритмов сравнения спектров. Он » включает в себя следующие компоненты.

1.Tpir <т ы рештеи дифракционных данных различного состава, объешзд ь 2300, 8000, и 38000 спектров, содержащие частично и структурную информацию ц представляющие собой иаборы данных с последовательной ортошзацяей.

2. Комплелс программ, хранящихся в библиотеке загрузочных модулей,

3. Текстовая библиотека для хранешш исходных данных н заданий па выполнение программ.

4. Вспомогательные файлы, служащие для хранения обучающей информации и информации о результатах первичного отбора.

Библиотека загрузочных модулей содержит программу первичного отбора, программу преобразования обучающей информации, программу вторичного отбора, программу распечатки стандартных карточек веществ, две программы визуализации результатов отбора с по-

мощью графопостроителя. Каждая из этих программ имеет спой набор управляющих параметров, являющихся пходпыми данными. Затек программ и подключение необходимых наборов данных осуществляется средствами языка управления заданиями ОС ЕС. Программы системы используют подпрограммы вычисления критерием, визуализации спектров и распечатки структурной информации. Г$ разделах текстовой библиотеки хранится часть вспомогательных фаллов, па-боры управляющих карч- и и хинных иплпых для запуска загрузочных модулей.

Работа с системой SSSS (ОС ЕС) производятся гл^дуюпшм образом. Спектр исследуемого вещества, слшсьппе'шй положениями н питспспвнастямн линий, вводится среди входных данных программы первичного отбора. Сначала с е<? помощью ведется перитшьм отбор сн1 строи из одной пз трех баз данных по одному пз тпостп критериев. Результаты отбора заданного числа спектров вносятся в файл-накопитель. Этот процесс может ¡t таторятьсч с рттшмп критериями, разными значениями их параметров и разными базами данных. Результаты каждого расчета могут быть визуализированы на АЦПУ, пли с помощью графопостроителя. fia этапе вторичного отбор;? из файла-накопителя выбирается заданное число эталонных спектров с наименьшими значениями комбинированного критерия. Эти спектры визуализируются п подвергаются визуальному контролю. Полная информация о выбрапных веществах распечатывается в виде стандартных карточек.

Практическое использование системы PSSS (ОС ЕС) показало, что опа является эффективным инструментом поиска структурных аналогов исследуемых веществ. Время первичпого отбора на Э1Ш ЕС-1061 зависит от критерия и числа лилий в тестируемом спектре. Например, для критерия гц оно составляет около 30-3-5 се уп,п для базы данных 1, причем скорость просмотра базы данных равш> примерно 100 веществ в секунду. Время вторичного отбора составляет от 5 до 10 секунд при длине обучающей лослсдо..ательпости о¡cc.ro 250 пар спектров. На "асунке I изображен типичный вил получаемых результатов. Основным лимитирующим моментос в работе системы является п. эцесс визуализация, который требует белее современны* вычислительных средств.

Поисковая система SSSS (IBM PC) представляет собой про-

СХОДНЫЙ СПЕКТР

I

Ш

о

'ЗА

РЕЗУЛЬТАТ (¡СБОРА А1!

РВ

,-" 1 г

<11?,05,РТ)

о--г

РТ

и

и»02

РЙ

¿^кД,,,

л--

си

г

- 14 -ИСХОДНЫЙ СПЕКТР АС»1

I

•<А

РЕЗУЛЬТАТ ОТБОРА Н2»0

С0»5Е

О ' 1 '4

(7NO.-i3MNO.6irE

0 ЫИ' 1Н ы

' 51*С(2Н)

цА^.

ИСХОДНЫЙ РЕ5«04 СПЕКТР 1

РЕЗУЛЬТАТ гы'ГЕг* ОТБОРА и

0 Т ' на»а12« ьЛ, I . 04 1, , 1,

N1*0025'' 1и (■ } 1 , .

0 ' • !кИ 1, 4 1 , 1,

0 ' НЙ"ГЕ2« 1 04

0 ' ' ., »^»(К. 1. 4 1 , •

0 г . гег«Т1«< „—Дд- Э4

з

Рис.1 'Гшшчиый вид результатов отбора, получаемых с помощью поисковой системы ЕС).

грамму для персонального компьютера IBM PC/AT с монитором типа EGA н операционной системой MS DOS. Программа написала па языке Паскаль. Текст программы вместе со всеми процедурами занимает ояото 130 Кб. В пей ревизован алгоритм первичного отбора по критерию га/. Имеется возможность работы с любой базой данных, записанной требуемым образом п файл на жестком доске компьютера. Диалог с пользователем ведете;! па русском или английском языке по его выбору. Система управляется посредством иерархии меню. С помощью системы можно проделать следующие действия.

1. Осуществить просмотр описания любого вещества из используемой базы данных и изображение его рептгендифракц-опнопо спектра.

2. Ввести с клавиатуры тестируемый спектр н, если необходима, поместить его в архив входных данных; ввести в качестве тестируемого один из спектров базы данных; взять тестируемый спектр из архива, если он был ранее туда помещен.

3. Изменить принятые по умолчанию параметры критерия гм-

4. Осуществить попек заданного числа эталонных спектров с наименьшими значениями критерия.

¡9. Просмотреть результаты поиска, сравнивая на экране тестируемый спектр с очередным найденным эталонным спектром; отбросить найденные спектры, непохожие па тестируемый; осуществить обзорный просмотр, в результате которого па одном экране выводятся изображения тестируемого л эталонных спектров в количестве до 3 эталонпых.

6. Получить информацию о структуре выбранных веществ.

Эксплуатация системы SSSS (IBM PC) показала ее болыгоп удобство. Скорость вычисления для компьютера IBM PC / AT с тактовой частотой 16 Мгц составляет около 10 значений критерия т> секунду.

В конце главы приведены примеры результатов поиска иопобных спектров с помощью системы SSSS (ОС ЕС), и лапа ш iратная интерпретация.

В заключении рассматриваются перспеятиьы возможного витяя идей и методов диссертационной работы.

Приложение 1 содержит описание комплекса подпрограмм поисковой системы для ЭВМ EC-1G61. Приложение 2 содержит теист

программы первичного отбора этой системы.

ВЫВОДЫ.

В результате проведенных исследований получены следующие основные теоретические к практические результаты.

1. Предложены С количественных критериев визуального сходства спектр даны алгоритмы их вычисления.

2. Построены алгоритмы сравнения спектров, определяющие их подобие по ,иачешж> одного критерия.

3. Дана схема построения многокритериального алгоритма сравнения спектров па основе теории распознавания образов.

4. Построен эвристический многокритериальный алгоритм сравнения сиехгрои.

5. Предложен подход к созданию структурно-чувствительной поисковой системы, сочетающий использование построенных алгоритмов И эрудиции специалиста-пользователя.

6. Созданы структурио:чувствительные поисковые системы в базе рентгендифракциошшх даипых для ЕС ЭВМ н персонального компьютера IBM PC.

7. При пснальзопаиии созданных систем проведены расчеты по поиску аналогов реальных твердых материалов.

Осиовн е содержание диссертации опубликовано в следующих работах.

1. Кнрик С.Д., Ковязин С.А., Федотов A.M. Формулировка способов и критериев сравк. идя рентгендафракдионных спектров родственных по кристаллической структуре веществ // Материалы 10 Всесоюзного совещания по рентгенографии минерального сырья — Тбилиси, 1986. — С. 67-68.

2. Кирш; С.Д., Ковязин С.А., Федотов A.M. Алгоритмы, определяющие подобие порошковых днфрактограмм в задаче расшифровки кристаллических структур. — Препринт / ВЦ СО АН СССР, N £>. — Красноярск, 1987. — 40 с.

3. Кирик С.Д., Ковязин С.А., Федотов A.M. Методика и критерии сравнения рентгендпфракщюхшых спектров // 9 Всесоюзное совещание по физическим и математическим методам в координатной химии. Тезисы докладов. — Новосибирск, 1987, — С. 93,

4. Кирик С.Д., Ковязип С.А., Федотов A.M. Некоторые формализованные критерии подобия рентгендяфракщгопных спектров. // Доклады ЛН СССР. — 198S. — Т. 300, N 3 — С.614-01Л

5. Кприк С.Д., Ковязпи С.А., Федотов Л.М. Подход к сравнению и классификации рентггпдифракционных спектров ро /,ствеппых по кристаллической структуре веществ // Методы дифракционных исследований кристаллических материалов. — Новосибирск, Наука, 1989. — С.87-95.

6. Кирик С.Д., Ковязип С.Л., Федотов Л.М. Формализованные критерии визуального сходства рентгснднфракгркятых спектров // Динамика химических и биологических систем. — Новосибирск, Наука, 1089. — C.i.92-139.

7. Кирик С.Д., Ковязип С.Л., Федотов A.M. Система автоматизированного структурно-чувствительного поиска порошковых рептге-погрг-пм // Материалы 11 Всесоюзпого совещаппя по рентгенография минерального сырья — Свердловск, 1989. — 'ГЛ. — С.65.

. 8. Кирик СЛ., Ковязип С.А., Федотов A.M. Восстановление электронной ллотлости порошковых кристаллических веществ по данным высокочастотного рассеяния. // Условно-корректные задачи математической физики. Тезисы Всесоюзной конференции (2-0 октября 1989г., Алма-Ата) — Красноярск: ВЦ СО АН «СССР, 1989. — С.54.

9. Кирик С.Д., Ковязпв С.А., Федотов A.M. Методы распознавания образов в анализе рснтггяяифраккиоотхызг сне/строп кристаллических веществ // I Всесоюзная конференция "Распознавание образов п анализ изображений: позые информационные технологии". Тезисы докладов. — Минск, 1991. — 4.4. — С.78-81.

10. Кнряк С.Д., Ковязип С.А., Федотов A.M. Опит прнменепля распознавания образов к порошковым рс зтгеплнфракщюшгьш данным, //9 Всесоюзлая конференция "Химическая информатика". Тезисы докладов. — Черноголовка, 1D92. — С.252.

11. Кирик С.Д., Ковязип С.А., Федотов A.M. Автоматизированное распознавание поропгкозтлх реитгепогра; м для веществ с подобными- кристаллическими структурами. //12 Всесоюзное совс-шанне по рентгенография минерального сырья. Тезисы докладов, — Соча, 1992* С.253.

12. Ковязпи С.А. О применении теории случайных шгакеста в распознавании бинарных шобракссшш // Тезисы докладов. Н

Всесоюзная конференция "Автоматизированные системы обработки изображений" — М.: Наука, 1986. — С.142-143.

13. Койяэнн С.А. О попятил средней формы случайного измеримого множества Ц Динамика химических и биологических сш :ем.

— Новосибирск, Наука, 1989. — <2.131-163.

И. Kirik S.D., Kovjazin S.A., Fedotov A.M. A program for comparing an;i selecting of X-ray powder patterns of substance*: with similar structure // 14 International congress of crystallography. Abstract book. — Pc-a,'Australia, 1987. — P.C230.

15. Kirik S.D., Kovjazin S.A., Fedotov A.M. New criteria for automatic structure-sensitive search system in powder diffraction. // 12 European Cryetallographie meeting. Collected Abstracts. — Moscow, 1989. — V.3 — РЛ71.

16. Kirik S.D., Kovjazin S.A., Fedotov A.M. IIow of organize a aearch of a utrucl.ure analog for a new substance with computer and PDF // 13 Hungarian diffraction conference. Collected Abstracts. — Budapest, 1989. — P.42.

17. Kirik S.D., Kovjazin S.A., Fedotov A.M. Structure-sensitive searching in X-ray powder diffraction // Powder Diffraction. — 1990.

— V.6, N 3, — P.l-6.

18. Kirik S.D., KoVjaain S.A., Fedotov A.M. Combined criterion of powder pattern similarity //2 European Powder Diffraction Conference. Abstracts. — Euschede, Netherlands, i:92. — P.68.