автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Алгоритмическое и программное обеспечение автоматизированной системы прогноза физико-химических и термодинамических свойств двухэлементных неорганических твердых соединений

кандидата технических наук
Кулясова, Юлия Вячеславовна
город
Москва
год
1992
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Алгоритмическое и программное обеспечение автоматизированной системы прогноза физико-химических и термодинамических свойств двухэлементных неорганических твердых соединений»

Автореферат диссертации по теме "Алгоритмическое и программное обеспечение автоматизированной системы прогноза физико-химических и термодинамических свойств двухэлементных неорганических твердых соединений"

Московский ордена Ленина и ордена Трудового Красного Знамени химико-технологический институт им. Д. И. Менделеева

На правах рукописи

КУЛЯСОВА ЮЛИЯ ВЯЧЕСЛАВОВНА

ШРИТМЙЧЕСКОЕ Н ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПРОГНОЗА ФИЗИКО-ХИМИЧЕСКИХ И ТЕРМОДИНАМИЧЕСКИХ СВОЙСТВ ДВУХЭЛЕМЕНТНЫХ НЕОРГАНИЧЕСКИХ ТВЕРДЫХ СОЕДИНЕНИЙ

05.13.16—Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва — 1992

у

Работа выполнена на кафедре кибернетики химико-технологических процессов Московского ордена Ленина и ордена Трудового Красного Знамени химико-техкологического института им. Д. И. Менделеева.

Научный руководитель — доктор технических наук, профессор И. Н. Дорохов.

Официальные оппоненты: доктор технических наук, профессор Г. М. Островский; доктор химических наук, профессор С. И. Дракин.

Ведущая организация — Всесоюзный научно-исследовательский институт химических реактивов и. особо чистых химических веществ (ИРЕА), р. Москва.

Защита состоится ДС _ 1992 г.

в час. в ауд. М 1УЪ на заседании специализи-

рованного совета Д 053.34.08 в Московском химико-технологическом институте им. Д. И. Менделеева по адресу: 125190, г. Москва, А-190, Миусская пл., дом 9.

С диссертацией можно ознакомиться в научно-информационном центре МХТИ им. Д. И. Менделеева. , '

Автореферат разослан А£ ч^р-.р-г^ 1992 г.

Ученый секретарь специализированного совета

Д. А. БОБРОВ

^ ОЩЯ ХАРАКТЕРИСТИКА РАБОШ ' '

5 Актуальность проблемы. Развитие химической промышленности 1шо е страна и за рубежом тесно связано с исследованием СУэйств химических соединений. Проведение любого процесса, будь-то синтез, растворение, кристаллизация, сушка и ряд других, не обходится без учета информации о свойствах, в частности, физико-химических и термодинамических, участвующее реагентов. Так например, одним из путей оценки возмоянооти самопроизвольного протекания реакции между исходными компонентами является расчет изменения энергии Гиббса между продуктам и начальными веществами. Для этого используются значения энергии Гиббса индивидуальных соединений. Учет таких свойств-, как температура плавления и температура кшения, крайне важен в тех ситуациях, где речь идет о термической устойчивости соединений. Очень часто тепловой баланс невозможен без информации о теплоемкостях реактантов. В конечном итоге, необходимые сведения о свойствах используемых соединений играют исключительную роль на этапе проектирования любого промышленного процесса.

Координационном планом научно-исследовательских работ по направлению 2.27. "Теоретические основы химической технологии" на 1591-1995 годы предусмотрено выполнение задания В 2.27.6.7. "Разработка принципов автоматизированного поиска периодической закономерности изменения базовых и производных свойств хшичест-ких соединешш". Выполнение этого задания связано с поискал новых подходов к нахождению неизвестных свойств веществ.

В настоящее время существуют различные способы оценки свойств веществ, в частности, неорганических, представляло: собой огромное многообразие структур и форм. На практике наибольшее применение находят приближенные методы расчета, как более быстрые, экономичные и простые. Такие работы по приближенным расчетам велись и ведутся, в частности, в химической науке. Например, в работах К.Ф.Павлова (1935) расчет свойств осуществляется путем интерполирования и экстраполирования опытных данных методом "выпрямления" химико-технологических функций. В работах Ю.Карапетъянца (1965) имеет место, как продолжение идей К.Ф.Павлова, сравнение сходных рядов веществ и вывод исследуемого свойства на основе этого сравнения. В работах Д.Г. Рувре (1936) химическое свойство, в частности, температуру плавления, можно выразить через типологический индекс сое/шне-Ш!л, рассчитываемый но с тру1/, ту ре молекул». В шш ремонтных методах В.М.Татевского (1980) длл оркишчоетшх соодпломш; ¡лечет

свойств производится на основании числа атомов каждого из элементов, входящие в состав молекулы. Каждый из способов оценки свойств распространяется на -определенную группу соединений (чаще всего сходных ляг токологически подобных) и предполагает наличие исходной информации о свойствах или структуре вещеотга.

Раооты по интенсификации приближенных методов расчета еэ-дутся по трем основным направлениям:

- распространение методов к разнообразным свойствам различию; вещестЕ;

- обеспечение надежности, т.е. удовлетворительной для практических целей точности оценки той или иной величины;

- упрощение, т.е. уменьшение затрат времени на применение. Настоящая работа посвящена первым двум из указанных направлений усовершенствования приближенных методов расчета.

Сдерживающим фактором в решении задач интенсификации приближенных методов является специфика областей их применения. Так, метод из серия приближенных методов, справедливый для определенного класса соединении, оказывается неудовлетворительны.! для другой группы веществ. Для успешного решения это;: задачи требуется разработка новых подходов с позиций как системного анализа, так и методологического принципа последовательного отождествления, позволяющих повысить эффективность применения методов расчет! к прогнозу свойств химических соединении.

Работа выполнена на кафедре кибернетики химико-технологических процессов МХЗИ им. Д.И.МевделееЕа.

Цель работы: I) изучение возможности прогноза физико-хши-ческих у термодинамических свойств, в частности температур плавления и гашения, теплоемкости, энтропии, энтальпии и энергии Гиббса, для индивидуальных двухэлементных неорганических твердых соединений с позиций системного анализа и методологического принципа последовательного отождествления; 2) обеспечение максимальной точности прогноза исследуемых свойств по имею- ' щейоя информации; 3) разработка автоматизированной системы прогноза исследуемых .свойств для заданного множества соединений; 4) развитие современных вычислительных методов расчета свойств, позволяющих повысить эффективность и снизить трудоемкость процедуры определения требуемых физико-химичсских и термодинамических величин.

Научная новизна. Разработана методология прогноза физико-химических и термодинамических свойств (в частности, температур плавления и кипения, теплоемкости, энтропии, энтальпии и энер-

пш Гиббса) для рассматриваемого множества химических соединений - двухэлементных неорганических твердых. Осуществлен эдбор и обоснована однозначность признаков для идентификации каядого вещества. Предлагаемая методика отличается универсальностью, доступностью и точностью информации по исходив» признака:.'. Разработан алгориш кластеризации, включаккций процедуру расчета критерия эффективности кластерной классификации.

Практическая значил ость. Доказана возможность достоверного расчета некоторых физико-химических и термодинамических свойств д.чя двухэлементных неорганических твердых соединений на основе разработанного метода'^'расчета. Разработано алгоритмическое и программное обеспечение автоматизированной системы прогноза свойств, что позволит экономить как материальные и технические ресурсы, так и затраты Еремеки на проведение лабораторных экспериментов для определения физико-химических и термодинамических величин. Усовершенствованный алгоритм кластеризации может быть применен для широкого класса народохозяйстненных задач, включая социалыше проблемы. На основе теоретических разработок создан пакет прикладных программ, включая программы по кластерному анализу с расчетом критерия эффективности кластерной классификации, а такае программы по выделению групп функционально близких соединений и расчету исследуемых сеойсте соединений.

Результаты раиотч использованы в Центральной Аврологичес-кой Обсерватории (ДАО), ШЮ "11РЕА", г.Москва, при определении неизвестных свойств двухэлементных неорганических твердых соединений.

Апробация работы. Теоретические разработки, вошедшие в настоящую работу, докладывались на:

- Ш-й научно-технической конференция молодых ученых МХТИ им. Д.И.Ыевделеева, Москва, 1989 г.

- 1У-й Московской кощ.ореацип молодых ученых и студентов по химии и хкмпческо! технологии, ЮЯИ им. Д.Н.Менделеева, Москва, 1990 г.

- Научно-методологическом семинаре "Химическая информация, вычислительная и математическая химия", ГСНШЮХТ, Москва, 15Ш г.

- У-й Московской конферешщи молодых ученых и студентов по химии и хшическсП тохнолопш, МХТ11 игл. Д.И..Менделеева, Москва, 1091 г.

Публикации. По тип о диссертации опубликована 5 ночатчых работ.

Объем работа. Диссертация изложена на Л!>1 страницах, состоит из взелония, Пяти глав, енводое, списка литературы, включающего .источников, содержит До рисунков и

Л5 таблиц. . • '■

СОДЕРЖАНИЕ РАБОТЫ.

В первой глаие приводится обзор работ по методам нахожде-1шя свойств химических соединений, включая эксперимент и теоретический расчет. Подробно отражено современное состояние приближенных методов расчета. Показана необходимость развития новых подходов к усовершенствованию существующих методов и расширению их области применения.

. Вторая глава посвящена выбору и обоснованию признаков для каждого соединения.

В исследуемое множество химических соединений вошли двухэлементные неоргащ!ческие твердые вещества. Исходная выборка была составлена из 306 соединений. Для каждого соединения из справочников выписывались значения таких физико-химических и термодинамических величин (которые мы будем называть свойствами), как температура плавления (°С), температура кипения (°С\ теплоемкость (Дж/моль-К), энтропия (Ду/моль-К), энтальпия (вДж/моль), энергия Гиббса (кДж/моль). Значения свойств брались при нормальных условиях. С целью распространения приближенного метода расчета на все без исключения изучаемое множество соединений с позиций системного анализа и методологического принципа последовательного! отождествления был определен набор признаков (в отличие от свойств), идентифицирующий каждое индивидуальное соединение. Поскольку выбор признаков играет важную роль для дальнейшей реализации задачи, к признакам предъявляется ряд требований: физическая обоснованность, универсальность, единственность соответствия, простота вычисления.

В основу выбора признаков был положен методологический принцип последовательного отождествления сходных между собой молекул. Принцип отождествления, например, лежит в основе периодической системы элементов. Короткопериодный вариант системы объединяет е группы не только изовалентные 5- и р-элементы, но и триады 4-элементов, а также семейства ^элементов. Шесте с тем каждая клеточка системы элементов содержит некий набор, ансамбль, состоящий из изотопов, возбужденных состояний атомов и аллотропных модификаций, отоздествляеыых понятием "элемент".

Принцип отождествления лежит в оснотю и естественной систематики молекул. В качестве простейшего строительного элемен-

та системы молекул используется введенное Е.В.Бабаевш представление об изостернш ансамбле. Изостернш ансамбль - это множество молекул, тлеющих равное число валентных электронов (ЕЕ) и ядер (Й ). Таким образом выбираются диа признака для решения задачи.■ Это N - число ядер и ЕЕ - число валентных электронов.

Каздый изостерный ансамбль Еключает: I) молекулы с одинаковой валентной'оболочкой, но различным невалентным остовом (например, ЫН3, PHg, AsHg);. 2) молекулы-изостеры (с равным числом невалентных электронов, например, С02, Wg^^t 3) молекулы-изомеры всех типов^ Нетрудно надеть, что объединенные в изостерный ансамбль молекулы зачастую обладают весьма близким набором химических и физических свойсте. Действительно, в случае изомеров подобная близость свойств нередко приводит к трудностям разделения или идентификации изомерных соединений. Что касается физико-химического сходства одинаково построенных молекул, содержащих атомы-аналоги по периодической системе, то оно неоднократно использовалось для доказательства справедливости самого периодического закона.

При построении пространства изостерннх ансамблей отчетливо выявилась условность разделения соединений на органические п неорганические. Однако, принципиальной задачей при классифи-1сации изостерннх ансамблей является поиск естественных признаков для различия объектов внутри ансамбля.

В качестве одного из вариантов решения этой задачи предлагается восполнить набор признаков для изостерного ансамбля тремя дополнительными величинами для идентификации кавдого конкретного соединения, добавляя следующие признаки: RA - отношение атомных весов (большего к меньшему) для различия молекул— изостеров, М - относительную молекулярную массу для различия молекул с одинаковой валентной оболочкой, 1> - относительную плотность для различия молекул-изомеров. Таким образы, набор признаков, характерны! для химических соединении, включает: Н -число ядер, ЕЕ - число валентных электронов, RA - отношение атомных Еесов, М - относительную молекулярную массу, Э - относительную плотность. Выводится обоснование однозначности такого набора признаков, т.е. соответствие конкретного набора EES, ¡'^.ХЗ одно1,,/ индивидуальному соединению. Такое

обоснование основывается на фа;сто, проверенном для всех возможных сочетании ато:.:ол, что кепкретпоо значение 6 Ас. отвечает

единственной паре атомрв, С этой цель» било просчитано более 5 тысяч 'возможнее комбинаций отношений атомных весов. Такш образом, исходный массив данных для 306 рассматриваем®: соедогз--ней! бал заполнен значениями признаков для каждого ьвв;аотва и теми значениями исследуемых сволоте, которге клелись ъ снрапо 1-ннках.

Третья глава посвящена кластерному анализу прю'енптелыю к химическим соединениям.

По выбранным признакам и каядому из послецуегшх свойств проводилось объединение соединений в кластерн по блпзоотк кал признаков, так и рассматриваемого свойства. Кластеризация даст возможность по набору признаков для данного соединения с неизвестными свойствами отнести это вещество к одному из кластеров с целью получить ориентировочное значение исследуемого свойства в виде значения центра этого кластера.

По специфике решаемо'! задачи использовалась кластеризация с такими характеристиками: по элементам - исключающая (одни элемент может появиться только в одном подмножестве), по признакам - внутренняя (все признаки считаются равноправии.!!:), по-литетичеокая (все признаки учитываются в равной степени для определения принадлежности объекта к тому или иному кластеру), по типу объединения - иерархическая (оптимизируются отношения пе~-ду объектами и всей популяцией), по направлению - агломарашв-ная (объекты объединяются в подмножества возрастающего объела до тех пор, пока вяя популяция не объединится в одно множество).

Описание вычислительной процедуры состоит из четырех основных этапов.

Шаг'1. Расчет Евклидовой метрики

где - значение р-того

признака I ( 4. )-того объекта (соединения). Рассчптаннкз по формуле (I) значения ¿ц образуют симметричную действительную с нуле вши диагональным элементами матр:-цу Евклидовых расстояний

- значение р-того

i )= d15 , 1=1,.,., ; | = .

Шаг 3. Объединение соответствующих объектов: {l} U { 3 ^ = {•

Печатается информация: ÎM^ l^} <Ахч •

Шаг 4. Вычисляются (cl**), к=1,...,и-2; n = s»-I.

После проверки условия переходят к шагу 2. Процедура заканчивается после исчерпания всех объектов.

Алгоритм кластеризации, реализующий приведенную вше вычислительную процедуру, достаточно прост, однако, окончательная программа кластеризации отличается сложностью, т.к. при многократном выполнении 'относительно простого процесса осуществляется хранение существенной доли результатов. Стандартны;! алгоритм кластеризации дополнен расчетам критерия эффективности.

Рекурсивная процедура объединения объектов осуществлялась по единственной на сегодняшний день удобной для расчета формуле Ланса-Унльямса

(3 цО ••• (Vfcj^) • • • и; + hj

Jidy+cijdbi + .Mii + "ÎTI^KI-dKJ \ • (2)

Перед объединением известны dh: , dkj,cUj ,1ч , ht n»j . Каждая из стратегий объедпьения характеризуется своим наборш параметров di » «¿j » £ п "3* > которые определяют способ объединения индивидов в кластеры. Сравнительная характеристика стратегий объединения по показателя правильности кластерной классификации ( ^ ), характеризующему эффективность разделения объектов по кластерам, позволяет заключить, что для нашего случая наиболее благоприятной является гибкая стратегия с такими параметрами: J; = Jj = 0.625, J$=4j.25, у^О (табл.1). В качестве параметров кластеризации в данном случае использовались только признаки без рассматриваемого свойства.

Табл.Е, Сравнительная характеристика стратегий объединения

I 2 3 4 5

5.2 8.8 6.7 7.2 10.7

- стратегия, Ь- показатель; I - стратегия блиглйшого соседа, 2 - группового среднего, 3 -цснтроидная1 4 - приращение внутригруппонои суммы квадратов, о - гибкая с параметрами •';= Л: =0.625. ^ =-0.25 и т-0

Показатель прамгльности класторно!; класснфикацми рассчитиваот-ся с.'кугуюпаш образом *1=\Т\ /М, гдо

элементы общих сумм произведений,

= Х^Г Сх—г -к^Хк^и (р-И) -

* Гп»4*«4 * *

элементы внутриклассовых сумм произведений; М - -число кластеров; И«- число точек в кластере н. ; р - исходная выборка. Определение оптимального числа кластеров осуществлялось по максимальному значению ц, (рксЛа), соответствующему тшу моменту процесса кластеризации, когда: I) все исходные элементы распределены по кластерам и 2) мера расстояния («4 ) практически не меняется с увеличением числа групп (КО) (рис.16, точка. 2; в точке перегиба I не выполняется условие окончания кластеризации, т.к. не все элементы распределены по кластерам).

Таким образом, оптимальное число кластеров получилось равны.) 22 при мере расстояния Л =1.05. Каждый'кластер характеризуется своим набором признаков {ы , ЕЕ, НА, М,И} и значениями исследуемых свойств в центральной точке. Значения свойств в центральной точке служат ориентировочными значениями искомых физико-химических и термодинамических величин.

Рис.1. Определение оптимального числа кластеров

А5"

М

5"

I

0.5 4.0 I

Для оценки качества проведенной кластеризации по выбранным признакам был осуществлен процесс кластеризации по разным наборам параметров. Результаты сравнения приведены .в табл.2, где НР - сумма порядковых номеров атомов в молекуле, Ь - сумма длин химических связей, - электроотрицательность молекулы (отношение стабильности по Сандерсену). Из табл.2 видно, что

Табл.2. Сравнительная характеристика параметров

а с----— i' 2' 3' 4' 5'

I {И.ЕЕ., М,Т>} 4 306 20 6.83 -

2 1мр. ь. м, т>5 4 102 10 3.71 2

3 5 306 22 10.70 -

4 {н.^.м.м,"»! 5 306 25 6.04 5

5 6 306 34 4.87 -

а - номер варианта, Ь- характеристики, с - параметры; I'- число параметров, 2'- число соединений, 3'- число кластеров. 4'- показатель эффективности кластеризации (>1,«м»), 5'- число перекрываний границ кластеров

выбранный набор признаков под номером 3 оправдал себя при проведении процесса кластеризации по показателю эффективности и отсутствию перекрываний границ кластеров. Увеличение числа признаков (например, в дополнение к набору 3 включение признака ) и уменьшение,числа признаков приводят к худшим результатам. Введение Ег вместо ЕЕ, как делалось раньио, привело к перекрыванию кластеров.

В четвертой главе приведет разработанная методам и алгоритм выделения групп функционально близких соединений (ФБС). Проведете процесса объединения Еещзств по функциональной близости необходимо вследствие уточнения исследуемого свойства, представленного в виде значения центральной точки кластера.

Решая проблему кластеризации, мы добиваемся возможности любое из рассматриваемых соединении отнести к одному из мастеров. При этом ориентировочное значение кскоглого свойства представляется в виде значения центра данного кластера. Но это ориентировочное значение носит достаточно приближенный характер. Поэтому необходимо уточнение искомого свойства. И здесь возможным вариантом является выделение групп соединений, функционально близких по исследуемому свойству, т.е. достаточно точно описываемых одной и той же функциональной зависимостью данного сеойстеэ от выбранных параметров. Кластеризация отличается от такого подхода тем, что соединения здесь близки по значении исследуемого свойства. Граница каждой группы ФБС определяется областью интерполяции данной функции, инжи слонами, граничными значениями параметров. На рис.2 приведен при?.!ер для иллюстрации выделения групп ФБС, где Р(х) - функциональная загчсимость •

исследуемого свойства (целевая функция); « -(число соединений в группе; х»,, х»г - граничные значения параметров для каждой группы. Каздая из групп характеризуется своими значениями коэффициентов ? (х), « , х», и х и •

При проведении процесса выделения групп ФБС возникла проблема выбора параметров функциональных зависимостей исследуем!.1:: свойств. Если взять исходные признаки .каждого соединения, то дчя случая линейной зависимости с шестью коэффициентами будет 1-.'.'.пучено много групп, что создаст дополнительные гычпелн-

?'-с.2. Выделение групп ФБС

тельные трудности при переборе вариантов, В случае ке квадратичной зависимости с 21 коэффициентом имеет место дефицит по объему выборки для каждой из групп и выявляется немало соединений, не попавших ни в одну из групп. В итоге, работа с исходными признаками затрудняется и возникает потребность в снижении размерности исходного пространства признаков для анализа функциональных зависимостей исследуемых сеойств. Для этой цели использовался метод главных компонент.

Из исходной симметричной действительной матрицы коэффициентов парной корреляции

I 0.93 -0.03 0.43 -О.П N

I -0.11 0.51 -0.12 ЕЕ

ii I 0.26 0.30 ' НА

I ' 0.35 М

X Т>

были получены по методу Якоби с использованием стандартной иод-

программы-функции ЩбШ собственные числа (Ь"5 ) и собс 'векные

вектора (Я ):

■г =( 2.28 1.32 0.93 0.41 0.06 )

X, X, X» Хч

0.62 -0.14 0.89 0.73 -0.05

0,63 0.42 -0.25 -0.55 0.0

-0.07 0.43 -0.29 0.67 0.0

0.46 0.78 -0.34 -0.73 0.0

0.01 0.20 -0.17 -0.05 0.0

Анализ относительной доли суммарной дисперсии позволяет заключить, что достаточно использование первых трех главных компонент с потерей информации 9%. Целевая функция исследовалась в виде полинома второй степени

И/,= «о + , . (3)

гдо у,, Уг - параметры целевой функции (главные компоненты),.-_ с» - коэффициенты. Из Есех возможных комбинации исходных признаков набор главных компонент оказался самым подходящим, т.к. коэффициент множественной корреляции, шбрашшй в кпчео рве критерия сравнения, в этом случае максимален и ране.! О.В07.

Графическая иллюстрация целевой функции на примере температуры плавления от трех хгнавних компонент представлена на рис.3 при двух различных значениях третьей главной компоненты. . !!з рио.З рш'.но, что нерогнб целевой функции попадает в интервал темпе заданного >маякиш ведоогл, что позволяет принять

Фунюптсяашя» зависимости ксслодуемнх свойств й уиде кнралеиия (3) л«ч проведения процгсса ваделекзя групп РБСв

Из алгортт внделения групп ФБС следует, что ^ормирокшво

Ргс.з. ГргДлческая пллпетгашш целевой '¡утгкнта: при V;-2 (д) и -1) (б) '

а«)

-50

I П \ , О

с* о

5СЖ>

ггг;-

ч

•г

> га , -

А

> 4 У, -4 'о

халдой из групп происходит в том случае, если: I) максимальное значение относительней погрешности в группе не превышает некоторого заданного порога (пли предела) и 2) число соединешй и группе больше числа рассчитываемых коэффгащеитов. На рис.4 пи-'мано, как определялся предел относительной погрешности: силчача по числу образуемых групп (рис.4а), а затем проводилось уточнение но числу не попавших в группы соединений (рис.46). В

Рис.4. Определение продола относительной погрешности

Си,)

?0

(АР)

10

•о

. СОПД!'

У*» г

тех г 1-2'':. прете -'нн™ ¡:ос'1'.

* I Ь А 5 < I II ч

число групп; мэ- число сое шли пил, не попавших в грунт;-; АЕ -'предел относительной погрешности {%)

ту;'£:ге предел относительной погренности принимается рзнннм •.•: наиболее уд о вле те орял:.; г 1 и по числу групп, и по числу

•• миЯ, те попэгапх в группы. Число первоначально не попав-гт.уплн соогдоюний Я" ностетуп-дем этапе рассеивается по :и)Уо0саш:ю.1 группам. При этом относительная погрешность •;упп, куда Г Ж» ¡ДОТ от!! соедлшния, может Увеличиться на Тпкое определение прод« т относительной погрешности не •отует на общность решения .для рззпнх объемов выборок соз-Ко в конкретном случае это привело к определению точ-чиогчозс, не прсрютга'п:". погрешность таборгторных экспо-

риментов по определению свойств веществ.

Коэффициенты полиномиального выражения (3) для целевой функции от параметров в виде трех главных компонент рассчитывались по методу наименьших квадратов (МНК), Оценка значимости коэффициентов не проводилась, во-первых, потому, что стандартизованные коэффициенты для ьсех исследуемых свойств оказались одного порядка; во-вторых, сам прием выделения групп 4бс предполагает отыскание такой функции для каждой из груш, где заранее задана невысокая относительная погрешность расчета для всех соединений, входящих в группу, или, другими словами, заранее задана высокая степень прогноза. Поэтому и проверка на адекватность представляется излишней.

Следовательно, если известно, соединение попадает в одну из групп, качество прогноза исследуемого свойства будет гарантировано однозначно. Если же по значениям главных компонент соединение попадает в несколько групп, то возникает проблема альтернативного выбора. Е этом случае ориентировочное значение в ввде величины исследуемого свойства в центре кластера, которому ; однозначно принадлежит данное соединение, даст воз/ложность перейти от альтернативного выбора к единственному. Изложенный принцип положен в основу нового способа расчета свойств заданного множества соединений - двухэлементных неорганических; тверди. :

,В пятой главе решалась задача формирования алгоритмического н программного обеспечения автоматизированной системы прогноза физико-химических и термодинамических свойств химических соединений и проверка работоспособности системы на некоторых случайно выбранных из исходной Енборки веществах.

Алгоритм работы автоматизированной системы прогноза исследуемых свойств строится на; результатах третьей и четвертой глав. Перед началом работы для данного соедиения с неизвестным свойством необходило знать набор признаков, а именно, число . ядер в молекуле этого соединения, число валентных электронов, , отношение атомных весов, относительную молекулярную массу и относительную плотность. Первые четыре признака рассчитываются на основе истинно;! химической формулы вещества, значение пос- ' леднего признака (относительной плотности) берут либо из справочника, либо определяют экспериментально.

После подготовительного этага по определит) значена-; приз-накоп мох'лю приступить к работе с автоматизированной системой ирсдакца сво--сть, одторлш которсл илодстаядеется к следующем

виде

| Начало

1. Веод информации о признаках: (н, ЕЕ, й А, х=(х« Ввод номера исследуемого свойства: р

2. Расчет нормированных значении признаков: хМх?), <■-!..5

3. Расчет главных компонент: у» » I 3 -I..3

«*Ч

4. Расчет "СолЬгуг-а «пеЬчс " мезду введении! соединениям и исходными кластера!.« .

1*1

К - число кластеров

5. Нахождение м1к(е!^")= с^"*, Сб[1..к]

Результат: Ре - ориентировочное значение исследуемого свойства

6. Нахождение по (у]) подходящих (О, }=1..3, ч =1.

Н'- число групп ФЕС

7. Нахождение (|Р£-Ре\ )=р£ , Результат этапа: - уточненное значение исследуемого

8. Вывод р, Р,

свойства

?

Конец

[олученное в результате работы автоматизированной! системы уточ-[енное значение исследуемого свойства представляется в виде :рогноза. Из всех этапов работы алгоритма больше всего времени Утрачивается на 6 этап, а именно - подбор по значе.шям главных компонент данного соединения подходящих фушщионалъннх зависи-остей исследуемых свойств и расчет по ним соответствующих зна-:ений. Для реализации этого этапа необходимо оценить одновремен-ое попадание исходных главных компонент вещества в граничные нтервалы для каздои главной компоненты всех имеюгдахся групп. | случае удовлетворения этого условия (одновременного попадания :сходных главных компонент в соответствующие интервалы) найден-вя группа считается подходящей. По функциональной зависимости, лраведливой для данной группы, рассчитывается возможное уточ-[енное значе!ше исследуемого свойства. В результате такого пе-габора вариантов получается одно или несколько возмогднх уточнен-шх значений. То из них, которое ближе всего будет к оркентиро-ючно.чу, найденному в результате отнесения данного соединения : одному из кластеров, считается истинным уточнен:;?« значением

е-выводится как итоговое в качество прогноза.

Хля проверки достоверности получаемых результатов из исход-, ной выборки случайннм образом были отобраны 10 соединений. Проверка проводилась на примере расчета температуры плавления. Среди 10 соединений девять имели значения температуры плавления в исходном файле,.а для одного такое данное отсутствовало. По всем девяти соединениям относительная погрешность расчета оказалась не выше 3-4$. Tait, CaHg с набором исходных признаков. (З, 4, 39.8, 48.1, 1.7} и главных компонент 1-2.26, 1.63, -1.64'} попал в кластер со значением температуры плавления в центральной точке (Тпл), раЕНШ 750°С. Имелся всего один вариант уточнения - это значение Тпд, равное 832°С. Этот единственный вариант. щюдставлялся в виде прогноза. Исходное же значение Тп , взятое из справочника, составляет 814°С. Другой пример: TtgOg с набором исходных признаков {б, 24, 12.77, 456.7, 10.о} и главных компонент {1.59, 2.78, -0.94} попал в кластер со значением ■ температуры плавлэния в центральной точке, равным 742°С. Здесь уже имелось пять вариантов уточнения Тцл - это 1100, 935, 517, 306, 720 (°С). Как. видно, блкке всего к центру данного мастера расположено значение v2P°C. Оно принимается за истинное уточненное. Справочное значение составляет

Интерес представляло сравнение выведенных нами данных с прогнозом, получаемым по другим методам приближенного расчета, в частности, по методам машинного расчета физико-химических величин, основанным на подборе коэффициентов в выражении для расчета свойств сходных веществ. Такой метод по расчету температуры плавления при нормальных условиях отсутствует. Имеется только методика расчета Тдл при повышенных давлениях. Видоизменив ее для нормальных условий, удалось рассчитать значение Т^ только для СаН2» оно оказалось равным 851°С,гт.е. несколько хуже, чем по нашей методике.

Таким образом, в отличие от других сравниваемых методов, • предлагаемая методика отличается универсальностью, доступностью и точностью исходно;! информации по признакам. В случае же других приближенных.методов необходимо использовать несколько методик для расчета свойств разных веществ.

Все алгоритмы были реализованы на 0U.1 типа CU-2420. В качестве языка'протем,\:ироЕашш использовался V08JÏUU -77. 06-щ.й объем нрогрсаждного обеспечения иоставил 120 Кбайт.

Разработанная автоматизированная система прогноза сеойстз юединений, реализующая предлагаемую методику расчета физико-озмических величин* использовалась п Центральной Аерологическсй !бсернатопии (UAO), ^Долгопрудный Московской области, для вычис-гения таких характеристик двухэлементных неорганических твердит, зеществ. в частностий температуры плавления и энтальпии при нср-шльннх условиях, информация о которых отсутствовала е справочной : периодической научно!; литература. Полученные денные о температурах плавления и энтальпиях рассматриваемых соединений использовались для расчета порога льдообразования - важного параметра при 13 учении активности веществ, исскуственно вводимых в аплосферу ия образования осадков. В настоящее время в ЦАО интенсивно Ее-сутся работы в направлении поиска заменителей АзЗ (вследствие то-? 'о, что является дорогостоящим материала1.!) и Pb3t (вследстЕИЭ >трицаг,ельного влияния на экологическую обстановку), чаще всего ¡спользуемнх в метеорологической службе. Специалистами ЦАО было Iоказано, что из всех параметров веществ, испытываемых для поиска шалогоЕ Ц'З и PbtSj , величина порога льдообразования играет^ ' [ервостепенную роль. Вот почему использование предлагаемой методп-UI расчета сопутствующих значений (а именно, температуры плавле-шя Тп и энтальпии UHil) для вычисления порога льдообразования ;риобретает особый смысл, г.к.: I) экономятся материальные и тех-шческие ресурсы, а также время на проведение экспериментов по »пределенип таких свойств, как Тдл и 2) вследствие доступ-

гости исходной информации по признакам расширяется круг нсследуе-!ых соединений при выборе аналогов для иодидов серебра и свинца.

Предлагаемая методика р-асчета свойств использовалась также в !аучно-производственнам объединении "ИРЕА" для прогноза физико-ишпчпских величин особо чистых веществ и реактивов. Экономически эф;ект от использования автоматизированной еноте;,«н прогноза ¡во?.с*:?, реализующей предлагаемую методику, составляет 150 тыс. !убле:.'/год.

ВЫВОДЫ

Разработана методика прзбляяешого расчета свойств двухэле-•ot!iнеорганических твердых соединений. С этой целью:

Предложен набор признаков, однозначно соответствующий :п~v.-.yj индивн.пуадьпому соединению из исследуемого множества шухэлоквнтинх неорганических твердых.

г. Разработан алгоритм кластеризации, включаетдий процедуру почета критерия эффективности кластерной классификация.

У. Проведена кластеризация двухэлементных неорганических лзоогм;: соединений по внбрашш признакам. В качество ориентяро-

вочных значений рассматриваемых сеойств (температур плавления и кипения, теплоемкости, энтропии, энтальпии и энергии Гиббса) приня значения центров полученных кластеров.

4. Разработана и осуществлена на практике методика выделения групп функционально близких соединений с целью уточнения исследуемых свойств.

5. Построен и реализован алгоритм прогноза рассматриваемых свойств, позволивший предсказывать неизвестные физико-химические и термодинамические свойства заданного множества соединений. Данный алгоритм реализует новый метод расчета свойств, основанный на возможностях, связанных с развитием вычислительной техники и методов обработки данных. Предлагаемый метод относится к общей группе прибликенных методов расчета.

6. Результаты работы переданы в Научно-производственное объединение "ИРЕА", а также в Центральную Аерологическуш Обсерваторию, где использованы для прогноза свойств веществ, участвующих в химических процессах. Ожидаемый экономический эффект за счет экономии времени, материальных и технических ресурсов на проведение лабораторных эксперимонтов оценивается в 150 тыс. рублей/год.

Предлагаемая методика обеспечивает точность прогноза свойств в выбранном множестве-соединений - двухэлементных неорганических твердых.

Основные результаты.работы излокены в следующих публикациях:

1. Дорохов И.Н., Кулясова Ю.В. Применение менделеевского сравнительного метода к установлению закономерного характера изменения свойств сложных химических .соединений / Деп. в ВИНИТИ,

ii 3004-91 от 15.07.91 Г.

2. Дорохов И.Н., Кулясова Ю.В. Элементная систематизация молекул и подход к установлению закономерности изменения свойств химических соединений / Деп. в ВИНИТИ, й 3724-9*1 от 17.09.91 г.

3. Дорохов H.H., КулясоЕа Ю.В. Проблема поиска закономерного характера изменения свойств химических соединений // Тезисы докладов 1У Московской конференции молодых ученых по химии и химической технологии - Москва, 1991 г. С.50.

4. Кулясова Ю.В., Обухова A.B. Кластеризация хгаичооких соединений / Деп. в ВИНИТИ, J£ 4828-91 от 28.I2.SI г.

Ь. Дорохов И.Н., Кулясова Ю.В. Применение кластерного анализ; к исследованию свойств химических соединений / Деп. в ВИНИТИ, I 4825-91 от 28.12.91 г.