автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Компьютерное моделирование свойств органических молекул с использованием фактографических банков данных
Автореферат диссертации по теме "Компьютерное моделирование свойств органических молекул с использованием фактографических банков данных"
РГВ ОЛ
i 9 Л У7 *:Г!г I t> Uli! u- • ••>
ГОЮ ДАРСТВЕННЫЙ КОМИТЕТ PC JC. :;ЙСКОЙ ФЕДЕРАЦИИ .ПО ВЫСШЕМУ ОБРАЗОВАНИЮ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
iHa црава> рукописи
ОСИПОВ АЛЕКСАНДР ЛЕОЛШЗОДИУ
КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ СВОЙСТВ ОРГ.' 'ШЧЕСКИХ МОЛЕКУЛ С ИСПОЛЬЗОВАНИЕМ ФАКТОГРАФИЧЕСКИХ БАНКОВ ДА ИНЫХ
05.13.16 -- Пргтененн':" вичиглвтельной техники, математнче< ^ого моделирования и ат^чатичес.кпх методов к научных исследованиях
А в т о |) е ф е р а т диссертации на соискание учёной степени кандидата технических цау:
Новосибирск — 1996
Работа вътблйеаа в лаборатории систем обработки данных научно—исс «щова-'1 льско" част'й' Йбвосибирского государственного университета
Науч.-бй' Леяь: доктор технически., наук,
: рофессор Н. Г. Загоруйко
Сфиийаяьй 16 йЮйй'-тЙ: доктор технических наук,
профессор Ю. А. Щеглов
кандидат физ.-мат. каук
Л. К. Бобров
Ведуйтя организация: Новосибирский институт
- органической химии СО РАН
Защита состоите. " _ : 4 ' " йоя года, в ..^Р. .
на часедаЕии диссертационно^ совзта Д 06'' $8.01 по присуждению ученой сте-пе1 .л кандидата техиычесхих наук з Новосибирском государстяейном унизерситете по ^дргсу: 630090, Новосибирск, ул. Пирогова, 2.
С дигсе! 1ациой Можно ознакомиться в библиотеке Новосибирского "осударс-лен-I. лх> университета.
Айтърефе] т I -ЗосйаУ
У^еЁь'й секретарь диссер тионного совета, Уи^ /\ ка.1 'Йдат технических наук ^ ^^ Ю.И.Еремип
ОБЩАЯ ХАРАКТЕРНО А РАБОТЫ
Актуальность ■*■ мы. В , lciо®щее время в оргаг"'ческой химии «'"тезировг' о более 13 миллионов химических веществ, набор сведений ,о ко .рых весьма обширен. Активное использование в научных исследованиях этой atроииой информации невозможно без привлечения средств вычислительной те.шики. Комиьют /цые технологии я мат- чатическое моделирование позволяют отказаться от традиционного метода поиска химиче них веществ с заданными свойствами г -тем экспериментов, которые являются чрезвычайно сложными, длительными и дорогостоящ' ш. Так, разработка единственного лекарственного препарата *. , ебует в среднем от 8 до 20 лет, а затраты составляют до 100 и 'лляонов дол аров. Согласно статистике, удачным оказывается приблизительно одно из 10 тысяч испытана, воз: >жньгх овых лекарственных препаратов. В снг-и с этим многие фирмы -вязываю. успех в разработке новых препаратов с. внед гнием в хи\ыч' ki исследования компьютерного н математического моделирования, резко сокращающего сроки создания физиологически активных веществ, тутом отсеивания заведомо неактивных т вь"-охотоксич-ных соечипений. По оценке "International Resource Development Inc" особенно быстро растёт объём финансирова ия работ по созданию компьютерных си "ем для моделирования разли' ых свойств х шческпх i ¡цеств — от 66 миллионов долль,,ов в 1983 году до 8,5 миллиардов долларов в 1993 х iy. При соз.ч;. ли таких систс • возникают сложны выходящие (а рамш) информационного поиска задачи, рг 'ение которых требует разработки специальных чподоя я моделей, оригинальных алго-ритлов и соответствующего программного обеспечения. Подобные системы будут обладать к тому же рядом преимуществ, обус тленных гчцной информационной поддержкой в ниде баз фактографических данных, яаличие которых позволит решать и такие важные в научном а практическом отношении проблемы, как уста-новле. ie эмпирическпх за- но.-ерностей для моделирования связи -между строением вещества и ег< ¡ноико-химпческпми и биологическим1' свойствами. Хотелось бы отмстить, что поиск новых высокоактивных и безопасных для человека я окруж с-цей среды химических препаратов с заранее .заданными свойства" 41 является важнейшей' фундаментальной проблемой мировой нкуки, так как создание таких и тест в есть одно из ос. >нпых условий роста технологический моши современного общества.
Таким образом, проблемы создания информапионно-матемзтической инфрастр>к-туры системы научных химических ис< челов; им вместе с комплексом проблемно-ориентированных баз данных, по гк» плоте адекватных нуждам пользователей, являете в настоящее время ключевс " для иитег (фнкащш научных исследований. Изложенное выше определяет актуальность, научную п п' гктическую значимость проведенных иссле-ований в одной из наиболее важных областей химической информатики — разработке компьютерных средств и математических методов для ..юделировани* связи между строением вещества и его свойствами.
Изложенные в диссертации Результаты получены в ходе выполнени. ко едь ваний по планам фундаментальных научно-исслед*. ате -.гкнх работ, пр юдимых и >амках единого заказ-наряда по распоряжению Госкомвуза РФ. по на"чно-техпиче1 ой
рограмме йеалкзадия пр^ритегжи-о направления развития химической н'уки и т :<ш>лйгШ lipl!' РКНТ СССР и АН СССР "Создание базовых инфорьшшокно-ао-асковых сисТей.йс структурам и свойствам зешеств к материалов для прогноза свойств к выбора оптккалъв-путей синтеза химических соед:-,..ений", • i государ-..т^онеоЛ не; ш< технической программе России "Новые принципы и методы получения химических еществ' и материалов", а также по хозяйственным договорам.
Цел: рабаТьг. '^гль 'диссертационной работы заключается в разработке ффек-тивкых методов'математической,- 2 компьютерна. ■ ыодет уов&пия связи структура хин.ическй: соединений— молекулярные свойстве.— биологическая активность" на основе стратегий форм .юиаяие баз« данных и знаний ь.з имеющихся примеров, а . тгл, . г 1 создании компьютерных технологий поддержки профессиональных химики-структурнс-би Тс ячеекгх баз дагчыж и знаний Для достижения указанной цели по поиску зф'фехтйЖйх препаратов с зада: -ыми свойствами потребовался углубленный айали'з к теоретические; исследоваиЕя первичных экспериментальных данных репильзевакием й^Ьймадаог^компьютериых технологий и методов математического моделкро" vdäii,
С Зьектс.. Hacfo'iKiiiefо'КСпедования я ■ тяется химико-биологическая в струк-турпая информации о х*мйчес£их ^дикениях и их свойствах.
Предметом дееяедов'аййй являются компьютерные системы многоцелевого назначения, математически методы и модели, использованные для решения проблемы установления связь между с-раен.,ем .вещества, и его свойствами.
Предложенные дассерТайток математические м< чгли, структуры баз данных и алгоритмы фуь'КЕЕОяарОоайа'«; айформадионно — моделирующих систем был. реализованы zm на »snoüüi tpotp гширования Си с 'С+т в wpeae MS OOS.
Научная ноймэяй js'ääSitlj заключается в комплексной подходе к конструированию бг лог чес&й соединен: 1, который сочетает использование средств вычислительной itxu.ikit ай-хх>мат«иррг<и. ¡ых информационно-поисковых систем с фактографическими базами данных, гоаых мат латеческих методов расчёта физики химических српйоТв молекул £ моделей дня уставозленяя зависимостей между стрjeaseM вещества й его ¡csokctssaSw: в создании оригинальных подходов математн-4ecKt.ro описания мш;. tec-ffix ссеДаненЕ,. кз их структурных формул; которые позволяют производить анализ соединении; арика'лежащлх к различным структурным классам
Практическая значимость. К моменту написания диссертационной работы ее результаты внедрены в научную и производственную практику Всесоюзного научно-исследозательского И' "титута химических средств защиты растений (Москва), института мате^ .ал^едения (Калининград Московской области), Всесоюзного научно-исследовательского технологического института гербицидов и регуляторов роста растений (Уф;N и в научно-инженерные цен.р "Системы и технологии'' та химическом общ*-тве им. Д.И. Менд 1еева (Москва). Внедрение i гуль -.гтов исследован;, л осу ествлено. преимущественно, через выполнение газдоговорных рэ'гст Е договоров па передачу иаучно-ч-хнических достижений. Система компьютерного пр-тзирс-нания биологических свойств, используемая Всесс.саным на. що-исследовательским
институтом "'одических средств защиты рлс'нгй для скрининга химических соединений, покачала высокую экономичес ю эффективность в пределах 12С — 360 тысяч рублей (в ценах 1990 года) на одлу тысячу предъявлег-тых для анализ* и планируемых к синтезу • импчес ix веществ. Реальный ,<ект был достигнут за с"вт отбраковки заведомо неэффективных с , ^уктур и сокращением пустых синтезоэ и биологических испытаний.
Апробация работы. Основ.чые положен) . и резуль. аты работы док: дывались ч обсуждалйа на семинарах и конференциях, в том чыле: па IV Всесоюзном симпозиуме по машинны; методам обнаружения закономерностей (Новосибирск, 1983), на VII и VIII Всесоюзных конференциях "Использование вычислительных машин в ..имических исследованиях и спектроскопии молекул" (Рига, 1986 и Новосибирск, 1989), на VIII Всесоюзной конферен- чи "Планирование и автоматизация эксперимента в научных исследованиях" (Ленинград, ¿9S6), на 1 и II Всесо- зны: яонфер щиях "Математические методы и ЭВМ в аналитической химии" (Москва, 1986 и 1991), на рабочем совещании "Молекулярные графи в "И! чческнх исследованиях" (Одесса, 1987), на Региональной научно-технической конференции "Синтез и при v. лени* пестицидов и кормовых j бавок в сельскохозяйственном производстве" < Волгоград, 19S8), на III Всесоюзной конференции "Методы и средства обработки сложной графической информации" (Гор .ий, 10SS), на IV Всесоюзной конференции "Системы баз данных и знаний" (Калинин, Wf1), на Меж, ¿спубликавской конференции "Си;.,ез, фармакология и клинические aci ;<ты новых пси: гропных и ct: аечво-сосудвстмх веществ'' (Волгоград, 1989), на II Всесоюзной конференции "Моделирование систем информатики" (Новосибирск, id90), на Международной конференции "Автоматизг рованние биолнотечно информационные системы" (Новосибирск, 1993), на II Всероссийской конференции "Математические проблсы экологии" (Новосибирск, 1994), на Международной конференции "Полые информационные технологии в университетском образовании" (Новосибирск, ¡995). на III и IV научных семинарах с междула-родц. ,i участием "Автом ; и? рованные библиотечно — информационные системы (Новосибирск 1989 и 1991), на научно-техническом се-чшарес международным участием "Экспертные и обучающие системы* (Саратов, 1995), на II Междун одной конференции "Непрерывно-логические методы и модели в науке, технике и экономике" (Пенза, 1995), на VI Сибирском научном семинаре-с между народа ..im участием "Ивформ; !.ия в фундаментальных, гуманитарных и прикладных научных исследованиях" (Новосибирск, 1996).
Н* защиту выносятся:
1. Комплексный подход к решению проблемы поиска химических веществ с заданными свойствами, который сочетает использование средств вычислительной техники, автоматизированных информационно-поисковых и прогнозирующих систем, математических методов и моделей для установ s ия заэисих • стей между строением вещества и его физико-химическими и биологическими свойствами.
2. Оригинальная компьютерная система для проведс ля научных исследований п'о
моделированию связи .лежду строением вещества и его свойствами с ястлыо-ва''чем фактографических банкой данных, а также информационные технологии, связанные с разработкой нроф<~ -стюнальчых банков данных для химико-биологических исследoí ..»1Й.
3. Математиче( ие модели для предсказания физико-химических и токсикологи-чес их параметров органических соединений и их эффективность по сраг 1ению с зарубежными пакетами.
Луб якацаи. По Т'"ме диссертации олубликов&ко 36 (аучны>. рг.бот. ' ^тоуктура К объём ра .оты. Диссертация состоят из ьведеяи? шест., гла , заключения, amcr-i литературы из ^¿^аимекования и двух поил жекий. Общий об Зм .иссертации составляет страниц, зхяючая_¿J._-—иллюстраций.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
L j введении обосновываете актуальною работы, её практическая значимость, формулируется цели исследования, научная новизна и основные ваг -жения, «вносимые на защит...
В перчой главе рас иатривается комплексный подход к проблеме автоматизации научных иесдедовани" по l.jHCKy химических препаратов с заданными свойствами. Показываете«, что применение -'атематиче ;их методов и ACH И для уста-вог гения количественных соотношений структура — физико-химические сг^ "1ства — биологическая активность а их использование для жстраполхиик на свойства ещё неизученных соединений становятся одцимч из вгжкых и оишяшх путей взыскания i;,iena1 атов с заданными свойсгг ми. Харахтераий тенденцией развития автоматизированных и1.фог мациоинмх ckctí- . является соед5ше;ше а них средств удо влетвопеиия чисто информационных Ботребиост к (поиск в базах данных) y. средств переработки ииформадии (получение нового знания), создание которых связано с программной реализацией существующих и разработкой новых математических моделей и алгоритмов обработки данных. Ядром АСНИ является информационно — математическое обеспе' -ние, включмощее и формааионио — вычислительные системы » системы математи"есхоп> моделирования и обрг-ботки дат Jx аа о< юзе средств вычислительной техники. Далее описывается состаз информационного и ма тематического обеспечения научных химических исследований, а также перечень соответствующих зад. л, решаемых в диссертационной работе.
Во второ.. и ¿ретьей главах описываются компьютерные технолога« по формированию и ведению профессиональных баз данных (БД) по свойствам органических мол< ул, которые являются обнови..слагающими с точки зрения перспектив развития фундаментальных 1. прикладных исследований. *опы :и создания дос-i то* о эффективных моделей и инструментальны средств по вецег ю таких БД в химических исследованиях сталкиваются с целым рядом трудностей, кото,. „I" связаны с необходимостью оперировать нечисловыми ^оъектами ,химическими сгрукту-
рами или ре. циями), характеризуемыми, лом м< ipo'iero, и числовыми параметрами {дозами, хо чентрациями). Существу) .дие системы управления БД недо,.таточно приспособлены к манипулированию такими объектами ак химичесис рафы, к тому же они явл: о гея сис»ема"ч универсального азначения, коте че пасте- :ь-ко сложны, что ст ановятся практически неуправляемыми со es .юны подавляющего большинства, пользователей, ?.. для своей реализации требуют расходования значительных ресурсов. Поэтому, диссертант не стремился к максимальной ут.^ерсально-ти л усложне йости разрабатываемых им средств, а стремился к созданию простой, понятной, удобной и С астрой в усвоении непрофессиональны!,' . пользователями систем«.
Химическая информационно — прогнозирущая система CHANCE (CHernical ANalysis in Computer Environn nt) op'ieHTHj )вана на ведение и обработку слож-nocTpv':Typnpop,a.4jK>H информации о химических соединениях v. ориентацией ,ia ре-aiei'w прикладных задач. Она о< лествляет чоль.зователь< ий интерфейс в режиме диалога г исследователями и noi. оляет выполня ;> t .елующие основные операции:
• ведение химико-би„лоп»ческих Г>Д, включающих ка:; текст р.ую ч числовую, тзк и химическую молекулярную (структурные формулы) информацию;
• поиск химического соединения в БД и его номеру, по п£ оизволы;о.лу усл^ ию над текстовыми и числовы а полями, а та <е по структ. чпой формуле или подструктурам фрагментам:
• ирогн J свойств химических соедшклий по их структурным формулам (СФ) на основе фактографических ВД и методов математического моделирования связи структура — биологическая актив.^сть;
• выгрузка всей БД или ее части, выдаваемой но запросу, в ASCI файл (экс • аорт/имлорт на урс ле ^ айлов);
• печать всей получаемой информации.
Структура БД состоит из набора записей, содержащих поля чг ырех типов: текст, t' -лое число, вещественное число, структурная формула. Формат записи определяется при создании БД. Для з..дання формата отображения ин:] р-мацин используется экранная форма, задаваемая с пои* 1ью встроенного редактора форы. Для просмотра и редактирования СФ используется встроенный графический редактор структурных формул , рьоот? с которым ведётся в режиме, диалога с пользователем в наиболее естественной и удобной форме без использования какого-либо директивного >. .ьгка, причем время ожидания ответ а от ЭВМ значительно меньше времени реакции пользователя на изображение. Системы подобно1, i ',>ода созда: г для пользователя определенный психологический комфорт, предоставив ему возможность мыслить в наиболее удобной и привычной для пего форме, не формулу св т замыслы на фиксированно.« языке. Этим обьясняг сх высокие выходные характеристики системы: с ее помощью можно откорректировать (,'Ф буквально за песко; ко
секунд, а кавык автоматической работы вырабатывается у пользователя з. один
г (.лис.
Экранный редактор СН4 'CHeir'ca! ..ditor 4) предназначен для ввода, редак--"■»гчвани* к манипулирования СФ химическ 'х соединений. Представление структуры с точки зрения БД рассматривается ..ак запись переменной длины.. С точки зрения пользователя, СФ представляется графом с пом ченными ребрами и вершинами, привязанным ii регуляряс"- п .свивальной сетке, что позволяет изображать оси чкые элементы химических структур (кольца, цепи) и виде, близком к приня-тог у в учмиа. Пользовательский интерфейс редактора ппедставл зт собой систему экр^чных мешо с возможное! ю вьГ>ра команд как с помощью клавиатур!- так ** манипулятора "мышь". Кроме, того, для удобства, предусмотрен вво- ряда команд с по"ош ю функциональной хлавиа.уры. Помимо стандартных средст- редактирования (рисование, поме ка, удаление с^ае^-ных узлов или -й структуры, скролли-ров.шя поля редактирования, изменение масштаба изображения, выбора нужно!и ■1 .шг. связи или атома) в редакторе существует гибкий режим сборки из фрагма т-ов, пред"сматривамщий возможность пополнять базу фрагментов и ; льорачивать нужным образом фрагмент перед добавлением его к структуре, возможность сдвигать и вращать Чс-оти структур, устанавливать параметры каждого узла (ч,.оло присоединенных атомов водорода, число вакансий и г.,ложение узла над/на/под плоскостью), а также г аертекс овый Help, позволяющий даже неопытному пользователю легко научиться работе с редактором.
Соединение компьютерной системы ¡.лучных исследований CHANCE ' мощными пьыми средствами вврда и редактирования СФ мэлек^л дает : лчественяыи скачок для -спешного решения проблемы поисха химических пре листов с заданными свойствами. Н; основе CHANCE н СН4 созданы фактографические БД по лнпофмль-вости и молекулярной рефракции органических молекул, по мировому ассортименту химических средств защиты раст* шй, по мутагенным и канцерогенным свойствам химич- ских веществ., m токсикологическим параметрам хими5' ских соединений, которые использовались в диссертации для оценки эффективности предлагаемых па"-ходот и ы делей.
В Четвёртой главе описывается инструментам*, кая система создания прогнозов,.которая 1&л:*тгся сродством моделирования связи между ст]. зением вещества и его бйологической активное^ л. Поскольку эффект взаимо; шет'-чя веществ с оио-системой зависит от многих услови.1, он iMeeT вероятностную природу, поэтому при хнализе связи предпочтительнее использовать вероятностные, статистические модели, а так^е модели теории распознавания образов. Пс трое] !е адекватной мо-I ли, описывающей связь струкз ры соединения с активностью, является сложной задачей, решение которой невозможно без привлечения компьютерных средств математического моделирования на основе фактографических БД по физик» имическим и бяологьвеским свойствам веществ. Пр моделировании связи между химическим строением в/чюлогг еским действием обычно используют различною экспериментальную или расчётную физико-химическую информацию, основанную на г гдета-влениях о озможных механизмах дейс ия. Но для различных классор, соединений
отсутствуют (остаточно надежные, полные i, щ ¡родные данные. В диссертации предлагается м тематический подход, ко'; рый основа:! на знании только С<1 соединения. Для реализации данного подхода по моделированию ( язи создана вы >коэф-фективная компьют i пая система MP (Make Progpo 'ij, которая пред* ^матрив: -т выполнение следующих осьсвных NTanoei моделирования:
» выявление дескрипторов структуры, от, ывающих ./шественные дг проявляемой биологической активности особенности строения соединений обучающей выборки;
* формирование моде, i описания к лекулярной с^'уктуры и построение на се основе математической модели предсказания биологической активности химических веществ;
• проверка модели на апекват ость хнмикп-био.тогичес!. м данным.
Интерфейс пользователя инструментальной системы состоит из четырёх частей, области системных сообц.. лшй. блока общей информации, блока ог"сап«я классов и облает'» функциональной клавиатуры. В о0.1астт. системных сообщений помещается информация о текущее состоянии системы и сообщения об опшб-чх. В области функциональной • 1авиатуры прг гдён гписо.. исполняемых системой следующих команд:
Выбор (F¡) — составление ь„.борки по логическим условиям над полями БД.
Итоги (F.5) — просмотр на экране разметки БЛ с результатами анализа, изменение состава выборки.
Анализ (F6) — анализ помеченных документов выборки.
Прогон (F7) — полный анализ БД.
Печать (F8) —печ. гь результатов анализа.
DOS (F9) — выход в операционную систему без выгрузки системы АхР. Конец (FÍO) — завершение работы с системой.
Б. ок общей информации состоит и семи полей:
чмл прогноза — это имя 6yj. г испольэс аться для идентификации вашего про гноза в си теме;
имя базы данных — БД по которой будет производиться прогн .j, уже дол ж ид существовать;
имя ведущего поля — используется для идент! икации документа для пользователя в итоговой сводке; '
имя поля структуры — тдентифьдирует поле для генерашш дескрипторов и проведения анализа типа структура — биолог ическая активность;
общий заголовок прогноза — исяоль;. ется дг-'. идентификации прогноза пользователем;'
число независим -зх классов —- в прогнозе (любое число от двух до лимита си-ст( !ы по памгти);'
типы используемых .дескрипторов — используются следующие типы десхрип-торов: атом (микрофрагмент) с валентным состоящем; атом (микрофрагмент) — связь — атом (микр рраге ¿т); атом (михрофрагмект) с первым 4 руж -пнем; атом (микрофрагмеит) со вторым окружением; все кра" ¡айшие пути в Г'^афе структурной формулы; вышеперечисленные дескриптор!.., во с разметкой в цепи, кош че или мостике 'ахояятся вершины г; 1фа.
Ьлок описания классов сог-оит из заголоака, который используется для идентификации класс;1 пользователем и логического условия, которое ^-чрактеризует при-вадк.кность ,»окумеата к даннечу классу. У< овяя классоз представляют собой ло-ги"лские операции скомбинированные знаками & (и), ! (или), ! (ло- чческое отрицание) и скобкь.аи () произвольной вложен"ости. Логические операции: сравнение целых и вещественных 1,.1сел ( .<, >, =, !=, <=, >=, в качестве операндов могут выступать числовые кочстаь гы и имена полей целого и вещественного типа, определенные в БД); операция поиска вриочения по, строки в строку <: /в качестве операндов используются имена текстовых полей а БД иле текстовые хонстацты); оцерация сущесч иования *ор! даёт истину, если поле 01>1 в данном документе БД не пустое, и ложь в противном случае. Пример контроля гипотетического документа на при»' длеи цость классу:-
♦ тип ^индекс, к ( "деф" <: тип | индекс > 55.6 ), где предполагается наличие в БД текстового по я тип я целого или вещественного полл индекс. Документ принадлежит классу, если поля тип и ми^екс определены, в поле тип есть подстроха ёеф еле инпекс данного документа превышает число 55.6.
. В разделе 4.1 описывается метод предсказания биологической актизнОсти многоатомных молекул на осгове дескрипторов гр; ¡>ов С<4-, который основан на байесовской теопиь статистических чешений в предположении независимости всех пр]. ша-ь в с линейной дискриминантной функцией вида
+ (1)
где х = (<¿(,¿2,...,(¿„) — вектс наблюдений; <1, ■ 1 или 0 в зависимости от того, присутствует или отсутствует ьй дескриптор в описании соединения; /; — информационный вес 1-го дескриптора при использовании его для различения б. алогически
активных молекул от неактивных:
''(?)
где hu — частота встречаемости t-ro дескриптора а к-й выборке, к — индекс гласса, Nk — объём к-и выборки. При распознавании биологической активности молекул по их СФ использовалось следук цее правило:
если ((г) > с, то х € #i, иначе х 6 Нг, (3)
где Hi есть множество СФ, принадлежащих к классу активных соедии пий, а Hj •< классу неак- иных соединений, причем 1(х) вычисляли по формуле {I) с учётом формул (2). Величин: f(z) имеет простой статистический см> 'л — это количество информации, которое содержит вектор i в пользу гипотезы о том, что < груктура активна против альтернативной гипотезы.
Для определения типа активное i использов; ось правило
logpt(i) > \< 'Pj(x) ,k£j=>xfzX' , (4)
где = 1,2,3 — индекс, соответствующий mit у активности, в нашем - ту чае гербициднои, инсектиция"ой и фуигицидной.
logp^^ = £rf,log—+ -ры) . (5)
* — рн
Для проверки эффективности предлагаемого попхода была выбоана БД по мировому ассортименту пестицидов, которая содержала информацию о 757 веществ Т] х типов биологический активное i — гербицидной, инсектицидной и фунгицид,юн. В качестве нес тивных веществ был взят стр. к гурный файл 2800 соединений из атласа спектроз ЯМР,3С, а признаками являлись следующие четыре типа дескрипторов:
• микрофрагмент — связь — микрофрагмент и микрофрагмент с учетом первого окружения, с отметкой кратности повторения дескриптора в СФ.
• те же дс крипторы, но с указанием нахождение микрофрагмента в цени или кольце;
• микрофрагмент с указанием валентности, кратности нахождения ч структуре, размещения в цепи или кольце;
• микрофрагмент с указанием валентности, кратности г хождения в структуре,
метками, показывающими, в ц< я или ..ольце находятся он и его связи.
Задача выявления критери«; распреде; иия соединений по классам активные и неактивные, а гчутри класса активных — по тре;1 типам активности решалась с использованием упомянутых выше множеств дескрипторов и решающих правил (3) и (4).
В диссертации приведены экспериментально полученные зав' имости уг товных вероятностей ошибок первого ( ' ) и второго рода (Й) относительно выбир.ем« о пи рога при разделении веществ на два класса. Вели .инь- t\{c)f /3j(с) под< итаны дл? всей выборки = 757, jV2 = 2800 по дескрипторам первого тип, orj, ßi — «ля
. ескрипторов рторого типа, cv3, — для дескрипторов третьего типа, 04 Д5 — о учеяя«" (рандомизированная выборка с JVi = 324, Л"; = 3 372 — дескрипторы первого типа), íis, /05 — экзамен на соедино'" чях не рошаццгих в обучающую выборку (ЛГ1 = 224, N2 — 3019, деск{ игоры первого тиаа), ав,/?е — да« дескрг торов че-гвертог i тш i.
Показано, что 1ц<и применении минимаксного праэиля условные вероятност и ошибок сост. .щяют все1 ■ от 10% до 15% в зависимости от типа используемых ,ю...зрип-торов, полученных по достаточно бояыьой выбор.:в. Kpz: je ошибок на обучении и экзамене практически не различаются, что свидетельствует об устойчивости полученных одеяох Процент . ошибок прч использовании соответствующих решающих праьц:
Для выраб< г*., критериев определения тип активности соединения, если оно признано активным, выборка активных оединеняк была пазбита Еа три группы активности: гербяцг дну», фукгицвдкую к инсектицидную. решения принкмалиг г ) правилу (4) и дескриптор: \¡ первого типа, результаты которых представлены ниже.
ЧЛСЛО ВраВКЛШ'Х ответ-« 53 ОШИбК! при прогнозе активности
Предъявлено Прогнозируемый класс активности % сишбох
-ербицид! фунгицид | инсектицид
Гербициды 225 7 ■ ' 7 5.S ■
Фунгициды 17 ПО ¡ 7 17.8
Инсектициды 1 л и 4 j 193 7.6
■ Полу .енные результаты показывают, что опкеакйе структура долекул на языке атомов и связ и с учётом .ии. без учёта первого окружения и использование алгоритмов теории статиста «сих решений делав-1 возможным я эффективным вычиелгзи; вероятностей гипотез об активное ге гипотеткче-ких структур без привлечения более сложных оаисаня,! и алгоритмов.
3 пятой глазе предложены и исследованы математические модели ь^эдехазань л физико-химических св йств органически молекул, а также приводится сравнение их с зарубежными и отечественными разработками. С-здание и использование математических моделей для прогнозирования свойств органических соодгченкй эл'-сто : спернментгльного их изучения является одним из основных nyTi.ii интенсификации научных исследований на всех этапах разработки яовг'Х физиологичесха активных химических веществ. Широкое применение математических V „-годов и компьютерных технолог: 1 в решении задач моделирования связи между строением вещества и ею физико-химическими свойствами включает несколько основных аспектов, связанных с необходимостью иметь: методь. кол ¡ественного описания химической структуры, т.е методы преобразор ния молекулярной структур \ в н^-бор численных } -ск] пторов, связанных с определенными свойства»»«; математическ-е модели установления количеств« ной связи между этими дескрипторами и физико-хи» ческими свойствами; Программные средства, реалиэукмщ исяольз; мые модели; базы дан-
ных и знаний, содержащие экспериментальные данные для проверки эффективности тех или иных моделей и выбранного способа описания.
Компьютерный расчёт физико-химических параметров и их использование в да ,-нейшем для лроп. ла биег гической активности молекул является, одной у важных задач современной химии. При моделировании этих параметров широкое применена нашли эмпирич. ск ч модели, базирующиеся . принципе г'руктуриой аддитивности, которые обладают следующими недостатками: пинкой точностью, узостью области применения -о классу химич ских веществ и диапа-юпу изменения параметров. Компьютерная систем чьчПа, хранения и обработки .''изико-химическор :| структурной информации CHANCE позволяет поставить на качественно новый уровень решенк следующих _ч1дач:
» полной автоматг -.ации расчётов по описанным в литературе моделям (первое начравлг ие);
в ревизии структурно — аддитпных моделей г. использованием новых структурных эле.«'"нтов (»торсе и: правление) ;
■ разработки новых- структурно — леадштшных моделей (трс гье направление).
Далее в этой главе при моделирс; шик связи ¡..¿жду строением вещества и его физико-химическими свойствами показывается возможность пр< ресса по второму и трет .ему направлениям.
В общем случае искомая величина физико-химического гяраме'та / молекулы представляется как линейная функция ..гаогих переменных, каждая из которых есть количество подграфов СФ, принадлежащих определённому типу. Следуя этом", рассмотрим класс, соединений, хаждое из которых включает в себя не более п заданных înnos атомов X1. X', ■ ■ ■, X"'. Расчёт физико-химического свойства / структурного соединения П из нашего класса може-; быть проведён по формуле:
/(£?) = £e.-[r'j + £ ayPf'fcX'') + • • • + ~£ a{,..<JX<,kXi>k---b*i-], '
•=i (<J) ..,->-)
где [Ач&• - ■ &Х'"] — количество подграфов типа • • -LX'"), причём каждый
из индексов t^, ¿2, • • •, tn пр' бегает подмножество из {1,2, ■ • • ,п}, которое ье включает в суммирование изоморфные подглац^ы. Величины а,-,, где .* = 1,2, ■ • ■, и определяются с помощью статистических мегодоь, исходя из зкепериме" гальных данных. В диссертяции используется упрощённый вариант используемых типов подграфов (атомы с эал<,:тным состояние.., атом — связь — .том и цеиоч«и атомов произ! ильной длины без указания промежуточных вершин, т. е. типы подграфо" A"', (Jf'fcX») и {Xi>kXi2&---Sc*i*), где в ( ' • • • ЬХ4") промежуточных вер-
шин X12, • • •, А1"-1 нет, а есть только конечные ьир-чины X" и А''", связанные между собой крат .йшим путём, состоящим из типов связей между вер'чина' и, входящими в тот путь, например, С V--= С//2).
Данный подход позволяет про позировать различие физико-химические параметры, в частности, липоЛнл! юсть oj.. анкческих молекул. Именно липофильные сн >й- • ства определя. л как способ!: сть молекул проникать через липидиые слои мембран, так гидрофобное ' ■аимодейстаие их с отдельными у астками рецептора, В работе авторов (Camilleri Р., Watts S.A., Boraston J.A.) приведены средиеквадратические погрешности предсказания этого показателя на обучающей ..ыборке в 217 соег нений двумя программами, которые составили а ~ 0.275 и <х = 0.258. При расчёте по выш приведенной модели с использованием скользящего контроля среднеквадрати-ческая погрешность составила <т = 0.157, чз - дает заметно более высокую точность. Авторами (Смоленский Е. А Пономарева 1. А., Зефиров Н. С.) была достигнута среднеквадратическая погрешность и = 0.119 при , лучении на 172 np пводных бен-~ ла, что хорошо согласуется и с расчётами диссертанта но этой выборке да. яых (<т = 0.121 при скользящем контроле). Но эти эксперименты строились на ограниченной выС. ¡же химических веществ в рамках шределенного структурно химического класса, что не позволяет переносить полученные результаты на другие классы.
Диссертантом была создана БД по экспериментальным значениям липофилыю-сти объемом в 3500 соединений из разли пых химических классов, которая ь Послужила основой длч проведения различных вычислите -иных экспериментов по моделированию этого параметра, результаты одного из которых с использованием скользят -го--онтроля приведены ниже.
О
Остаточная сумма квадратов 262.54
Сумма к и аратов регрессии 12305.15
Полная сумма квадратов 12567.69
Средний квадрат регресс!: 1 58.0
Диспепсия ошибок 0.157
Стандартное отклонение 0.396
Коэффициент детерминации 0.979
'Коэффициент корреляции 0.989
Критерий Фишера 373.25
Табличное значение Фиикуа Р(210, 1688, 99.9%) 1.76
Процент необ-ьясненнога стандартного отклонения 14.5%
Друге 1 подход компьютерного моделирования связи молекулярного строения с биологической активностью состоит в порождении иных дескргчторов, которые отражают пространственные корреляции локальных физико-химических свойств на молекулярной структуре. В диссертации использовались лишь некоторые из них, а именно, спектры плотностей физических свойств по отноц- нию к вершинам молекулярной структуры, дающие богатое описание молекулярных структур в терминах дескрипторов с ясной физической интерпретацией, которые определяются соотношениями:
ед = Х>(г.;-0 «-,•„ (6) >
{£%«-!) (7)
ддо-Е^-'Ж..-^) (в).
1 •/>>
от = - 0 К* - о.,„Г, (9)
где 2,7 = 1.. п — номера вершин мо„ч кулярной структуры; г,,- — расстояние между вершинами г и 1; 1 ^ — вклад в физическое свойство, нумеруемое индексом а, связанный с в' зшиной /; / = 0... £(г — /) — символ Кронекера.
Структурио-аддитивь-ле модели расчёт., физико-химических параметров имеют вид
Л = Я0 4 Л, (10)
' х
где п. — число структу; 1ых элементов ¿-го типа в молекуле; П, — инкремент 4-го структурного элемента в величину пзоаметра П. Описанные в литературе модели для расчета лкп. фкль ;остя характеризуются на разнородных в- борках хими-.еских соединений среднеквадратичн' гмн ошиб) 1ми 0.-. 0.5, что намного больше погрешности экспериментального определения. Традиционный путь уточнения структурпо-ад штивных моделей, рассмотренный в' тше, связа с усложнением структурных фрагментов, что приводит к увеличен! ю числа подлежащих определению параметров. Альтернативой этому является уточнение структурно-аддитивных схем посредством 3 (ёта влияния окружения исходных структурных фрагментов (в качестве которых в диссертаций взяты атомы с учётом Е? юнтного состояния) через локальные физико-химические свойства, в первую очередь электронные и сферические, В качестве исходных факторов при конструировании моделей неаддитивных зкладов и< ользова-иы спег ?рь' плотностей физических свойств (локальных зарядов п ван-дер-ваальсовых радиусов) по отношению к вершинам молекулярной структуры, определенные соотношениями (6)-(9). В соотношениях (6)-(9) вместо индекса 1 введём нумерацию из двух индексов: г —У {г, г Л где I — 1... Г — тип вершины молекулярной структуры чатом о учётом валентного состояния), ¿1 = 1...гм — номе 1 вершин ¿-го типа. Пусть -,)„(/) — любой из спектров (6)-(9). Усреднённые, по вершинам ¿-го типа спектры:
=--Е %,-,}«(') (чх
Обобщённая модель (10) име^г тот же ввд, ьо с величинами
Л, = *, + .$*-«, (12)
где^тг, —линейная ; ш нелинейная функция компонент спектров (11) с подлежащими определению коэффициентачи, отбиваемыми'пошаговой регрессией.
Достигнутая в pa.iu.^x этого подхода погрешность расчёта лшюфильности состав тает 0.1-0.2 в чависимости от химического класса, а на разнородных классах ошибка «а контрольной выборке составляет 0.31, что улучшает прогнозирование данного ноказател.. по сравнению с работами зарубежных авторов (Hansh С., Leo А.; ьугпап W. J., ftehl W. F., Rosenblatt .). Н.; Rekker R.F.). Дальнейшие jk< еримен-ты заключались в сравнении экстраполяциопной способности предложенного метода рас«, ¡га липофильносги с известным методом гидрофобных фра. .»гентарных констант Рекке.ра (Rekker R.F.) и методом ня основе топологических индексов (Др-боглав В .В.). Получены следую. ;де соотношени" между стандартными сшибками, основанными на экзаменационной и обучающей выборках: для метода на основе топопологических индексов <гл/<г„ = 1.3G9; для метода Реккера а3/сг0 = 6.081; для мет^ча предложенного в диссертации a^jo,, — 1.057, что следует из результатов эксперим чтов, в ходе которых получены уравнения со следующими статистическими характеристиками: R ~ 0.968,<тс = 0.296,Л' = 1702 — на обучении и R =0.964, = 0.313, Л' = 1761 — на экзамене. 13 экзаменационной выГ рке vn были представлены соединения, которые входили в обучающую выборку.
Развитие различных отраслей промышленности, особенно химической, использование химических удобрений и пестицидов в сельском хозяйстве привели к постепенному загрязнению окружающей среды множеством химических веществ, кото"Ы<у^» огромном количестве попадают в почву, воду и воздушную среду, где преобразуются в еще более токсичные продукт' i, вызывая отравления и различные заболевания, в том «иске i iKoreHiiue. В целях предупреждения огрнцагельных последствий химизации ма4ХЩ1юго хозяйства в различных странах сложились ил» создаются системы предупредительных мероприятий, среди которых одним из главнь. является токсикологическая оценка химич!. ких веществ , включая их предварительный отГ р для последующего производства и применен!.,.. Поэтому, поиск новых высокоэфф. лтив-ных и безопасных для человека и окружающей среды химических вещее 1 в является важнейшей проблемой мировой науки. Значительное место в ».. /й проблелк аннмис . задача прогноза параметров токсичности (LDF,o СК50 и др.) органических соединений, необходимость практическою решения которой тесно связана с с тем, что при использовании традиционных методов нормирования химических веществ и существующих мощностях токсикологических лабораторий не..¿ходнмой токсикологической оценке и гигис лическому регламентированию подвергается но. более 10% новых химических веществ.
В связи с этим важное значение приобретают разработка aj. гернативных принципов нормирования и методологии ускоренной токсикологической оценки новых химических веществ, что позволь i1 существенно сокр тить объем и время для экспериментального обоснования гигиенических и токсикологических нормат ивов. Поэтому, применение химических веществ требует тщательной проверки их безопасности тя людей и окружающей среды и связано с использованием большого числа дорогостоящих тестов, альтернатив т которым является математическое моделирование
характера "роцео (.-вэаин'одействья химического вещества и живых организмов с использованием фактографических банков данных по показателям токсичности. Из-за отсутствия 1 большинстве случаев адекватных теоретических представлении о механизмах биоло! ическо! ; действия, из-за сложности процессов, происход них с веществом в живых системах, широкое применение находят эмпирические закономернее га, устанавливающее связь между строением молекул их с] ;зико-хи' чческими и токсикологическими характеристиками.
В шесто" главе исследуются эмиири«пскне обобщения < форме современных методов я моделей многомерно!: регрессии, а также теории рас! знавания образов. 13 качестве информационной поддержки исследуемых моделей использовалась фактографическая ЗД по токсичности органических молекул объемом в 4.,24 соединений различных с1руктурк0-химических классов. Предсказание ЬОб осуществлялось в два этапа. Сначала ос, ществлялся качественный прогноз, п< лволяющий определить класс токсичности или опасности вещества, что является весьма аг уальной задачей, так как во многих химических исследованиях нет необходимости в строгой оценке параметров токсичности и достаточно знать классы опасности веществ, затем в каждом ез классов гоксичностг строились ог-имальвые регрессионны^ зависимости и л- ним осуществлялся количествет..лй прогноз. Прогноз клас<« токсичности осуществлялся основе модпей и алгоритмов распознавания образов и байесовской теории статистических решений с иа ;льзованием минимаксного к-'чтерия.
Провг-жа раоотои<особ"ости ж эффективности решающего правила исследовала«- па выборках г.с определ :ию класса токсичности, указание которых вместе с выбором информативных подструктур: ух фрагментов осуще-твля-т—ь автоматически при помощи оригинальной СУБД л системы запросов к БД. Вся выборка разбивалась па четыре класса опасности. Нервы1"- класс содержал 479 соеаиве"ий и показатель токсичности лежал з интер.ва *я 0 < ЬОго < 50, второй -— 654 соединения и 50 < < 2С\ третий - 1402 соединения и 200 < 1Л>50 < №00, а. четвертый — 9089 соединений и ЬОЕо > 1000. В качестве при-накового пространства использовались подструктура»: • дескрипторы, порождаемые авт1. .¡атически и описанные иа языке атомов к функциональных групп с учётом их валентное состояния, а также иепочек произвольной длины с указанием -»хождения атома или группы в цепи, кольце или мостик- Йнфсчгтгдаюсть дескрипторов оцег. валась по критерии л -вергеиции Кульбака
п • ■! У2 , ,, ,
■ АГг ■+
которая являете- мерой различчмости двух выборок по г-му признаку ч выбирались те из них, у которых ^аачения критерия превышали порогоьче значение. Отнесение химического соединения к соответствующему классу токсичности производилось п'> значениям ! — егк, где — ошибка втор. . о рода для к-го класса в зависимости от отношения правдоподобия /, л значение к, па кг.тором достигается тах (1 — £■)"), и является номером класса опасности. Точность преяокаочция,( роце .• правильных решений) при скользящем контро.™-' по выбранным жлассам токсичности колебалась
в пределах от Я9% ,чо !)5%, что хорошо видно из гюл;уч>";шь:х экспериментальных зависимостей вероятностей о:иибог ^ к £2. Ниже приведём график зависимостей ошибок для четвёртого „ласен опасности.
Рис. 1: Зависимости вероятностей ошибок первого и вток .го рода.
Количественный прогноз осущеетяля. ся на основе неадднтявных моделей, которые имеют вид:
£ >1.
где — парциальный вклад Ь-х структурных элементов а параметр / = 1п —Ц^, где М есть молекулярная масса молекулы. В каждом классе опасности строились оптимал' тые регрессионные уравнения, в которых величины Д. определялись исходя из экспериментальных данных устойчивым методом наименьших квадратов. Результаты одного из вычислительных экспериментов с использованием скользящего контроля приведены ниже.
Кл' с.ы то -и'.шос - 'i I 11 111 IV
Остаточная сумма квадратов 86.32 г~ 74.79 160.33 361.42
Сумма нитратов регрессии 1У 14.52 568.СО 1275.80 11760.44
Полная сумма квадратов I8M.H4 (i-13.39 1436.13 12124. i
Средний квачрит , ^гресг'Ч ;)■:.::» 11.37 25.52 235.21
Дисперсия ошпОок 0.28!) 0.1 G4 Ü..G3 с.251
Стандартная ошибка 0.Л 18 0.Í05 0.404 0.501
Коэфф ициент детерминац;"т Г 055 0.SS4 G.oSS 0.970
Коэффициент коррелят. .1 0.977 0.940 O.u-13 0.9S5
Критерий Фишера. I2G 70 157 936
Прош-пт несбъяенешюго
стандартного отклонения !,05ч 21.2% 3-4.1% 33.4... 17.3%
Средня« относительная ошибка 23% 20% 19% 17%
Иг. литературы известно, что основной параметр т< хнчпогти lg LDso определяется з зкснеримев ах на животных, npi, тк обычно стандартное отклонение, связанное с г-.грешностью о..сперямеята. находится « пределах 0.3-0.5. Там же тмечено, что естес. веяная, биологическая зариаб«г ость эт 3 величины eme 'ольше, поскольку известно, что саа.завигаг от возраста животных, времени года и еще от мпоглх факторов, определяющих её р-тсгентног-гь Из приз* 'еиных результатов и вышеска-г&квего следует .¡ыса t-ч эффективность системы при компыот оном расчете uÜ50, сравнимая с экспериментален) определ- тем У. <й величины. Отмечается, что ко. .-мерчесхий пакет TopKat »меет стандартное отклонение, связанное с погрешностью пр гнозирования, равное 0.62 я коэффтциепт к<.-реляции равный и.721. ¡ice это позволяет сляпать зыэад о том, ч? прогноз по оачработашшм моделям даёт более высокую точность, чем TopKat. Созданная компьютерная «шформационпо-поисловая с стема представляет собой -гащный инструментарий, который да», г возможность в режиме диалога вести оперативный п' -5гноз токсикологических показателей, проверят.. на больших выборках гапогезы о связи структуры р-ществ с их биологическим действием, а тачже англизировать сравнительную пнформать туго цет. сть различных гручя факторов при изучении механизмов взаимодействия веществ с живым организмом. Систем» позволяет повысить достоверность "олучаемых научных результатов в помогает существенно снизит!, трудоемкость hci леловательских работ за счет качественно нового их уровня.
J заключении приводятся оспоыше результаты диссертг ли:
1. Разработан комплексный подход к решению проблемы поиска х .мнческих веществ с за '.иными свой« вами, который сочетает использовании - сг "пств вычислительной техники, автоматизированных информационно-поисковых и прогнозирующих систем, мат»матич< ких методов и моделей для установлени зависимостей мел .у строением вещее, ва т его физико-химическими и биологическими свойствами.
\ Создана оригиналы я компьютерная система для ..роведения научных исследований по моделированию сь,.зи между строением вещества и его свойствами
с использован: ^м фактографических банков данных.
3. Предложены и исглед ланы м. i-ематические модели для предсказания физг.чо-химичес. их параметре' эрганических соединений. Проведено сравнение эффективности эти> моделей с зарубежными подхода: т. "
4. Предложены д исследованы математические модели стр чтурно-иеаддигивного тина для предсказания параметров токсикометрии (на примере LJsuj- Проведено сравнение с зарубежным коммерческим пакетом прогнозирования параметров токсикометрии.
5. Созданы информационнее " лчиологиа, связанные с разработкой профессиональных банков данных для химико-биологических исследованя.1.
6. Установлена необходимость и перспективность разви тия исследований в облает. создания компьютерных средств, ^тематических моделей и методов анализа струя 1'урно-химической и биологической информации на основе фактографических банков данных.
7. Реальный экономический эффект от внедрения Результатов работы в различные организации составил 684373 рубля в год в ценах 1990 года. Это подтверждается соответствующими документами, хранимыми в ИГУ.
О
Список основных публикаций автора по теме диссертации: •
1. Мучник В.В., Нигматулл-и P.C., Осипов А.Л. Диалоговая система ввода мо-лекулярны. структурных формул в химические базы данных // НТИ. Сер. 2. Информационные процессы и системы. Москва, 19>-"í. N 8.
2. Осипов А.Л., Нигматуллин P.C., Пузаткин А,П., Коппог В.. .. Статистический метод предсказания биологи ческой активности многоатомных молекул на ос; >ве дескрипторов графов структурных формул//Хим.-фа'рм. жури. 1985. N 2.
3. Осипов А.Л., Нигматуллин P.C., Зацепин 13.М. Лингвистические .. программные средства создания баз данных по химическим реакциям /, Разработка' д использование словарио —• терминологических средстг документальных ИНС: Сб. научн. тр. ГПНТБ СО АН СССР. Новосибирск, 1987.
4. Осипов А.Л., Нигматуллин P.C. Пакет прикладных программ для исследования связи структура — свойство многоатомных молекул // ЭВМ в аналитической химии. М.: Институт геохимии и аналитической химии АН СССР, 1987.
5. 3? пепин. В.М., Нигматуллин P.C., Осипов А.Л- Структурно-аддитивные и структурно-неаддитивные медели расчета свойств органически.. соединений // Сип-тез и применение пестицидов и кормовых добавок в сельскохозяйственном производстве. Волгоград, 1988.
6. Осипов А.Л., Нигматуллин P.C., Зацепин В.М. Пак<>т программ для анализа и прогнозирования связи молекулярная структура-свойство // Информацион мй бюллетень но химической промышленности стран членов СЭВ. N 2 (119), 1988.
7. Нигчатулг-'н P.C.. Осипов Л.Л., Карпова H.A. Система поиска и анализа патентной информации о химических соединениях // НТИ. Сер. 2. Информационные процессы и системы. Москва, 1989. N 1.
8. Нигматулл.ц P.C., ^сипов А.Л., Лазуткин ЕЛО. Миоготерминалык- ' система для конструирования оригинальных химических структур с заданными свойствами /7 Гелексммуника.лйо чые средства исподьзо1»н...)я банков д тных: CP научи, тр. ГПНТБ СО АН СССР. Новосибирск, 1990.
9. Осипе-' А.Л., Чигматулдин Р.-., Зацепин В.М. Использование баз данных по химическим реакциям для • орреляцнй типа "структура - реагент — прощ г выхода"// Эффективность использования интерактивных библиотечных систем- Об. научн. тр. ГПНТБ СО РАН. Новосибирск, 1994.
10. Осюь .» А.Л., НягмаТуллин P.C. Семенов Р.Д. Компьютерная система поиска я анализа данных о груктурных, биоло! ических и физико-химических свойствах веществ (CHANCE) // Математические проблемы экологии. Нов''-ибнрск, 1994.
11. Осипов А.Л., Семенов Р.Д., Зацепин В.М., 3ai ;руйко П.Г. Создание машинных систем пр. дсказания свойств веществ по их структуре п генерации структур Hi ;ых соединепю», обладающих заданными свойствами. Отчет по НИ .' НГУ. Номер гос. регистр. 01800026762. Нсвосибвр 1995.
12. Осипов А.Я., Сек. mm Р.Д. Компьютерная система анализа и прогнозировании« фкзгко-химйческих л биологических свойств в, .десте // Труды Международной хоЕфереппиа '" Н^-вые . .кформационные технологии в унизерсвт« . схом образования'1. Новпсибирсх, ¿§95.
13. Осгпов А. Л., Семеаоа Р. Д. Математические модели ртрсссип и рзслозтаяа-HI î образов в токсикологических иссл дозаниях ,'/ Непрерывно-логические метода 'я модели в науке, технике а эковсклхе. Пеяза, 1995.
14. Осиное А.Л. Моделирование физ™ко-химических свойств органических мо-j.-жул с 'использряэнием ты"ьютеряых технологий // Компьютерные технолог па г. учебном процессе. Казань, 1995.
»5. Осипов А.Л. Обучающие и прогнозные системы я химии // Труды начио-. кальногэ научно-технического семинара с международным участием ''Экс.^рткые,и. обучак. да системы". Саратов, 1995.
Zacepin V.M . Osipov A.L., Semycnov R.D. A System rir Computer Prediction f Physical, Chemical and Biological Properties of Organic Compounds //' Optoelectronics, instrumentation and Data "rocessing. No. 5, 1У95.
17. Осипов А. Л., Семенов Р.Д. Мотеля прогнозирования ток, асологическихсвойств химических веществ//'Автометрия, 1995. N 0.
18. Осипов А.Д. Ииф^рмз-щонно-йсследоЕат-зльска!! .система по предсказанию свойств органических -еществ // Труды VI Сибирского нау\ ..ого семинара с между-* народ; ым участием "Информация в фундаментальных, гуманитарных и приклад ных научных 51с.следов'г>чиях". Новосибирск, 1996.
Подписано к печати 11.07.96
Фопмат 60x84 1/16 Объем 1.31 п.л.
Заказ N 320 Тираж экз.
Ротапринт. НГУ, Иовссмьиг г-90, Пирогова, 2
-
Похожие работы
- Организация структур данных и технологическая реализация фактографических информационно-поисковых систем в автоматизированных системах научной и технической информации
- Методология прогнозирования свойств химических соединений и ее программная реализация
- Программная система прогнозирования свойств химических соединений
- Разработка автоматизированных подсистем регистрации и классификации химико-структурных данных с использованием формул Маркуша в системе информационного обеспечения по проблемам химической безопасности
- Разработка алгоритмического и программного обеспечения для проектирования и поддержки регионального банка цифровой геологической информации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность