автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Применение системного физико-химического подхода к поиску взаимосвязи структура-активность
Автореферат диссертации по теме "Применение системного физико-химического подхода к поиску взаимосвязи структура-активность"
8 О 1Ч^ДЕМИЯ НАУК СССР
чИ
ИНСТИТУТ ФИЗИОЛОГИЧЕСКИ АКТИВНЫХ ВЕЩЕСТВ
На правах рукописи
ЧИСТЯКОВ Валерий Викторович
ПРИМЕНЕНИЕ СИСТЕМНОГО ФИЗИКО-ХИМИЧЕСКОГО ПОДХОДА К ПОИСКУ ВЗАИМОСВЯЗИ СТРУКТУРА — АКТИ ВНОСТЬ
(05.13.16 — применение вычислительной техники, математического моделирования, математических методов в научных исследованиях в отрасли химических наук)
Автореферат диссертации на соискание ученой степени кандидата химических наук
Черноголовка 1991
Работа выполнена в Институте физиологически активных веществ АН СССР.
Научный руководитель: доктор химических наук, профессор О. А. Раевский
Официальные оппоненты:
доктор химических наук, ведущий научный сотрудник В. А. Шляпочников, кандидат химических наук, научный сотрудник В. А. Пал юл им
Ведущая организация —
Всесоюзный центр биологических испытании химических соединений, п. Купавна, Московская область
Защита состоится ^апреля 1991 года на заседании специализированного совета 003.(37.01 Института физиологически актив-пых вещепг, ЛИ СССР, 142132, и. Черноголовка Московской области.
С диссертацией можно ознакомиться в библиотеке Института физиологически активных веществ АН СССР.
Автореферат разослан „
199/ г.
Ученый секретарь специализированного совета кандидат химических наук
Е. Г. Киреева
© Институт физиологически активных веществ АН СССР
члЧ !
введение.
аэг. ряЬработка теории, связывающей строение и свойотвэ ¡¡щи! иг; является одной из наиболее фундаментальных и *туальных в наше время проблем. Возможность целенаправлен-эго синтеза - вто путь к отказу от экспериментального ^следования тисяч и десятков тысяч веществ, зачастую опоо-¿х в экологическом отно" энии, сокращению объема необходи-IX биоиспытаний I резкому снижению затрат на эти цели,
актуальность иооадовлгая.
Данная работа посвящена дальнейшему развитию и реализации цей, заложенных н системном фионко - химическом подходе к зтановлению связи между структурой соединения и проявляемой и активное! .ло. Проведетюе исследовэшго било стимулировано лребностями химиков-синтетик в и биохимиков в достаточно ростом и экономичном методе предсказания, ьаличия или гсутстния некоторых свойств и их комбинаций при гаэкспяримантальном конструировании веществ с заданными зойствами. Переход от эгятирнческого описания к разработке здержателышх моделей биохимических и биологических эоцессов требует количествеггного моделирования основных зкономержгтей. Анализ построенных моделей позволяет по звому эценить протекающие процессы, обо^щи-ть им кяцуюся ?формацию и извлечь новую за счет агрегппщ существу идей.
и основные задачи работы.
Основная цель работы - разработка и применение методов люка связи структура - активность на основе, объединения ' »тодов распознавания образов и методов построения регресси-шых зависимостей. При этом решались задачи: I поиска оптимального для конкретных областей приложения шештя исследуемого массива соединений. I выбора методов обработки данных, наиболее соответствующих ¡утренней структуре поставленной задачи и позволяющих :ртить ,)ту структуру.
I разработки и испытания н.1 практических примерах ¡огромного '"'молочения для <. .работки данных.
НАУЧНАЯ НОВИЗНА.
1.Разработаны оригинальные методики выбора оптимально! модели описания структуры соединений исследуемых массивов, сконструированы новые дескрипторы на базе донорт*о-акцептор-ных факторов, позволяющие полнее учитывать способноси активных центров к межмолекулярному взаимодействию.
2.Исследованы возможности разработанных методов на примере построения моделей прогноза :
термодинамических свойств комплексообразовакш полидентатных лигандов с кальцием в вод i (физико-хкмическа! стадия взаимодействия);
- констант ингиОирования фосфорорганическими веществам] ацетил- и бутирилхолинастеразы (стадия 1л vitro) ;
- психотропной активности в ряду макроциклических полиэфиров (стадия in vivo). •
3.На базе предложенной методики созданы программно-алгоритмические комплексы РАСТР и K.WAC, рассчитанные н мши- или микроэвм.
ТЕОРЕТИЧЕСКОЕ И ПРАКТИЧЕСКОЙ ЗНАЧЕНИЕ ПОЛУЧЕНИИ
•."РЕЗУЛЬТАТОВ.
I. Разработана и успешно применена для различшх задач схем автоматизированного вычисления д^норно-акцепторных факторов Показаны на практически*. примерах их исключительйо высоки 'прогностические свойства.
В. Полученные регрессионные -зависимости могут быть использс ваш' для оценки апологической активности, кинетических ког стант, энтальпии или. константы комплексообразования ДJ неисследованных соединений.
. . АПРОБАЦИЯ РАБОТЫ. Результаты исследования докльдывали< на конференции молодых ученых (Тарту, 1987), конференции i целенаправленному синтезу лекарственных средств (Купавн; 1989). ' •
ПУБЛИКАЦИИ. По теме диссертации опубликовано 9 работ.
ОБЪЕМ РАБОТЫ. 'Работа' мзлокэна . на 130 страниц; .машинописного текста,. Содержит; 9 таблиц и 4 ри^унко: Диссертация состоит из введения, гг;<зх глав, выводов, qrmc: "литературы и прйлозкейия.
. ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ. ,
В первой главе проведен обзор компьютерных методов ¿явления связи структура-свойства.
Во второй главе рассмотрена реализация систешогг лзико-химического подхода на основе комплексов "РАСТР" и ШРЛС".
Физико-химический подход, развитый в работах (Раевский, эвиков, 1982; Раонекий, Авидон, Новиков, 19821 в значительна степени детализ1фует описание структуры исходя из эедставлений о донорно-акцепторном характере взаимодействия гбстратов с рецепторами. В этих публикациях было предложено тарифицировать дескрипторнне центры(ДЦ) на основе значений ггальпш (ДН)" кошлексообразования с их унификацией на базе даней шкалы донорных-акцепторных факторов согласно уравнено
.ДН^ЧАН,,!^
. Значения Е± л Ед являются безразмерными и характеризуют иосительную способность активных центров к взаимодействию.
Для широкого внедрения донорно-акцепторных факторов [АФ) в практику конструирования биологически активных щэств автором под руководством к.ф.-м.н. А'.М.Сапегина была ¡зработана единая автоматизированная система оценки :ачений (Е ^). 'На этом этапе был .реализован и достаточно роко испытан алгоритм расчета Е±(К;)), основанный на рреляцнонных уравнениях С Мартынов, Раевский. 1980 ], язывавдих значения ДАФ с индукционными и резонансны1®. нстантами Тафта заместителей. В алгоритме предусмотрен ад- ' матический расчет-констант Тафта но введенной структуркой рмуле и описанным типам атомов.
Входной информацией для'работы алгоритма является: Количество ДЦ, для которых надо рассчитать Е1(Е^). Номера выбранных ДЦ (все атомы в структурной формуле онумераваны>. . ■ '
тип и количество присоединенных атомов для каждого атома руктурной формулы.
Таблица связности.- _ '■_'..
'Для конпевых вершин в библиотеке программы хранятся
табличные значении констант Тафта t Hanach. , Leo 1979 ] дл] каждого типа атома.
После определения констант Тафта для всех концевы; атомов дашюго фрагмента, рассчитывается констак/а Тафта дл: фрагмента нв основе регрессионных уравнений; выбор уравнени: определяется типом атома корневой вершшш фрагмента. Зате1 поиск возобновляется по остальным ребрам rpt¿-представления f Подробно алгоритм расчета долорно- акцепторных факторо. ошсан в работе [Сапегин, Раевский, Чистяков, 1987 (1)].
Полнота и корректность описания структуры при системно] физико-химичеоком^ подходе достигается за счет включения базовый набор описания структуры различных информационно-то пологических индексов [Станкевич, Оефиров, Станкевич, 19U3) молекулярных физнко -химических параметров, индексов на баз донорно-акцепторных факторов [Раейский, Сапегин, 1980] отражающих' структурные свойства, связанные с различным видами межмолекуляршх взаимодейстси":. При этом первична модель описания структури формир/ется nyiOM иоключени малоинформативных дескрипторов из базового набора с помощь пошаговой процедуры дмскримшшнтНого анализа ( метод " обоб щэнногЪ гпртрета " ) г Банник, 1984 ].
• Качество решающего правило оценивается по экзаМанацион пой выборке сонд1г».л1ЛИ из соотно .ения правильных и ошибочны результатов отнесения.
Выявленное минимальное пространство^дескрипторов слум основой для моделирование описания структуры соединена путем введения новых дескрипторов, содержащих информащ лна логичную виде ленным tu гирмэтиышм дескрипторам и обладак щих ясным физическим смчедом, и последующим дискриминант анализом нового иаОра дескрипторов до тех пор, пока • будет получено компактное содсржатолыгао описрние структу] исследуемых соединений. Далее строитсе регрессионная моде, на характеристических' компонентах сингулярного разложен, матрицы плана. Коли .эти комппнонты представляют линейн; КомбУчнцит исходник переменных, v? • поисходит пересчет пол: ченных корфГнцийНтов к Исходному г?( юру переменных. Ча в. .клпчи^льнем мтчве модель KCGA мо№*: проверяться на адйквл 'toc-Tf с. пом;'Щ И дисперсионного анализа.
При проверке нашей методологии для различных массивов зпользовалось от 30 до 75 дескрипторов структуры различных' шов, что позволило подобрать оптимальное описание для :ех исследованных массивов.
Для расчета информационно-топологических дескрипторов згшсана программа DESCRIPT, позволяющая рассчитывать до 40 эзличннх индексов.
Применение собственно ДАФ в качестве дескрипторов не :егда возможно и целесообразно. Более разумным представля-"ся создание на их базе индексов, отражающих способность щекули в целом к взаимодействию с учетом топографии. При 'ом используется расстояние между активными центрами, игокулярный вес, объем, разветвленность молекулы и т.д.
Системн"й физико - химический подход, основанный на до->рно-акцепторной модели взаимодействия субстрат - рецептор, 'зволяет объединить качественные метода . классификации единений по сходным признакам с количественной регрессиои-й оценкой величины биоактивности молекул по отобранным щим структурным фрагментам. В этом случае на этапе выявле-я биологически активных структурных фрагментов ДАФ внсту- ' ют как качественные характеристики дескрипторных центров лекулы, а при построении на базе отобранных признаков рег-ссионттой модели - как ее количественные параметры Такой дход делает наглядной связь меаду описанием структуры го-пулы и количественной оценкой проявляемы:) ею свойств.
С цзлью реализации.описываемого подхода автором вместе к.ф.-м.н. А.М.Сапегиным были разработаны прогрэМмно-горитмические комплексы РАСТР и КЛАРАО [Сапе г я А.М.,.Чис-<ов В.В., Раевский O.A., 1987 (2,4) ]. •
В третьей главо описано применение данного- подхода прогнозированию биологической активности соединений.
Рассмотренный в методологической части системный !ико-химический подход был применен для 'анализа тлексцобразующей . способности полидентатных лигандов 1.3.I), ингибирования холинэстеразы (гл.3.2)< антиконвуль-геной активности мвкроциклов , (гл.3.3). Таким образом юнстрируется диапазон примсшмости метода:
г*из. химия - биохимия -» биоактивность ■
Обнаружено, что результативность применения метода большей мере зависит от параметров обучающчй выборки, чем о специфики предметной области, что доказывает высокую степей универсальности метода.
был осуществлен поиск взаимосвязи меж ду структурой .тегандов и их способностью связывать кальций водной среде. Выбор кальция в качестве екцеь^ора был продаж •говуИ его важной ролью б процессах жизнедеятельности. Масси данных но энтальпии (ДН) и константам устойчивости (log К сформирован на основе литературных данных и эксперименталь них дздны* к.х.;-'. Соловьева В. П., лаборатория физико химических исследований Института физиологически активны в^чест» АН СССР.'Из большого набора дескрипторов с помощь пошчгового дискришнантного анализа отбирались наиболе информативные, на базе которых строилось классификационно правило и проводился кластерный анализ соединений в это дискриминантном пространстве. Характер кластеризации соеди нений и описывающих их структур:' дескрипторов изучало методами факторного анализа Шберла,19вСЛ. Для наглядног отображения кластеризации соединений по отношению к дискри минвнтиой гиперплоскости, разделяющей соединения на дв класса, йыло использовано SLD (Stem-and-Leaf-Display) пред ставление "разведи того" агализа данных 'j[ Дэйвисон, 19s8 1 В нашем случае•к первому классу били отнесены соединения ]gK>4 и АН<-5 кДк/моль , а ко второму - все остальные. ' Для каждого выявленного кластера 'соединений методо попаговой' регрессии отроилась количественная модель связ Структура - комплексообр зунцая способность, которая зато проверялась на устойчивость с помощью с.лг'улярного анализ и на адекватность - методами дисперсионного анализа.
С целью дальнейшего уточнения описания структуры бил изучены .информационно-топологические, электронно-топографи ческие и физико-химические свойства лигандов,■ выражении через набор соответствующих дескрипторов. На основе'пошаго вой поцчлурн дис.фиминантного аья;"за были выделены наибе лее информативные дескрипторы, пять тз которых (молек>лярни ьео,' число дважды координировании^ вершин я молекулярнс графе, смеша'.Iгай индекс, донбрно-акцепторные тадекси Е^
С)
2) оказались одинаково пригодны как для описания взаимо-язи 'структура-АН', так и 'структура-lgK'.
Полученные t процессе этого моделирования результаты называют, что "ухе на стадии дискримянантной модели сущест-эт заметное различив между достоверностью классификации i обучении и при скользящем контроле. Это в значительной зпени объясняется недостаточно представительной выборкой гчтдов для выявления всех влияющих на процесс комплексооб-зования факторов. На основе проведенных расчетов гружено, что увеличение обучаицей выборки лигандов до 240 единений снизило бы вероятность ошибочной классифшсации до I в модели прогноза АН и до 7% в модели прогноза lgK.
На основе входящих в модель описания структуры жрипторов бнл проведен также факторный анализ, который спзал, что набор соединений гМучающей выборки на является юродным. Об этом ке свидетельствуют и неудаттые попытки :троения единой регрессионной модели для всей выборки единений. В связи с этим для модели, описгаающей АН были 1<?лены три кластера. для которых были получены ■рессионные зависимости с хорошими статистическими ¡Яствами (коэффициент регрессии порядка 0.93, критерий lepa поря цк а нескольких десятков).
1-.; кластер
г £24.5+3.66(lgP)-tl.7(NDC)-1592(Dte)
( R = 0.97, sd = 12.3, n = 14, F - 59)
2-й кластер
=39.70-11.86(lgP)-0.32(SI)-3198(DZ22)
( TI = 0.89, sd = 9.7, n = 11, F = 8.5)
3-й кластер
96.48+3.1 4 (MR)+0.44 (MI )+3Z .83 {% )-4864(DZ2 )+43745 (M22) . ( R = 0.95, Sd = 15.9, n = 23, F = 29.7)
lgK удалось получить аналогичные rio качеству результат!!.
В отличие от модели для ^gK, где применение ппсалировз-. írpuBflj") к большей по сравнению с использованием фактор-
• но^о анализа детализации описания взаимосвязи 'структура -комплексообразующая активность', модель д ля АН значительно упростилась. Был обнаружен только один кластер соединений.
Такое различие между моделями для и Аи, особенно при сравнении характера кластеризации в факторном и дискриминантном пространстве, по-Еидимому, связано с тем, что на формировании модели по ДН шляет широкий спектр взаимосвязанных структурных свойств соединений. Общие тенденции изменения их хорошо отражаются главными компонентами в факторном анализе, но на могут быть выделены при выборке только одного направления в пространстве структурных дескрипторов. Наоборот, модели по характеризуются более специфическими структурными свойствами, которые могут быть выделены только по отношению к определенному, задающему максимальное изменение моделируемого- свойства, направлению (как в случае многомерного шкалирования), а не из описывающего 1 общие закономерности факторного .. нализа.
В целом проведенное исследов.шие показало, что при моделировании комплексообразующей способности лигандов с разнородной структурой необходимо учитывать неоднородность обучакЛцей выборки соединений. С этой точки зрения методика построения дискретно - непрерывных моделей связи структура-.активность, где па первом этаьэ проводится кластеризация соединений, а затем для каждого полученного кластера строится количественная модель, выглядит достаточно эффективной.
' . В_глл_3^2__работы проведен анализ взаимосвязи между
структурой фосфороганическух соединен!^ и их спосоюностью к ингибированию холинэстерг. ,ы.
Ферменты класса холинэстераз, ката-л-чфующие гидролиз ацетилхолина, и Тс)ким образом регулирующие эндогенной уровень этого медиатора, играют ключевую роль в процессе передачи нервных импульсов. .Следует от:.:лить, что холинпрги-ческий механизм передачи нервных импульсов присущ к^к теплокровным животным, Так , и насекомым. По этой ' причине пгтолп объясним огромный интерес- г изучению как механизма дойстлия этих ферментов, так и взаимодействия с ин-гигифущими их химическими ооедка-лгаями - потенциальными йнсоктоысприг.идами' и лекаротвеиними веществами.
О
Исследуемый массив был сформирован на основе литератур-, них данных гго ингиОированию ацетилхолинэстеразы эритроцитов крови человека (ацетилгидролаза ацатилхслина.КФ 3.1.1.7.АХЭ) и бутирилхолинэстерпы сыворотки крови лошади ( ацилгидрола-за ацнлхолинов, КФ 3.1.1.8, БуХЭ ) и данных, . редоставленннх к.х.н. Р.С.Агабекяном.
Для всего использованного массива соединений, состоящего из ?ю обратимых и необратимых ингибиторов, константы менялись в следующих интервалах :
- для необратимых ингибиторов ацетилхолинэстеразы
Ка - ( 2.2*10-9 - 7.4*1СГ4 ), кр - ( 4.5*10~3 - 1.51 );
- для необратимых ингибиторов бутирилхолинэстервзы
К, - ( 2.8*10~9 - 1.5*10-3 ), кр - ( 3.5*10~э - 6.24 );
- для обратимях ингибиторов ацетилхолинэстеразы
- ( 3.0*10~б - 8.7*10-* );
- для обратимых ингибиторов бутирилхолинэстеразы
К± - ( 2.5*10"7 - 7.8*10~д );
Такой разброс свидетельствует о существенном влиянии заместителей при. атоме фэсфора на процесс ингибирования и обеспечивают условия для корректной постановки задачи пахоя-;дая количестЕешшх взаимосвязей структура - антихолинэсте-разная активность в изученном массиве соединений.
На первом этапе работы была, предпринята попытка проведения дискриминантного анализа для выработки классификационного правила I. > разделения обратимых и необратимых ингибиторов лишь на базе легко рассчитываемых информационно-топологических и некоторых физико-химических параметров. Результаты- оказались неудовлетворительными : более трети соедшюний классифицировались неправильно. Это с очевидностью свида-. тельствовало о недостаточности использованного набора дескрипторов для адекватного описания взаимосвязи между струк-' турой фосфорорганичэских, соединений и их антихолинэстеразной активностью. Здесь следует, отметить, что в ргссматрийаемом массиве изменение характера ингибироватШ соединений происходит дахо при замене заместителей с близкими свойствами. В етих условиях такие дескрипторы, как индексы Рандича,
•Винера, некоторые физико-химические характеристики, отражающие интегральные свойства молекул, не ъ состоянии обеспечить • описание структуры, достаточное для выявления связи структура-активность. Поэтому необходимо с такими индексами и характеристиками использовать дескршторы, характеризующие деталь®« электронные эффекты заместителей на свойства активных центров молекул. В настоящей работе в качестве дескрипторов, характеризующих способность активных центров к ком-плвксообразованию, были использованы элоктронодонорпно факторы активных центров фосфороргэнических молекул, соотнесенные к числу этих центров, молекулярному весу, объему и др.
Результаты дискриминантного анализа массива изученных соедин'иг'й приведены в ТпбЛ. Только четыре из 240 соединений обучающей выборки были классифицированы неправильно. В процессе миниминимизации. дискриминантного пространств с ц»\зъм отсева неикформативпих дескрипторов машина отказалась от классификации указании четырех соединений, построив классификационную поверхность, которая правильно разделяет 236 соединений на базе только 15 дескрипторов. Примечательно, что в качестве информативных для классификации характера ингибирования холинэстераз дескрипторов выступили 7 из 10 использованных донорно-акцепторных дескрипторов. Это свидетельствует о важной роли данных взаимодействий в процессе ингибирования холинэстераз фосфорорганическими соединения*'.;!. Таблица I.
результаты доскташшгного анализа данных по ингибированию^ холинэстераз для масс'ва 2.40 совд.
для полного пространства дескрипторов Класс Кол - во Достоверность классификации
соединений обучающей выборки
корректно некорректно необрат, 147 144 Ш%) 3 (2%)
обратим-. 93 92 ( 98.ЭЖ) 1(1.1«)
общее 240 236 (93.355) 4 (1.7»)
после оптимизации пространства дескрипторов . необрэт» 144 144 (ТООа) О (ОХ)
обратим* 92 92 (ТОО™) о (05)
оборе ' Гоб 236 (и'07.) о ¡0$)
В таблице 2 приведены результаты скользящего контроля для полного массива. В этой процедуре каждое из 236 •соединений предъявлялось на экзамен по отношению .к классификационной говерхности, построенной для остальных 235 соединений. Тем самым проверялась .рогностическая способность созданной дискретной модели. Только 8 из 236 соединений (3.42) при этом были классифицированы неправильно. Подсчет возможного уменьшения ошибки классификации в случав увеличения '-тела соединений в обучающей выборке показал, что использованный в настоящей работе массиь соединений вполне достаточен для формирования корректной дискретной модели.
Таблица 2.
РЕЗУЛЬТАТЫ СКОЛЬЗЯЩЕГО КОНТРОЛЯ (240 СОЕДИНЕНИИ).
Класс ° Количество Достоверность классификации
Выполненная работа по построению классификационной по-_"врхности в К-мерном пространстве дескрипторов для разделения с помощью дискричинантного анализа обратимых и необратимых ингибиторов холинэстераз привела к формированию качественной модели. Следующим этапом было построение единой дискретно-рег^ссионной модели, обладающей достаточной описательной и прогностической способностью. В этом случае неоднородность обучающей выборки была учтена с помощью БЫЗ-кластеризации в- дискриминантном пространстве дескрипторов структуры. Такая кластеризация проводилась для подмассивов количественных данных по значениям констант, характеризующих' обратимое и необратимое ингибирование ацетил- и бутирилхолкнэстераз.
Необходимо подчеркнуть, что в литература при построении количественных моделей "структура - способность ингибировать | активность различных ферментов " используются данные как по константам ингибнрования, так и по их логарифмам. Поэтому в
соединений
обучающей выборки корректно некорректно
неоОрат. 144 обратим. 92 Общее 236
140 (Ь7.2%) 4(2.8%) 88 (95.7%) 4(4.311, 228 (96.6%) Я(3.4%)
■данной работе предпринята попытка построения регрессионных уравнений как для непосредственно констант, так l для их логарифмов и сопоставления результатов этой работы.
В качестве,,примера можно привести следующие регрессионные зависимости:
для ацетилхолинэстеразы (необратимые ингибиторы):
in
Kd =-2.5-0.2(DAF)+6.0(DZ1)-T.4(DZ8)
( 10000К., R = 0.95, sd = 0.05, Г = 51.0, n = 21 )
а а
l€Kd=-8.86-1.42(DZ5)+7.83(DZ6)+11.94(40Ish)
( R = 0.97, sd = 0.25, F = 55.8, n = 13 ) для бутирилхолинэстеразы (неоОатимые ингибиторы):
К^''=0.62-0.005(°К)-0.014(Nh)-3.7(DZ8)
( Кд"*= К^Ю*. R = 0.96, Sd = 0.04, F = 39.1, п = 16 )
.26-0.01 (IG)+3.20(DAF)
< R = 0.94, Sd = 0.32, Г = 24.0, П = 14 )
Определяющая роль донорно-акцепторнух факторов на качественном этапе исследования ( при построении разделяющей гиперплоскости ) характерна также при формировании количественной модели, что позволяет предположить значительную роль данного типа взаимодействий при. формировании исследуемого типа активности.
В целом, во всех установленных в настоящей работе качественных моделях и регрессионных уравнениях статистические критерии свидетельствуют об устойчивости выявленных зависимостей, что позволяет широко их использовать в дальнейшем для оценки характера и величин констант ацетил- и бутирилхолинэстераз новыми фэсфорорганическими соединениями.
В, гл.__3Д3__работы представлено моделирование связи
структура-актигчость для макроциклических антиконвульсантов.
Макроциклические полиэфиры (МП) обладают способностью образовывать комплексы с различными ионами биометэллов и алкил-аммониевых фрагментов. В биологических объектах ком-плексообразование обуславливает такие процессы, как фермен-ТВТИВ'ШЙ катализ, ингибирование, репликация, хранение и
передача генетической информации, иммушшй ответ, (Задано концентраций ионов снаружи и внутри клеток. В связи с этим макроциклическиа- полиэфиры являются объектом пристального внимания прежде всего специалистов по биомиметической химии, изучавших проблемы кооперативного связывания нескольких активных центров лигандов с одним катионом и хирального узнавания в диастероомерных активированных комплексах О участием макроциклических молекул .
Психотропная активность таких соединений в значительной мере определяется числом электронедепорта центров макроцик-ла.его рвзморами, природой заместителей при макроцикличоском карквеэ. Тем самым становится правомерной постановка задачи целеноправленного поиска эффективных психотропных средств среди макроциклических полиэфиров (МП).
Моделировадие связи структура-активность проводилось на примере противосудороашого действия крпун-эфиров. При этом принимались во внимание особенности конформяциошшх состояния креун-вфиров (из ренгеноструктурннх данных I Лукьяненко, Богитскчй, 198Б 3, и расчетов по методом молекулярной механики (Стьюпер, 1982) ), а также их предполагаемый механизм взаимодействия с биологической мишенью. В качестве специфических молекулярных дескрипторов использовались индексы, основанные но донорно - акцепторных факторах, отражающих комплекиооброзующие свойства краун-вфиров.
Из рассмотрении* дескрипторов минимальный набор после дискршииантного анализа составили энтропийный и два электронодонор"чх фактора, индекс Шеннона для эквивалентных по характеру связей, индексы окружения - простой, взвешенный и присоединенный, а тисет два индекса, отрмактих молекулпр-нче свойства: молекулярная массса и молекуляр1шй обг""м.
Полученные результаты подтп"р?кд'лют важную роль комплетссообразующей способности макроциклов в формировании их нсихотропн1 ¡1 активности и укапывают на необходимость учпта возможных стеричесних препятствий при взаимодействии МП с мипенью. Так, среди высокоактивных соединений ость лиглндм, в молекулах • которых имеется три легкодоступных ,!>.!икт}Х)}годонпрннх центра. В связи с втим было выдвинуло !1;«|Д1То.лп«рциэ,ч'го взаимодействующая о мишенью сторона
лкганда представляет собой тре\- эльник, образованный алектронодонорными атомами кислорода. Поэтому в качестве переменных в регрессионную модель структура-антиконвульсант-ная активность были включены попарные произведения электро-нодонорных факторов этого треугольника и соответствующие равновесной конформации расстояния между ними.При этом включение только одного минимального расстояния между алектронодонорными центрами уже дало коэффициет корреляции R=0.60. Введению двух попарных произведений электронодонорных факторов этого треугольника соответствует R=0.77. Еще более высокое значение коэффициента корреляции (R=0.92) дает включение в регрессионную модедь помимо функций от электронодонорных факторов молекулярной массы (MW) :: ■ Т=-4.I3+I.27 (Е, g )-1.90 (Егз )+6.03 (M\V) -1.05 (MW2¡)
(( 'Я = 0.92, sd = 0.84, п = 15, tp-s if&J2')., тде fpffiчетное 'значение биоотклйка.
Обнаружено, что увеличение 'этой 'йюиййости 'коррелирует с уменьшением минимального расстояния мавду активными центрами 'в треугольни -в >и увеличением <их электронодонорной способности по отношению 'к 'третьему активн :лу центру.
:К сожалению, малый -диапазон "изменения размеров активного треугольника и э'лект-роноДбйорных свойств входящих в не-'го атомов ira позволяют Tía Данном этапе ставить вопрос об бгфе'Делении :количестве'ШШх •'бкладов каждого из рассматривае-'Мых 'дескрипторов *в 'Величину активности.Эта задача может быть ¡решена по мере накоплений -новых данных и расширения выборки Соединений за счет синтеза ¡новых перспективных соединений 'На основе установленной Корреляции между параметрами структуры и антиконвульсантной'активностью.
РЕЗУЛЬТАТЫ И ВЫВОДЫ.
1. Разработаны оригинальные метэдики выбора оптимальной модели описания структуры соединений исследуемых массивов, сконструированы новые дескрипторы на базе электронодонорных факторов, позволяющие Полнее учитывать способность активных 1 центров1 к ■ межмолекулярному ■• взаимодействию.
2. ;На 'основе использования . методов распознавания ■образгз, 'кластерного -и факторного анализа, многомерного
шкалирования и регрессионного анализа изучена взаимосвязь •структура - активность* для различных классов соединении и видов активности : комплексообразующей активности полиден-татннх лигандов,, ингчбирования фосфорорганическими веществами ацетил- и бутирилхолинзстеразы, психотропной активности в ряду макроциклических полиэфиров
3. Для больших массивов экспериментальных данных проверена- возможность построения множественных дискретно-непрерывных моделей, объединяющих в себе качественное и количественное описание взаимосвязи струг^ура-активность.
4. Доказана возможность выявления скрытой неоднородности обучающей выборки посредством построения кластерной структуры, в том числе, SLD-разложения, и использования этой неоднородности для построения более точных регрессионных моделей
5. На примере ингибирования холинэстеразы показана исключительно большая роль донорно-акцэпторных факторов для построения адекватной устойчивой прогностической модели по константам каждого вида.
6. Для массива макроциклических полиэфиров найден "треугольник активности".возможно отвечающий за психотропную активность, построено регрессионное уравнение.
7. На базе предложенной методики были созданы программно-алгоритмические комплексы РАСТР и КЛАРАС, рассчитанные но миниЭВМ с ОЗУ s£56 К или микроЭВМ типа IBM PC.
Автор выражает глубокую благодарность д.х.н. профессору О.Л.Раевскому л к.ф.-м.н. Л.М.Сапагину, которым принадлежит в этой области много ценных идей и алгоритмов, к.х.н. В.П. Соловьеву и к.х.н. Р.С.Агабекяну за помощь в сборе и подготовке данных. • .
' СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО THffi ДИССЕРТАЦИИ. • ■ 1 .Сапегин А.!.;., Раевский O.A., Чистяков В.В., Мартынов И.В.. Алгоритм расчета-донорно-акцепторных факторов для описания молекул биологически активпых соединений //Хим.-фарл. К., 1987, Т.21, Л 9, С. 1098. • .
, г.Сапегин A.M., Раздольский A.C., Чистяков В.В., " ' ■ Раевский O.A. РАСТР: Реализация физико-химического подхо-
•■ да к проблеме "структура-свойство" V/Хим.-фарм. ж., 1987, Т.21, * II, 0.1341.
3.Раевский O.A., Сапегин A.M., Чистяков В.В. и др. Моделирование овяви структура-активность. Макроциклические анти-коньульсанты //Хим.-фарм.)"., 1988, Т.22, М 10, С.1230.
4.Раевский O.A.,Сапегин A.M..Чистяков В.В..Раздольский А.Н., Зефиров Н.О. Дискретно - непрерывная модель связи структура-свойство. //Докл. АН СССР, 1989, Т.309, » 3,
5.Раевский O.A., Чистяков В.В., Агабекян Р.С., Сапегин A.M., Зефиров Н.О. Формирование моделей взаимосвязи между структурой фосфороргэнических соединений и их способностью к аигибированию холинэстераз // Биоорг. химия, 1990, т.16, * II, С.1П0Э.
6.Раевский о.д., Сапегин A.M., Чистяков В.В., Соловьев В..1., Зефиров Н.С. Формирование моделей взаимосвязи структура -комгаюксообрпзуюиая способность // Координац. химия, 1990, т.16, * 9, С.1176.
7.Чистяков В.В., Раздольский А.Н. Целенаправленный поиск биологически активных веществ на основе спектра межатомных расстояний // Тез. VII республ. конференции молодых ученых, Таллинн, май 1987, С.57.
8.Раевский О.А., Сапегин A.M., Чистяков В.В., Соловьев В.П., Янфиров Н,С. Модель взаимосвязи структурэ-комшюкоообр!' -зунцня способность полидонтатных лигандов по отношении) к кпльци« /'/ Тез. Боос. научной конференции "Оценка фарм. активности хим. соединений, ноябрь 1989, г. 269
9.AgabeKywi R.S.,nae.VBki О.А., Chistyakov V.V., S&pegln A.Mt) Zpflrov N.3. Development of CUE -organofoaforoue Inhibitors QSAit models // Third International Meeting on Oholinestera-ces, la Grand-Motte, France,-1990, p.165, ( abatraots ).
22.Д2,1991г, ,3aк. 157 Объём In.л. Тир. ЩОэкз. '^пец'ра^йя ОИХФ АН СССР Ü6
С. 623
-
Похожие работы
- Системный анализ и подготовка информации о химических структурах с целью разработки модели конструктора активных добавок для полимерных композитов
- Анализ и подготовка информации об ингредиентах полимерных композиций для моделирования зависимости "структура-активность"
- Моделирование нестационарных процессов на поверхности платиносодержащих катализаторов в промышленных реакторах установок риформинга бензинов
- Принципы выбора гетерогенно-каталитических систем для органического синтеза
- Особенности взаимодействия элементов тонкой структуры полимерных материалов и их физико-механические свойства
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность