автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Применение искусственных нейронных сетей для выбора действующих веществ фармакологической продукции химического производства
Автореферат диссертации по теме "Применение искусственных нейронных сетей для выбора действующих веществ фармакологической продукции химического производства"
На правах рукописи
'-ои п Ушаков Павел Александрович
ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
ДЛЯ ВЫБОРА ДЕЙСТВУЮЩИХ ВЕЩЕСТВ ФАРМАКОЛОГИЧЕСКОЙ ПРОДУКЦИИ ХИМИЧЕСКОГО ПРОИЗВОДСТВА
05.13.01 - Системный анализ, управление и обработка информации (химическая промышленность)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Москва, 2008 г.
003455078
Работа выполнена на кафедре Информационных технологий Государственного образовательного учреждения высшего
профессионального образования "Московская государственная академия тонкой химической технологии им. М.В. Ломоносова".
Научный руководитель: Официальные оппоненты:
Ведущая организация:
доктор технических наук, профессор
Бурляева Елена Валерьевна
доктор технических наук, профессор
Гартман Томаш Николаевич
доктор технических наук, профессор
Ермуратский Петр Васильевич
Московский институт кибернетической медицины
Защита состоится " 23 " " декабря " 2008 года в 14 час, на заседании диссертационного совета Д 212.120.08 в Московской Государственной Академии тонкой химической технологии им. М.В.Ломоносова по адресу: 119571, г. Москва, пр. Вернадского, 86.
С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В.Ломоносова (119571, г. Москва, пр. Вернадского, 86). Автореферат диссертации размещен на сайте www.mitht.ru
Реферат разослан "2с>" " " 2008 года.
Ученый секретарь диссертационного совета доктор технических наук
Бурляева Е.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы Одним из первых этапов химического производства фармакологической продукции является выбор перспективных действующих веществ из большого массива химических соединений. Компьютерное прогнозирование таких свойств еще не синтезированных химических соединений, как токсичность, биодоступность, фармакологическая активность и т.п., позволяет проводить дорогостоящие экспериментальные исследования более прицельно и оценивать возможность использования соединения в качестве основы для создания лекарственного препарата на ранних стадиях его изучения. В основе исследований лежит предположение о том, что структура соединения определяет свойства, проявляемые этим соединением. Гипотезы о взаимосвязи структуры молекулы соединения и его свойствами могут быть построены на основе анализа сведений об уже синтезированных и исследованных молекулах соединений того же класса. Эту область исследований кратко называют изучением зависимостей «структура — свойство».
Традиционно для построения гипотез о зависимости между структурой молекулы сложного органического соединения и его свойствами используются методы регрессионного анализа, однако построить модели с приемлемыми прогностическими возможностями не всегда удается. В качестве альтернативных подходов в последнее время предлагается использование эвристических методов, в том числе искусственных нейронных сетей (ИНС) и эволюционных алгоритмов. Однако при применении ИНС для задач прогнозирования свойств органических соединений возникает ряд проблем, связанных, в первую очередь, с малым объемом выборок. Актуальной остается задача разработки алгоритмов и методик применения ИНС для отбора действующих веществ новых лекарственных препаратов на основе прогнозов свойств этих соединений.
Целью работы является повышение эффективности ранних стадий химического производства фармакологической продукции за счет
сокращения сроков выбора действующих веществ путем использования искусственных нейронных сетей.
Для достижения этой цели необходимо последовательное решение следующих задач:
1. анализ особенностей применения ИНС для задач прогнозирования свойств органических соединений;
2. выбор структуры ИНС и алгоритмов их обучения и тестирования;
3. разработка методики отбора действующих веществ лекарственных препаратов;
4. выбор инструментальных средств для реализации разработанной методики;
5. применение методики для решения различных задач отбора соединений с требуемыми свойствами.
Научная новизна
• выявлены особенности применения ИНС для задач прогнозирования активности органических соединений,
• разработана методика выбора действующих веществ фармакологической продукции химического производства;
• предложен алгоритм регуляризации, позволяющий повысить точность прогнозов за счет уменьшения количества входных параметров ИНС.
Практическая значимость. Основным практическим результатом является методика выбора действующих веществ фармакологической продукции химического производства. На основе этой методики получены подтвердившиеся в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных
тетрагидроимидазобензодиазипенона (Т1ВО).
Методы исследования
Разработка методики выбора действующих веществ фармакологической продукции химического производства выполнена с
использованием методов структурного системного анализа. Для прогнозирования свойств органических соединений использованы гомогенные однонаправленные трехслойные ИНС с 3-мя нейронами в промежуточном слое.
Апробация работы
Основные положения и результаты работы докладывались на российских и международных научно технических конференциях, в том числе на российском национальном конгрессе «Человек и лекарство» (Москва, 2006), международных научно-технических конференциях «Process Control» (Чешская республика, Пардубице, 2006), «Математические методы в технике и технологиях» (Кострома, 2004, Казань, 2005).
Публикации
Полученные в работе результаты изложены в 6 опубликованных работах, в том числе 2 статьях в журналах, рекомендованных ВАК РФ.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертации, сформулированы цель и основные задачи исследования, дана общая характеристика работы.
В первой главе выполнена постановка задачи выбора действующих фармакологической продукции химического производства с использованием искусственных нейронных сетей. Обосновано использование методов компьютерного прогнозирования свойств органических соединений для выбора перспективных соединений. Рассмотрены различные способы описания структуры молекулы соединения и проявляемых этим соединением свойств. Особое внимание уделено описанию структуры с помощью точечных характеристик, называемых молекулярными дескрипторами, в том числе квантово-химическим параметрам, описывающим трехмерную структуру молекулы. Показано, что построение гипотез о взаимосвязи между структурой и свойствами исследуемых соединений сводится к выявлению общей закономерности на основе ряда примеров ее проявления. Рассмотрены различные методы построения гипотез, в том числе статистические, логические и эвристические, и способы получения оценочных значений свойств исследуемых соединений.
Далее рассмотрены методы ИНС как вычислительной схемы, построенной из однородных логических элементов, называемых формальными нейронами. Такой нейрон представляет собой математическую модель простого процессора, имеющего несколько входов и один выход. Множество входных сигналов, обозначенных хь х2,..., хп, поступает на формальный нейрон. Каждый сигнал умножается на соответствующий вес \Уь \У2,..., \у„, и поступает на суммирующий блок, обозначенный X. Суммирующий блок складывает взвешенные входы алгебраически. Далее этот результат преобразуется с помощью нелинейной функции, называемой также функцией активации.
ВХОД НЫе С иншгачесш е Блок Бд ок н елинейн ого В ых одно й
сигналы веса суммирования преобразования сигнал
Г----------------1
Рис.1 Формальный нейрон
В диссертационной работе рассмотрены различные типы таких функций: пороговая, линейная, сигмоидальная, гиперболический тангенс. При построении ИНС отдельные нейроны связываются между собой таким образом, что входные сигналы поступают на вход нескольких нейронов с учетом весов. С точки зрения топологии выделяют полносвязные ИНС, в которых каждый нейрон передает выходной сигнал всем остальным нейронам, слабосвязные ИНС, в которых нейрон передает выходной сигнал нескольким соседним нейронам, и многослойные, в которых нейроны объединяются в слои и каждый слой содержит совокупность нейронов с едиными входными сигналами. Кроме того, выделяют гомогенные ИНС, в которых все нейроны имеют одинаковую функцию активации, и гетерогенные, в которых используются нейроны с различными функциями активации.
В работе выполнен анализ извесшых пл литературы результатов применения ИНС для задач прогнозирования, в том числе прогнозирования свойств химических соединений. Показана необходимость разделения имеющихся данных на обучающую выборку, с помощью которой выполняется формирование гипотез, и тестовую, с помощью которой рассчитываются и анализируются прогнозы. При прогнозировании свойств органических соединений обучающую выборку для построения ИНС составляют векторы числовых значений молекулярных дескрипторов и числовые значения изучаемых свойств. Обучение ИНС эквивалентно
установлению зависимостей между молекулярными дескрипторами и исследуемыми свойствами соответствующих соединений.
Показано, что при исследовании зависимости «структура - свойство» предпочтительными являются гомогенные нейронные сети, в которых каждый нейрон последующего слоя связан со всеми нейронами предыдущего слоя. В такой сети выделяют входной слой, осуществляющий распределение значений входных параметров, промежуточные слои и выходной слой, в котором определяется значение выходного параметра сети. Наилучшие результаты достигаются при использовании трехслойных сетей. Для определения оптимального количества нейронов в скрытом слое проводились специальные исследования, в которых было доказано, что наилучшие результаты достигались при использовании 3 нейронов. Структура трехслойной гомогенной ИНС с 3-мя нейронами в промежуточном слое приведена на рис.2
Рис.2 Трехслойная гомогенная ИНС с 3-мя нейронами в промежуточном слое
В качестве функции активации в такой сети выбрана сигмоидальная функция
где х, - значения молекулярных дескрипторов, у - значение исследуемого свойства, а, \у„Ь! - параметры ИНС.
В основе применения ИНС лежит использование алгоритмов, получаемых при помощи обучения на примерах. Эти алгоритмы кодируются в ИНС в виде значений весов нейронов. Обученная таким образом ИНС способна решать задачу аппроксимации нелинейной функции произвольного вида от многих переменных.
Целью обучения является получение по заданному множеству входов желаемое множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал требуемый выходной вектор. Таким образом, по конечному набору пар (вход, выход), называемому обучающей выборкой, формируется отображение Г(х)=у.
На основе анализа различных алгоритмов обучения ИНС для задач построения зависимости «структура-свойство» обосновано использование алгоритма Левенберга-Маркардта как алгоритма «обратного распространения ошибки» (backpropagation). Минимизируемой целевой функцией ошибки ИНС является величина:
где у{*р] - реальное выходное состояние нейрона ] выходного слоя N
нейронной сети при подаче на ее входы р-го образа; с1м, - идеальное (желаемое) выходное состояние этого нейрона. Суммирование ведется по всем нейронам выходного слоя и по всем обрабатываемым сетью образам.
(1)
Минимизация ведется методом градиентного спуска, что означает подстройку весовых коэффициентов следующим образом:
Здесь W,, — весовой коэффициент связи, соединяющей i-ый нейрон слоя п-1 с j-ым нейроном слоя п, 77-коэффициент скорости обучения, 0<^<1.
Рассмотрена проблема переобучения ИНС и различные методы их тестирования. Для повышения достоверности результатов предложено применение метода скользящего контроля, позволяющего проанализировать большое количество комбинаций разбивки полной выборки соединений на обучающую, тестовую и контрольную. Рассмотрены методы полного перебора всех вариантов разбивки и случайного выбора.
На основе анализа программ, реализующих построение и тестирование ИНС, обоснован выбор в качестве инструментального средства программы Statistica Neural Networks (производство компании StatSoft Inc).
Рассмотрены основные проблемы, связанные с применением ИНС при построении гипотез о зависимости «структура — свойство», и способы их преодоления. Показано, что факторами, ограничивающими применимость ИНС для задач прогнозирования активности органических соединений, являются большая корреляция между значениями параметров и малые объемы выборок (количество параметров нейронной сети, как правило, на порядок превосходит объем выборки), что приводит к переобучению сети. При переобучении сети ошибка, полученная по обучающей выборке, мала, но при подстановке в сеть новых данных, т.е. при прогнозировании, резко возрастает. Для преодоления этих проблем применяются различные виды регуляризации, позволяющие уменьшить количество используемых в ИНС параметров без уменьшения прогнозирующей способности сети.
Таким образом, возникает задача разработки методики отбора действующих веществ лекарственных препаратов с использованием
искусственных нейронных сетей (ИНС), сформулированная в заключительном параграфе первой главы.
Вторая глава посвящена разработке методики отбора перспективных действующих веществ лекарственных препаратов с помощью ИНС. Исходными данными для этой методики являются описания набора однотипных соединений, причем описание каждого соединения состоит из численных значений молекулярных дескрипторов и численного значения исследуемого свойства. Результатом являются отобранные с использованием полученных прогнозов перспективные с точки зрения исследуемых свойств соединения.
В качестве инструмента для установления этапов отбора действующих веществ лекарственных препаратов, установления информационных связей между ними и указания управляющих воздействий исследователя использованы методы структурного системного анализа1. В рамках этих методов описание предметной области строится в виде иерархической структуры, которая отражает различные уровни абстракции с ограниченным числом компонентов на каждом из уровней. Основным элементом является диаграмма, состоящая из функциональных блоков и соединяющих их дуг. Различают 4 роли дуг: интерфейс ввода/вывода, управляющее воздействие и механизм реализации функции. Роль дуги задается ее расположением относительно функционального блока: стрелка, входящая в блок слева, обозначает входной параметр, стрелка, входящая сверху, - управление, стрелка, входящая снизу, - механизм реализации, стрелка, выходящая справа, - выходные параметры. Методы структурного системного анализа позволяют удобно описать иерархическую декомпозицию «этап-подэтап» сверху вниз, поскольку обеспечивают пошаговую детализацию диаграмм. Каждый компонент описания может быть декомпозирован на другой диаграмме.
' Рекомендации по стандартизации. Информационные технологии поддержки жизненного цикла продукции Методология функционального моделирования //Госстандарт России, Москва, Издательство стандартов, 2001
Методика отбора действующих веществ лекарственных препаратов с помощью ИНС состоит из 5 основных этапов:
• разбиение исходных данных на обучающую (ОВ), контрольную (КВ) и тестовую (ТВ) выборки;
• построение ИНС;
• получение прогнозов исследуемых свойств и анализ прогностических возможностей ИНС;
• регуляризация ИНС;
• отбор перспективных соединений на основе полученных прогнозов.
На диаграмме, представляющей детализированное описание методики (рис.3), выделено 5 функциональных блоков, соответствующих ее этапам. Диаграмма включает в себя дуги, описывающие исходные данные и результаты прогнозирования, а также дуги, описывающие взаимодействие отдельных этапов: передачу данных и передачу управления. В частности, после анализа качества ИНС происходит либо построение ИНС для нового варианта разбиения исходных данных на ОВ, КВ и ТВ, либо регуляризация ИНС.
Рассмотрим каждый этап методики более подробно. На первом этапе производится разбиение описаний соединений на 3 подвыборки: обучающую, с помощью которой производится обучение ИНС, контрольную, служащую для предотвращения переобучения сети, и тестовую, по которой оцениваются прогностические возможности сети. При небольших объемах выборки возможно выполнение полного перебора всех возможных вариантов разбиения, однако чаще используют процедуру, при которой разделение проводится случайным образом. Соотношение мощностей ОВ, КВ и ТВ зависит от мощности исходной выборки; как правило, суммарная мощность КВ и ТВ не превышает 10% от мощности исходной выборки.
описания соединений
наиболее перспективные соединения
Рис. 1. Детализированное описание методики отбора действующих веществ лекарственных препаратов
На втором этапе для каждой OB выполняется построение трехслойной ИНС с сигмоидальной передаточной функцией. Для анализа прогностических возможностей отдельной ИНС используется величина отношения стандартного отклонения ошибки к стандартному отклонению данных (далее будем называть эту величину «коэффициентом стандартного отклонения», как в программе Statistica Neural Networks).
После построения ИНС по каждой обучающей выборке выполняется анализ прогностических возможностей набора ИНС, для этого рассчитывается средний коэффициент стандартного отклонения как по всему набору ИНС, так и по наборам ИНС для каждой КВ.
Для повышения прогностических возможностей ИНС используются различные алгоритмы регуляризации, позволяющих уменьшить количество используемых в сети дескрипторов. Для исключения маловариабельных и коррелированных дескрипторов используется генетический алгоритм,
позволяющий сгенерировать, проанализировать и выбрать приемлемый набор молекулярных дескрипторов.
Дальнейшая регуляризация может быть выполнена на основе анализа набора построенных ИНС. Предложен следующий алгоритм регуляризации. Выбираются молекулярные дескрипторы, входящие в наибольшее число построенных ИНС, обучается новая ИНС, включающая в качестве входных только отобранные дескрипторы, и выполняется анализ полученных значений коэффициента стандартного отклонения. В том случае, если среднее значение коэффициента стандартного отклонения не возрастает, можно считать регуляризацию выполненной и в дальнейшем использовать только отобранные молекулярные дескрипторы. В противном случае необходимо изменить порог отбора дескрипторов. Диаграмма, описывающая регуляризацию ИНС по предложенному алгоритму, приведена на рис.2.
порог отбора
Рис. 2. Детализированное описание этапа регуляризации ИНС
Окончательный отбор соединений с требуемыми свойствами осуществляется на основе прогнозов, полученных с помощь к> регуляризованной ИНС. Для повышения достоверности прогнозов на этом этапе можно использовать также прогнозы, полученные с помощью других методов, например, логических.
В третьей главе представлены результаты применения предложенной процедуры прогнозирования свойств для 2-х различных групп соединений.
Первая группа состояла из производных дитиокарбаминовой кислоты, синтезированных и экспериментально изученных в отделе Медицинской 14
химии Государственного научного центра по антибиотикам (ГНЦА). Эти соединения рассматриваются как перспективная основа для противотуберкулезных препаратов. В качестве исследуемого свойства количественно определялась способность подавлять рост микобактерий туберкулеза на твердой среде. Рассматривалась выборка из 32 соединений, причем большая часть (24 соединения) не обладала исследуемым свойством.
Общая структура соединений представлена на рис.5, расшифровка заместителей и значение свойства для ряда соединений - в табл. 1 (таблица, описывающая всю выборку, приведена в диссертационной работе).
т
Рис.5. Общая структура исследованных производных дитиокарбаминовой кислоты
Таблица 1
N2 соед. И2 Я4 К5 Р6 Активность
1 N02 Н н Н н СН2СН3 СН2СН3 18
II N0? Н N02 Н н СН2СН3 СН2СНз 25
III N02 Н Рг Н н СН2СН3 СН2СНЗ 19
IV N02 н Ъ С1 н СНз СНз 0
V N02 н Рз Н N02 СНз СНз 0
XXVII N02 н CNH2 0 Н Н СН2СН2СН2СН2 0
XXV!!! МП. ■ и Н Н СН2СН2СН2СН2 0
XXIX N0? н N02 Н CN СН2СН2СН2СН2 22
XXX N02 н N02 Н СЫН2 0 СН2СН2СН2СН2 18
XXXI N0? н N02 Н CN СН2СН3 | СНз 25
XXXII N02 н N02 Н CNCH3 СНз СН2СН2СН2СН2 21
Вначале выполнялся скользящий контроль методом полного перебора
при 1 контрольном и 1 тестовом веществе. При построении ИНС использовался генетический алгоритм для уменьшения количества входных переменных. Среднее значение коэффициента стандартного отклонения по всем построенным ИНС составляет 0,1, что свидетельствует о приемлемых
прогностических возможностях сетей для данной выборки. Наилучшие результаты достигаются при выборе соединения XI в качестве контрольного, в этом случае среднее значение коэффициента стандартного отклонения, рассчитанное по всем тестовым соединениям, составляет 0,04. Значимость полученных результатов особенно возрастает, если учесть, что выборка содержит большое количество соединений с нулевыми значениями выходного параметра. Анализ таких выборок классическими регрессионными методами существенно затруднен, а ИНС показывают приемлемые результаты.
Регуляризация полученных ИНС по предложенному алгоритму позволила отобрать 24 параметра, которые встречались в первоначально полученных ИНС более 20 раз. Значение коэффициента стандартного отклонения для регуляризованной ИНС составило 0,0006.
Прогнозы, построенные с помощью регуляризованной ИНС, позволили отобрать в качестве наиболее перспективных соединения II, XXIX, XXXI, XXXII, что соответствует как экспериментально полученным данным о противотуберкулезной активности, так и прогнозам, полученным с помощью логических методов.
Для исследуемых соединений выполнялся также скользящий контроль с использованием случайного перебора комбинаций соединений, составляющих контрольную и тестовую выборку. Контрольная выборка состояла из 1 соединения, тестовая - из 3 соединений. По 28 случайным комбинациям среднее значение коэффициента стандартного отклонения составило 0,05. Несмотря на сокращение объема обучающей выборки, прогностические возможности ИНС ухудшились незначительно, что свидетельствует об устойчивости полученной модели.
Соединения второй группы - производные тетрагидроимидазобензо-диазипенона (Т1ВО) используются в комплексных анти-ВИЧ препаратах. Данные о соединениях выбирались из нескольких литературных источников. Рассматривалась выборка из 49 соединений. В качестве исследуемого
свойства рассматривались значения отрицательного логарифма 50% ингибирующей концентрации (ГС50), в табл. 2 это свойство обозначено I. Общая структура соединений представлена на рис.6, расшифровка заместителей и значение для ряда соединений - в табл. 2. (таблица, описывающая всю выборку, приведена в диссертационной работе).
3
Таблица 2
Соедин. р* X У г 1С50(Дм) I
в-1 н э 8-С1 ОМА 0,046 1,337
э-И н Б 9-С1 ОМА 0,16 0,796
э-Ш 7-Ме О ОМА 12,1 -1,083
в-ХХ 5-Ме(3) Э ОМА 3,32 -0,521
Р-1 4-Ме(5) О ОМА 32,1 -1,507
р-н 4-М е(5) Б 9-С1 ОМА 0,67 0,174
р-Ш 7-Ме(5) Э СН2СН2СН3 2,43 -0,386
[¡-VII 5-Ме(5) в ОМА 0,026 1,585
-1 5-Ме(8) Н ОМА 0,044 1,357
-II 5-Ме(8) 8-Р ОМА 0,006 2,222
-III 5-Ме(Б) в 8-Вг ОМА 0,003 2,523
-X 5-Ме(8) Б 10-Вг ОМА 1,072 -0,030
-XI 5-Ме(8) Э 10-О-СНз ОМА 4,677 -0,670
-XII 5-Ме(Б) Э 9,10-(Ш ОМА 0,026 1,585
М 4-Ме ОМА 0,028 1,553
Ь-УИ 14-Ме | 9-С1 | РЕЬА 10,012 И,921
Примечания: ОМА - диметилаллил-; Ре1А - диэтилаллил-
Полный перебор всех вариантов разбиения выборки на ОВ, КВ и ТВ практически невозможен, поэтому для второй группы соединений
использовался только метод скользящего контроля с использованием случайного перебора комбинаций. Контрольная выборка состояла из 2 соединений, тестовая - также из 2 соединений. Среднее значение коэффициента стандартного отклонения по 10 вариантам составило 0,2 (табл.3).
Таблица 3
Состав КВ Состав ТВ Коэффициент стандартного отклонения
МП, э-ХУ1 1>У, ¡-IX 0,1
8-Х1, МУ Н ¡-1 0,3
э-ХУ, р-1У э-Х, рЛ/11 0,1
8-1, ¡-VIII э-ХУ, И-УМ 0,4
¡-VII, ИА/И э-И, э-ХХ 0,2
¡-XI, Э-ХУ1 Б-Ш, 1-1-111 0
э-М, э-Х1 р-1У, МИ 0,2
Б-ХХ, ¡-1 э-У, э-Х1 0,2
8-1, Н1 э-УШ, р-У1 0,2
Э-1У, ¡-VII ¡-X, М1 0,1
Среднее значение коэффициента стандартного отклонения: 0,18
При дальнейшей регуляризации было отобрано 29 молекулярных дескрипторов, которые встречались в первоначально полученных ИНС более 8 раз. Коэффициент стандартного отклонения регуляризованной ИНС составил 0,08.
Прогнозы, построенные с помощью регуляризованной ИНС, позволили отобрать в качестве наиболее перспективных соединения б-УП, б-ХУ1, ¡-II, III, ¡-IV, Ь-У, Ь-УП, что соответствует как экспериментально полученным данным об анти-ВИЧ активности, так и прогнозам, полученным с помощью логических методов.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. выявлены особенности применения искусственных нейронных сетей (ИНС) для задач прогнозирования свойств органических соединений;
2. обоснован выбор структур ИНС и алгоритмов их обучения и тестирования;
3. разработана методика выбора действующих веществ фармакологической продукции химического производства;
4. предложен алгоритм регуляризации, позволяющий уточнить прогнозы за счет уменьшения количества входных параметров ИНС;
5. получены подтвержденные в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных тетрагидроимидазобензодиазипенона (Т1ВО)
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Бурляева Е.В., Ушаков П.А. Применение искусственных нейронных сетей для прогнозирования противотуберкулезной активности органических соединений // Вестник Костромского государственного университета им. Н.А. Некрасова, т.12, № 3,2006, с. 25-29
2. Бурляева Е.В., Ушаков П.А. Применение нейронных сетей для прогнозирования активности органических соединений // Вестник МИТХТ, 2008г, тЗ, №4, стр. 79-83.
3. Бурляев В.В., Ушаков П.А. Применение нейронных сетей для уточнения интервальных прогнозов активности конформационно-гибких соединений // Сборник трудов XVII Международной научной конференции «Математические методы в технике и технологиях», т.4, Кострома, Изд-во КГТУ, 2004, с. 165-166
4. Бурляев В.В., Ушаков П.А. Применение нейронных сетей для прогнозирования противотуберкулезной активности производных дитиокарбаминовой кислоты // Сборник трудов 18-й международной конференции «Математические методы в технике и технологиях», Казань,
2005, т.8, с. 132
5. Бурляев В.В., Бурляева Е.В., Ушаков П.А. Применение искусственных нейронных сетей для прогнозирования противотуберкулезной активности производных дитиокарбиминовой кислоты // Тезисы докладов XIII Российского национального конгресса "Человек и лекарство", Москва,
2006, с. 563
6. Burljaeva Е., Ushakov P. Neural networks application for prediction of antituberculosis activity // Proceeding of 7-th international scientific technical conference "Process Control - 2006", Czech Republic, Pardubice, 2006, p. 138
Подписано в печать 19.11.2008. Сдано в производство 20.11.2008.
Формат бумаги 60x90 1/16. Объем 1,5 п.л.
Тираж 100 экз. Заказ № 584
Отпечатано в ООО "Фирма БЛОК"
107140, г.Москва, ул. Краснопрудная, вл.13. т.264-3073
Изготовление брошюр, авторефератов, печать и переплет диссертаций
Оглавление автор диссертации — кандидата технических наук Ушаков, Павел Александрович
ВВЕДЕНИЕ.
ГЛАВА 1. ОСОБЕННОСТИ ПРИМЕНЕНИЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ВЫБОРА ДЕЙСТВУЮЩИХ ВЕЩЕСТВ ФАРМАКОЛОГИЧЕСКОЙ ПРОДУКЦИИ ХИМИЧЕСКОГО ПРОИЗВОДСТВА
1.1 Задача выбора действующих веществ фармакологической продукции химического производства.
1.2 Описание структуры молекул исследуемых соединений.
1.3 Искусственные нейронные сети.
1.3.1 Структура искусственных нейронных сетей.
1.3.2. Обучение и тестирование искусственных нейронных сетей.
1.4 Программы моделирования нейронных сетей.
1.5 Применение нейронных сетей в химических и биохимических исследованиях.
ГЛАВА 2. МЕТОДИКА ВЫБОРА ПЕРСПЕКТИВНЫХ ДЕЙСТВУЮЩИХ ВЕЩЕСТВ ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ С ПОМОЩЬЮ ИНС.
2.1 Методы функционального моделирования предметной области.
2.2 Обобщенное описание процедуры выбора действующих веществ фармакологической продукции химического производства.
2.3 Этапы выбора действующих фармакологической продукции с помощью ИНС.
ГЛАВА 3. ПРИМЕНЕНИЕ МЕТОДИКИ ВЫБОРА ДЕЙСТВУЮЩИХ ВЕЩЕСТВ ФАРМАКОЛОГИЧЕСКОЙ ПРОДУКЦИИ ХИМИЧЕСКОГО ПРОИЗВОДСТВА.
3.1 Выбор производных дитиокарбаминовой кислоты, обладающих противотуберкулезной активностью.
3.2 Выбор ненуклеозидных ингибиторов обратной транскриптазы, обладающих анти-ВИЧ активностью.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Ушаков, Павел Александрович
Одним из первых этапов химического производства фармакологической продукции является выбор перспективных действующих веществ из большого массива химических соединений. Компьютерное прогнозирование таких свойств еще не синтезированных химических соединений, как токсичность, биодоступность, фармакологическая активность и т.п., позволяет проводить дорогостоящие экспериментальные исследования более прицельно и оценивать возможность использования соединения в качестве основы для создания лекарственного препарата на ранних стадиях его изучения. В основе исследований лежит предположение о том, что структура соединения определяет свойства, проявляемые этим соединением. Гипотезы о взаимосвязи структуры молекулы соединения и его свойствами могут быть построены на основе анализа сведений об уже синтезированных и исследованных молекулах соединений того же класса. Эту область исследований кратко называют изучением зависимостей «структура - свойство» (structure-activity relationships, SAR).
Для исследования взаимосвязи между структурой молекулы соединения и его свойствами структуру молекулы описывают с помощью точечных характеристик-параметров и затем пытаются выявить взаимосвязи между параметрами и интересующими исследователя свойствами соединений. Построение гипотез о взаимосвязи между структурой и свойствами исследуемых соединений сводится к выявлению общей закономерности на основе ряда примеров ее проявления. Эта задача относится к классу задач индуктивного вывода. Как правило, гипотеза описывается в виде формулы, в которую необходимо подставить параметры структуры молекулы для того, чтобы получить оценку ее активности. Основным результатом прогнозирования являются оценки значений свойств соединений тестовой выборки.
Корреляционные методы основаны на попытках построить функцию, связывающую значения каких-либо параметров со значением свойства. Для получения такой функции применяются различные методы статистической обработки данных, такие как различные варианты регрессионного анализа, дискриминантный анализ, метод главных компонент и метод "частичных наименьших квадратов". Наибольшее распространение получили регрессионные методы, однако при применении регрессионного анализа не всегда удается получить хорошую модель. Причин для этого может быть несколько, например, нелинейность исследуемой зависимости между структурой и свойством (активностью), или комбинаторные затруднения. Поэтому в последнее время стали активно применяться подходы, основанные на методах искусственного интеллекта, в том числе методы, основанные на использовании искусственных нейронных сетей, позволяющих формировать гибкие нелинейные модели зависимостей «структура-свойство». Однако при применении ИНС для задач прогнозирования свойств органических соединений возникает ряд проблем, связанных, в первую очередь, с малым объемом выборок. Актуальной остается задача разработки алгоритмов и методик применения ИНС для отбора действующих веществ новых лекарственных препаратов на основе прогнозов свойств этих соединений.
Целью работы является повышение эффективности ранних стадий химического производства фармакологической продукции за счет сокращения сроков выбора действующих веществ путем использования искусственных нейронных сетей.
Для достижения этой цели необходимо последовательное решение следующих задач:
1. анализ особенностей применения ИНС для задач прогнозирования свойств органических соединений;
2. выбор структуры ИНС и алгоритмов их обучения и тестирования;
3. разработка методики выбора действующих веществ лекарственных препаратов;
4. выбор инструментальных средств для реализации разработанной методики;
5. применение методики для решения различных задач выбора соединений с требуемыми свойствами.
Научная новизна
• выявлены особенности применения ИНС для задач прогнозирования активности органических соединений,
• разработана методика выбора действующих веществ фармакологической продукции химического производства;
• предложен алгоритм регуляризации, позволяющий повысить точность прогнозов за счет уменьшения количества входных параметров ИНС.
Практическая значимость. Основным практическим результатом является методика выбора действующих веществ фармакологической продукции химического производства. На основе этой методики получены подтвердившиеся в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных тетрагидроимидазобензодиазипенона (ПВО).
Методы исследования
Разработка методики выбора действующих веществ фармакологической продукции химического производства выполнена с использованием методов функционального моделирования. Для прогнозирования свойств органических соединений использованы гомогенные однонаправленные трехслойные ИНС с 3-мя нейронами в промежуточном слое.
Заключение диссертация на тему "Применение искусственных нейронных сетей для выбора действующих веществ фармакологической продукции химического производства"
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. выявлены особенности применения искусственных нейронных сетей (ИНС) для задач прогнозирования свойств органических соединений;
2. обоснован выбор структур ИНС и алгоритмов их обучения и тестирования;
3. разработана методика выбора действующих веществ фармакологической продукции химического производства;
4. предложен алгоритм регуляризации, позволяющий уточнить прогнозы за счет уменьшения количества входных параметров ИНС;
5. получены подтвержденные в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных тетрагидроимидазобензодиазипенона (Т1ВО)
Библиография Ушаков, Павел Александрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Поройков В.В. Компьютерное предсказание биологической активности веществ: пределы возможного. Химия в России, 1999, N 2, с.8-12
2. Кларк Т. Компьютерная химия: Пер. с англ.-М.: Мир, 1990.-383 с.
3. Hansch С., Leo A. Exploring QSAR. Fundamentals and Applications in Chemistry and Biology //American Chemical Society Professional Reference Book, Washington, 1995
4. ZefirovN. S., Baskinl.I., Palyulin V. A., SYMBEQ program and its application in computer-assisted reaction design // Journal of Chemical Information and Computer Science, 1994, 34, (4), pp. 994-999.
5. Leo A.J., Calculating log Poet from Structures. // Chemical Review, № 4 (93), 1993, pp. 120-146.
6. Gruber C., Buss V., Quantum-mechanically calculated properties for the development of quantitative structure-activity relationships (QSAR's) . pKa-Values of phenols and aromatic and aliphatic carboxilic acids // Chemosphere, 19, (1989), p. 1595
7. Cartier A., Rivali J.-L. Electronic Descriptors in Quantitative Structure-Activity Relationships // Chemometrical Intelligence Laboratory Systems, 1, 1987, p. 335.
8. Hehre W. J., Radom L, Schleyer. P. v.R., Pople J. Ab Initio Molecular Orbital Theory A.; Wiley, 1986.
9. Dewar M.J.S., Zoeblisch E.G., Healy E.F., Stewart J.J.P., Development and use of quantum mechanical molecular models. AMI: A new general purpose quantum mechanical molecular model, 107, 1985, p 3902.
10. Stewart J.J.P. Optimization of parameters for semiempirical methods // Journal of Computational Chemistry, V. 12., № 3, 1991. pp. 320-341.
11. Bradbury S.P., Ankley G.T. The role of ligand flexibility in predicting biological activity//Environmental Toxical Chemistry, 17, 1998, pp.15-25
12. Барский А.Б. Логические нейронные сети // БИНОМ. Лаборатория знаний, ИНТУИТ.ру, 2007, 352 е.
13. Горбань А. Н., Дунин-Барковский В. Л., Миркес Е. М. и др. Нейроинформатика. Новосибирск: Наука, 1998.
14. Хехт-Нильсен Р. Нейрокомпьютинг: история, состояние, перспективы// Открытые системы. 1998. №4.
15. Тархов Д. А. Нейронные сети. Модели и алгоритмы. Радиотехника, 2005, 256 с.
16. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия ТЕЛЕКОМ, 2001, 382 с.
17. Розенблатт Ф. Принципы нейродинамики: Персептроны и теория механизмов мозга. М.: Мир, 1965.
18. Прикладные нечеткие системы/ Под ред. Т. Тэрано, К. Асаи, М. Сугено. М.: Мир, 1993.
19. Patterson. D. (1996). Artificial Neural Networks. Singapore: Prentice Hall.
20. Горбань A. H. Обучение нейронных сетей. M : СП Параграф, 1991.
21. Moody, J. and Darkin, C.J. (1989). Fast learning in networks of locally-tuned processing units. Neural Computation 1 (2), 281-294.
22. Levenberg, K. (1944). A method for the solution of certain non-linear problems in least squares. Quarterly Journal of Applied Mathematics II (2), 164-168.
23. Marquardt, D.W. (1963). An algorithm for least-squares estimation of nonlinear parameters. Journal of the Society of Industrial and Applied Mathe^matics 11 (2), 431-441.
24. Огнев И. В., Борисов В. В. Ассоциативные среды. М.: Радио и связь,2000.
25. Bishop. С (1995). Neural Networks for Pattern Recognition Oxford University Press.
26. Kohonen, Т. (1990). Improved versions of learning vector quantization. International Joint Conference on Neural Networks I, 545-550. San Diego, CA.
27. Галушкин А.И. Теория нейронных сетей. М.: ИПРЖР, 2000, 208 с.28 www.nd.com29 www.neuralware.com30 www.neuralproject.com31 www.statsoft.ru
28. Пилиньский М., Рутковская Д., Рутковский JI. Нейронные сети, генетические алгоритмы и нечеткие системы М., Горячая-линия-Телеком, 2007, 452 с.
29. Баскин И. И., Палюлин В. А., Зефиров Н. С. Применение искусственных нейронных сетей в химических и биохимических исследованиях. Вестник Московского Университета. Химия. 1999, том 40, N 5, с. 323
30. Zupan J., Gasteiger J. Neural networks for chemists // Weinheim: VCH,1993.
31. Neural networks in QSAR and Drug Design // Ed. by Devillers J., London, Academic Press, 1996.
32. Salt D.W., Yildiz N., Livingstone D.J. et al. The Use of Artificial Neural Networks in QSAR//Pesticide Science, 1992, v.32. № l, pp.161-170
33. Tetko I.V., Livingstone D.J., Luik A.I. Neural Network Studies. Comparison of Overfitting and Overtarining // J. Chem. Inf. Comput. Sci., 1995, v.35, № 5, pp.826-833
34. Tetko I.V., Villa A.E., Livingstone D.J. Neural Network Studies. Variable Selection // J. Chem. Inf. Comput. Sci., 1996, v.36, № 4, pp.794-803
35. Livingstone D.J., Salt D.W. Regression Analysis for QSAR using Neural Networks // Bioorganic and Medicine Chemical Letters, 1992, v.2. № 3, pp.213-218
36. Villemin D., Cherqaoui D. et al. Neural Networks Studies: QSAR of Mutagenic Aromatic Nitro Compounds // J. Chem. Phys., 1993, v.90, pp. 1505-1519
37. Baskin I.I., Palyulin V.A., Zeflrov N.S. A Neural Device for Searching Direct Correlations between Structures and Properties of Chemical Compounds // J. Chem. Inf. Comput. Sei. 1997. 37. № 4. P. 715.
38. Кафаров B.B., Дорохов И.Н. Системный анализ процессов химической технологии. -М., Наука, 1976, 500 с.
39. Калянов Г.Н. CASE. Структурный системный анализ (автоматизация и применение). -М.: ЛОРИ, 1996, 242 с.
40. Рекомендации по стандартизации. Информационные технологии поддержки жизненного цикла продукции. Методология функционального моделирования Госстандарт России, Москва, Издательство стандартов, 2001
41. Бурляева Е.В. Диссертация на соискание ученой степени доктора технических наук. 2004
42. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления. —М., Высшая школа, 2002. — с. 184.
43. Барский А.Б. Нейронные сети: распознавание, обучение, принятие решений М.: Финансы и статистика, 2004, 176 с.
44. Кораблев М.В., Евец М.А. Гербицидная активность производных дитиокарбаминовой кислоты: применение в сельском хозяйстве. Фармакология и токсикология, 1977, № 5, с.603-612
45. Тарахтий Э.Ф., Сидорова Л.П., Жигальский О.А., Чупахин О.Н. Антихолестериновая активность новых солей дитиокарбаминовых кислот // Химико-фармацевтический журнал, N 1, 1998. с. 17-21
46. Сорокина О.Б., Алексеев В.Г.; Новый бифункциональный комплексон с дитиокарбаматными группировками. Сборник научных трудов "Учёные записки Тверского государственного университета". ТА. Тверь, 1998, с.28-31
47. Граник В.Г, Макаров В.А. Синтез и свойства производных тиокарбаминовых кислот. Успехи химии, 11, 1998, с. 1013-1032
48. Бурляева Е.В., Ушаков П.А. Применение искусственных нейронных сетей для прогнозирования противотуберкулезной активности органических соединений // Вестник Костромского государственного университета им. Н.А. Некрасова, т. 12, № 3, 2006, с. 25-29
49. Юркевич A.M., Бурляев В.В., Боридко B.C., Разливинская С.В. Компьютерное моделирование противотуберкулезной активности производных дитиокарбаминовой кислоты // Ученые записки МИТХТ, вып. 1., МИТХТ, 2000, с. 39-42
50. Ren J., Esnouf R., Hopkins A. at all The structure of H1V-1 reverse transcriptase complexed with 9-cloro-TIBO: lessons for inhibitor design// Structure, 1995, 3, pp. 915-926.
51. Silverman B.D., Piatt D.E. Comparative Molecular Moment Analysis: 3D-QSAR without Molecular Superposition // Journal of Medicinal Chemistry, 1996, vol.39, № 11, pp.2129-2140.
52. Kukla M.J., Breslin H.J., Diamond C.J. et al. (1991) Journal of Medicinal Chemistry, vol.34, 3187.
53. Бурляев B.B., Бурляева E.B., Разливинская C.B., Юркевич A.M., Швец В.И. Анализ прогностических возможностей метода комплексных интервальных моделей // Тезисы докладов IX Российского национального конгресса "Человек и лекарство", Москва, 2002, с.590.
54. Бурляева Е.В., Ушаков П.А. Применение нейронных сетей для прогнозирования активности органических соединений // Вестник МИТХТ, 2008г, тЗ, №4, стр. 79-83.
-
Похожие работы
- Алгоритмы определения необходимой и достаточной разрядности искусственных нейронных сетей в составе систем обработки информации
- Математические модели и методы оптимизации функциональной надежности искусственных нейронных сетей
- Прогнозирование потребления электроэнергии фабрикой окускования горно-обогатительного комбината методом искусственных нейронных сетей
- Теоретические основы прогнозирования опасности намечаемых к промышленному использованию веществ
- Алгоритмы и комплексы программ нейронно-сетевого моделирования отделений ректификации многокомпонентных смесей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность