автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Компьютерная диагностика канцерогенности химических веществ на основе систематизации и анализа структурных дескрипторов

кандидата технических наук
Орлов, Виталий Владимирович
город
Волгоград
год
2001
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Компьютерная диагностика канцерогенности химических веществ на основе систематизации и анализа структурных дескрипторов»

Оглавление автор диссертации — кандидата технических наук Орлов, Виталий Владимирович

введение.

Актуальность проблемы.,.

Цель и задачи исследования.

Материалы иметоды исследования.

Научная новизна результатов диссертащи.

На защиту выносятся.

Практическая ценность.

Реализация результатов исследования.

Апробация работы.

Публикации.

глава 1. использование методов прикладной статистики и теории распознавания образов для системного анализа и обработки информации по зависимостям "структура-свойство" (литературный обзор).п

1.1. краткий обзор методов анализа связи структура - СВОЙСТВО.

1.2. характеристика современных методов анализа СВЯЗИ структура - СВОЙСТВО.

1.3. современные прогностические модели канцерогенности (ТОКСИЧНОСТИ) химических веществ.

1.4. выводы из литературного обзора для обоснования диссертационной работы.

глава 2. систематизация и верификация информации по канцерогенным соединениям и формирование репрезентативной выборки.

2.1. формирование обучающей выборки на основе данных iarc.

2.2. формирование обучающей выборки на основе данных ro c.

2.3. тестовые выборки из рте-1, рте-2.

2.4. тестовые выборки по добавкам в полимеры.

глава 3. применение структурных дескрипторов для описания химических соединений — систематизация и формирование информационной основы

3.1. дескрипторы молекулярной структуры в исследованиях связи "структура-активность" и выбор эффективных (адекватных) дескрипторов.

3.2. используемые нотации структурной формулы.

3.2.0. Дескрипторный язык QL.

3.2.1. Простые атомные пары (АП).

3.2.2. Помеченные атомные пары (ПАПП).

3.2.3. Присоединенные атомные фрагменты (ПАФ).

3.2.4. Многоуровневые атомные окрестности (МАО).

3.2.5. Топологические индексы (ТИ).

глава 4. разработка и оптимизация многомерных методов анализа данных для диагностики канцерогенной опасности химических соединений.

4.1. математические модели.

4.1.1. Параметрические модели методов распознавания образов с различными гипотезами о распределении признаков.'.

1. метод, основанный на независимых дискретных признаках (ндп).

2. метод, основанный на полиномиальном распределении признаков (мпр).

3. линейная дискриминантная функция (лдф) фишера.

4. алгоритм взвешенного евклидова расстояния (вер).

5. метод, основанный на распределении пуассона признаков (мпур).

6. метод, основанный на геометрическом распределении признаков (мгр).

7. метод, основанный на распределении бернулли (мбр).

8. метод, основанный на гипергеометрическом распределении признаков (мггр).

4.1.2. Непараметрические модели.

9. метод к-ближайших соседей (кбс).

10. метод, основанный на разложении чоу для бинарных признаков(чоу).

4.1.3. Локальные методы классификации. вариант i. методы локального распределения с фиксированным радиусом сферы r. вариант 11. методы локального распределения с фиксированным объемом локальной обучающей выборки к.

4.2. процедуры голосования.

1. голосование по простому большинству (гпб).

2. голосование по байесовскому алгоритму для независимых бинарных признаков гиб).

3. голосование по правилу независимых экспертов (гнэ).

4.3. процедуры оптимизации пространства признаков: анализ и отбор.

1. априорный отбор признаков по точному критерию фишера (ткф).

2. алгоритм прямого отбора признаков (по).

3. алгоритм обратного отбора признаков (оо).

4. алгоритм случайного поиска с адаптацией (сна).

4.4. оценки точности прогноза канцерогенной опасности.

4.5. обсуждение результатов: сравнение и оптимизация методов распознавания.

4.6. дополнительное тестирование разработанной методики обработки информации на примере диагностики стабилизирующей активности и канцерогенной опасности добавок к полимерам.д

4.6.1. Прогнозирование свойств стабилизаторов замещенных полиэтиленов на основе зависимостей "структура-свойство".•.

4.6.2. Компьютерная экспертиза канцерогенной опасности низкомолекулярных модификаторов полимерных композиций — стабилизаторов замещенных полиэтиленов.

глава 5. программный комплекс компьютерной системы 8арк-ст2001 для диагностики канцерогенности химических вещест в. общая схема системы компьютерной диагностики. наборы данных.•.д архитектура баз данных.

80-ФАйлы. трансляторы.л.•. модули и алгоритмы прогноза. сервисные программы.д выводы.д

Введение 2001 год, диссертация по информатике, вычислительной технике и управлению, Орлов, Виталий Владимирович

Развитие системного анализа и обработки химической информации привело к возможности оценки токсических эффектов химических соединений на основе исследования их структурных формул, собранных в базу данных. Предварительный вычислительный эксперимент по компьютерной оценке вредных свойств исследуемых соединений с использованием химической информации, в частности, по оценке канцерогенной опасности (КО), позволяет снизить непроизводительные затраты и свести к минимуму возможность использования экологически опасных веществ.

Привлечение различных методов обработки информации для оптимизации поиска и конструирования лекарств, для исследования механизмов действия биологически активных веществ в последние годы становится все более актуальным. Причем создателей и пользователей компьютерных систем, ориентированных на решение этих задач, в особенности систем прогноза биологической активности, в первую очередь, естественно, интересует адекватность рассматриваемых моделей и точность математических методов, реализующих решающие правила и алгоритмы прогноза. Данная работа посвящена этим аспектам на примере построения и анализа методики компьютерной диагностики КО органических соединений. В работе использованы методологические принципы, принадлежащие междисциплинарному научному направлению "количественные соотношения структура - активность", другое название — компьютерный молекулярный дизайн биологически активных соединений [1-4]. Исследования в данной области, пограничной между математикой, химией, биологией и медициной, существенным образом основываются на интенсивно развивающейся электронно-вычислительной технике (ПК) и компьютерных методах анализа и обработки информации.

Целенаправленный поиск соединений, обладающих заданным видом биологического действия, требует привлечения информации о связи молекулярной структуры с биологической активностью. Знание связи между структурой и активностью, структурой и проявляемым полезным или вредным свойством, необходимо для конструирования лекарств, а также многих других видов биологически активных соединений (гербицидов, пестицидов, стимуляторов и т.д.). Здесь же находится ключ к пониманию механизмов токсического, в частности, канцерогенного действия целого ряда химических соединений.

Конечной целью системного анализа связи между структурой и активностью является детальное знание механизма действия биологически активных соединений (БАС). Но молекулярный механизм взаимодействий БАС с биологическими системами в большинстве случаев неясен ввиду исключительной сложности этих взаимодействий и самих систем, а исследования по моделированию механизмов действия трудоемки и методологически находятся только в стадии становления. В этом случае естественно разработать и применять на практике быстрые и эффективные методы обработки информации, дающие неявные сведения об этих механизмах и позволяющие решать насущные задачи.

Поэтому огромный интерес к проблемам связи структура - активность

CCA), особенно к исследованиям в области количественных соотношений между структурой и свойствами органических соединений, к так называемым задачам SAR/QSAR/QSPR ~ (quantitative) structure-activity (property) relationship ((количественная) связь "структура - активность (свойство)"), объясняется главным образом тем, что выявление ССА, чаш;е всего в неявном, трудно обозримом виде многопараметровых уравнений регрессии или многомерных решающих правил, все же, так или иначе, способствует лучшему пониманию механизмов .функционирования вещества в системах. Обнаруженные эмпирические закономерности могут служить основным источником информации о внутренней структуре и функциональных связей объектов. На базе выявленных закономерностей можно проводить предварительный отсев (скрининг), молекулярный дизайн органических веществ (лекарств - drug design), проявляющих полезное (вредное) свойство, а также наметить определенный набор биохимических и фармакологических тестов для оценки эффективности и безопасности нового лекарственного вещества. Это позволяет существенно снизить большие временные и финансовые затраты, необходимые для разработки соединений с заданными свойствами.

Общеизвестно, что канцерогенная опасность (КО) органических соединений является сложным общесистемным видом биологической активности [3]. Механизмы действия многих канцерогенных веществ малоизученны либо вообще неизвестны, а вычислительный прогноз КО новых химических соединений представляет собой одну из самых сложных задач QSAR. В связи с этим, в данном исследовании рассматривается конкретная практическая задача по разработке методики компьютерного прогнозирования канцерогенной опасности (КО) химических соединений. На практике подобные методики могут с успехом использоваться токсикологами, медицинскими химиками, фармакологами, химиками-синтетиками, экологами.

В своем наиболее общем и обычном виде исследование зависимости "структура-свойство" сводится к решению основной проблемы естествознания: как по отдельным, частным наблюдениям выявить и описать интересующую нас общую закономерность? Значительный интерес также представляет и обратная задача. В связи с этим, для исследования зависимостей "структура-свойство" в настоящее время применяется соответствующий математический аппарат прикладной статистики [5-7], многомерного статистического анализа 8], распознавания образов [9], искусственного интеллекта, теории принятия решенийЛ искусственных нейронных сетей, генетических алгоритмов, другие методы системного анализа и обработки данных с использованием возможностей современных информационных и компьютерных технологий.

Применение различных вычислительных методов позволяет облегчить и усовершенствовать процесс поиска исследователем эмпирических закономерностей природы. Предполагается, что совершенствование методов анализа данных позволит в будущем с помощью компьютерных технологий максимально полно восстанавливать зависимости в больших и малых массивах многомерных статистических данных. Причем, хочется отметить заметное превосходство машинных методов анализа в данной области, поскольку обычная многомерность (большое число переменных) в представлении структурной информации является пока непреодолимым препятствием для обработки ее человеческим мозгом. Только машина может запомнить большой ряд чисел, характеризующий изучаемый объект, с большой скоростью упорядочить их, выявить совпадения чисел, соответствующих объектам одного классаЛт.е. провести классификацию множества объектов, - а это один из видов творческой деятельности человека, часто предшествующий созданию строгих научных теорий. Поэтому ЭВМ, снабженная алгоритмом распознавания образов, обладает элементами интеллекта. Среди наиболее важных приложений алгоритмов распознавания в химии - применение методов распознавания образов для диагностики (предсказания, прогноза) свойств конкретного химического соединения [3,10]. Естественно, что окончательное решение в отношении интерпретации и использовании результатов прогноза должно приниматься квалифицированным экспертом, который примет во внимание также имеющуюся в его распоряжении дополнительную информацию.

Существует несколько особенностей применения математических методов к проблеме ССА. Эти методы требуют: 1) обучающей выборки, состоящей из репрезентативного набора химических соединений с известным уровнем активности и максимально полно представляющей данную предметную область; 2) количественного описания химической структуры, т.е. преобразования химической структуры в набор численных дескрипторов, предположительно связанных с биологической активностью; 3) установления количественной связи (модели) между этими дескрипторами и биологическими свойствами химических соединений; 4) процедур оценки адекватности построенной модели, характеризующих ее надежность и прогностическую способность. Изложение материала ведется в соответствии с этой схемой в рамках выбранной задачи ССА — зависимости структура-КО.

Актуальность проблемы.

В Перечне приоритетных направлений фундаментальных исследований [11], утвержденных на заседании Президиума РАН от 13.01.98 г., отмечено направление "3.2. . .Зависимость структура - свойство".

С июня 1996 года на базе Института биомедицинской химии (ИБМХ) РАМН создано Российское отделение Международного общества по анализу количественных соотношений структура - активность и молекулярному моделированию (The QSAR and Modelling Society), председатель - д.х.н., профессор Раевский O.A., а также организованы спецкурсы по компьютерному конструированию лекарств на ряде биомедицинских факультетов ведущих медицинских и химических вузов страны (спецкурс "Биоинформатика и компьютерное конструирование лекарств" для студентов медико-биологического факультета РГМУ). Целью Российского отделения является развитие сотрудничества между российскими и зарубежными исследователями, работающими в данной области, повышения уровня таких работ в нашей стране. I

Чтобы продвинуть лекарство на рынок, фармацевтической компании может потребоваться вложить 350-500 миллионов долларов [12]. Вообще, для фармацевтической промышленности, агрохимии и ветеринарии необходимость 1 1

В новых химических средствах чрезвычайно остра. Поэтому любой метод, позволяющий быстро найти новые химические средства, сократить время продвижения лекарства на рынок или уменьшить расходы на научные исследования и разработки (на них компании могут расходовать от 15 до 18 % оборотных средств), исключительно ценен и жизненно необходим для поддержания жизнеспособности данных компаний [12,13].

Большинство современных компьютерных систем прогноза КО доступны либо на коммерческой основе либо вообще не распространяются (т.е. создаются для домашнего, in-house, использования), и потому практически недоступны для массового использования. Аналогичная ситуация наблюдается со структурными банками данных по соединениям с известными свойствами.

Анализ литературы в данной области и результатов "слепых" тестирований прогностических моделей КО, проводившихся в рамках US NTP (National Toxicology Program), показывает низкое качество построенных математических моделей, основная причина этого видится в недостаточной изученности механизмов действия многих канцерогенных веществ. Это подтверждает мнение об отсутствии оптимального метода для анализа зависимости структура-свойство при решении задач, связанных с оценкой КО, и является привлекательным для разработки оригинальных моделей и методов с целями интенсификации исследований в области прогноза канцерогенности и определения наиболее полезных и надежных методов QSAR.

Все вышеизложенное убедительно доказывает, что разработка и адаптация системы компьютерной диагностики КО является актуальным направлением современной прикладной математики, токсикологии, теоретической органической и медицинской химии.

Цель и задачи исследования.

Разработать эффективную методику обработки химической информации для компьютерной диагностики канцерогенной опасности органических соединений с использованием химической структурной формулы.

Для достижения поставленной цели решались задачи:

1. По систематическому исследованию известных подходов к решению задач анализа зависимости структура-активность и к построению прогностических моделей структура-канцерогенность.

2. По анализу и подготовке информации для создания профилированных баз данных по канцерогенам на основе двух списков: IARC и RoC (NCI/NTP).

3. По разработке методики диагностики КО органических соединений и ее программной реализации.

4. По оценке и сравнению точности прогноза КО, основанного на различных математических моделях.

5. По распространению методики на другие свойства (активности) химических соединений, в частности для диагностики стабилизаторов полимерных композиций на основе замещенных полиэтиленов (добавок к полимерам) и оценке их КО.

Материалы и методы исследования.

Структурные формулы химических соединений представлялись с помощью: 1) оригинальных фрагментарных кодов: а) простые атомные пары, б) помеченные атомные пары, в) присоединенные атомные фрагменты (атомно-центрированные фрагменты); 2) оригинальной модификации дескрипторов атомных окрестностей, предложенных первоначально в (Филимонов Д.А. и со-авт., 1998) [14,15]; и 3) структурных дескрипторов иерархического фрагментарного языка дескрипторного типа QL (Васильев П.М. и соавт., 1990, 1991) [16,17].

На начальных этапах работы для хранения структурных данных и автоматической трансляции химических структур в коды языка QL использовался программный Комплекс системы "Микрокосм" [18,19] (Васильев П.М. и соавт., 1990-1992), ориентированный на специфические форматы данных и структуру баз данных. Поэтому часть результатов диссертации была получена на основе аналитических методов, разработанных для совершенствования существующей методики компьютерного прогноза биологической активности органических соединений, в рамках данной системы [20]. В дальнейшем были созданы полностью оригинальные и независимые методы и программные средства предлагаемой системы SAPR-CT2001 для компьютерной диагностики канцерогенной опасности, способные работать со стандартными форматами структурных данных (*.sdf- и * .то1 -файлами формата MD L Information Systems, Inc.).

Базы данных по канцерогенным веществам были сформированы по материалам IARC (Международного агентства по изучению рака, подразделения ВОЗ/ООН, [21], http://www.iarc.fr) и RoC (The Report on Carcinogens, Ninth Edition, 2000 из US NTP/NIEHS/NIH, http://ntp-server.niehs.nih.gov/). Неканцерогенные соединения, составляющие класс неактивных веществ обучающих выборок, выбирались случайным образом из справочника по лекарственным веществам (Negwer М., 1987) [22]. Объединенная обучающая и тестовая выборки ПО стабилизаторам замещенных полиэтиленов (включала данные по ПВХ, ПС, ПЭ, ПП) сформирована на основе результатов работ (Гермашев И.В. и соавт., 1997, 1998; Дербишер В.Е. и соавт., 1995; и др.) [23-25], а также поиска в доступных справочниках и научно-технической литературе по добавкам к полимерным материалам [26-36]. Эти выборки используются для построения соответствующих зависимостей структура-свойство и как объекты для оценки и отбора из них потенциально опасных химических добавок.

Сравнение эффективности разработанных методов с другими известными методами прогнозирования химической канцерогенности проводилось на основе двух тестовых выборок (РТЕ-1, РТЕ-2) и данных из статьи (Bristol D.W. et al., 1996; Duerksen-Hughes P.J. et al., 1999) [37,38].

Для решения поставленных задач в работе использованы методы системного анализа, распознавания образов, прикладной статистики, дискретной математики, теории графов, численные методы, методы анализа сложности и оптимизации алгоритмов, программирования, математической химии, медицинской химии, химии и физики полимеров.

Отдельные модули компьютерной системы реализованы в вИде MS Windows-приложений (система программирования Borland Delphi 5). Все расчеты выполнены на IBM-совместимом персональном компьютере на базе процессора AMD К6-166 ММХ. i Научная новизна результатов диссертация.

1. Построены и реализованы эффективные прогностические модели, примененные для обработки исходных данных: неоднородных, большой размерности.

2. На основе систематизации и анализа химической информации созданы две актуальные информационные базы данных по структуре соединений, канцерогенных для человека.

3. Разработана методика обработки химической информации, отражающей зависимость "структура-свойство".

4. Разработана система диагностики канцерогенной опасности химических соединений.

На защиту выносятся.

1. Метод решения задач, связанных с обработкой информации по зависимости "структура-свойство" с неоднородностью и большой размерностью исходных данных, на примере построения модели канцерогенной опасности органических соединений с использованием дескрипторов структурной форму21ыРезультаты тестирований разработанной методики компьютерной диагностики канцерогенности и сравнения ее точности с другими алгоритмами и подходами.

Практическая ценность.

1. Разработан программный комплекс "SAPR-CT200i" (Structure Analysis and Pattern Recognition for Chemical Toxicity), позволяющий реализовывать следующие процедуры для решения разнообразных задач "структура-свойство":

• описание химических соединений с помощью дескрипторов структурной формулы: а) фрагментарных кодов, б) топологических индексов;

• формирование матрицы данных на основе дескрипторного представления u с» / u \ соединений данной выборки для построения двуклассной (дихотомической) модели;

• анализ данных с целью построения прогностической модели методами распознавания образов.

2. Реализованный метод полезен в системах обработки информации, а также для экологической и медицинской практики, так как идентификация опасных веществ позволяет свести к минимуму возможность контакта с ними. Кроме того, существует потребность в быстрых и эффективных методах прогноза, позволяющих заменять или сокращать время и стоимость существующих способов определения уровня токсикологической (канцерогенной) опасности химических веществ, т.е. являющихся дополнениями или альтернативами к этим способам.

3. Общепринято, что получение подобных надежных моделей химической канцерогенности помогает в определении, понимании, открытии и подтверждении гипотез о ее различных механизмах и способах действия.

4. С помощью разработанной компьютерной системы показано, что 44 % применяемых в промышленности органических стабилизаторов полимерных

10 композиций являются потенциально канцерогенными для человека. Кроме того, на той же выборке для стабилизирующего свойства получена точная модель. Реализация результатов исследования.

Разработанная методика использовалась для компьютерной оценки биологической активности 17 новых производных адамантана [39]. Часть соединений (2 из 4), отобранных для экспериментального тестирования по результатам прогноза, показала наличие предсказанных свойств. Апробация работы.

Основные положения диссертации докладывались и обсуждались на IV и У-ой Региональной конференции молодых исследователей Волгоградской области (Волгоград, 1998, 2000); международной научной конференции "Математические методы в технике и технологиях" — ММТТ-12 (Великий Новгород,

1999) и ММТТ-2000 (Санкт-Петербург, 2000); Международном экологическом конгрессе "Новое в экологии и безопасности жизнедеятельности" (Санкт-Петербург, 2000); V традиционной научно-технической конференции стран СНГ "Процессы и оборудование экологических производств" (Волгоград,

2000) ; международной научно-технической конференции "Информационные технологии в образовании, технике и медицине" (Волгоград, 2000); международной научно-практической конференции "Развивающиеся интеллектуальные системы автоматизированного проектирования и управления" (Новочеркасск,

2001).

Публикации.

По материалам диссертации опубликовано 12 работ, включая 3 статьи и 9 тезисов докладов.

Заключение диссертация на тему "Компьютерная диагностика канцерогенности химических веществ на основе систематизации и анализа структурных дескрипторов"

выводы

Обобщая основные результаты проведенного исследования, в заключение диссертации сделаем следующие выводы.

1. На основе анализа и систематизации информации созданы актуальные базы данных по структуре химических соединений, канцерогенных для человека.

2. Систематически разработаны и реализованы методы моделирования зависиft ft мости структура - канцерогенность на основе дескрипторов структурной формулы, что позволило получить эффективную методику обработки неоднородной, многомерной информации.

3. Дескрипторное описание формул химических соединений с помощью фрагментарных кодов и топологических индексов на языке типов атомов и химических связей, а также использование простых байесовских решающих правил сделало эффективным диагностику канцерогенности без привлечения более сложных дескрипторов и алгоритмов.

4. При эффективной обработке неоднородных многомерных данных достаточно адекватные молекулярные дескрипторы сравнительно небольшой размерности могут обеспечивать максимально надежный прогноз (выше 90 %) свойств химических соединений.

5. Как показали компьютерные эксперименты, в условиях неоднородности и большой размерности пространства признаков, использование нескольких вариантов отбора признаков, различных процедур голосования, подбор кон-стантнь1х параметров методов являются единственными и основными средствами оптимизации простых решающих правил при выборе наиболее адекватных моделей данных.

6. Результаты проведенного тестирования разработанных методов на обучающих выборках показали, что наилучшие оценки точности прогноза полученных решающих правил находятся в пределах 85-90 %, что делает возможным использование этих методов при диагностике КО химических соединений (известные из литературы лучшие оценки для неоднородных моделей — 75-85 %).

7. При сравнении точности разработанных методов диагностики нСтестовых выборках с методами, разработанными другими авторами, оказалось, что средняя точность прогноза предлагаемой методики (53-86 %) превосходит как компьютерные решающие правила (30-65 %), так и биологические и субъективные подходы (38-79 %).

8. Предлагаемая методика обработки информации была также испытана на диагностике стабщ[изаторов полимерных композиций. Была построена адекватная статистическая модель, дающая до 87 % точности. Для этой же выборки показано, что 44 % применяемых стабилизаторов являются потенциальными канцерогенами.

Библиография Орлов, Виталий Владимирович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Голендер В.Е,, Розенблит А.Б. Вычислительные методы конструирования лекарств. — Рига: Зинатне, 1978. —238 с,

2. Розенблит А.Б., Голендер В.Е. Логико-комбинаторные методы в конструировании лекарств. — Рига: Зинатне, 1983. — 352 с.

3. Стьюпер Э., Брюггер У., Джуре П. Машинный анализ связи химической структуры и биологической активности. Пер. с англ. — М.: Мир, 1982. — 235 с.

4. Раевский О.А. Дескрипторы молекулярной структуры в компьютерном дизайне биологически активных веществ // Успехи химии. 1:999. - Т. 68. -Вып. 6.-С. 555-575.

5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей: Справ, изд. / Под ред. С.А. Айвазяна. — М.: Финансы и статистика, 1985. — 488 с.

6. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: ЬСлассификация и снижение размерности: Справ, изд. / Под ред. С.А. Айвазяна. — М.: Финансы и статистика, 1989. — 607 с.

7. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия: Учеб. пособие / Под. ред. М.М. Тихомировой. Л.: Изд-во Ленингр. ун-та, 1982. - 264 с.

8. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Пер. с англ. — М.: Мир, 1982. — 488 с. '

9. Горелик А.Л., Скрипкин В.А. Методы распознавания. — М.: Высшая школа, 1984. —208 с.

10. Джуре П., Айзенауэр Т. Распознавание образов в химии. — М.: Мир, 1977. — 232 с.11 .Приоритетные направления фундаментальных исследований // Изв. АН. Сер. хим.- 1998.-№3.-С.55 1.

11. Уайф Р., Хехенкамп Ю. SORT&gen новая технология открытия лекарств будущего // Рос. хим. ж. (Ж. Рос. хим. о-ва им. Д.И. Менделеева). - 1999. - Т. 43.-Вып. 2. С. 100-107.

12. Уайф Р. Объединение химии // Рос. хим. ж. (Ж. Рос. хим. о-ва им. Д.И. Менделеева). 1999. - Т. 43. -Вып. 1. С. 164-169.

13. И.Глориозова Т.А., Филимонов Д.А., Лагунин А.А., Поройков В.В. Тестирование компьютерной системы предсказания спектра биологической активности PASS на выборке новых химических соединений // Хим.-фарм. жури. -1998.-Т. 3 2.-№ 12.-С. 33-39.

14. Filimonov D., Poroikov V., Borodina Y., and Gloriozova T. Chemical Similarity Assessment through Multilevel Neighborhoods of Atoms: Definition and Comparison with the Other Descriptors // J. Chem. Iiif. Comput. Sci. 1999. -Vol. 39.-P. 666-670.

15. Vassiliev P.M., Breslaukhov A.G. Hierarchical language for description of structures of bioactive compounds // Abstracts of Second World Congress of Theoretical Organic Chemists. — Toronto, 1990.—Abstn AA-38.

16. П.Бреслаухов А. Г., Васильев П. М. ФКСП-3 —новый язык описания химической структуры биологически активных соединений // Первая Всесоюзная конференция по теоретической органической химии: Сб. науч. тр. в 2 т.— Волгоград, 1991. — Т. 2. —С. 498.

17. Васильев П.М., Орлов В.В., Дербишер В.Е. Прогноз канцерогенной опасности органических соединений методом шансов // Хим.-фарм. журн. — 2000. -Т. 34.-№7.-С. 19-22.

18. Канцерогенные вещества (Справочник. Материалы международного агентства по изучению рака). / Пер. с англ. А.Ф. Карамышевой. — М.: Медицина, 1987. —326 с.

19. Negwer М. Organic-Chemical Drugs and Their Synonyms. Berlin: Akademie-Verlag, 1987.—Vol. 1-3. ,

20. Дербишер В.Е., Бодрова Г.Г., Землянская H.H., Васильев П.М. Конструирование банка данных по низкомолекулярным добавкам для полимерных материалов // Изв. ВУЗов. Химия и химическая технология. — 1995. — Т. 38. — Вып. 4-5. — С. 129-133.

21. Гермашев И. В., Дербишер В. Е., Васильев П. М. Экспертная система банка данных по добавкам для поливинилхлорида // Химия и технология элемен-тоорганических мономеров и полимерных материалов. Сб. науч. тр. / Вол-гГТУ, Волгофад, 1997. — С. 94-101.

22. Шефтель В.О. Полимерные материалы. Токсические свойства. — Л.: Химия, 1982. —240 с. .

23. Вспомогательные вещества для полимерных материалов: Справочник / Под ред. К. Б. Пиотровского. — М.: Химия, 1966. — 176 с.

24. Горбунов Б. П., Гурвич Я. А., Маслова И. П. Химия и технология стабилизаторов полимерных материалов. — М.: Химия, 1981— 368 с.

25. Химические добавки к полимерам: Справочник. — М.: Химия, 1973. — 271 с.

26. Химические добавки к полимерам: Справочник / Под ред. И. П. Масловой—-2-е изд., перераб. и доп. — М.: Химия, 1981. —А 262 с.

27. Барштейн P. C.A Кирилович В. И., Носовский Ю. Е. Пластификаторы для по-ли.меров.—М.: Химия, 1982, — 197 с. г

28. Химикаты для полимерных материалов: Справочник / Под ред. Б.Н, Горбу-нова.—М.: Химия, 1984.—320 с.

29. Рэнби В., Рабек Я. Фотодеструкция, фотоокисление, фотостабилизация полимеров: Пер. с англ.— М.:Мир, 1978. — 676 с.

30. Справочник по пластическим массам: В 2 т. / Под ред. М. И. Гарбара. — М.: Химия, 1969. — Т. 2. — 517 с.

31. Справочник по пластическим массам: В 2 т. / Под ред. В. М. Катаева. — 2-е изд., перераб. и доп.—М.: Химия, 1975. — Т. 1. — 446 с.

32. Гордон Г.Я. Стабилизация синтетических полимеров. — М.: Госхимиздат, 1963. —299 с.

33. Bristol D.W., Wachsman J.T., Greenwell А. The NIEHS predictive-toxicology evaluation project // Environmental Health Perspectives. — 1996. — Vol. 104. — Supplement 5. — October.—P. 1001-1010.

34. Duerksen-Hughes P.J., Yang J., Ozcan O. p53 induction as a genotoxic test for twenty-five chemicals undergoing in vivo carcinogenicity testing // Environmental Health Perspectives. — 1999. — Vol. 107. — № 10. — P. 805-812.

35. Сафонов C.A. Синтез N-замещенных диимидоилхлоридов адамантана и их реакции с О- и N-нуклеофильными реагентами: Автореф. дис. на соискание уч. ст. канд. хим. наук / Волгоградский гос. технич. ун-т. — Волгоград, 2000.24 с. .

36. Барлоу Р. Введение в химическую фармакологию. — М.: Издательство иностранной литературы, 1959. — 464 с.

37. Hansch С, Maloney Р. Р., Fujita Т. Correlation of biological activity of phenoxyacetic acids with Hammett Substituent Constants and partition coefficients // Nahire. — 1962. — vol. 194, № 4824, pp. 178-180.

38. Hansch C, Fujita T. р-ст-л analysis. A method for the correlation of biological activity and chemical structure // Journal of American Chemical Society. —1964.vol. 86 —pp. 1616-1626.

39. Free S.M., Wilson J.W. A mathematical contribution to structure-activity studies // J. Med. Chem. a 1964, 4. pp. 395-399.

40. Валуева Л.Н., Зацепин B.M., Промоненков В.К. Применение математических методов для анализа связи молекулярная структура пестицидная активность (часть 1). Обзор, инф. Сер. "Химические средства защиты растений". М.: НИИТЭХИМ, 1985. - 56 с.

41. Kier L.B. Receptor mapping using molecular orbital theory. In.: Fundamental concepts in drug-receptor interactions. New York, Academic Press, 1970, pp. 1546.

42. Валуева Л.Н., Зацепин B.M., Промоненков В.К. Применение математическихметодов для анализа связи молекулярная структура пестицидная активность (часть 2). Обзор, инф. Сер. "Химические средства защиты растений". М.: НИИТЭХИМ, 1986. - 54 с. ' ?

43. Molecular Modelling and Prediction of Bioactivity// 12th European Symposium on Quantitative Structure-Activity Relationships: Abstract Book. Copenhagen, August 23-28,1998.

44. Валуева Л.Н., Зацепин B.M., Промоненков B.K. Применение математических методов для анализа связи молекулярная структура пестицидная активность (часть 3). Обзор, инф. Сер. "Химические средства защиты растений". М.: НИИТЭХИМ, 1987. - 50 с.

45. Weimnger D. // J. Chem. Inf Comput. Sei. 1990. - Vol. 30 - p. 237.

46. Артеменко А.Г. Анализ связи структура свойство на основе молекулярных решеточных моделей: Автореф. дис. на соискание уч. ст. канд. хим. наук / Физико-химический ин-т им. A.B. Богатского HAH Украины. — Одесса, 2000. —19 с.

47. Borodina Y., Filimonov D., Poroikov V. Computer-Aided Estimation of Syntetic Compounde whith Endogenous Bioregulations // Quant. Struct.-Act. Relat. -1998.-Vol. 17.-P. 459-464.

48. Бородина Ю.В. Компьютерный анализ сходства веществ с эндогенными биорегуляторами рецепторного действия и их синтетическими аналогами: Автореф. дис. на соискание уч. ст. канд. биол. на)А / Ин-т биомедицинской химии РАМН.—Москва, 1998.—21 с. а

49. Дербишер В.Е., Гермашев И.В., Колесникова Е.А. Компьютеризированная методика прогнозирования активных добавок к полимерным композициям // Пласт, массы. 1999. - № 2. - С. 32-36.

50. Васильев П.М., Дербишер В.Е., Орлов В.В. Способ прогноза свойств химических соединений методом фазового расстояния // Химия и технология элементоорганических мономеров и полимерных материалов: Сб. науч. тр. / ВолгГТУ. — Волгоград, 1999. — С. 57-61.

51. Аскадский A.A., Клинских А.Ф. ЭВМ-программа для расчета свойств полимеров и их растворителей // Пласт, массы. — 1998. — № 4. — С. 29-33.

52. Аскадский A.A., Клинских А.Ф. Компьютерный дизайн полимеров и метод атомных инкрементов // Высокомолек. сое д. — Серия А. — 1999. — Т. 41. —№ 1 . — С. 83-85.

53. Левшин И. Компьютеры и молекулы // Computerworld Россия. 1999. - № 16-17.

54. Ashby J., Tennant R. Prediction of rodent carcinogenicity for 44 chemicals: results // Mutagenesis. — 1994. — № 9. — P. 17-15,

55. Ashby J,, Tennant R,W. Definitive relationships among chemical structure, carcinogenicity, and mutagenicity for 301 chemicals tested by the US NTP // Mutation, Res, — 1991, — V. 257. — P. 229-306,

56. Jones T.D., Easterly C,E, A RASH analysis of National Toxicity Program data: Predictions for 30 compounds to be tested in rodent carcinogenesis experiments // Environ, Health Perspect, — 1996. — V. 104 (Suppl, 5), — P, 1017-1030.

57. King RD, Srinivasan A, Prediction ofrodent carcinogenicity bioassays fi-om molecular structure using inductive logic programming // Environ. Health Perspect.1996, — V, 104 (Suppl. 5). — P. 1031-1040.

58. Benigni R., Andreoli C, Zito R, Prediction ofrodent carcinogenicity ofnirther 30 chemicals bioassayed by the U.S, National Toxicology Program // Environ. Health Perspect. — 1996. — V. 104 (Suppl. 5). — P. 1041-1044.

59. Zhang Y,P,, Sussman N., Macina O.T,, Rosenkranz H,S. and Klopman G. Prediction of the carcinogenicity of a second group of organic chemicals undergoing carcinogenicity testing // Environ. Health Perspect, — 1996.— V. 104 (Suppl, 5).1. P, 1045-1050.

60. Moriguchi I., Hirano H,, Hirono S. Prediction ofthe rodent carcinogenicity of organic compounds fi-om their chemical structures using the FALS method // Envi164lron/Health Perspect — 1996. — V/104 (Suppl. 5. — РЛЛЛЛЛ

61. Marchant C., Prediction of rodent carcinogenicity using the DEREK system for thirty chemicals being tested by the National Toxicology Program // Environ. Health Perspect. — 1996. — V. 104 (Suppl. 5). — P. 1065-1073.

62. Tennant R.W., Spalding J. Predictions for the outcome of rodent carcinogenicity bioassays: identification of trans-species carcinogens and noncarcinogens // Environ. Health Perspect — 1996. — V. 104 (Suppl. 5). — P. 1095-1100.

63. Ashby J. Prediction of rodent carcinogenicity for 30 chemicals W Environ. Health Perspect — 1996. — V. 104 (Suppl. 5). — P. 1101-1104.

64. Huff J., Weisburger E., Fung V. Multicomponent criteria for predicting carcinogenicity: 30 NTP chemicals // Environ. Health Perspect. — 1996. — V. 104 (Suppl.5). —P. 1105-1112.

65. Smithing M.O., Darvas F. Hazardexpert: an expert system for predicting chemical toxicity // In: Food Safety Assessment. (Finley J.W., Robinson S.F., Armstrong D.J., eds). — Washington: American Chemical Society, 1992. — P. 191-200.

66. Haseman J., Zeiger E., Shelby M., Margolin В., Tennant R.W. Predicting rodent carcinogenicity from four in vitro genetic toxicity assays: an evaluation of 114 chemiclas studied by the NTP // J. Am. Stat. Assn. — 1990. — V. 85. — P. 96471.

67. Enslein K., Blake B.W., Borgstedt H.H. Prediction of probability of carcinogenicity for a set of ongoing NTP bioassays // Mutagenesis. — 1990. — № 5. —P. 305-306.

68. V. 103 (Suppl. 8). — P. 3-122.

69. Lewis R. Carcinogenically active chemicals. — New York: Van Nostrand Reinhold, 1991.

70. Zhang L., Sannes K., Shusterman A., Hansch C. The structure—Лactivity relationship of skin carcinogenicity of aromatic hydrocarbons and heterocycles // Chem. Biol. Interact. — 1992. — V. 81. — P. 149-190. Л

71. Ashby J., Tennant R. Chemical structure, Salmonella mutagenicity and extent ofi4carcinogenicity as indicators of genotoxic carcinogenesis among 222 chemicals -tested in rddents by the U.S. NGI/NTP7/ Mut. Res. -I- 1988. — V. 204. — P. 17, 115. • ' * f '

72. Huff J., Haseman J. Long-term chemical carcinogenesis experiments for identifying potential human cancer hazards // Environ. Health Perspect. — 1991. — V.96. —P.23-3L

73. Buchanan B. G., Mitchell T. M. Model directed learning of production rules // In: Pattern Directed Inference Systems (Waterman DA, Hayes-Roth F, eds). — New York:Academic Press, 1978. — P. 297-312.

74. US FDA. Carcinogen structure guide. In: General principles for evaluating the safety of compounds used in food-producing animals. — Washington: US Food and Drug Administration, 1986. — Appendix 1. — P. 7-17.

75. Bakale G., McCreary R.D. Prospective Kg screeiiing of potential carcinogens being tested in rodent bioassays by the US National Toxicology Program // Mutagenesis. — 1992. — № 7. — P. 91-94.

76. Soderman J., ed. CRC Handbook of Identified Carcinogens and Noncarcinogens. Vol. 1. — Boca Raton, FL:CRC Press, 1982.

77. Поройков B.B., Филимонов Д.А., Степанчикова A.B., Будунова А.П., Шилова Е.В., Рудницких А.В., Селезнева Т.М., Гончаренко Л.В. // Хим.-фарм. жури. 1996. - Т. 30. - № 9. - С. 20-23.

78. Lewis R.L. Sr, Sweet D.V., eds. Registry of Toxic Effects of Chemical Substances (RTECS). — Washington: U. S. Department of Health and Human Services, 1994. (updated quarterly).

79. Tennant R.W., Spalding J., Stasiewicz S., Ashby J. Prediction of the outcome of rodent carcinogenicity bioassays currently being conducted on 44 chemicals by the National Toxicology Program // Mutagenesis. — 1990. — V. 5. — P. 3-14.

80. Braga R. S., Barone P.M., Galvao D. S. Identifying carcinogenic activity of methylated polycyclic aromatic hydrocarbons (PAHs) // J.iMol. Struct. Theochem. — 1999. — V. 464. —№1-3. —P. 257-266. f

81. Блинова В.Г., Харчевникова Н.В. Прогноз токсичности замещенных бензолов с помощью ДСМ-метода автоматического порождения гипотез и квантовохимических расчетов // Хим.-фарм. журн. — 2000. — Т. 34. — № 4. — С. 44-50. 1

82. Кнунянц И. Л. (ред.) и др. Химическая энциклопедия. — М.: Советская энциклопедия (Большая Российская энциклопедйш, 1983-1998. аа—т. 1-5.166• -i-v'

83. Прохоров A.M. (ред.) Большой энциклопедический словарь. — М.: Большая Российская энциклопедия, 1998.— 1456 с. г

84. Справочник химика. — Л.: ХиШя, 1968, — Т. доп. — С. 39-116.

85. Химический энциклопедический словарь / Гл. ред. И. Л. Кнунянц. — М.: Советская энциклопедия, 1983. — 792 с.

86. Математический энциклопедический словарь / Гл. ред. Ю. В. Прохоров. —М.: Большая российская энциклопедия, 1995. — 847 с.

87. Aldrich Catalog/Handbook of Fine Chemicals. — Aldrich Chemical Company, Milwaukee USA, 1998.

88. Мельников H.H. и др. Химические средства зашиты растений. — М.: Химия, 1980. —288 с.

89. Венкатараман К. (ред.) Химия синтетических красителей. — Л.: Химия, Ленинград, 1974-1977. — Т. 3-6.

90. Левина Э.Н. (ред.) Вредные вещества в промышленности. — Л.: Химия, 1985. —464 с.

91. ПО. Айвазян С.А., Енюков И,С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных: Справ, изд. — М.: Финансы и статистика, 1983. — 472 с.

92. Basak S.C., Gute B. D., Ghatak S. Prediction of complement-inhibitory activity of benzamidines using topological and geometric parameters // J. Chem. Inf. Comput. Sci. — 1999. — Vol. 39. — № 2. — P. 255-260.

93. Кумсков М.И., Смоленский E.A., Пономарева Л.А., Митюшев Д.Ф., Зефиров Н.С. Системы структурньк дескрипторов для решения задач структура— свойство органических соединений // Докл. РАН. — 1994. — Т. 336. — №1.-0.64-66.

94. Пасюков А.В,, Скворцова М.И., Палюлин В.А., Зефиров Н-С. Оптимальный подбор меры молекулярного подобия в исследованиях QSAR // Докл. РАН. — 2000. — Т. 374.— № 6. — С. 786-789.

95. Basak S.C., Grunwald G.D., Gute B.D., Balasubramanian К., Opitz D. Use of statistical and neural net approaches in predicting toxicity of chemicals // J. Chem. Inf Comput. Sci. — 2000. — Vol. 40. — № 4. — P. 885-890.

96. Нигматуллин P.C., Осипов A^., Пузаткин А.П., Коптюг В.А. Статистический метод предсказания биологической активности многоатомных молекул на основе дескрипторов графов структурных формул // Хим.-фарм. журн. — 1985. —Т. 16. —№ 2. — С. 179-185.

97. Горелик А.Л.А Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания: Некоторые аспекты. — М.: Радио и связь, 1985. — 160 с.

98. Лбов Т.е. Методы обработки разнотипных экспериментальных данных.

99. Новосибирск: Наука, 1981. — 160 с. а

100. Дуда Р., Харт П. Распознавание образов и анализ сцен. — М.: Мир, 1976.511с.

101. Вапник В.Н., Червоненкис Я.А. Теория распознавания образов. — М.: Наука, 1974. —415 с. •'

102. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979. —447 с.

103. Бикел П., Доксам К. Математическая статистика. — М.: Финансы и статистика, 1983. — Вып. 1 — 280 с; Вып. 2 — 254 с.

104. Классификация и кластер / Под ред. Дж. Вэн Райзина. — М.: Мир, 1980.390 с.

105. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. a м.: Статистика, 1974. — 240 с.

106. Малиновский Л.Г. Классификация объектов средствами дискриминант-ного анализа. — М,: Наука, 1979. — 260 с.

107. Сборник научных программ на фортране. Руководство для программиста.

108. М.: Статистика, 1974. — Вып. 1. Статистика. — 316 с; Вып. 2. Матричная алгебра и линейная аЛгебра. — 224 с.

109. Вержбицкий В.М. Численные методы (линейная алгебра и нелинейные уравнения): Учеб. пособие для вузов. — М.: Высш. шк., 2000. — 266 с.

110. Дюк В. А. Компьютерная психодиагностика. — СПб:. Братство, 1994. — 363 с.

111. Дюк В. Обработка данных на ПК в примерах. — СПб: Питер, 1997. — 240 с.

112. Майника Э. Алгоритмы оптимизации на сетях и графах. — М.: Мир, 1981. —323 с.

113. Васильев В.И. Распознающие системы. Справочник. — Киев: Наукова думка, 1983. —422 с. '

114. Орлов В.В., Васильев П.М., Дербишер В.Е. Фрагментарный анализ структуры канцерогенных соединений // Химия и технология элементоорганиче-ских мономеров и полимерньк материалов: Сб. научн. тр. / ВолгГТУ. — Волгоград, 2001. — С. 74-80.

115. Дербишер В.Е., Гермашев И.В., Бодрова Г.Г. Количественная оценка эффективности термо- и фотостабилизирующих добавок в полимерных композитах на основе представлений о нечетких множествах // Высокомолек. соед. А. — 1997. — Т. 39. — № 6. — С. 960-964.

116. Промышленные фтор органические продукты: Справочн. изд. / Б.Н. Максимов, В.Г. Барабанов, И.Л. Серушкин и др. — Л.: Химия, 1990. — С. 356.

117. Сырье и полупродукты для лакокрасочных материалов: Справочн. пособие / Под ред. М.М, Гольдберга, — М,: Химия, 1978. — С. 69.

118. Савинская В,А,, Силе Д,Э,, Корчагова Э.Х., Каткевич М.Ю., Липсберс И,У,, Лукевиц Э. // Ж. орг. химии. — 1998. — Т. 34. — Вып. 12. — С. 1822.

119. Рейнгольд Э., Нивергельт Ю., Део Н. Комбинаторные алгоритмы. Теория и практика. — М.: Мир, 1980. — 476 с.

120. Тюрин Ю.Н., Макаров A.A. Анализ данных на компьютере. — М.: Финансы и статистика, 1995. — 384 с.

121. Кадыров Ч.Ш., Тюрина Л.А., Симонов В.Д., Семенов В.А. Машинный поиск химических препаратов с заданными свойствами. — Ташкент: Фан, 1989.—164 с.