автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Информационная система по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН

кандидата технических наук
Решетникова, Вера Владимировна
город
Москва
год
2007
специальность ВАК РФ
05.25.05
Диссертация по документальной информации на тему «Информационная система по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН»

Автореферат диссертации по теме "Информационная система по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН"

На правах рукописи

РЕШЕТНИКОВА

Вера Владимировна

ИНФОРМАЦИОННАЯ СИСТЕМА ПО ПРОТИВООПУХОЛЕВЫМ ПРЕПАРАТАМ ГУ РОНЦ им. Н.Н. БЛОХИНА РАМН

Специальность - 05 25 05 Информационные системы и процессы, правовые основы информатики

АВТОРЕФЕРАТ диссертации на соискание учёной степени кавдидата технических наук

Москва - 2007

003175192

Работа выполнена

в Государственном Учреждении Российского онкологического научного центра им. H.H. Блохина Российской Академии Медицинских Наук

Научный руководитель

кандидат биологических наук Апрышко Галина Николаевна

Официальные оппоненты:

доктор технических наук,

профессор Финн Виктор Константинович

доктор химических наук Балакин Константин Валерьевич

Ведущая организация

Государственная публичная научно-техническая библиотека

007 г в 10 часов на заседании диссертационного 6 01 во Всероссийском институте научной и технической.

Защита состоится совета Д 002 026 информации по адресу 125190, Москва, ул Усиевича, д 20

С диссертацией можно ознакомиться в библиотеке Всероссийского института научной и технической информации

Автореферат разослан «3 у>!2И/Л

07 г

Ученый секретарь диссертационного совета

доктор биологических наук, профессор

М.А. Каменская

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Несмотря на значительные успехи современной химиотерапии злокачественных опухолей, клиническая эффективность имеющихся в арсенале врачей противоопухолевых лекарств недостаточна, а спектр онкологических заболеваний, чувствительных к химиотерапии, ограничен Поиск новых веществ с противоопухолевыми свойствами для последующей разработки на их основе более эффективных лекарств является важной задачей химиотерапии

Первые исследования по поиску противоопухолевых веществ и разработке на их основе лекарств были начаты в 1952 г в Институте экспериментальной и клинической онкологии АМН СССР под руководством академика Л Ф Ларионова, пионера и основоположника отечественной химиотерапии Поиск проводился среди алкилирующих агентов, в частности производных хлорэтиламинов [1] Затем исследования расширялись, поиск новых потенциальных противоопухолевых лекарств проводился среди веществ разных химических классов с использованием адекватных методик [2, 3]

Поиск новых противоопухолевых лекарств сопровождается систематическим накоплением информации, получаемой в результате экспериментальных исследований потенциальных противоопухолевых средств На всех этапах разработки новых лекарств от конструирования новой химической структуры до клинических испытаний, в настоящее время широко внедряются информационные технологии, повышающие эффективность исследований

В связи с этим актуально создание Информационной Системы (ИС) по потенциальным противоопухолевым препаратам, изученным в ГУ РОНЦ им H H Блохина РАМН, в том числе eè основной части - фактографической базы данных (БД) БД имеет значение как инструмент, позволяющий систёматизировать информацию по химической структуре и свойствам изученных веществ и полноценно использовать ее в различных аналитических исследованиях

Целью настоящей работы является разработка корпоративной БД формата ISIS/Base, содержащей данные по регистрационным и номенклатурным характеристикам, химической структуре и физико-химическим свойствам синтетических веществ и природных экстрактов, как части ИС по препаратам, изучавшихся в ГУ РОНЦ им H H Блохина РАМН в качестве потенциальных противоопухолевых агентов Для достижения этой цели были поставлены следующие задачи.

Задачи исследования:

1 Систематизация и анализ документации по разработке потенциальных противоопухолевых лекарств с целью выделения объекта информации, его признаков и составления логической схемы БД по противоопухолевым веществам

2 Разработка структуры регистрационно-номенклатурного и химического модулей БД формата ISIS/Base

3 Разработка комплекса дескрипторых словарей и инструкций для заполнения полей регистрационно-номенклатурного и химического модулей БД формата ISIS/Base

4 Ввод данных по регистрационным и номенклатурным характеристикам, химическому строению и физико-химическим свойствам синтетических веществ и природных экстрактов в БД формата ISIS/Base и ее редактирование с использованием разработанных дескрипторых словарей и инструкций

5 Разработка системы поиска в БД для выполнения информационных запросов специалистов - разработчиков лекарств и аналитических

исследований в предметной области «Экспериментальная химиотерапия опухолей»

6 Оценка возможности на основе фактографической БД ИС по противоопухолевым препаратам для формирования обучающих массивов для компьютерных систем прогноза BD3IGON, PASS и ДСМ-метода

Научная новизна работы.

В результате выполненной работы создана первая отечественная корпоративная фактографическая БД формата ISIS/Base, представляющая собой систематизированный формализованный обзор многолетних исследований в ГУ РОНЦ им H H Блохина РАМН по поиску противоопухолевых веществ разных химических классов и являющаяся важной составной частью ИС по противоопухолевым препаратам ГУ РОНЦ им H H Блохина РАМН

Для созданной корпоративной БД формата ISIS/Base разработан комплекс дескрипторых словарей и инструкций по заполнению полей БД

Разработана методика подготовки выборок веществ разных химических классов для обзорно-аналитических исследований в предметной области «Экспериментальная химиотерапия опухолей», в том числе методика подготовки обучающих выборок для прогнозирования противоопухолевой активности m vivo и цитотоксической активности in vitro веществ разных химических классов с помощью компьютерных систем

Научно-практическое значение

Созданная корпоративная фактографическая БД формата ISIS/Base по противоопухолевым веществам используется в информационном сопровождении процесса создания новых противоопухолевых лекарств, в том числе для подготовки информационных справок по запросам специалистов разного профиля, работающих в области поиска и разработки новых противоопухолевых лекарств, а также для формирования обучающих массивов на этапе доэкспериментального скрининга (in silico) в программе отбора потенциальных противоопухолевых агентов

При непосредственном личном участии диссертанта разработана структура, комплекс дескрипторых словарей и инструкций для заполнения полей регисграционно-номенклатурного и химического модулей корпоративной БД Разработанный комплекс дескрипторых словарей и инструкций использован диссертантом для самостоятельной предмашинной подготовки (формализации) данных по химической структуре, номенклатурным характеристикам, физико-химическим свойствам более 11000 синтетических веществ и природных экстрактов, их ввода и редактирования БД Разработана методика поиска в БД по запросам специалистов в предметной области «Экспериментальная химиотерапия опухолей»

Апробация работы. Основные положения работы докладывались и обсуждались на научном семинаре Отдела теоретических основ информатики ВИНИТИ РАН, научных конференциях Отдела экспериментальной химиотерапии НИИ ЭДиТО ГУ РОНЦ им Н.Н Блохина РАМН, II Международной конференции «Химия, технология и применение фторсодержащих соединений в промышленности» (С-Петербург, 1994), Международном конгрессе по противоопухолевой терапии (Париж, 1997), б-ой Международной конференции «Распознавание образов и анализ изображений новые информационные технологии» РОАИ-6 (Великий Новгород, 2002), Всероссийской научно-практической конференции «Отечественные противоопухолевые препараты» (Москва, 2004), ХШ Российском национальном конгрессе «Человек и лекарство» (Москва, 2006)

Информация о БД по противоопухолевым веществам ГУ РОНЦ им Н Н Блохина РАМН включена в каталог «Медицинские информационные технологии», вып 6

По материалам диссертации опубликовано 19 работ, включая 3 статьи и 16 тезисов докладов

Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, списка литературы, содержащего 123 источника, 4 приложений Работа изложена на 136 страницах машинописного текста, иллюстрированного 13 рисунками и 14 таблицами

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, определены цель и задачи работы, сформулированы полученные в ходе работы результаты, оценена новизна исследования и его практическая значимость

Глава 1. Обзор литературы диссертационной работы представлен на 45 листах машинописного текста В обзоре литературы описаны актуальность задачи поиска новых биологически активных веществ, в том числе с противоопухолевой активностью, краткая история развития БД вообще и по биологически активным веществам в частности Приведены примеры существующих отечественных и зарубежных БД в области химии, биологии [13-17], их классификация, рассмотрены общие подходы и методы поиска в БД по структурно-химической информации и свойствам веществ Описаны отечественные компьютерные системы прогноза активности веществ по их структуре, отличительной особенностью которых является использование структурно-химической информации в электронном виде (система BIBIGON [18, 19], система PASS [8, 20], логико-комбинаторный ДСМ-метод [21-24]) При подготовке литературного обзора использовано 82 первоисточника

Глава 2. Материалы и методы. В качестве материалов использованы данные, характеризующие химическое строение, состав, номенклатурные характеристики и физико-химические свойства веществ и природных экстрактов, изучавшихся в Российском Онкологическом научном центре с 1952 г по настоящее время

В качестве источников данных использованы

1) Архив первичных документов НИИ ЭДиТО ГУ РОЩ им НН Блохина РАМН, основными из которых являются:

• паспорта на вещества, поступающие на первичное испытание циготоксической активности m vitro и противоопухолевой активности in vivo в подразделения Онкологического центра,

• журналы регистрации веществ и экстрактов, поступающих на биологические испытания в экспериментальные подразделения Онкологического центра,

• лабораторные журналы и протоколы биологических экспериментов,

• отчеты о результатах изучения биологической активности веществ,

• досье на вещества, проходившие углубленное изучение биологической активности,

• досье, передававшиеся в ФК МЗ для получения разрешения на клинические испытания новых противоопухолевых лекарств,

• протоколы заседаний Совета экспертов НИИ ЭДиТО по разработке новых противоопухолевых лекарств,

• сборники «Химиотерапия опухолей в СССР»,

• сборники трудов институтов СССР и стран СНГ, посвященные вопросам синтеза и изучения потенциальных противоопухолевых веществ,

• отечественные и зарубежные публикации по экспериментальной химиотерапии опухолей, реферируемых в Реферативном журнале ВИНИТИ «Онкология»,

2) Систематизированная картотека, содержащая формализованные данные по строению и свойствам веществ Она пополняется регистрационными картами (паспортами) на вновь поступающие на исследования объекты, новыми формализованными данными по активности уже зарегистрированных веществ и экстрактов Картотека сохраняет свое значение как самостоятельная информационно-поисковая система на бумажных носителях

Реализована корпоративная БД на персональных компьютерах системы IBM В качестве технических средств использовались принтеры, копировальные аппараты, устройства записи информации на компакт-диски и Zip-диски

Для ввода, хранения, обновления и поиска данных использовалась лицензионная СУБД ISIS/Base фирмы MDL Information Systems, Inc со встроенным структурным редактором ISIS/Draw и модулем AutoNom 2000 ADD-in для генерации химических названий по структурной формуле

Структура БД по противоопухолевым агентам, комплекс дескрипторых словарей и инструкций разработаны на основе классических подходов информатики [9, 10] и опыта создания фактографических БД, содержащих данные по химической структуре веществ, прежде всего БД Национального института рака США [11, 12] и других БД по биологически активным веществам [13-15]

В исследованиях связи «структура - активность» применяли компьютерные системы прогноза биологической активности по структуре веществ BIBIGON, PASS, ДСМ - метод и корпоративную БД по противоопухолевым агентам ГУ РОНЦ им НН Блохина РАМН, которая содержит структурные формулы и достоверные количественные данные по цитотоксичности in vitro и воздействию на экспериментальные опухоли животных in vivo, полученные в одинаковых экспериментальных условиях

Глава 3 Разработка структуры БД, описывающей строение и физико-химические свойства противоопухолевых веществ.

Разработка структуры БД по противоопухолевым веществам состояла из нескольких этапов и была начата с выделения объекта информации, определения его признаков и составления логической схемы БД При анализе большого объема документов, в качестве объекта информации выбран потенциальный противоопухолевый агент В данной работе под термином «агент» понимается вещество, поступившее на изучение биологической активности в подразделения ГУ РОНЦ им НН Блохина РАМН, независимо от стадии изучения Это могут быть индивидуальные вещества с идентифицированной химической структурой и экстракты из природного сырья или их фракции в виде нативных субстанций или лекарственных форм Определены признаки противоопухолевого агента и возможные значения этих признаков, подлежащие учету в регистрационно-номенклатурном и химическом модулях БД Всего выделено 45 признаков Основным признаком химического вещества, определяющим его свойства и биологическую активность, является химическая структура.

Используя результаты анализа первичной документации, а также учитывая опыт создания зарубежных БД например БД DIS NCI США [11, 12], средствами СУБД ISIS/Base разработана двухуровневая иерархическая структура БД по противоопухолевым веществам, которая состоит из 3 основных модулей: регисграционно-номенклатурный модуль, химический модуль, модуль по биологической активности БД содержит 93 поля, из них регисграционно-номенклатурный и химический модули имеют 52 поля Структура БД, тип и содержание полей регистрационно-номенклатурного и химического модулей приведены в табл 1

Таблица 1

Название, тип и содержание полей регистрационно-номенклатурного _ и химического модулей БД_

№ п/п Имя поля Тип поля Содержание поля

1 2 3 4

1 Ш Целое число Автоматически присваиваемый СУБД ISIS/Base порядковый номер записи

2 Шсошр Текст фиксированной длины Идентификационный номер вещества, присвоенный ему при первичной регистрации в РОНЦ

3 shifr_chem Текст переменной длины Авторские шифры и коды вещества

4 CodejS Текст переменной длины Шифр, присвоенный веществу в лаборатории экспериментальной химиотерапии

5 Code_U Текст переменной длины Шифр, присвоенный веществу в группе прескрининга m vivo

б Gosreg_number Текст переменной длины Номер, присвоенный веществу в системе Государственной регистрации новых соединений

7 organization Текст переменной длины Название организации, из которой поступило вещество на изучение в РОНЦ

8 authors Текст переменной длины Фамилия и инициалы авторов, получивших вещество

9 obtaining_ technique Текст переменной длины Способ получения вещества

10 confidence Текст переменной длины Конфиденциальность

И structure Структурное поле Структурная формула вещества

12 *fmla_ structure Брутго-формула Брутго-формула вещества

13 *mol weight_ sructure Реальное число Молекулярный вес вещества

14 saltdata Текст переменной длины Состав сольватной (гидратной) части молекулы

15 IUPAC_ autonom Текст переменной длины Название химической формулы вещества на английском языке по системе ИЮПАК, автоматически генерируемое встроенным модулем AutoNom СУБД ISIS/Base

16 names_ chem_rus Текст переменной длины Химические названия вещества на русском языке

17 names_ chem_engl Текст переменной длины Химические названия вещества на английском языке

18 other_ names_rus Текст переменной длины Синонимы, авторские названия, тривиальные названия, торговые марки вещества на русском языке

1 2 3 4

19 other_ names_engl Текст переменной длины Синонимы, авторские названия, тривиальные названия, торговые марки вещества на английском языке

20 composxtion_ empir Текст переменной длины Процентное содержание химических элементов в молекуле вещества, эмпирически полученное методами физико-химического анализа

21 composrtion_ comp Текст переменной длины Процентное содержание химических элементов в молекуле вещества, автоматически вычисленное средствами СУБД ISIS/Base

22 CHEM CLASS Parent Данные о химическом классе вещества

23* chem_class_ type Текст переменной длины Химический класс

24 stereo_ isomer Текст переменной длины Стереоизомер

25 optic_isomer Текст переменной длины Оптический изомер

26 physchemdata Текст переменной длины Указание на наличие данных физико-химических анализов вещества

27 aggregative_ state Текст переменной длины Агрегатное состояние вещества

28 outward_ appearance Текст переменной длины Внешний вид вещества

29 density Текст переменной длины Плотность вещества

30 meltmg_ point Текст переменной длины Температура плавления вещества

31 boilmg_ point Текст переменной длины Температура кипения вещества

32 hygroscopic_ properties Текст переменной длины Гигроскопичность вещества

33 stability Текст переменной длины Стабильность вещества при хранении во внешней среде

34 keepmg_ conditions Текст переменной длины Условия хранения вещества

35 SOLUBILITY Parent Данные по растворимости вещества

36* solvent Текст переменной длины Растворитель

37" level_of_ solubility Текст переменной длины Степень растворимости вещества

38 biotype Текст переменной длины Биологический тип организма -источника выделения вещества природного происхождения

39 family_rus Текст переменной длины Название биологического семейства организма - источника выделения вещества природного происхождения на русском языке

1 2 3 4

40 family_lat Текст переменной длины Название биологического семейства организма - источника выделения вещества природного происхождения на латинском языке

41 kind_rus Текст переменной длины Название биологического вида организма - источника выделения вещества природного происхождения на русском языке

42 kind_lat Текст переменной длины Название биологического вида организма - источника выделения вещества природного происхождения на латинском языке

43 kmd_engl Текст переменной длины Название биологического вида организма - источника выделения вещества природного происхождения на английском языке

44 harvesting_ place Текст переменной длины Место сбора природного сырья

45 harvesting_ time Текст переменной длины Шифр и/или время заготовки природного сырья

46 raw_materials_ supplier Текст переменной длины Поставщик природного сырья

47 organism fragment Текст переменной длины Фрагменты) организма, части растения, использованные при выделении вещества

48 drug- properties Текст переменной длины Характеристика природного вещества

49 additional_ comments_chem Текст переменной длины Дополнительная информация о регистрационных и номенклатурных характеристиках и физико-химических свойствах вещества

50 references_ chem Текст переменной длины Ссылки на публикации

51 NSC Текст переменной длины Регистрационный номер, присвоенный веществу в Национальном институте рака США

52 CAS Текст переменной длины Регистрационный номер БД Chemical Abstract

* - поля №№ 23, 36, 37 имеют 2-ой уровень, все остальные поля имеют 1-й уровень в иерархической структуре БД

Регистрационно-номенклатурный и химический модули БД состоят из 49 содержательных полей и одного служебного поля, в которое при вводе в БД новой записи автоматически помещается ее порядковый номер В 43 полях содержатся данные, которые извлекают из паспортов или других первичных документов, в 4 полях данные, автоматически генерируются СУБД ISIS/Base после ввода структурной формулы вещества, в 2 поля вносятся данные, найденные на специализированных сайтах в Интернете [16,17,36,37]

При первичной регистрации нового вещества в ИС и, соответственно, в БД ему присваивается идентификационный номер (Шсотр), представляющий собой семизначное число Шсотр, в отличие от других номеров и шифров, является «сквозным» идентификационным номером на всех этапах изучения потенциального противоопухолевого вещества и позволяет однозначно идентифицировать его

Поля 3-6, 51, 52 содержат различные шифры и коды, а именно шифры, присвоенные веществу авторами при его синтезе или выделении из природного сырья, номер, присвоенный ему в системе Государственной регистрации новых химических соединений СССР, шифры, присвоенные веществу в подразделениях, проводивших его биологическое изучение Вводятся также номера NSC (номер Национального института рака США) и CAS, если таковые имеются Номер NSC имеют вещества, которыми РОНЦ им H H Блохина РАМН и Национальный Институт рака США обменивались в рамках научного сотрудничества Поля 38-48 заполняются только для веществ природного происхождения и содержат таксономические данные, характеризующие систематическое положение живого организма, из которого это вещество получено Поля 44-48 содержат информацию об особенностях сырья, способе выделения природного препарата и его характеристику (конкретно указывается, что изучалось в эксперименте, а именно какая фракция, тип экстракта и т д )

Для веществ, как синтетического, так и природного происхождения, имеющих точно определенную химическую структуру, важнейшим является поле «structure», содержащее химическую формулу вещества

В дальнейшем при развитии предметной области «Экспериментальная химиотерапия опухолей» возможно появление у веществ новых признаков и соответственно изменение структуры БД Корпоративная БД по противоопухолевым веществам имеет гибкую структуру В данной работе представлена версия 2006 г

Глава 4. Разработка комплекса дескрипторых словарей и инструкций для заполнения полей регистрационно-номенклатурного и химического модулей БД по структуре и свойствам противоопухолевых веществ.

Важной частью БД по противоопухолевым веществам является комплекс дескрипторых словарей и инструкций по заполнению полей Она фактически была начата при разработке структуры БД на этапе определения значений признаков объекта информации и продолжается при эксплуатации БД

Назначение комплекса дескрипторых словарей и инструкций - обеспечение максимальной полноты и точности информационного поиска в БД В него включены различные лингвистические средства, дополняющие друг друга Для поиска фактографической информации, то есть данных по свойствам веществ и их биологической активности, используется вербальный информационно-поисковый язык ключевых слов Для большинства текстовых полей БД составлены словари типа вербально-дескрипторных, или списки дескрипторов Дескрипторы отобраны на основе анализа предметной области «Экспериментальная химиотерапия опухолей», отражают основные понятия и термины предметной области, несут наибольшую смысловую нагрузку в документе - источнике данных

Для формализации данных, их ввода, редактирования и поиска в регистрационно-номенклатурном и химическом модулях БД, составлено 14 дескрипторных словарей, которые состоят из списков нормализованных терминов Словари в процессе ведения БД изменяются, исключаются устаревшие термины, добавляются новые Мультидисциплинарный характер предметной области обусловил необходимость использования при составлении дескрипторных словарей химического блока разноплановой специальной и справочной литературы [25-32] и ресурсы Интернет [16-17] Составленные словари, используемые при заполнении БД подразделяются на два типа - фиксированные и свободные Словари первого типа состоят из фиксированного количества терминов, при этом СУБД ISIS/Base не позволяет при вводе данных использовать термины, отличные от содержащихся в словаре В случае появления в предметной области «Экспериментальная химиотерапия опухолей» новых значений конкретного признака вещества, возможно добавление в фиксированный словарь новых

терминов, используя операцию изменения структуры БД средствами СУБД ISIS/Base Для полей, имеющих словари свободного типа, возможно изменение термина или добавление нового термина без изменения структуры БД

Текстовые файлы списков дескрипторов используются для автоматического введения в структуру БД при ее редактировании или создании БД с новыми полями, объединены в папку «Vocabularies», которая также является составной частью разработанного комплекса [33]

В табл 2 представлены названия и типы словарей, имена полей, при заполнении которых они используются, а также имя текстового файла-словаря

Таблица 2

Словари регистрационио-номенклатурного и химического модулей БД

№ п/п Имя текстового файла-словаря Имя поля, заполняемое со словарем Название словаря Тип словаря

1 2 3 4 5

1 organization txt organization Организация Свободный

2 authors txt authors Авторы Свободный

3 obtaming_ technique txt obtainmg_ technique Способ получения Фиксированный

4 confidence txt confidence Конфиденциальность Фиксированный

5 saltdata txt saltdata Сольватная (гидратная) часть Свободный

6 chemclass txt chemclass type Химический класс Свободный

7 stereoisomer txt stereo isomer Стереоизомер Фиксированный

8 optic isomer txt optic isomer Оптический изомер Фиксированный

9 aggregative_ state txt aggregative_ state Агрегатное состояние Фиксированный

10 hygroscopic_ properties txt hygroscopic_ properties Гигроскопичность Свободный

И stability txt stability Устойчивость Свободный

12 solvent txt solvent Растворитель Свободный

13 level_of_ solubility txt level_of_ solubility Степень растворимости Фиксированный

14 biotype txt biotype Биологический тип Фиксированный

При первичной регистрации потенциального противоопухолевого вещества в БД при вводе и редактировании данных регистрационио-номенклатурного и химического модулей для веществ как синтетического, так и природного происхождения используется общий пользовательский интерфейс, или основная регистрационная экранная форма, представленная на рис 1

Регистрационная экранная форма содержит ячейки, соответствующие полям регистрационио-номенклатурного и химического модулей БД Ячейки сгруппированы в соответствии с типами данных, представленными в них, что создает определенные удобства при вводе Для ввода данных в поля второго уровня, соответствующие признакам, которые для одного объекта могут иметь несколько значений, используются таблицы («химический класс» для поля «сЬет_с1а88_1уре», «растворитель» для поля «8о1уепЬ>и «степень растворимости» для поля «1еуе1_о£_8о1иЫ1Пу»)

В ряде случаев, например, при работе с данными только для веществ природного происхождения, не имеющих химических формул, или наоборот, только для синтетических веществ с точно идентифицированной химической формулой,

используются специализированные экранные формы для природных экстрактов и синтетических веществ.

Экранная форма (интерфейс пользователя)

Ft ü* C&ái? !!Я*Я» S«K¡! JS4 Wïi<,! Ш

аиЗ________J

ЩЩЩ щщ

wwwi

ШШШЩ

ШЗСЁН it>c¿>*if

Ce«,3Ci2N-¿Os;

__________ит*им vf

Oim.) T лягм

___fHMMgi

» -ííCKíaríps: Maftf.sCf?.

ИИфР «tfpH И tf it i

фрлгмхт аргдяш

доломит. с».«л«ш

* СССР. »ЫМ^НО.еЛй. tMHÎ-50. uwi.iö. »WK.20. sun .22.24. Ш.

Пягтымя Г.Н.

^^Wjíf^ 0 Ш & " i ■•. j^wff Ww. jjSrSjS/üa^Ti.AUGUSTir , ' - ' '

Рис. 1. Экранная форма для заполнения полей регистрационно-номенклатурного и химического модулей БД.

В специализированных формах отражены только те поля БД, которые могут содержать данные для веществ только одного из этих типов. Меньшее количество учитываемых в них полей, по сравнению с основной экранной формой, позволяет делать в ней ячейки для ввода данных и соответственно шрифты более крупными, в связи с чем специализированные формы более удобны для работы.

В практику работы со специалистами лабораторий химического профиля РОНЦ и ряда других учреждений, сотрудничающих с РОНЦ по созданию новых противоопухолевых лекарств на основе синтетических веществ и природных экстрактов, введены разработанные в группе Банка данных электронные паспорта.

Электронный паспорт - это незаполненная БД формата ISIS/Base вместе с интерфейсами и дескрипторными словарями, содержащая поля регистрационно-номенклатурного и химического модулей.

Химикам-синтетикам, имеющим возможность пользоваться СУБД ISIS/Base, предоставляется незаполненная БД формата ISIS/Base, структура которой полностью соответствует структуре модуля по номенклатурно-химическим данным, вместе с регистрационной экранной формой для ввода данных, дескрипторными словарями и правилами ввода.

т

Сохранять файлы электронных паспортов формата ISIS/Base можно только в папки, названные на английском языке, в противном случае программа не сможет обнаружить и открыть файл электронного паспорта Затем данные, представленные в электронном виде, импортируются в формате «.rdf» в корпоративную БД, что существенно сокращает время решстрации и редактирования веществ Авторам синтеза или выделения природных экстрактов, не имеющим возможности подготовить паспорт в электронном виде с помощью СУБД ISIS/Base, предоставляется бумажная форма паспорта Бумажная форма паспорта отображает пользовательский интерфейс, используемый для ввода данных в БД, или электронный паспорт, имеющий формат таблицы Word, и заполняется в двух экземплярах

Инструкции по заполнению полей регистрационно-номеиклатурного и химического модулей БД.

Разработанные инструкции, содержащие общие и специальные правила, используемые при вводе и редактировании данных, включают в себя все особенности содержания полей БД и должны неукоснительно выполняться при работе с БД

Общие правила. Все поля БД заполняются без пробела перед первым знаком С прописной буквы вводятся названия организаций, фамилии и инициалы авторов веществ и исполнителей биологических испытаний, коды и шифры, торговые марки, специальные аббревиатуры на вещество, если они начинаются с таковой, а также географические названия, где было собрано сырье, из которого был выделен природный агент Вся остальная текстовая информация вводится со строчной буквы

Особое внимание обращается на использование клавиш соответствующего регистра при вводе данных и составлении запросов со словами, содержащими символы, имеющими одинаковое начертание в разных языках (буквы «С», «О» и т п )

Не рекомендуется изменять авторские номенклатурные данные при вводе в БД за исключением явных ошибок, особенно при написании химических формул

В специальных правилах объясняется, откуда извлекаются и по какому принципу образуются те или иные идентификаторы или формализуются данные, вводимые в каждое конкретное поле БД Существенное значение имеют рекомендации по поиску с помощью Интернет регистрационного номера NSC, присвоенного веществу при регистрации в Национальном Институте рака США, если таковая имела место, и регистрационного номера БД CAS

Использование словарей и разработанных правил при заполнении полей БД обеспечивает возможность получения адекватных результатов компьютерного поиска по различным характеристикам вещества, то есть максимальную полноту и точность поиска при различных запросах с использованием БД Инструкция по заполнению полей БД.

Поле «ГО» - автоматически присваиваемый СУБД ISIS/Base порядковый номер

записи

В поле «IDcomp» вводится номер вещества, присвоенный ему при первичной регистрации в ИС, состоит из 7 цифр Первые 4 цифры - год регистрации вещества, последние 3 цифры - порядковый номер его в соответствующем году Например 1952001 (1952 - год регистрации вещества, 001 - его порядковый номер в 1952 году) и т д IDcomp является «сквозным» регистрационным номером на всех дальнейших этапах изучения вещества и при поиске полученных результатов исследований После регистрации IDcomp не может быть изменен

В поле «shifr_chem» вводится авторский шифр вещества, не может быть изменен В поле «Code_S» вводится шифр, присвоенный веществу в лаборатории экспериментальной химиотерапии и используемый экспериментаторами при составлении протоколов испытаний и различных отчетов Данные берутся из регистрационных журналов лаборатории экспериментальной химиотерапии

В поле «Code_U» вводится шифр, присвоенный веществу в группе прескрининга m vivo и используемый экспериментаторами при составлении протоколов испытаний и различных отчетов Данные берутся из регистрационных журналов группы прескрининга В поле «Gosregjiumber» вводится номер, присвоенный веществу в системе Государственной регистрации новых соединений

В поле «organization» вводится название организации, из которой вещество поступило в ГУ РОНЦ им H H Блохина РАМН на биологические испытания При заполнении данного поля используется словарь свободного типа «Организация»

В поле «authors» вводятся фамилии и инициалы авторов, получивших вещество путем синтеза или выделения из природного сырья При заполнении поля используется словарь свободного типа «Авторы», учитываются все соавторы, участвовавшие в синтезе или выделении вещества

В поле «obtainmg_techmque» вводятся данные о способе получения вещества со словарем фиксированного типа «Способ получения»

В поле «confidence» вводятся данные о статусе конфиденциальности вещества строго в соответствии со словарем фиксированного типа «Конфиденциальность» Вещества регистрируются под грифом «открыто», при наличии публикаций в открытой печати или документа о возможности таких публикаций, подписанного членами Ученого Совета и директором НИИ ЭДиТО и заверенного печатью ГУ РОНЦ им H H Блохина РАМН Остальные вещества имеют гриф «конфиденциально», данные о них могут быть выданы из БнД по запросам только сотрудникам Онкологического центра или по согласованию с авторами вещества

В поле «structure» вводится структурная химическая формула вещества с помощью структурного редактора ISIS/Draw, либо путем импорта из файлов формата .mol или .sdf

Поле «*fmla_structure» - брутто-формула вещества, автоматически генерируется СУБД ISIS/Base на основании введенной структурной химической формулы

Поле «*mol weight_structure» - содержит значение молекулярной массы вещества, автоматически вычисленное СУБД ISIS/Base на основании введенной структурной химической формулы

В поле «saltdata» вводятся данные о составе сольвапной (гидратной) части молекулы вещества в соответствии со словарем свободного типа

Поле «IUPAC_autonom» - химическое название вещества на английском языке, автоматически генерируется встроенным в СУБД ISIS/Base программным модулем AutoNom в соответствии с правилами ИЮПАК

В поля «names_chem_rus» и «names_chem_engl» вводятся на русском и английском языке соответственно разные систематические названия вещества, составленные по разным номенклатурным системам, одно из них - обязательно по правилам ИЮПАК Каждое название вводится с нового абзаца без использования знаков препинания, разделяющих названия (запятые могут содержаться в самом названии)

В поля «other_names_rus» и «other_names_engl» вводятся на русском и английском языке соответственно все синонимы названий (тривиальные, полутривиальные названия, торговые марки, общепринятые аббревиатуры, сокращения и тп) Каждое название вводится с нового абзаца без использования знаков препинания, разделяющих названия (запятые могут содержаться в самом названии)

В поле «composition_empir» вводятся данные о процентном содержании химических элементов в молекуле вещества, эмпирически полученные методами физико-химического анализа

Поле «composition_comp» - значение элементного состава вещества рассчитанного из введенной структурной формулы средствами СУБД ISIS/Base Рассчитанные данные переносятся из таблицы S AR формата Excel

В поле «chem_class_type», дочернее поле от поля 1-го уровня «Chem_class», вводится столько различных записей, к скольким химическим классам можно отнести данное вещество Используется словарь свободного типа «Химический класс»

В поле «stereoisomer» вводятся данные о типе сгереоизомерии вещества в соответствии со словарем фиксированного типа «Стереоизомер»

В поле «optic_isomer» вводятся данные о типе оптической изомерии вещества в соответствии со словарем фиксированного типа «Оптический изомер» В поле «density» вводятся данные о плотности вещества

В поле «aggregative_state» вводятся данные об агрегатном состоянии вещества в соответствии со словарем фиксированного типа «Агрегатное состояние»

В поле «outwardappearance» вводятся данные о внешнем виде в произвольной форме без использования словаря

В поле «meltmg_point» вводится значение температуры плавления вещества В поле «boihng_pomt» вводится значение температуры кипения вещества В поле «phys_chem_data» вводятся результаты физико-химического анализа вещества с использованием общепринятых сокращений (ЙК, УФ, ЯМР)

В поле «hygroscopicjjroperties» вводятся данные о гигроскопичности препарата в соответствии со словарем свободного типа «Гигроскопичность»

В поле «stability» вводятся данные о стабильности препарата во внешней среде в соответствии со словарем свободного типа «Стабильность»

В поле «keepmg_conditions» вводятся данные об условиях хранения вещества в произвольной текстовой форме без словаря

При заполнении поля «solvent», дочернее поле от поля 1-го порядка «SOLUBILITY»,, с использованием словаря свободного типа «Растворитель» вводится такое количество записей, сколько растворителей указано в паспорте, в которых растворяется вещество

В поле <<level_of_solubihty» вводятся значения уровня растворимости вещества в каждом из растворителей в соответствии со словарем свободного типа «Степень растворимости»

* В поле «biotype» вводятся данные о биологическом типе организма -источника выделения вещества в соответствии со словарем фиксированного типа «Биологический тип»

* В поле «family_rus» вводится название семейства организма - источника выделения вещества на русском языке

* В поле «family_lat» вводится название семейства организма - источника выделения вещества на латинском языке

* В поле <<kmd_ras» вводится название биологического вида организма - источника выделения вещества на русском языке

* В поле «kind_lat» вводится название биологического вида организма - источника выделения вещества на латинском языке

* В поле «kmdengl» вводится название биологического вида организма -источника выделения вещества на английском языке

* В поле «harvestmgjplace» в произвольной форме вводятся сведения о месте сбора сырья, использованного для выделения вещества

*Поле «harvestmg_time» - в произвольной форме вводятся сведения о времени сбора сырья, использованного для выделения вещества

*В поле «raw_materials_suppher» в произвольной форме вводятся сведения о поставщике сырья

* В поле «orgamsmjfragment» в произвольной форме вводятся сведения о частях растения или тканях животного и т д, использованных для выделения вещества

* В поле «drug_properties» - в произвольной форме вводятся данные о характеристике препарата природного происхождения (конкретно указывается, что изучалось в эксперименте фракция, экстракт, вид штамма и т п )

В поле «additional_comments_chem» в произвольной форме вводятся дополнительные сведения о регистрационных и номенклатурных характеристиках и физико-химических свойствах веществ, не вошедшие в соответствующие поля компьютерной БД

В поле «references_chem» в произвольной форме вводятся ссылки на публикации, из которых извлечены данные по номенклатурным характеристикам и физико-химическим свойствам веществ

В поле «NSC» вводится найденный с помощью ресурсов Интернет регистрационный номер, присвоенный веществу при регистрации в Национальном Институте рака США, если таковая имела место

В поле «CAS» вводится найденный с помощью ресурсов Интернет регистрационный номер БД CAS, если таковой имеется

Поля, помеченные *, заполняются только для веществ природного происхождения [33]

Все данные при заполнении БД берутся из авторских паспортов или из архива первичных документов Дополнительные сведения о веществе извлекаются из публикаций и из Internet

Глава S. Технология ведения БД по структуре, паспортным данным и физико-химическим свойствам противоопухолевых веществ.

В главе описывается технология заполнения полей БД с помощью средств СУБД ISIS/Base, разработанного комплекса дескрипторных словарей и инструкций, описаны трудности, которые возникали в ходе заполнения БД а также ее содержание Описана методика поиска информации по различным запросам специалистов в предметной области «Экспериментальная химиотерапия опухолей»

Сложившаяся технология ввода данных формировалась постепенно При обработке архива первичных документов всем потенциальным противоопухолевым веществам, поступившим на изучение в РОНЦ, присваивался Шсошр, который является единым регистрационным номером на всех дальнейших этапах изучения вещества и при поиске полученных результатов исследований, и не может быть изменен

Предмашинная формализация данных проводилась с использованием разработанного комплекса дескрипторных словарей и правил ввода в поля регистрационно-номенклатурного и химического модулей БД Тех сведений, которых недоставало для описания вещества, искали в литературных источниках, если это был известный препарат, в известных химических и биологических БД с использованием ресурсов Интернет, либо связывались с авторами синтеза и просили сообщить недостающие сведения о веществе Несмотря на это, некоторые поля БД остаются незаполненными, что создает трудности при аналитических работах с БД

Для веществ как синтетического, так и природного происхождения, имеющих точно определенную химическую формулу, важнейшим является поле «structure», содержащее химическую формулу вещества Средства СУБД ISIS/Base обеспечивают при добавлении в БД новой химической формулы проверку на наличие в БД «дублей» и аналогов

При вьивлении «дублей» принято решение оставлять под единым регистрационным номером вещества с одинаковой химической формулой в следующих случаях если вещество было синтезировано в разных организациях, разными авторами, при синтезе использовались разные методы выделения, а также разные серии субстанций препарата, поступившие на изучение Если вещество было синтезировано в одном и том же учреждении, но поступало на биологическое изучение в разное время, данные о результатах биологического изучения объединялись, веществу присваивался один

регистрационный номер, который был присвоен в более ранний период, но при этом указывались все шифры изучения биологической активности и время изучения

При регистрации препаратов природного происхождения столкнулись с ошибками в латинском написании природных объектов На некоторых паспортах были указаны только русские названия природных объектов, отсутствовали латинские названия, и наоборот Были найдены варианты переводов и внесены названия на русском, латинском и английском языках природных источников выделения вещества Для исправления латинских названий природных источников выделения вещества использовались современные справочники [34, 35], а также Интернет [36, 37]

К настоящему времени БД по противоопухолевым веществам формата ISIS/Base содержит структурные формулы, формализованные текстовые и числовые данные по свойствам и биологической активности более 11000 веществ, из которых 9389 веществ имеют структурные формулы Непосредственно в химических лабораториях РОНЦ были синтезированы или выделены из природного сырья 3140 веществ, Извлечены из статей научных публикаций данные о 3424 веществах 1669 были выделены из природного сырья, 84 имели полусинтетическую природу, 5575 были получены путем химического синтеза, 28 препаратов не классифицированы по способу получения из-за недостатка данных в паспортах [38]

Структурные формулы для 10500 веществ представлены в формате «.db» (обрабатываются с помощью СУБД ISIS/Base) 568 структурных формул представлены в нечетком виде Это структуры, где неизвестны радикалы и места присоединения заместителей (см рис 2), полимеры (см рис 3), производные Mo, V, W (см рис 4), а также структуры веществ природного происхождения, где авторы не указали порядок присоединения Сахаров и их изомерию (см рис 5)

Cl

Рис 2 Химическая структура, где R и R' неизвестны

Cl

Рис 3 Химическая структура полимера

H8[Si(Mo207)6], H8[Si(Mo207)5V206] Иго, H8[Si(W207)d NaV03 2Н20

Рис 4 Химические формулы производных металлов

Gluc-

Рис 5 Структура вещества природного происхождения, авторы не указали порядок присоединения Сахаров и их изомерию

При заполнении поля «structure» возникла проблема ввода (написания) ряда структурных формул, таких как полимеры, комплексные соединения металлов, четвертичные аммонийные соли и другие координационные соединения [39]

Известную трудность представляла необходимость добиться четкого соответствия структурной формулы комплексных соединений металлов, введенной с помощью графического редактора ISIS/Draw, с его брутго-формулой, генерируемой программой ISIS/Base Возьмем для примера одну из простейших структур, (en)PtCb, т е дихлор(этшендиамин-Ш,к№)платина(П) (см рис 6)

Рис 6 Структурная формула диьчор(эталендиамин-к^кК')ллатины(Н), введенная методом разделения зарядов с помощью графического редактора ISIS/Draw

Если изображать эту структуру с помощью разделения зарядов (положительно заряженный атом Pt2+, отрицательно заряженный СГ и нейтральный диамин), то получим брутго-формулу CjHgCbNiPt, в то время как истинная брутго-формула должна быть CzHgCbNjPt

Для решения этой проблемы первоначально использовали способ представления координационных связей химического редактора ISIS/Draw для изображения нитрогруппы 0=N+-0" Здесь атом азота, являющийся донором электронов, несет положительный заряд, а атом кислорода, являющийся акцептором электронов -отрицательный

Перенос этого способа на комплексы металлов, к сожалению, приводит к искусственному представлению о наличии отрицательного заряда на атоме металла, но зато позволяет генерировать истинную брутто-формулу и молекулярный вес данного соединениями рис 7)

14

Рис 7 Структурная формула дихлор(этилевдиамин-кЫ,кЫ')платины(П) с искусственным представлением о наличии отрицательного заряда на атоме металла

Авторами синтеза при написании химических формул некоторых соединений были допущены грубые ошибки Восстановить истинный смысл этих структур не представляется возможным Эти химические формулы были удалены из БД при этом делалась специальная пометка в поле «дополнительные сведения»

При написании структурных формул по химическому названию или при исправлении структурных формул в соответствии с химическим названием использовалась специализированная химическая литература [25, 26, 29, 30, 31, 32]

В систему поиска конкретного вещества в БД как по текстовым полям (по их полному содержанию и неполному), так и по полю «химическая структура» (по полной формуле или по ее фрагментам, по функциональным группам) входят

1) сформированный список структурных запросов, с помощью которых проводится подструктурный поиск, представляющий собой комплекс файлов формата .mol, который содержит структурные фрагменты, функциональные группы, индивидуальные структуры, обеспечивающие тот или иной механизм воздействия вещества на биологические мишени,

2) списки основных, часто используемых запросов, которые сохраняются при БД например, Root>shifr_chem like "%JIXC%", Root>chem_class>chem__class_type like "%платин%", Root>obtaining_technique like "%синт%", Root>obtainmg_techmque like "%природн%", Root>confidential like "%открыго%" и т д

Приведем пример поиска соединений, содержащих нитрозогруппу Сделав запрос по структурному фрагменту Root>structure sss nitrozo (-N=0), получили 456 соединений, а сделав запрос по химическому названию Root>names_chem_Rus like "%нитрозо%" - 116 соединений Разница очевидна Оказалось, что в первом случае, помимо нитрозогруппы (-NO), в результат запроса попали все соединения, содержащие нитрогруппу Ж>2 (0=N+-0") Таким образом, первый запрос по структурному фрагменту следует скорректировать Необходимо вызвать все нитрозопроизводные, исключив все нигропроизводные Root>structure sss nitrozo and not (Root>structure sss nitro) Получили 122 соединения При просмотре результатов нового поиска выяснили, что в эту группу соединений попали не только нитрозопроизводные, но и производные N- гидроокиси, пиридин-оксида Удалив данные соединения из списка, получили точную выборку нитрозопроизводных как по химическому названию, так и по структурному фрагменту

Результаты поиска соединений меди в разных полях БД приведены в табл 3

Таблица 3

Результаты поиска соединений меди в БД__

№ п/п Название поля, в котором проводился поиск Поисковый запрос Рез-ты поиска

1 г 3 4

1 Химическое название на русском языке Root>names_chem_Rus like "%медь%" 90

2 Химическое название на русском языке Root>names_chem_Rus like "%меди%" 2

3 Химическое название на русском языке Root>names_chemJRus like "%мед%" 93

4 Химическое название на русском языке Root>names_chem_Rus like "%купрат%" 3

5 Химическое название на русском языке Root>names_chem_Rus like "%купр%" 4

6 Тривиальное название на русском языке Root>other_names_Rus like "%медь%" 20

7 Тривиальное название на русском языке Root>other_names_Rus like "%меди%" 6

1 2 3 4

8 Тривиальное название на русском языке Root>other_names_Rus hke "%Me«%" 29

9 Тривиальное название на русском языке Root>other_names_Rus hke "%Kynp%" 8

10 Тривиальное название на русском языке Root>other_names_Rus like "%KynpaT%" 7

11 Химический класс Root>chem class>chem class type like "%MeflH%" 98

12 Брутто-формула Root>*fmla structure like "Cu" 96

13 Структура Root>structure sss Cu 96

Из табл 3 видно, что авторы называли вещества, содержащие медь, по-разному (производное меди, медьпроизводное, купрат и т д ) Наиболее полный результат поиска получен, когда в запросе фигурировал корень «мед», но в список при этом поиске вошло вещество под регистрационным номером 1989115, с химическим названием 2-[(1-метилтио-2-нитровинил)аминокарбонил]-димедон, не относящееся к производным меди Самый полный поиск происходит по запросу в поле «химический класс» Root>chem_class>chem_class_type like "%меди%", так как это поле заполняется с помощью словаря «меди соединения» и «меди комплексные соединения» Таким образом, ключевым словом для поиска производных меди в поле «химический класс» является слово «меди» Для проверки полноты данных провели поиск в поле «structure» по запросу Root>structure sss Cu с помощью подструктурного запроса «Си» и по запросу в поле «брутго-формула» Root>*fmla_structure hke "Cu" Результаты двух последних поисков совпали, но при этом общее количество найденных веществ оказалось на 2 меньше, чем при запросе в поле «химический класс» Сделав распечатку в табличном варианте, выявили, что в БД зарегистрировано два вещества, не имеющих структурной формулы Одно из них имеет тривиальное название «медь-50», а в поле «дополнительные сведения» имеется информация о том, что это вещество содержит 12% меди, что дало повод отнести его к химическому классу «меди соединения», другое соединение аналогичное, только имеет другой процент содержания меди

Проведение точного и правильного поиска по различным запросам является одним из сложных и трудоемких процессов в работе с БД При этом необходимо придерживаться четких правил в оформлении запроса, знать структуру БД содержание полей и словарей

Глава б. Использование БД ГУ РОНЦ им. H.H. Блохина РАМН по противоопухолевым агентам в исследованиях связи «структура-активность».

Корпоративная БД по противоопухолевым веществам формата ISIS/Base ГУ РОНЦ им H H Блохина РАМН является фактически формализованным обзором неопубликованных, предназначенных для внутреннего использования отчетных материалов и имеющих ограниченное распространение публикаций в области «Экспериментальная химиотерапия опухолей»

Разработанная методика поиска информации в БД используется для справочно-информационного обеспечения специалистов - разработчиков новых противоопухолевых лекарств При составлении запросов используется вербальный информационно-поисковый язык ключевых слов, те же правила и дескрипторные словари, что и при вводе данных В табл 4 приведен примерный перечень поступающих в группу БнД запросов, ответы на которые выполнялись при составлении отчетов, для планирования синтезов, для обзорно-аналитической работы в предметной области «Экспериментальная химиотерапия опухолей»

Таблица 4

Примеры запросов, которые поступают в ИС по противоопухолевым препаратам для получения различных информационных справок

№ п/п Запрос Ответ на запрос

1 2 3

1 Изучались ли вещества, выделенные из хлопчатника? RooOkiudjrus like "%хлопчатник%" 8 соединений поступило на изучение в РОНЦ РАМН, для них распечатаны химические формулы и показания растворимости

2 Изучались ли вещества, выделенные из растения ива белая? Root>kind_rus like "%ива белая%" Нет, изучались ива козья (бредина), ива пятитычин-ковая (чернотал), ива ушастая, ива трехтычинковая

3 Какие производные гидразинов (с формулами и химическими названиями) изучались в РОНЦ РАМН? Root>names_chem_rus like "%гидраз%" Изучено 208 соединений, были распечатаны формулы и химические названия

4 Сколько соединений природного происхождения прошло изучение в 2004 г ? Root>H)comp like"%2004%", Root>obtaining technique like "%природн%" Поступило на изучение 182 препарата

5 Сколько зарегистрировано веществ, синтезированных в лаборатории химического синтеза РОНЦ РАМН, и сколько из них производных карбазолов? Root>shifr_chem like "%ЛХС%", Root>CHEM_CLASS>chem class_type like "%карбазолы%" 1155 веществ синтезированы в лаборатории химического синтеза РОНЦ РАМН, из них 151 соединение относится к классу карбазолов

б Сколько соединений было изучено на лейкозе Р388? Root>Antitumor activity>tumor like "%P388%" 829 соединений

7 Сколько соединений поступило из Ленинградского технологического ин-та? Root>organization like "%ЛТИ%" 413 соединений

8 Сколько комплексных соединений платины прошло изучение в РОНЦ РАМН? Root>CHEMCLASS>chemclass_type like "%платины%" 242 соединения

9 Сколько соединений имеют номер Госрегистрации'? Root>Gosreg_number exists 1006 соединений

1 2 3

10 Сколько природных экстрактов было изучено? Root>drug_properties like "%экстракт%" 385 экстрактов

11 Сколько производных кумаринов зарегистрировано в БД? Root>structure sss cumarine 94 кумариновых производных

12 Сколько соединений в БД с грифом «открыто»'' Root>confidentiaI like «%открыто%» 1867 соединений

15 Сколько соединений имеют молекулярный вес > 1000? Root>*moI.weight structure >= 1000 102 соединения

Важным направлением использования корпоративной БД является формирование на ее основе обучающих массивов для компьютерных систем прогноза биологической активности веществ по их химической структуре, использующих технологии, объединенные названием SAR/QSAR - Structure-Activity Relationships/Quantitative Structure-Activity Relationships Технологии SAR/QSAR исходят из предпосылки того, что биологическое действие химического соединения всецело определяется его молекулярной структурой, то есть конкретным множеством атомов, организованных в пространстве посредством фиксированного набора связей [40, 41]

Предпосылками подготовки обучающих выборок из БД ГУ РОНЦ им Н Н Блохина РАМН для использования в системах прогноза послужили следующие соображения использование данных, полученных в унифицированных условиях одного учреждения, каковыми и являются данные по биологической активности, представленные в БД РОНЦ, что повышает достоверность прогнозов Степень унифицированности условий получения данных можно изменять, включая в обучающие выборки вещества, изученные только одним исследователем в одной лаборатории (высокая степень унифицированности) до веществ, изученных в разных учреждениях одним и тем же методом

Достоверность прогноза биологической активности повышается при использовании в качестве обучающего массива набора веществ, близких по химической структуре тестируемому веществу Этот подход особенно целесообразен при непосредственном сотрудничестве с химиками-синтетиками, ведущими поиск высокоактивных веществ в определенном классе

Наличие в БД количественных значений величин, характеризующих такие биологические эффекты, как торможение роста опухолей (ТРО), увеличение продолжительности жизни (УПЖ) - в случае противоопухолевой активности, ИК50 - в случае цитотоксической активности, полученные в одинаковых условиях, позволяет перейти от качественного прогноза к полуколичественному Например, можно включать в обучающую выборку вещества, ингибирующие рост солидных опухолей не на 50% и более, что соответствует принятому в ГУ РОНЦ им НН Блохина РАМН критерию активности, а более высокому уровню (70%, 80% и более)

С целью формирования обучающих выборок, более надежных и более подходящих, по нашему мнению, для прогноза цигостатической активности m vitro и противоопухолевой активности in vivo проводили последовательное разделение БД на кластеры с использованием средств СУБД ISIS/Base и системы файлов формата «,шоЬ> Эти файлы используются в качестве структурных запросов для формирования кластеров веществ, относящихся к различным химическим классам Кластеризованы по химическим классам 5569 веществ с точно определенной химической структурой, для которых в БД содержатся структурные формулы и текстовые данные об их принадлежности к тем или

иным химическим классам [42] Этот подход к формированию обучающих массивов был использован в ряде работ по прогнозированию биологической активности веществ по структуре с помощью отечественных систем прогноза BIBIGON, PASS и ДСМ-метод

При тестировании компьютерной системы прогноза BIBIGON показано, что данные по химической структуре и биологической активности корпоративной БД Онкологического центра пригодны для формирования обучающих массивов для этой системы Экспериментальная проверка предсказанных значений показала, что система BIBIGON удовлетворительно прогнозирует цитотоксичность веществ по выбранному критерию активности (> 50% торможению включению тимидина в ДНК) и может быть использована для быстрого предварительного скрининга цитотоксических соединений среди новых производных кумаринов, фторсодержащих органических соединений [43-46]

Обучающие выборки веществ разных классов, активно изученных в ГУ РОНЦ имНН Блохина РАМН, использовались для прогноза биологической активности и механизмов действия новых веществ с помощью системы PASS [47]

В табл 5 суммированы типы химических структур, для которых программа PASS не прогнозирует биологическую активность

Таблица 5

Типы химических структур, для которых система PASS не прогнозирует биологическую активность

№ п/п Химическая формула соединения Особенности химической структуры

1 2 3

1 _ CI N Л* R О Химическая структура содержит неизвестные радикалы Е, Б.'

2 Химическая структура содержит два и более компонента (вещество представляет собой смесь двух и более компонентов)

3 Glc-Gal-Glc-GIc, i H Gal-GIc Углеводный остаток химической структуры представлен буквенными символами, неизвестны места присоединения Сахаров в цепочке

4 Na4H4[S1(Mo207)6]> Ha[S,(Mo207)5V206] x H20 Структурные формулы комплексных соединений металлов авторами не представлены

1 2 3

5 Полимеры

6 о 0 N-^NN N N N N Полипептиды

7 <Pb «чч Комплексные соединения металлов

8 ^ р JQ "О О Фталоцианины металлов

Разработанная система структурных запросов использована при выделении веществ классов гликозидов бисиндолов и индолокарбазолов для прогнозирования биологической активности с помощью ДСМ-мегода [21-24] При этом целью работы являлась разработка 2Б-представления молекул веществ, содержащих хиральные атомы, в виде множества помеченных подграфов молекулярных графов веществ, учитывающих пространственную изомерию молекул Все вершины и ребра молекулярных графов в этой задаче содержат, помимо обычных меток, еще одну - метку хиральности

В качестве экспериментальных данных использованы структурные формулы веществ из классов бисиндолов и индолокарбазолов и данные по их цитотоксической активности m vitro и противоопухолевой активности m vivo из БД Онкологического центра В проведенном эксперименте на массиве из 176 соединений, из которых 51 соединение было дано на прогноз, с применением ДСМ-метода 20 соединений были предсказаны (предсказание активности 19 соединений полностью совпали с экспертной

оценкой, 1 соединение было предсказано ошибочно) и 31 соединение не предсказано. Несмотря на очень низкую полноту прогноза, которая связана с недостатком информации в обучающей выборке, предлагаемый метод описания является адекватным решаемой задаче [48].

Апробированная методика формирования обучающих массивов может использоваться на этапе доэкспериментального (in silico) скрининга низкомолекулярных противоопухолевых агентов и для оптимизации схем экспериментального изучения новых веществ.

В настоящее время на базе ИС по противоопухолевым препаратам осуществляется информационное сопровождение исследований по созданию новых противоопухолевых лекарств. Большой объем постоянно пополняемой информации позволяет проводить различные аналитические исследования с использованием алгоритма поиска на основе разработанного комплекса дескрипторных словарей и инструкций в БД по противоопухолевым веществам.

На диаграмме (см. рис. 7) проанализирована динамика поступления новых фармакологических веществ, поступивших на изучение в подразделения ГУ РОНЦ им. H.H. Блохина РАМН безотносительно их способа получения и химической природы.

600

500

£ 400

g 300

... П Ш О) N Ю

ЮЮСОСОСОСО!^-!-^. 010)010)0)0)0)0)Ф01

годы изучения

Рис. 7, Динамика изменения общего количества изученных веществ.

Из диаграммы видно, что в последние 10 лет отмечается снижение общего количества изучаемых препаратов. В то же время за последние 5 лет изучалось больше природных веществ, чем синтетических, что проиллюстрировано на диаграмме (см. рис.8). Это связано со стремлением исследователей найти новые, ранее не изучавшиеся оригинальные структуры соединений с противоопухолевыми свойствами, синтезированными природой.

Рис. 8. Динамика соотношения синтетических и природных веществ, изучавшихся в Онкологическом центре.

На диаграмме (см. рис. 9) показано количественное соотношение веществ разных химических классов, наиболее интенсивно изучавшихся в ГУ РОНЦ им. H.H. Блохина РАМН. Среди изученных индивидуальных веществ преобладали вещества из классов хлорэтиламинов, пиримидинов, индолов, соединений металлов. Вещества других классов изучались в меньшей степени.

Рис. 9. Количественное соотношение веществ разных химических классов.

Из 7358 изученных веществ на клинические испытания были переданы 20 препаратов, что составило около 0,2% от всех изученных субстанций, 10 из них применялись или применяются в клинической практике до настоящего времени В их числе оригинальные препараты из класса хлорэтиламинов, комплексных соединений платины, препараты из класса нитрозопроизводных [38]

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В процессе выполнения поставленных задач получены следующие

результаты

1 Систематизирован архив первичных документов, который содержит сведения о веществах, поступавших на изучение биологической активности в ГУ РОНЦ им НН Блохина с 1952 г по настоящее время

2 На основе анализа предметной области «Экспериментальная химиотерапия опухолей» средствами СУБД ISIS/Base разработана двухуровневая иерархическая структура БД, содержащая формализованные описания признаков потенциальных противоопухолевых веществ Поля БД условно разделены на три модуля регистрационно-номенклатурный, химический и модуль по биологической активности. Регистрационно-номенклатурный и химический модули БД содержат 52 поля

3 Разработан комплекс дескрипторных словарей и инструкций для заполнения полей регистрационно-номенклатурного и химического модулей корпоративной БД В этот комплекс включены различные лингвистические средства, а именно 14 дескрипторных словарей, правила для заполнения полей БД, а также текстовые файлы списков дескрипторов, используемые для автоматического введения в структуру БД при ее редактировании или создании БД с новыми полями

4 Проведена предмашинная обработка (формализация) данных о веществах, изученных в РОНЦ Предмашинные форматы (паспорта) составляют основу систематизированной картотеки и используются при вводе данных в БД Картотека сохраняет свое назначение как самостоятельная ИПС на бумажных носителях, постоянно дополняется новыми данными по активности ранее зарегистрированных веществ

5 С использованием разработанного комплекса дескрипторных словарей и инструкций введены в БД и отредактированы химические формулы, номенклатурные характеристики и физико-химические свойства более 11000 веществ различного происхождения

6 Отработана система поиска в БД которая применялась при различных аналитических исследованиях

7 Апробирована и показана возможность использования данных БД ГУ РОНЦ им НН Блохина РАМН для исследований связи «структура-активность» с помощью компьютерных систем прогноза BIBIGON, PASS, ДСМ-метод

ВЫВОДЫ

1 Разработанная структура регистрационно-номенклатурного и химического модулей БД по противоопухолевым веществам охватывает исчерпывающее количество признаков вещества, позволяющих однозначно идентифицировать его, а также получить перечень физико-химических свойств в объеме, достаточном для проведения биологических испытаний и анализа их результатов

2 Разработанный комплекс дескрипторных словарей и инструкций по заполнению полей позволяет проводить полноценный поиск в БД для различных информационно-аналитических работ

3 Фактографическая БД по противоопухолевым веществам эффективно используется для информационного обеспечения процесса поиска и разработки противоопухолевых лекарств в РОНЦ

4 БД по противоопухолевым веществам формата ISIS/Base пригодна для формирования обучающих массивов в исследованиях связи «структура-активность» с помощью различных компьютерных систем

Основные результаты работы изложены в следующих публикациях:

1 Апрышко Г H, Решетникова В В, Лесная H А Комплексные соединения платиновых металлов в БД по противоопухолевым веществам // Тез докл XV Черняевского совещания по химии, анализу и технологии платиновых металлов -М, 1993 -С9

2 Апрышко Г H, Решетникова В В , Лесная H А Фторсодержащие соединения в БД по противоопухолевым препаратам // Тез докл

П Международной конференции «Химия, технология и применение фторсодержащих соединений в промышленности» - СПб, 1994 - С 200

3 Апрышко Г H, Решетникова В В, Лесная H А, Герасимова Г К, Кумсков МИ и др Прогнозирование цитотоксической активности химических соединений с помощью компьютерной системы «BIBIGON» //Тез докл П Российского национального конгресса «Человек и лекарство» -М, 1995 - С 57-58

4 Апрышко ГН, Решетникова В В, Лесная H А База данных по синтетическим противоопухолевым агентам//Тез докл Ш Российского национального конгресса «Человек и лекарство» — М,199б —С 229

5 Апрышко Г H, Лесная H А, Решетникова В В База данных по агентам природного происхождения // Тез докл Ш Российского национального конгресса «Человек и лекарство» - M, 1996 -С 229

6 Апрышко Г H, Решетникова В В , Лесная H А, Информационная система по противоопухолевым агентам как основа аналитических исследований в области экспериментальной химиотерапии рака //Тез докл IV Российского национального конгресса «Человек и лекарство» -М, 1997 - С 244

7 Апрышко Г H, Решетникова В В , Кумсков M И, Маслова Л К Пономарева Л А База данных по противоопухолевым препаратам для изучения связи «СТРУКТУРА-АКТИВНОСТЬ» // Материалы 6-ой Международной конференции «Распознавание образов и анализ изображений новые информационные технологии» РОАИ-б-2002 — Великий Новгород, 2002 -С 39-40

8 Апрышко ГН, Решетникова В В, Филимонов ДА, Лагунин A.A., Поройков В В Компьютерное прогнозирование механизмов действия противоопухолевых препаратов // Российский биотерапевтический журнал -2005 —Т4, N 1 —С 46

9 Апрышко ГН, Решетникова В В Лингвистическое обеспечение электронной базы данных РОНЦ РАМН по противоопухолевым препаратам // Рукопись деп в ВИНИТИ РАН 19 07 06 , № 976-В2006 - 60 с

10 Апрышко ГН, Решетникова В В Регистрационно-номенклатурный и химический модули электронной базы данных Информационной системы по противоопухолевым агентам //НТИ Сер 2 -2007 -N 6 -С 24-30

11 Решетникова В В, Апрышко Г H, Кластеризация по химическим классам биологически активных веществ, представленных в банке данных НИИ ЭДиТО РОНЦ РАМН // Российский биотерапевтический журнал - 2004 — Т 3,N2 -С31

12 Решетникова В В , АпрышкоГН, Герасимова Г К Изучение веществ разных химических классов в ГУ РОНЦ им Н Н Блохина РАМН по данным информационной системы по противоопухолевым агентам //Российский биотерапевтический журнал — 2006 — N 4 - С 84-88

13 Решетникова В В , АпрышкоГН Номенклатурно-химическая информация в Банке данных по противоопухолевым веществам ГУ РОНЦ им НН Блохина РАМН //Вестник РОНЦ -2007 -N3 -С 9-14

14 Самохин М В , Апрышко Г Н, Горюнова О В , Плихтяк И JI, Решетникова В В Прогнозирование биологической активности гликозидов бисиндолов и индолокарбазолов на основе представления молекул помеченными графами с учетом пространственной изомерии // Тез докл ХШ Российского национального конгресса «Человек и лекарство» - М, 2006 - С 35

15 ApryshkoGN Reshetmkova V V, Gerasimova G К KumskovMI ZefirovNS The prediction of the cytotoxical activity of chemicals with the computerised "BIBIGON" system // Abstracs of 5th Int Symposium on molecular aspects of chemotherapy, Gdansk, Poland, 1995, P 47

16 Apryshko GN, Reshetmkova V V, Lesnaya N A Gerasimova GК The database on antitumor natural products // Abstracs of 9th NCI-EORTC Symposium on new drags in cancer therapy, Amsterdam, 1996, P 398

17 Apryshko GN, Reshetmkova V V, Lesnaya N A The databank on antitumor agents // Abstracs of 7th International Congress on anticancer treatment, Pans-France, February 3rd"6rd 1997, P 212

18 Apryshko G N, Reshetmkova V V, Kumskov MI The analytical researches on the basis of Databank on antitumor agents // Abstracs of 10th NCI-EORTC Symposium on new drags in cancer therapy, Amsterdam, 1998, P 40

19 Apryshko GN, Reshetmkova VV, Lesnaya N A The information system on antitumor agents // Proc Of 2 ad World Meeting APG/APV, Pans-France, 25-28 May, 1998, P 273-1274

ЛИТЕРАТУРА

1 Ларионов ЛФ Химиотерапия злокачественных опухолей - М Медгиз, 1962 -464 с

2 Экспериментальная оценка противоопухолевых препаратов в СССР и США /Под ред ЗП Софьиной, А Б Сыркина, А Голдина, А Кляйна - М Медицина, - 1980 - С 71-131

3 Система создания противоопухолевых препаратов в СССР и США /Под ред НН БлохинаиЧГ Зуброда -М Медицина, 1977 -352 с

4 Апрышко Г Н, Быстрое Л В, Герасимова Г К, Парфентьев С В , Сучков А П, Яник А А Банк данных по противоопухолевым препаратам //Тез докл IXВсесоюзной конференции «Химическая информатика» — Черноголовка, 1992 —С 55

5 Апрышко Г Н Предметно-ориентированный банк данных по противоопухолевым препаратам // Тез докл П Российского национального конгресса «Человек и лекарство» — М, 1995 —С 63

6 Апрышко Г Н Банк данных Российского онкологического научного центра по противоопухолевым агентам //Материалы V Всероссийского съезда онкологов «Высокие технологии в онкологии» Казань, 2000 - Т 1 — С 131— 133

7 Апрышко ГН Информационная система по противоопухолевым агентам // Российский биотерапевтический журнал -2002 - ТЗ -С 7-10

8 http //www mdl com

9 Михайлов А.И, Черный А И, Гиляревский PC «Основы информатики» 2-оеизд перераб идоп -М Наука, 1968 -756 с

10 Гиляревский Р С Курс лекций «Основы информатики» -М Экзамен, 2004 -320 с

11 Milne G W , Feldman A, Miller J A, Daly G P, Hammel M J The NCI Drug Information System 2 DIS Pre-Registry //J Chem Inf and Comput Sei - 1986 -Nov, 26(4) P 159-168

12 Milne GW, Feldman A., Miller JA, Daly GP The NCI Drug Information System 3 The DIS J Chemistry Module //J Chem Inf and Comput Sei - 1986 -Nov, 26(4) P 168-179

13 http //www chem msu /rus/chinfo/strac/

14 http //www fcgsen ru/2902/archive html/ SARET

15 http //cactvs cit mh gov/ncidb2/

16 http IIwww cas org

17 http //www ncbi nlm mh gov/

18 Апрышко Г H, Решетникова В В , Лесная H А., Кумсков M И Информационная система по противоопухолевым агентам как основа аналитических исследований в области экспериментальной химиотерапии рака //Тез докл IV Российского национального конгресса «Человек и лекарство» -М, 1997 -С 244

19 Apryshko G N, Reshetnikova V V, Kumskov MI The analytical researches on the basis of Databank on antitumor agents //Abstraes of 10th NCI-EORTC Symposium on new drags in cancer therapy, Amsterdam - 1998 - P 40

20 http//www lbmh msk ru/PASS

21 Финн В К Интеллектуальные системы для наук о жизни и социальном поведении - Режим доступа http //www vimti ru/icsti_papers/russian/Finn pdf

22 Финн В К Правдоподобные рассуждения в интеллектуальных системах типа ДСМ // Итоги науки и техники Сер Информатика - 1991 - Т 15 -С 54-101

23 Финн В К Об особенностях ДСМ-метода как средства интеллектуального анализа данных // НГИ Сер 2 - 2001 - N 5 - С 1-4

24 Финн В К Об интеллектуальных системах типа ДСМ для наук о жизни и социальном поведении//НГИ Сер 2 - 2002 -N6 С 1-4

25 Химическая энциклопедия в пяти томах -М БРЭ, - 1988-1995

26 Большой энциклопедический словарь «ХИМИЯ» //Научн изд БРЭ М, 1998 -790 с

27 Государственная Фармакопея СССР 11-е изд - M Медицина, 1998 -Вып 1 Общие методы анализа - 1998 - С 175-176

28 Двуязычный информационно-поисковый тезаурус классов органических соединений Справочное пособие /Отв ред В В Бондарь - M, ВИНИЩ 1987 -383 с

29 Номенклатурные правила ИЮПАК по химии Т2 Органическая химия Полутом 1 - M ВИНИТИ, 1979 - 507 с

30 Номенклатурные правила ИЮПАК по химии Т 3 Органическая химия высокомолекулярные соединения Полутом 1 - M ВИНИТИ, 1983 - 343 с

31 Номенклатурные правила ИЮПАК по химии ТЗ Органическая химия высокомолекулярные соединения Полутом 2 -М ВИНИТИ, 1983 -403 с

32 Бокий Г В , Голубкова H А Введение в номенклатуру ИЮПАК Как назвать химическое соединение -М Наука, 1989 - 183 с

33 Апрышко Г H, Решетникова В В Лингвистическое обеспечение электронной базы данных РОНЦ РАМН по противоопухолевым препаратам // Рукопись деп в ВИНИТИ РАН 19 07 06 № 976-В2006-60 с

34 Блажей А, ШугыйЛ Фенольные соединения растительного происхождения -М Мир, 1977 -235с

35 Schroeter AI, Panasiuk V A Dictionary of Plant Names - Koenigstem Koeltz Scientific Books, 1999 - 1033 p

36 http //www golkom ru/price/herbanum html

37 http//www jcbiru/ecol/indexshtml

38 Решетникова BB, Алрышко ГН, Герасимова Г К Изучение веществ разных химических классов в ГУ РОНЦ им НН Блохина РАМН по данным информационной системы по противоопухолевым агентам //Российский биотерапевтический журнал -2006 -N4 - С

39 Коттон Ф, Уилкинсон Дж Современная неорганическая химия Учебник /Пер с англ, под ред МН Варгафтика, МЕ Дяткиной -М,Мир, 1969 -4 3 - 499 с

40 Поройков В В Компьютерное предсказание биологической активности веществ пределы возможного - Режим доступа

http // www qsar ru/article002 htm

41 http//www qsar ru/indexq htm

42 Решетникова В В, Апрышко Г Н Кластеризация по химическим классам биологически активных веществ, представленных в банке данных НИИ ЭДиТО ГУ РОНЦ им НН Блохина РАМН //Российский биотерапевтический журнал -2004 -ТЗ, N2 - С31

43 Апрышко ГН, Решетникова В В , ЛеснаяНА, ГерасимоваГК, КумсковМИ и др Прогнозирование цитотоксической активности химических соединений с помощью компьютерной системы «BIBIGON» // Тез докл П Российского национального конгресса «Человек и лекарство» -М, 1995 -С 57-58

44 Апрышко Г Н, Кумсков М И, Решетникова В В , Маслова Л К Пономарева Л А. База данных по противоопухолевым препаратам для изучения связи «СТРУКТУРА-АКТИВНОСТЬ» //Мат 6-ой Международной конференции «Распознавание образов и анализ изображений новые информационные технологии» РОАИ-6-2002 -Великий Новгород, 2002 - С 39-40

45 Apryshko G N Reshetnikova V V, Gerasimova G К, Kumskov MI, Zefirov N S The prediction of the cytotoxical activity of chemicals with the computerised "BIBIGON" system //Abstracs of 5th Int Symposium on molecular aspects of chemotherapy, Gdansk, Poland - 1995 - P 47

46 Apryshko GN, Reshetnikova V V, Kumskov MI The analytical researches on the basis of Databank on antitumor agents //Abstracs of 10th NCI-EORTC Symposium on new drags in cancer therapy, Amsterdam - 1998 - P 40

47 Апрышко ГН, Решетникова В В , Филимонов ДА, Лагунин А. А, Поройков В В Компьютерное прогнозирование механизмов действия противоопухолевых препаратов // Российский биотерапевтический журнал -2005 -Т4,N 1 -С46

48 СамохинМВ, Алрышко ГН, ГорюноваОВ, ПлихтякИЛ, Решетникова В В Прогнозирование биологической активности гликозидов бисиндолов и индолокарбазалов на основе представления молекул помеченными графами с учетом пространственной изомерии //Тез докл ХШ Российского национального конгресса «Человек и лекарство» - М, 2006 -С35

Подписано в печать4/10.0? г Формат 60x84/16. Тираж 100 экз Заказ f Отпечатано в службе множительной техники ГУ РОЩ РАМН им Н Н Блохина РАМН 115478, Москва, Каширское ш, 24

Оглавление автор диссертации — кандидата технических наук Решетникова, Вера Владимировна

СПИСОК ПРИНЯТЫХ В РАБОТЕ СОКРАЩЕНИЙ

ВВЕДЕНИЕ

ГЛАВА 1. СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ПОИСК НОВЫХ ПРОТИВООПУХОЛЕВЫХ ЛЕКАРСТВ (ОБЗОР ЛИТЕРАТУРЫ)

1.1. Некоторые положения теории БД.

1.2. Современные биологические БнД и БД, их классификация, примеры отечественных и зарубежных БД.

1.3.Исследования связи «структура-активность» на основе БД по биологически активным веществам.

1.4. Компьютерные системы прогноза активности веществ.

ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ

ГЛАВА 3. РАЗРАБОТКА СТРУКТУРЫ БД, СОДЕРЖАЩЕЙ ДАННЫЕ ПО СТРОЕНИЮ И ФИЗИКО-ХИМИЧЕСКИМ СВОЙСТВАМ ПРОТИВООПУХОЛЕВЫХ ВЕЩЕСТВ

3.1. Выбор объекта информации, определение его признаков, составление логической схемы БД.

3.2. Выбор СУБД; краткое описание функциональных возможностей ISIS/Base for Windows.

3.3. Структура БД (название, тип и содержание полей).

ГЛАВА 4. РАЗРАБОТКА КОМПЛЕКСА ДЕСКРИПТОРНЫХ СЛОВАРЕЙ И ИНСТРУКЦИЙ ДЛЯ ЗАПОЛНЕНИЯ ПОЛЕЙ БД

4.1. Принципы разработки комплекса дескрипторных словарей и инструкций. Словари регистрационно-номенклатурного и химического модулей БД.

4.2. Инструкции по заполнению полей регистрационно-номенклатурного и химического модулей БД.

ГЛАВА 5.ТЕХНОЛОГИЯ ВЕДЕНИЯ БД ПО СТРУКТУРЕ, ПАСПОРТНЫМ ДАННЫМ H ФИЗИКО-ХИМИЧЕСКИМ

СВОЙСТВАМ ПРОТИВООПУХОЛЕВЫХ ВЕЩЕСТВ

5.1 .Экранные формы, образцы паспортов для регистрации веществ в БД.

5.2. Технология ввода информации в БД.

5.3. Содержание БД.

5.3. Методика поиска данных по различным запросам.

5.4. Поиск в БД при выполнении запросов специалистов -разработчиков новых противоопухолевых лекарств.

ГЛАВА 6. ИСПОЛЬЗОВАНИЕ БД В АНАЛИТИЧЕСКИХ ИССЛЕДОВАНИЯХ И В ИССЛЕДОВАНИЯХ СВЯЗИ

СТРУКТУРА - АКТИВНОСТЬ»

6.1. Аналитические исследования по материалам БнД.

6.2. Исследования в области связи «структура-активность».

Введение 2007 год, диссертация по документальной информации, Решетникова, Вера Владимировна

Несмотря на появление новых противоопухолевых лекарств, их клиническая эффективность недостаточна, а спектр онкологических заболеваний, чувствительных к химиотерапии, ограничен. В связи с этим не теряет актуальности вопрос поиска новых химических соединений с противоопухолевыми свойствами как основы для последующей разработки более эффективных лекарств. Основными критериями для отбора новых соединений являются: уникальность химической структуры, новый механизм действия, избирательная цитотоксичность, высокая противоопухолевая активность in vivo, доступность для производства [32].

Идея создания нового противоопухолевого препарата рождается в экспериментальных лабораториях, проходит апробацию на линиях опухолевых клеток, на экспериментальных опухолях животных, а затем передается на клинические испытания. В настоящее время многие разработки, начатые несколько лет назад в экспериментальных лабораториях, применяются в онкологической клинике, некоторые из них находятся на последних этапах внедрения в практику [89].

Поиск новых противоопухолевых лекарств сопровождается систематическим накоплением информации, получаемой в результате экспериментальных исследований потенциальных противоопухолевых средств. На всех этапах разработки новых лекарств от конструирования новой химической структуры до клинических испытаний, в настоящее время широко внедряются информационные технологии, повышающие эффективность исследований. Важной частью этих технологий являются фактографические БД по структуре и свойствам БАВ.

Актуальность работы. В связи с этим актуально создание ИС по потенциальным противоопухолевым препаратам, изученным в ГУ РОНЦ им. Н.Н. Блохина РАМН, в том числе её основной части - фактографической БД. БД имеет значение как инструмент, позволяющий систематизировать информацию по химической структуре и свойствам изученных веществ и полноценно использовать её в различных аналитических исследованиях.

Целью настоящей работы является разработка корпоративной БД формата ISIS/Base, содержащей данные по регистрационным и номенклатурным характеристикам, химической структуре и физико-химическим свойствам синтетических веществ и природных экстрактов, как основной части ИС по препаратам, изучавшихся в ГУ РОНЦ им. Н.Н. Блохина РАМН в качестве потенциальных противоопухолевых агентов.

При выполнении работы решались следующие задачи:

1. Систематизация и анализ документации по разработке потенциальных противоопухолевых лекарств с целью выделения объекта информации, его признаков и составления логической схемы БД по противоопухолевым веществам.

2. Разработка структуры регистрационно-номенклатурного и химического модулей БД формата ISIS/Base.

3. Разработка комплекса дескрипторых словарей и инструкций для заполнения полей регистрационно-номенклатурного и химического модулей БД формата ISIS/Base.

4. Ввод данных по регистрационным и номенклатурным характеристикам, химическому строению и физико-химическим свойствам синтетических веществ и природных экстрактов в БД формата ISIS/Base и ее редактирование с использованием разработанных дескрипторых словарей и инструкций.

5. Разработка системы поиска в БД для выполнения информационных запросов специалистов - разработчиков лекарств и аналитических исследований в предметной области «Экспериментальная химиотерапия опухолей».

6. Оценка возможности БД формата ISIS/Base для формирования обучающих массивов для компьютерных систем прогноза BIBIGON, PASS и ДСМ-метода.

Научная новизна работы

В результате выполненной работы создана первая отечественная корпоративная фактографическая БД формата ISIS/Base по структуре и свойствам веществ, представляющая собой систематизированный формализованный обзор многолетних исследований в ГУ РОНЦ им. Н.Н. Блохина РАМН по поиску противоопухолевых веществ разных химических классов и являющаяся важной составной частью ИС по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН.

Для созданной корпоративной БД формата ISIS/Base разработан комплекс дескрипторых словарей и инструкций для заполнения полей БД.

Разработана методика подготовки выборок веществ разных химических классов для обзорно-аналитических исследований в предметной области «Экспериментальная химиотерапия опухолей», в том числе методика подготовки обучающих выборок для прогнозирования противоопухолевой активности in vivo и цитотоксической активности in vitro веществ разных химических классов с помощью компьютерных систем.

Научно-практическое значение

Созданная корпоративная фактографическая БД формата ISIS/Base по противоопухолевым веществам используется для информационного сопровождения процесса создания новых противоопухолевых лекарств, в том числе для подготовки информационных справок по запросам специалистов разного профиля, работающих в области поиска и разработки новых противоопухолевых лекарств.

Корпоративная фактографическая БД по противоопухолевым веществам используется для формирования обучающих массивов на этапе доэкспериментального скрининга (in silico) в программе отбора потенциальных противоопухолевых агентов.

Заключение диссертация на тему "Информационная система по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН"

ВЫВОДЫ

1. Разработанная структура регистрационно-номенклатурного и химического модулей БД по противоопухолевым веществам охватывает исчерпывающее количество признаков вещества, позволяющих однозначно идентифицировать его, а также получить перечень физико-химических свойств в объеме, достаточном для проведения биологических испытаний и анализа их результатов.

2. Разработанный комплекс дескрипторных словарей и инструкций по заполнению полей позволяет проводить полноценный поиск в БД для различных информационно-аналитических работ.

3. Фактографическая БД по противоопухолевым веществам эффективно используется для информационного обеспечения процесса поиска и разработки противоопухолевых лекарств в РОНЦ.

4. Разработанная БД по противоопухолевым веществам формата ISIS/Base пригодна для формирования обучающих массивов в исследованиях связи «структура-активность» с помощью различных компьютерных систем.

110

ЗАКЛЮЧЕНИЕ

В процессе работы над диссертацией получены следующие результаты:

1. Систематизирован архив первичных документов, который содержит сведения о веществах, поступавших на изучение биологической активности в ГУ РОНЦ им. Н.Н. Блохина с 1952 года по настоящее время.

2. На основе анализа предметной области «Экспериментальная химиотерапия опухолей» средствами СУБД ISIS/Base разработана двухуровневая иерархическая структура БД, содержащая формализованные описания признаков потенциальных противоопухолевых веществ. Поля БД условно разделены на три модуля: регистрационно-номенклатурный, химический модуль и модуль по биологической активности. Регистрационно-номенклатурный и химический модули БД содержат 52 поля.

3. Разработан комплекс дескрипторных словарей и инструкций для заполнения полей регистрационно-номенклатурного и химического модулей корпоративной БД. В этот комплекс включены различные лингвистические средства, а именно: 14 дескрипторных словарей, инструкции для заполнения полей БД, а также текстовые файлы списков дескрипторов, используемые для автоматического введения в структуру БД при ее редактировании или создании БД с новыми полями.

4. Проведена предмашинная обработка (формализация) данных о веществах. Предмашинные форматы (паспорта) составляют основу систематизированной картотеки и используются при вводе данных в БД. Картотека сохраняет свое назначение как самостоятельная ИПС на бумажных носителях, постоянно дополняется новыми данными по активности ранее зарегистрированных веществ.

5. С использованием разработанного комплекса дескрипторных словарей и инструкций введены данные в поля БД и отредактированы химические формулы, номенклатурные характеристики и физико-химические свойства для более 11000 веществ различного происхождения.

6. Отработана система поиска в БД, которая применялась при различных аналитических исследованиях.

7. Апробирована и показана возможность использования данных БД ГУ РОЩ им. Н.Н. Блохина РАМН для исследований связи «структура-активность» с помощью компьютерных систем прогноза BIBIGON, PASS, ДСМ-метод.

Таким образом, созданная ИС по противоопухолевым препаратам ГУ РОЩ им. Н.Н. Блохина РАМН, важной составной частью которой является БД по противоопухолевым веществам формата ISIS/Base, содержащая информацию о синтетических и природных веществах, проходивших испытания в качестве потенциальных противоопухолевых средств, может служить основой для усовершенствования классификации противоопухолевых агентов, стратегии поиска новых противоопухолевых лекарств. ИС по противоопухолевым препаратам ГУ РОНЦ им. Н.Н. Блохина РАМН используется в исследованиях связи «структура-активность» с целью прогнозирования биологической активности по структуре вещества с применением отечественных систем прогноза.

Библиография Решетникова, Вера Владимировна, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Авидон В.В. Критерии сравнения химических структур и принципы построения информационного языка для информационно-логической системы по биологически активным соединениям //Хим. фарм. журн. -1974. -N.8. - С.22-25.

2. АпрышкоГ.Н. Предметно-ориентированный банк данных по противоопухолевым препаратам //Тез. докл. II Российского национального конгресса «Человек и лекарство». — М., 1995. — С.63.

3. Апрышко Г.Н. Банк данных по противоопухолевым препаратам //Материалы I съезда онкологов стран СНГ. М., 1996. - 4.1. - С. 151.

4. АпрышкоГ.Н. Банк данных Российского онкологического научного центра по противоопухолевым агентам //Материалы V Всероссийского съезда онкологов «Высокие технологии в онкологии». Казань, 2000. -Т.1.-С.131-133.

5. Апрышко Г.Н. Информационная система по противоопухолевым агентам //Российский биотерапевтический журнал. 2002. - Т.З. - С.7-10.

6. Апрышко Г.Н. Система «Слежение» банка данных» //Сборник «Химиотерапия опухолей в СССР». 1987. - Вып.47. - С.217-232.

7. Апрышко Г.Н., БыстровЛ.В., Герасимова Г.К., и др. Банк данных по противоопухолевым препаратам //Тез. докл. IX Всесоюзной конференции «Химическая информатика». — Черноголовка, 1992. — С.55

8. Апрышко Г.Н., Решетникова В.В., Филимонов Д.А. и др. Компьютерное прогнозирование механизмов действия противоопухолевых препаратов //Российский биотерапевтический журнал. 2005. - Т.4, N.l. - С.46.

9. Апрышко Г.Н., Поройков В.В., Филимонов Д.А. Компьютерный прогноз спектра противоопухолевой активности //Тез. докл. XII Российского Национального Конгресса «Человек и лекарство». М., 2005. - С.636.

10. Апрышко Г.Н., Решетникова В.В., Кумсков М.И. и др. Прогнозирование цитотоксической активности химических соединений с помощью компьютерной системы «BIBIGON» //Тез. докл. II Российского национального конгресса «Человек и лекарство». М., 1995. - С.57-58.

11. Апрышко Г.Н., Решетникова В.В., Лесная Н.А. Фторсодержащие соединения в Банке данных по противоопухолевым веществам.

12. Тез. докл. II Международной конференции «Химия, технология и применение фторсодержащих соединений в промышленности». СПб., 1994.-С.200.

13. Апрышко Г.Н., Решетникова В.В., Лесная Н.А. База данных по синтетическим противоопухолевым агентам //Тез. докл. III Российского национального конгресса «Человек и лекарство». М., 1996. -С.299.

14. Апрышко Г.Н., Лесная Н.А., Решетникова В.В. База данных по противоопухолевым агентам природного происхождения //Тез. докл.

15. I Российского национального конгресса «Человек и лекарство». М.,1996. -С.299

16. Апрышко Т.Н., Решетникова В.В., Лесная Н.А. Информационная система по противоопухолевым агентам как основа аналитических исследований в области экспериментальной химиотерапии рака. //Тез. докл.

17. Российского национального конгресса «Человек и лекарство». М.,1997.-С.244.

18. Апрышко Г.Н., Решетникова В.В. Лингвистическое обеспечение электронной базы данных РОНЦ РАМН по противоопухолевым препаратам. //Рукопись деп. в ВИНИТИ РАН 19.07.06. № 976-В2006-60 с.

19. Апрышко Г.Н., Решетникова В.В. Регистрационно-номенклатурный и химический модули электронной базы данных Информационной системы по противоопухолевым агентам. //НТИ. Сер.2. 2007. - N.6. -С.24-30.

20. Англо-русский словарь по химии и химической технологии. /Под ред. акад. В.В. Кафарова. М.: Русский язык, 1986. - 581 с.

21. Блинова В.Г. Результаты применения ДСМ-метода генерации гипотез к проблемам анализа связи «структура химического соединения -биологическая активность» //НТИ. Сер.2. 1995. - N.5. -С. 17-24.

22. Блинова В.Г., Добрынин Д.А. Языки представления химических структур в интеллектуальных системах для конструирования лекарств //НТИ. Сер.2. 2000. - N.6. - С.14-21.

23. Блинова В.Г., Харчевникова Н.В. Прогноз токсичности замещенных бензолов с помощью ДСМ-метода автоматического порождения гипотез и квантовохимических расчетов //Хим. фарм. журн. - 2000. - Т.34, N.4. - С.44-50.

24. Бокий Г.В., Голубкова Н.А. Введение в номенклатуру ИЮПАК: Как назвать химическое соединение. М.: Наука, 1989. - 184 с.

25. Большой энциклопедический словарь «ХИМИЯ» //Научн. изд. БРЭ. М., 1998.-790 с.

26. Блажей А., Шутый J1. Фенольные соединения растительного происхождения. М.: Мир, 1977. - 235 с.

27. Василевич А.Ф., Зиновьев С.П., Молотков Л.И. Использование баз данных системы STN International в МЦНТИ.-Режим доступа: http://www.benran.ru/Magazin/cgi-bin/Sb97/pr5.exe717!

28. Герасимова Г.К., Сыркин А.Б. Система отбора новых противоопухолевых агентов в ОНЦ РАМН //Материалы I съезда онкологов стран СНГ. М., 1996.-4.1.-С.152.

29. Герасимова Г.К., Апрышко Г.Н., Решетникова В.В. и др. Новые подходы к поиску соединений с противоопухолевой активностью как основы для разработки новых лекарственных средств. //Вестник РАМН. 2007.

30. Гиляревский Р.С. Курс лекций «Основы информатики». М.: Экзамен, 2004.-320 с.

31. Государственная Фармакопея XI СССР. М.: Медицина, 1987, 1990. -Вып. 1.-334 с. -Вып.2 -398 с.

32. Двуязычный информационно-поисковый тезаурус классов органических соединений: Справочное пособие /Отв. Ред. В.В. Бондарь. М., ВИНИТИ, 1987.-383 с.

33. Дейт К.Дж. Введение в системы баз данных. М.: Диалектика, 1998. -784 с.

34. Добрынин Д.А. Язык представления пространственной структуры молекул химических соединений в интеллектуальных системах для конструирования лекарств //НТИ. Сер.2. 2001. - N.12. - С.4-9.

35. Добрынин Д. А. Инструментальные средства для представления информации о структуре и химических соединений и их сходстве в интеллектуальных системах: Автореф.дис.канд.техн.наук М., 2003. -26 с.

36. Ефременкова В.М. Структурирование процесса поиска и анализа научно-технической информации //НТИ. Сер. 1. -2007. -N.8. С. 13 -23.

37. Журнал Всесоюзного химического общества им. Д.И. Менделеева. /Под ред. акад. И.Л. Кнунянца. М., Химия, 1983. - T.XXVIII, N.3. - 119 с.

38. Зицерман В.Ю., Кобзев Г.А., Фокин Л.Р. Возможности и перспективы информационных технологий в подготовке и распространении справочных данных: свойства вещества и материалов. //НТИ. Сер.1. -2004. N.2. - С.7-14.

39. Исляйкин М.К., Данилова Е.А., Кудрик Е.В. Синтез и изучение противоопухолевого действия макрогетероциклических соединений и их комплексов с металлами //Хим. фарм. журн. - 1997. - Т.31, N.8.1. С. 19-22.

40. Коттон Ф., Уилкинсон Дж. Современная неорганическая химия: Учебник /Пер. с англ., под ред. М.Н. Варгафтика, М.Е. Дяткиной. М., Мир, 1969. -Ч.З.-499 с.

41. Кочетков Н.К., Бочков А.Ф., Дмитриев Е.А. и др. Химия углеводов. М.: Химия, 1967. - 672 с.

42. Кузнецов С.Д. Введение в стандарты языка баз данных SQL. Режим доступа: http://www.citforum.rU/database/sqlbook/sqlbook02.shtml# 11

43. Кузнецов С.О. ДСМ-метод как система автоматического обучения //Итоги науки и техники. Сер. Информатика. М., ВИНИТИ. -1991. -Т. 15,-.С. 17-54.

44. Кузнецов С.О., Самохин М.В. Машинное обучение на данных, представленных помеченными графами //Труды 12-й Всероссийской конференции «Математические методы распознавания образов» (ММРО-12) /ВЦ РАН. М., 2005. - С.150-153.

45. Ларионов Л.Ф. Химиотерапия злокачественных опухолей. М.: Медгиз, 1962.-464 с.

46. Мартиросов А.К., Гончаренко Д.И., Зацепин В.М. и др. Применение формул Маркуша в современных химических информационныхсистемах: методические и программно-технологические средства //НТИ. Сер.2. 2004. - N.4. - С.21-33.

47. Мартынова Н.Б., Филимонов Д.А., Поройков В.В. Компьютерное прогнозирование спектра биологической активности низкомолекулярных пептидов и петидомиметиков //Биоорганическая химия. 2000. - Т.26, N.5.-C.330-339.

48. Михайлов А.И., Черный А.И., Гиляревский Р.С. «Основы информатики»: 2-ое изд. перераб. и доп. М.: Наука, 1968. - 756 с.

49. Немировская И.Б., Трепалин С.В., Королева JI.M. Представление стереохимической информации в Базе данных ВИНИТИ. //НТИ. Сер.2. -2004. -N.4.-С.1-6.

50. Номенклатурные правила ИЮПАК по химии. Т.2, полутом 1. М.: ВИНИТИ, 1979. - 507с.

51. Номенклатурные правила ИЮПАК по химии. Т.З, полутом 1. М.: ВИНИТИ, 1983.-343 с.

52. Номенклатурные правила ИЮПАК по химии. Т.З, полутом 2. М.: ВИНИТИ, 1983.-403 с.

53. Панкратова Е.С., Ивашко В.Г., Авидон В.В., Блинова В.Г. Экспериментальная проверка новой версии ДСМ-метода: Препринт -1- 3426. ВИНИТИ, 1988. 4с.

54. Панкратова Е.С., Панкратов Д.В., Финн В.К., Шабалов И.П. Применение ДСМ-метода для прогнозирования высокопатогенных типов вируса папилломы человека //НТИ. Сер.2. 2002. - N.6. - С.22-26.

55. Пирузян JI.A., Авидон В.В., Розенблат А.Б. Принципы построения банка данных по структуре и активности биологически активных соединений.

56. Хим. фарм. журн. - 1977. - N.5. - С.35-40.

57. Погребняк А. В., Поройков В.В., Старых В.В. Компьютерный прогноз противоопухолевой активности сесквитерпеновых лактонов, обнаруженных в представителях семейства Asteraceae //Растительные ресурсы. 1998. - Т.34, N.l. - С.61-64.

58. Поройков В.В, Блинова В.Г. Новое в информационном обеспечении химико-фармацевтической промышленности развитых стран: догонять или использовать? //НТИ-96. М., 1996. - С. 189.

59. Поройков В.В. Компьютерное предсказание биологической активности веществ: пределы возможного. Режим доступа:http:// www.qsar.ru/article002.htm

60. Поройков В.В., Филимонов Д.А. Компьютерный прогноз биологической активности химических соединений как основа для поиска и оптимизации базовых структур новых лекарств //Сб. Азотистые гетероциклы и алкалоиды. М.: Иридиум-пресс, 2001. - Т.1. - С.8-12.

61. Потапов В.М. Стереохимия. М.: Химия, 1976. - 695с.

62. Решетникова В.В., Апрышко Г.Н. Кластеризация по химическим классам биологически активных веществ, представленных в банке данных НИИ ЭДиТО РОНЦ РАМН //Российский биотерапевтический журнал. -2004. -Т.З, N.2. С.31.

63. Решетникова В.В., Апрышко Г.Н., Герасимова Г.К. Изучение веществ разных химических классов в ГУ РОНЦ им. Н.Н. Блохина РАМН по данным информационной системы по противоопухолевым агентам //Российский биотерапевтический журнал. 2006. - N.4. - С.84-88.

64. Решетникова В.В., Апрышко Г.Н. Номенклатурно-химическая информация в Банке данных по противоопухолевым веществам ГУ РОНЦим. Н.Н. Блохина РАМН. //Вестник РОНЦ, 2007, №3. С.9 -14.

65. Розен В.Б. Основы эндокринологии: Учебное пособие для студ. ун-тов по спец. «Биология». 2-е изд., перераб. и доп. /Глава III. Химическаяструктура гормонов и ее связь с биологической активностью. М.: Высшая школа, 1984. - С.ЗЗ -81.

66. Садым А.В., Лагунин А.А., Филимонов А.Д., Поройков В.В. Интернет-система прогноза спектра биологической активности химической соединений //Хим. фарм. журн. - 1974. - Т.36, N.10. - С.21-26.

67. Самохин М.В. Машинное обучение на узорных структурах: Автореф.дис.канд. техн.наук. М., 2006. - 26 с.

68. Система создания противоопухолевых препаратов в СССР и США. /Под ред. Н.Н. Блохина и Ч.Г. Зуброда. М.: Медицина, 1977. - 352 с.

69. Терней А. Современная органическая химия в 2-х томах: Пер. с англ. -/Под ред. Н.Н. Суворова. -М.: Мир, 1981. Т. 1. 678 е.; Т.2. - 651с.

70. Уткина Е.А. Программа перевода названий химических соединений в систематической номенклатуре в молекулярные графы (для некоторых важных классов органических соединений) //НТИ. Сер.2. 2000. - N.3. -С.24-36.

71. Филимонов Д.А., Поройков В.В. Прогноз спектра биологической активности органических соединений //Журнал Российского химического общества им. Д.И. Менделеева. 2006. - T.L. - N.2. - С.66-75.

72. Финн В. К. Интеллектуальные системы для наук о жизни и социальном поведении. Режим доступа: http://www.viniti.ru/icstipapers/russian/ Finn.pdf

73. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ //Итоги науки и техники. Сер. Информатика. 1991. - Т. 15. -С.54-101.

74. Финн В.К. ДСМ-метод как средство анализа казуальных зависимостей в интеллектуальных системах//НТИ. Сер.2. -2000. -N.l 1. С. 1-5.

75. Финн В.К. Об особенностях ДСМ-метод а как средства интеллектуального анализа данных //НТИ. Сер.2. 2001. -N.5. - С.1-4.

76. Финн В.К. Об интеллектуальных системах типа ДСМ для наук о жизни и социальном поведении //НТИ. Сер.2. 2002. -N.6. С.1-4.

77. Харчевникова Н.В., Блинова В.Г., Добрынин Д.А. и др. Применение ДСМ-метода и квантово-химических расчетов для прогноза канцерогенности и хронической токсичности галогенозамещенных алифатических углеводородов. //НТИ. Сер.2. -2004. N.12. - С.21-25.

78. Химический анализ лекарственных растений: Учебное пособие /Под ред. проф. Н.И. Гринкевич, доц. JI.H. Сафронич. М.: Высшая школа, 1983. -173 с.

79. Хуторецкий В.М. Химическая информация и обучение ее поиску.-Режим доступа: http://www.chem.msu.su/rus/vmgu/00add/009/

80. Химическая энциклопедия: в пяти томах. М.: БРЭ, - 1988 -1995. •

81. Экспериментальная онкология на рубеже веков. /Под ред. М.И. Давыдова и А.Ю. Барышникова. М.: изд. группа ГУ РОНЦ им. Н.Н. Блохина РАМН, 2003. - 552 с.

82. Экспериментальная оценка противоопухолевых препаратов в СССР и США. /Под ред. З.П. Софьиной, А.Б. Сыркина, А. Голдина, А. Кляйна. -М.: Медицина, 1980. - С.71 -131.

83. Эльянов М. Медицинские информационные технологии //Каталог. 2006. -ВЫП.6.-С.158.

84. Apryshko G.N., Reshetnikova V.V., LesnayaN.A. Gerasimova G.K. The database on antitumor natural products //Abstracs of 9th NCI-EORTC. Symposium on new drags in cancer therapy, Amsterdam. 1996. - P.398.

85. Apryshko G.N., Reshetnikova V.V., Lesnaya N.A. The databank on antitumorth •agents //Abstracs of 7 International Congress on anticancer treatment, Paris-France. -1997. P.212.

86. Apryshko G.N., Reshetnikova V.V., Kumskov M.I. The analytical researches on the basis of Databank on antitumor agents //Abstracs of 10th NCI-EORTC. Symposium on new drags in cancer therapy, Amsterdam. 1998. - P.40.

87. Apryshko G.N., Reshetnikova V.V., Lesnaya N.A. The information system on antitumor agents //Proc. Of 2 nd World Meeting APG/APV., Paris-France. -1998. -P.1273-1274.

88. Kumskov M.I., Mitushev D.F., Ponomareva L.A. Automatic formation method for structural descriptors of organic-compounds for quantitativestructure -property relationships //Russian Chemical Bulletin. 1994. - 43(8): P.01317-01319.

89. Kumskov M.I., Ponomareva L.A., Zakharova M.V. New apporoach to the solution of QSAR problem on organic-compounds //Zhurnal obshchei khimii. 1995. - 65(2): P.00285-00286.

90. Kumskov M.I. Perspectives of the application of BIBIGON program for the prediction of physicochemical properties of fluorine-containing organic-compounds //Zhurnal organicheskoi khimii. 1995. - 31(10): P.01495-01498.

91. Milne G.W., Miller J.A. The NCI Drug Information System. 1. System overview//J. Chem. Inf. and Comput. Sci. 1986. - Nov; 26(4): P.154-159.

92. Milne G.W., Feldman A., Miller J.A, Daly G.P., Hammel M.J. The NCI Drug Information System. 2. DIS Pre-Registry //J. Chem. Inf. and Comput. Sci. -1986.-Nov; 26(4): P.159-168.

93. Milne G.W, Feldman A., Miller J.A, Daly G.P. The NCI Drug Information System. 3. The DIS J Chemistry Module //J. Chem. Inf. and Comput. Sci. -1986.-Nov; 26(4): P.168-179.

94. Milne G.W., Miller J.A., Hoover J.R. The NCI Drug Information System. 4. Inventory and Shipping Modules //J. Chem. Inf. and Comput. Sci. 1986. -Nov; 26(4): P.179-185.

95. Milne G.W., Nicklaus M.C., Driscoll J.S., Wang S., Zaharevitz D. National Cancer Institute Drug Information System 3D database //J. Chem. Inf. and Comput. Sci. 1994. Sep-Oct; 34(5): P.1219-1224.

96. Schroeter A.I., Panasiuk V.A. Dictionary of Plant Names. Koenigstein: Koeltz Scientific Books, 1999. - 1033 p.

97. Voigt J.H, Bienfait В., Wang S., Nicklaus M.C. Compararison of the NCI open database with seven large chemical structural databases //J. Chem. Inf. and Comput. Sci.-2001.-May-Jun; 41(3): P.702-712.

98. Zehnacker M.T., Brennan R.H., Milne G.W., Miller J.A. The NCI Drug Information System. 5. DIS Biology Module //J. Chem. Inf. and Comput. Sci. 1986.-Nov; 26(4): P.186-193.

99. Zehnacker M.T., Brennan R.H., Milne G.W., Miller J.A., Hammel M.J. The NCI Drug Information System. 6. System maintenance //J. Chem. Inf. and Comput. Sci. 1986.-Nov; 26(4): P.193-197.