автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Разработка базовых компонент систем манипулирования структурной химической информацией

кандидата химических наук
Пиоттух-Пелецкий, Вадим Николаевич
город
Новосибирск
год
1990
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка базовых компонент систем манипулирования структурной химической информацией»

Автореферат диссертации по теме "Разработка базовых компонент систем манипулирования структурной химической информацией"

АКАДЕМИЯ НАУК СССР

Ордена Ленина Сибирское Отделение Новосибирский институт органической химии

На правах рукописи ПИОГТУХ-ПЕЛЕЦКИЙ Вадим Николаевич

УДК 681.3.016:519.17

РАЗРАБОТКА БАЗОВЫХ КОМПОНЕНТ СИСТЕМ МАНИПУЛИРОВАНИЯ СТРУКТУРНОЙ ХИМИЧЕСКОЙ ИНФОРМАЦИЕЙ

05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (химические науки)

АВТОРЕФЕРАТ

диссертации на соискание учбной степени кандидата химических наук

НОВОСИБИРСК - 1990

Работа выполнена в Научно-техническом центре химической информатики при Новосибирском институте органической химии СО АН СССР.

Научные руководители - академик В.А.Коптит

- кандидат физико-математических наук, доцент В.И.Смирнов

Официальные оппоненты - доктор химических ваух М.Е.Зляиберг - кандидат химических наук А.В.Федотов

Ведущее предприятие - Институт химии АН Молдавской ССР

Защита состоится 1990 р. в {к. часов

на заседании специализированного совета К 002.42.01 в Новосибирском институте органической химии СО АН СССР по адресу: 6Э0090. г.Новосибирск, пр. Ак. Лаврентьева, 9.

С диссертацией можно ознакомиться в библиотеке Новосибирского института органической химии СО АН СССР .

Автореферат разослан . 1990 г.

Учений секретарь специализированного кандидат физико-математических наук

совета, ^ _

в.и.аирнов

• ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

'А ~и \

Актуальность проблеш

В органической химии в настоящее время синтезировано и описано около десяти миллионов индивидуальных химических соединений. Каждое соединение охарактеризовано структурной формулой, а также набором его физических и химических свойств. Активное использование всей информации о химических соединениях возможно лишь при решении вопросов её хранения в крупномасштабных банках данных и быстрого доступа к этой информации. Понятно, что для этих целей требуется разработка соответствующих способов представления структурных формул на языке ЭВМ и алгоритмов извлечения из машинного банка требуемых данных. Следует отметить, что алгоритмы для работы со структурной химической информацией неразрывно связаны со способами её представления, и обычно и те и другие разрабатываются одновременно.

Отметим также возникшую в последние годы тенденцию создания большого числа локальных банков данных по строению и свойствам химических соединений. В таких локальных информационных системах, создающихся для решения целенаправленных прикладных задач химической информатики (биологическая активность, пестициды, токсикология, стабилизаторы полимеров и т.п.), одной из важнейших компонент является подсистема хранения, регистрации и поиска химических соединений и классов структурно родственных соединений. В связи с этим особую актуальность приобретает создание эффективных способов представления и обработки структурной химической информации.

Данная работа первоначально была ориентирована на создание программных средств манипулирования структурной химической информацией в рамках локальных информационных систем, однако разработанные в ходе ее выполнения алгоритмы и программные средства могут в равной степени использоваться и в крупномасштабных информационных системах.

Цель работы

Целью диссертационной работы является разработка базовых средств эффективного манипулирования структурами химических

соединений для банков данных типа; "структура-свойство" и строящихся на' их основе прикладных, автоматизированных систем химической информатики.

Научная новизна.

В ходе работы для решения поставленной задачи предложены и реализованы базовые средства манипулирования структурами химических соединений, включающие в себя средства регистрации, поиска и анализа структурной родственности химических соединений в информационных системах. Разработан и программно реализован алгоритм канонизации представления структурных формул, являющийся одной из необходимых компонент для решения задач регистрации и быстрого поиска структур в машинных банках данных. Анализ критериев, определяющих структурную родственность химических соединений в привычном для химика понимании, позволил сформулировать алгоритм проверки вложения частей структуры (структурных фрагментов) в полные структурные формулы, имещий принципиальные отличия от алгоритма изоморфного вложения графов. Предложен новый способ описания структур химических соединений с помощью спектров фрагментах составов. Его программная реализация обеспечивает эффективное построение полных наборов фрагментов заданного размера, содержащихся в структуре химического соединения. Спектры фрагментннх составов использованы в качестве основы для эффективной реализации иерархического указателя вложений фрагментов, используемого для быстрого поиска классов соединений в структурной базе данных. Разработаны алгоритм и соответствующая программа выделения групп структурно родственных соединений - таксономии на графах химических структур. Спектры фрагментннх составов структур использованы также для решения задачи выявления максимальных общих структурных фрагментов для заданной выборки структур - важного инструмента для выявления структурных аналогов.

Практическая значимость Выполненная работа характеризуется тем, что на основе предложенных нового способа представления структурной информации и разработанных алгоритмов обработки этой информации реализованы программы для ЭВМ, которые использованы всозда-

ваеиых химических информационных системах в качестве базовых элементов, реализующих основные функции обработки структурной химической информации. Разработанные базовые компоненты систем манипулирования структурной химической информацией прошли испытания и внедрены в ряде организаций, в том числе, в Новосибирском институте органической химии (в банках данных по молекулярной спектроскопии), во Всесоюзном научно-исследовательском технологическом институте гербицидов и регуляторов роста растений (г.Уфа).

Апробация работы и публикации

Результаты работы докладывались на 5-й, 6-й, 7-й и 8-й Всесоюзных конференциях по использованию ЭВМ в спектроскопии молекул и химических исследованиях (соответственно, Новосибирск, 1981, Новосибирск, 1983, Рига, 1986, Новосибирск, 1989), на 1-м, 2-м и 3-м Советско-японских симпозиумах {соответственно, Новосибирск, 1983, Тойхаши, 1985, Новосибирск, 1987), на Всесоюзной школе-семинаре по применению теории графов в химии (Иркутск, 1988).

По теме диссертации опубликовано 27 печатных работ.

Объём работы

Диссертация состоит из 4 глав, введения, заключения, списка литературы, содержащего 105 наименований и приложения. Общий объём работы 128 страниц текста, вклшапцего 7 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении анализируется роль структурной информации в химических информационных системах и проблемы, возникающие при обработке структурной информации в банках данных по строению и свойствам химических соединений и в прикладных системах.

Отмечается, что при работе с базами структурных данных программные средства должны обеспечивать не только поиск конкретных химических соединений, но и отбор структурно родственных соединений. Поэтому разработка методов эффективного поиска структурных аналогов изучаемого объекта в крупномасш-

табных и локальных структурных базах в последнее время становится одной из важнейших в химической информатике. Решение этой задачи особенно актуально для практических приложений исследований в области корреляций между структурой и свойствами химических соединений. Это связано с эвристической функцией современных химических информационных систем: информационные потребности пользователя-химика должны предвосхищаться системой, и среди результатов поиска должны предлагаться ближайшие аналоги искомого соединения или класса соединений.

Предлагаемые в работе новый способ представления структур химических соединений с помощью спектров фрагментах составов и алгоритмы их построения и использования для обработки структурной информации позволяют достаточно эффективно решать такие практически важные задачи, как поиск структурных формул, содержащих заданные фрагменты, выявление максимальных и произвольных общих структурных фрагментов для выборок структур, классификации структур в выборках на основе оценки структурного родства, выраженного посредством спектров общих фрагментных составов.

В первой главе приводится обзор способов представления структурных формул в химических информационных системах (как традиционных, тек и основывающихся на использовании ЭВМ). Причём, основное внимание уделяется способам адекватного отражения важных с точки зрения химиков структурных особенностей молекул в машинных представлениях структур!.

При сопоставлении. химической номенклатуры и родственных ей систем представления структурных формул типа системы кодирования. Висвессера с одной стороны и чисто машинных способов представления структурных формул с другой стороны, демонстрируются критерии, предъявляемые к описаниям структурных формул в современных информационных системах. Наиболее важные среди них - степень отражения химических особенностей строения молекулы и соответствие разработанным к настоящему времени алгоритмам обработки структурной информации на ЭВМ. Демонстрируется непригодность . традиционной химической номенклатуры с точки зрения второго критерия,, поскольку различные компоненты структуры могут отражаться в номенклатурном наз-

вэнии совершенно различными способами, что чрезвычайно затрудняет алгоритмическую обработку представленной таким образом структурной информации. Следует отметить и другой аспект сопоставления химической номенклатуры и машинных представлений структуры - лёгкость восприятия информации о структуре пользователем-химиком. В этом отношении наиболее приемлемым способом внешнего представления структурной химической информации является графическое изображение структурных формул, как наиболее удобное для человека и алгоритмически просто трансформируемое во внутреннее представление структуры в ЭВМ.

Представление структурных формул, основанное на графе структуры, как наиболее адекватной форме отражения структуры молекулы, оказывается недостаточным для описания стереоизо-меров. В связи с этим рассматриваются способы представления информации о пространственных особенностях стереоизомеров. В данном случае подхода, предложенные химиками, оказываются чрезвычайно близки к способам представления пространственных особенностей в машинных информационных системах. В обоих случаях пространственное строение стереоцентров представляется е виде дополнительных характеристик вершин химического графа - ЕЭ-меток в номенклатуре Кана-Ингольда-ГТрелога или компонент вектора чётности в машинном представлении.

Предлагаемые способы представления информации, учитывающие многообразие видов структур и приемлемые с точки зрения машинной реализации, являются ключевым моментом при создании информационных систем по химии, определяющим выбор путей практической реализации систем поиска химической информации, разнообразных систем выявления корреляций между строением и свойствами химических соединений, алгоритмов манипулирования структурной информацией в этих системах и алгоритмов решения прикладных задач химической информатики.

Во второй главе рассматриваются основные операции, осуществляемые над представлениями структурных формул в системах манипулирования структурной химической информацией. Таких операций, представляющих интерес практически для всех химических информацонных систем, две:

- проверка структур на совпадение;

- определение степени родственности несовпадающих структур.

Поиск совпадающих структур важен для определения новизны структуры и для регистрации новых соединений, а также для извлечения из банка данных информации о конкретном заданном соединении.

Поиск родственных структур важен для задач анализа и обобщения химической информации, а также для тех случаев, когда искомая структура в банке данных отсутствует, а пользователя интересуют хотя бы похожие в некотором отношении .структуры.

Соответствующие- этим операциям базовые компоненты систем манипулирования структурной химической информацией должны решать задачи идентификации структур и определения структурной родственности.

Графовое представление структуры, несмотря на все свои достоийства, обладает существенным недостатком: оно неоднозначно с точки зрения нумерации вершин графа. Так, для Ы-вершинного графа существует К - факториал способов нумерации. Т.е. возможно существование ы! внешне различных способов представления графа в памяти ЭВМ. Практически все существующие алгоритмы определения изоморфизма графов, по сути своей, переборные, т.е. в худаем случае могут требовать и! сравнений для установления изоморфизма двух различных представлений одного и того же графа..

Решением проблемы установления изоморфизма графов структурных формул является предварительное построение канонической нумерации вершин.

г

Ж

4

1

¿К

4

каноническая нумерация

Сравнение канонических представлений графов - это проверка совпадения соответствующих им кодов. Для построения канонической нумерации графов автором разработан алгоритм, базирующийся на принципах Арлазарова, Ускова и Фарадкева (1974) о канонизации графов с непомеченными вершинами и ребрами. В разработанном алгоритме при канонизации учитываются метки

а

вершин, соответствующие типам атомов и метки рЭбер, соответствующие типам связей в молекуле. Канонической считается такая нумерация вершин, которая приводит к так называемой максимальной матрице смежности, т.е. такой матрице смежности, для которой конкатенация элементов всех строк а11 а1г ...а2, • ••&„, •••апп Даёт лексикографически максимальную строку. Программа, реализующая разработанный алгоритм, использовалась для канонизации 11000 структурных формул банка данных по масс-спектрам (время канонизации 33 мин. на ЭВМ СМ-4), а также тестировалась на всех 12-вершинных кубических графах с непомеченными вершинами и рёбрами (среднее время канонизации - К2 сек. на один граф на ЭВМ ЕС-1035). В качестве побочного результата при построении канонической нумерации вершин получается информация о симметрии графа структуры, что может представлять интерес, например, для специалистов в области ИК и ЯМР - спектроскопии.

Для решения задачи определения структурной родственности химических соединений существует больное число различных подходов. Общим для большинства из них является определение родственности химических структур на основе наличия в них определённого структурного фрагмента или набора фрагментов. Именно поэтому наиболее частой процедурой отбора родственных структур из банка данных является поиск структур, содержащих заданные фрагменты. Однако использование традиционного математического определения изоморфного вложения оказывается неприемлемым с точки зрения потребностей химиков.

и— □

А В

Гак, согласно определению теории графов, фрагмент А не вкладывается в граф В, в то время как для химиков-пользователей информационными системами было бы желательно установление такого вложения. В связи с этим разработан алгоритм, осуществляющий проверку вложения фрагментов в структуру в привычном для химика понимании. Принцип работы этого алгоритма - переборный. Как следствие этого - достаточно большое время работы, например, в одной из реализаций данного алгоритма на ЕС ЭВМ для проверки вложения 7-вершинного бензильного фраг-

мента в- 31 ООО структурных формул банка данных по ЯМР-'Н спектрам органических соединений потребовалось около 30 мин. машинного времени. Тем не менее, его использование позволило решать задач;' поиска структур по произвольным фрагментам, т.е. задачи, которые практически не могут быть решены с помощью ручного поиска в базах данных, содержащих десятки тысяч соединений.

В третьей главе рассматривается предлагаемый автором новый подход к описанию структур химических соединений с помощью фрагменгных составов графов, приводится алгоритм порождения фрагментных составов графов и обсуждается возможность использования спектров фрагментных составов структур как инструмента классификации структурных формул.

Невысокая эффективность переборных алгоритмов проверки вложения фрагмента в структуру делает весьма актуальной задачу разработки алгоритмов быстрого поиска структур по фрагментам. Несколько ускоряет поиск использование фильтровых признаков, таких, например, как брутто-формулы связей, но и они не обеспечивают достаточной селективности предварительного отбора. В связи с этим, а такке для решения задач выявления связи между строением и свойствами химических соединений предложен новый способ описания структурных формул химических соединений, ориентированный на алгоритмы манипулирования фрагмеятным составом структуры. Структурная формула при этом описывается с помодыэ списков полных наборов фрагментов вплоть до заданного размера к, так называемых спектров фрагментных составов структуры. Разработанный алгоритм порождения полных фрагментных составов структуры последовательно строит из двухвершинных фрагментов - трёхвершинные и т.д. до заданного предельного размера. Генерируемые фрагменты канонизируются и им присваиваются регистрационные номера с помощью локальной регистрационной системы фрагментов. Для каждой структурной формулы строятся списки регистрационных номеров фрагментов заданного размера, содержащихся в данной структуре - спектры фрагментных составов структуры. Описанный алгоритм реализован в виде программы на языке ФОРТРАН. Среднее время разборки структуры на полные фрагментные составы от 2 до 7 - вершинных фрагментов около 9 сек. на ЭВМ ЕС-1035 (при среднем числе вершин в графах структурных фор-

мул равном 13).

Спектры фрагментами составов структур могут существенно ускорять решение таких задач химической информатики, как поиск структур по фрагментам, выявление максимальных и субмаксимальных общих структурных фрагментов, классификация структур по фрагментным составам, выявление корреляций проявляемых веществом свойств с наличием в его структуре определённых фрагментов.

При решении задач классификации структур по фрагментным составам наличие определенного фрагмента в структуре рассматривается как случайное событие с точки зрения теории вероятности. Используя разложение на фрагменты всех структур анализируемой выборки, мы можем оценить статистическую однородность выборки по всем входящим в нее фрагментам. Например, для приведенных ниже монометилзамещенных варбоцикличес-ких соединений спектр фрагментов одинаков для всех фрагментов, содержащих не более 4 вершин. Но для фрагментов с 5 вершинами уже начинаются различия. Так, во второй и третьей структурах отсутствует фрагмент СНр-(СН2)3-СН-, имеющийся в первой структуре.

О 0°" О"5

2-: СН2-СН2 3: СН„~СНР-СН2 4: СН2-СН2-СН2-СН2

сн"-сн2 сн^-сн^-сн" СНц-СНд-СНд-СН

СН -СНд СН2-СН~-СН2 СН^СН^СН -СН2

СН2~СН -СНд С^-С^-СН -СНд

СНг^-СН —СНг>

СНд

Естественно, что о степени подобия структур в рассматриваемой выборке проще всего судить по степени совпадения-спектров фрагментов с большим числом вершин, причем фрагменты могут вкладываться не во все структуры выборки. Для рассмотрения таких задач целесообразно ввести векторное описание структуры соединения на уровне п-вершинных фрагментов. Размерность вектора, описывающего структуру из данной выборки химических соединений, определяется исходя из числа раз-

личных п-вершинннх фрагментов, содержащихся во всех структурах выборки. За фрагментами закрепляются фиксированные (в пределах данной выборки структур) номера, соответствующие номерам компонент вектора. Каждая компонента принимает значение 1 или о в зависимости от того, присутствует или нет в данной ■ структуре соответствующий фрагмент. Таким образом, каждое соединение характеризуется определенным двоичным вектором, отражающим спектр присутствующих в нем п-вершинных фрагментов.

Используя описанное выше векторное представление спектра фрагментов структуры, можно строить количественные оценки расстояния между векторами, например, с помощью меры Хем-минга или аналогичных мер, применяемых в задачах группировки и распознавания образов. То есть, задача сравнения структур химических соединений, количественной оценки "расстояния" между, казалось бы, трудносопоставимыми объектами, сводится к классической з_,.. >е определения расстояния между соответствующими векторами фрагментных составов структур.

Б четвёртой главе рассматриваются приложения спектров фрагаеятных составов для организации иерархического . указателя, обеспечивающего как быстрый поиск структур по заданным фрагментам, так и выявление общих структурных фрагментов и на их основе - групп структурно родственных соединений.

Если рассмотреть набор всех фрагментов, содержащихся в нескольких структурах, то можно заметить, что он образует сеть вложений фрагментов друг в друга и в исходные структуры.

В приведённом ниже примере фрагмента сети вложений цифрами обозначены регистрационные номера фрагментов, содержащих от 2 до 7 вершин, порождённых для двух данных структур. Б качестве вершин во фрагментах использовались атомы и группы типа СН, со, СН3.

С—N И-СНз С-СН С-00 СО-Сь СН~СН

Эта сеть отражает также и историю порождения фрагментов из исходных структур. Имея такув информацию, естественно попы-

таться использовать её для быстрого поиска структур, содержащих заданные фрагменты. Если фрагмент невелик и может присутствовать в регистрационном файле фрагментов, то процедура его поиска очевидна - канонизация и проверка наличия канонического кода в регистрационном файле. Если фрагмент достаточно крупный, то сеть вложений выступает в качестве своеобразного фильтра. Для крупного фрагмента строятся полные фрагментные составы, и для исчерпыващего анализа на вложение отбираются только те структуры, в которых содержатся все компоненты искомого фрагмента.

Сразу следует отметить избыточность полной сети вложений с точки зрения поиска структур по фрагментам. Так, если некоторый двухвершинный фрагмент содержится в 8 структурах, то в этих же 8 структурах или в ещё меньшем числе структур будут содержаться и все более крупные фрагменты, в которые он вкладывается. Следовательно, нет нужды хранить все более крупные фрагменты в сети. На этом принципе строится поисковая сеть вложений фрагментов, каждый узел которой содержит регистрационный номер фрагмента, счйтчик вложений и список ссылок.

Если счётчик больше некоторого порога, то в узле приводится список ссылок на более крупные (и, скорее всего, более селективные в качестве фильтра) фрагменты. Если счйтчик меньше порогового значения, то данная вершина сети является терминальной, т.е. не содержит ссылок на более крупные фрагменты, а имеет вместо этого список номеров структур, содержащих данный фрагмент. Варьируя значение порога, можно строить поисковые сети, удовлетворяли© требованиям экономии памяти или степени селективности отбора, обеспечивая, таким образом, ослабление зависимости времени поиска от объёма базы структурных данных. Так, например, даже в случае базы дан-

ни, содержащей 1000 структур, время поиска с использованием сети вложений фрагментов сокращается по сравнению с последовательным анализом структур в 3-5 раз для крупных фрагментов и составляет около 20 сек на ЭВМ ЕС-1035.

Ещ5 одно приложение спектров фрагментаых составов структур - оценка структурной родственности и выделение групп структурно родственных соединений в выборках структур. Эта задача особенно актуальна для. изучения связи наблюдаемых свойств со структурными особенностями химических соединений. Одна из первых формулировок данной задачи - оценка структурного родства с помощью максимальных общих структурных фрагментов - основывается на переборном алгоритме, использующем идею параллельного построения и сопоставления фрагментных составов структур, начиная с двухвершинных фрагментов. Однако данный алгоритм работет недостаточно эффективно, в связи с этим разработан подход к построению максимальных общих фрагментов на основе фрагментных составов структур. Спектры фрагментных составов позволяют решать задачу выявления максимальных общих структурных фрагментов на качественно новом по эффективности уровне. Однако, опыт работы с максимальными общими фрагментами показал, что для пользователя-химика гораздо большую ценность представляют не максимальные, а субмаксимальные общие фрагменты, а иногда даже и просто общие фрагменты независимо от размера. Их построение на основе спектров фрагментных составов структур сводится к достаточно быстро работающей процедуре построения пересечений списков фрагментных составов структур анализируемой выборки. Данный подход применен к анализу структур, получаемых в качестве результатов поиска по масс-спектрам и спектрам ЯМР-1ЭС.

В конце главы приводятся некоторые характеристики выборки структур, на которой проводились эксперименты по построению фрагментных составов, а также результаты построения фрагментных составов для 986 структур, состоящих из вершин 38 типов й имеющих 5 типов связей, представленные в виде таблицы:

Размер фрагмента Все фрагм. (полные описания Без типов связей Без типов вершин БФСС качес-твенн. БФ качественная Типы связей (связев. составы) Типы голых остовов

ВСЕ 12199 Ш07 592 9020 3720 145 59

2 153 136 5 153 136 5 I

3 509 424 8 404 304 8 2

4 127В 1076 24 1160 543 13 4

5 2275 2038 61 1865 758 22 8

6 3449 3161 159" 2455 914 35 16

7 4535 4272 335 2893 1065 42 28

В заключении сформулированы основные результаты, полученные в диссертации.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Разработан и программно реализован алгоритм канонизации графов с помеченными вершинами и рёбрами, включавший предварительное разбиение вершин по их типам и типам окружающих вершин.

2. На основе анализа критериев, определяших структурную родственность химических соединений в привычном для химика понимании, разработан алгоритм проверки вложения частей химических графов. Соответствующие программы позволяют анализировать графы с вершинами, эквивалентность типов которых заранее задана.

3. Предложен новый способ описания структуры химических соединений, использупаий спектры фрагментных составов, т.е. полные наборы к-вершинных фрагментов графов структур химических соединений. Разработан и программно реализован алгоритм построения соответствующих наборов фрагментов. На мо-

дельных выборках структур продемонстрирована возможность применения спектров фрагментных составов для решения задач таксономии структур.

4. Предложена иерархическая система фильтровых признаков структур, базирующаяся на спектрах фрагментных составов. На её основе построен сетевой указатель к базе структурных формул - указатель вложений фрагментов друг в друга и в структурные формулы соединений. Показана эффективность использования системы фильтровых признаков при решении задач поиска структур, содержащих заданные фрагменты.

5. Разработан алгоритм и соответствующие программы выделения групп структурно родственных соединений, включая выявление максимальных структурных фрагментов для гыборок структур. Перспективность использования программ данного типа продемонстрирована на примере анализа соединений, отбираемых по предъявленному спектру информационно-поисковой системой по масс-спектрометрш.

ОСНОВНЫЕ РАБОТЫ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Пиоттух-Пелецкий В.Н. Программа установления изоморфизма и изоморфного вложения неориентированных графов с помеченными вершинами // Сборник аннотаций программ для молекулярной спектроскопии. - Новосибирск, 1977. - С.148-149.

2. Пиоттух-Пелецкий В.Н., Подгорная И.И., Смирнов В.И., Ба-лакина Г.Г., Коптюг В.А. Поисковая система по структурам и структурным фрагментам химических соединений //Известия СО АН СССР сер. химич., - 1976г. - Вып. 5. - С.134-142.

3. Пиоттух-Пелецкий В.Н. Программа выделения максимальных связных фрагментов, содержащихся в двух структурных формулах //Сборник аннотаций программ для молекулярной спектроскопии. - Новосибирск, 1977. - С.149-150.

Торопов О.В., Пиоттух-Пелецкий В.Н. Построение "графа общих частей" для идентификации соединений по спектральным характеристикам // Тезисы докладов 6-й Всесоюзной конференции "Использование ЭВМ в спектроскопии молекул и химических исследованиях". - Новосибирск, 1933. С, 172-173.

. Пиоттух-Пелецкий В.Н. Проблема структурного подобия в

задачах идентификации органических соединений и других задачах органической химии// Тезисы докладов 6-й Всесоюзной конференции "Использование ЭВМ в спектроскопии молекул и химических исследованиях". - Новосибирск,. 1S83. -С.90-91 ..'.V

6. Коптюг В. А., Пиоттух-Пелецкий В.Н., Смирнов В.И. Новые программные средства хранения и обработки структурных данных // Тезисы докладов 8н& Всесоюзной конференции "Ис-

. пользование вычислительных машин в спектроскопии молекул и химических исследованиях". - Новосибирск, 1989.: -

' С. 137-138.

7. Пиоттух-Пелецкий В.Н., Румянцев А.К., Смирнов В.И. Спектр фрагментов графа - новый способ эффективного описания структур химических соединений //Тезисы докладов 8-й Всесоюзной конференции "Использование ЭВМ в спектроскопии молекул и химических исследованиях". - Новосибирск, 1989. -С. 160-161.

8. Пиоттух-Пелеший В.Н.. Румянцев А.К., Смирнов В.И. Поиск структур по фрагментам на основе базы данных о фрагмент-ных составах // Тезисы докладов 8-й Всесоюзной конференции "Использование ЭВМ в спектроскопии молекул и химических исследованиях", - Новосибирск, 1989. - С.162-163.