автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Системный анализ и адаптивное моделирование сложных химических объектов

доктора физико-математических наук
Туров, Юрий Прокопьевич
город
Сургут
год
2013
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Системный анализ и адаптивное моделирование сложных химических объектов»

Автореферат диссертации по теме "Системный анализ и адаптивное моделирование сложных химических объектов"

На правах рукописи

Туров Юрий Прокопьевич

СИСТЕМНЫЙ АНАЛИЗ И АДАПТИВНОЕ МОДЕЛИРОВАНИЕ СЛОЖНЫХ ХИМИЧЕСКИХ ОБЪЕКТОВ

05.13.01 - Системный анализ, управление и обработка информации

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

1 о ЛПР ¿013

Сургут-2013

005052251

Работа выполнена в Сургутском государственном университете и Институте химии нефти СО РАН

Научный консультант - доктор химических наук профессор

Унгер Феликс Гергардович

Официальные оппоненты - доктор физико-математических наук

профессор Галль Лидия Николаевна

- доктор физико-математических наук Померанцев Алексей Леонидович

- доктор физико-математических наук Ельников Андрей Владимирович

Ведущая организация - Институт мониторинга климатических

и экологических систем СО РАН

Защита состоится 20 апреля 2013 г. в 10 час на заседании Диссертационного Совета Д 800.005.06 при Сургутском государственном университете по адресу: 628412, Сургут, просп. Ленина, 1, ауд. 346.

С диссертацией можно ознакомиться в библиотеке Сургутского государственного университета по адресу: 628412, Сургут, просп. Ленина, 1.

Автореферат разослан « марта 2013 г.

Отзыв на автореферат в двух экземплярах, заверенных печатью организации, просим направлять по вышеуказанному адресу на имя ученого секретаря Диссертационного Совета.

Ученый секретарь

Диссертационного Совета Д 800.005.06 ¡¡Q Л___„

канд. технич. наук Q/<yt&ZcJ^ef B.C. Микшина

Общая характеристика работы

Актуальность проблемы. Системный анализ как связующее звено в решении самых разнообразных междисциплинарных задач находит все большее распространение. Системный анализ позволяет также реализовать непосредственный контакт и стыковку принципов различных конкретных наук, открывая новые возможности решения наддисциплинар-ных проблем.

Установление состава сложных химических объектов, строения веществ и материалов является примером междисциплинарной задачи, и лежит в основе регулирования технологических процессов, определения цены товаров при коммерческих сделках, идентификации источников загрязнения окружающей среды, криминалистической экспертизы и играет важную роль в других областях человеческой деятельности.

Обеспечить надежность, правильность и низкие погрешности результатов при решении таких задач чрезвычайно важно, поскольку ошибки обходятся дорого и могут вызвать разнообразные тяжелые последствия: утрату позиций на рынке, прямые и косвенные экономические потери, а также социальные и даже политические последствия, что особенно характерно для рынка нефти и нефтепродуктов.

Решение таких комплексных задач распадается на два этапа: получение набора исходных характеристик объекта (значений аналитических признаков), а затем математическую обработку полученных данных.

Количественная связь исходных характеристик с исследуемыми свойствами объекта по своей сути является его математической моделью, параметры которой чаще всего устанавливаются заранее с использованием обучающих процедур.

Качество конечных результатов, получаемых на основе используемой модели, определяется множеством не всегда поддающихся непосредственному контролю факторов. Наиболее значимым источником погрешностей является неполное соответствие качественного состава реальных образцов модельным, включенным в обучающую выборку, на основе которой были разработаны и аттестованы методики анализа. Решению этой проблемы путем более полного физического моделирования за счет увеличения числа модельных смесей в обучающей выборке препятствует широкая вариабельность состава природных объектов и ограниченный набор стандартов - трудно физически моделировать материальную систему, компонентный состав которой априори не определен.

Значимый вклад в снижение качества результатов могут вносить погрешности определения аналитических сигналов за счет неконтролируемых вариаций технического состояния и настроек приборов. Кроме того, разработчики новых поколений аппаратуры с микропроцессорным

и компьютерным управлением, стремясь защитить свои программные продукты от неквалифицированного доступа, часто ограничивают функции оператора только лишь регистрацией полученных данных, оставляя функции контроля качества работы аппаратуры фирменным сервисным службам. Поэтому не проявляющие себя явно отклонения от штатных режимов работы отдельных узлов автоматизированной аппаратуры могут долгое время служить источником дополнительных погрешностей.

Поэтому значительная часть результатов, получаемых с использованием методик, аттестованных на модельных обучающих выборках, содержит погрешности, которые не могут быть обнаружены обычными приемами внутрилабораторного контроля качества.

Поэтому разработка адаптивной методологии к исследованию сложных химических объектов, не требующей предварительного обучения, основанной на математической обработке и интерпретации многомерных экспериментальных данных, получаемых при исследовании конкретного объекта, а также разработка алгоритмов и программ для решения этих задач, с использованием системных подходов к анализу экспериментальной информации, является актуальной.

Работа посвящена системному анализу данных с применением адаптивных моделей состава, математическим методам обработки многомерной информации и рассмотрению физических процессов, лежащих в основе формирования аналитических сигналов при использовании аппаратуры с многоканальными детекторами в исследовании сложных химических объектов.

Состояние вопроса. Математическая обработка экспериментальных данных является заключительным этапом работы и непосредственно определяет успешность решения задач при исследовании сложных химических объектов. В ее основу положены формализованные представления о связи исходных аналитических характеристик (аналитических признаков) исследуемого образца с его составом и свойствами. Эта количественная связь фактически является математической моделью исследуемой системы — анализируемого объекта. Степень адекватности используемых моделей в значительной степени предопределяет успешность всей работы в целом и корректность получаемых результатов, чем обусловлена определяющая роль выбора моделей при разработке методик анализа и установлении состава.

Существует два класса расчетных методик - детерминированные и адаптивные. Рассмотрение детерминированных и адаптивных подходов как альтернативных на этапе формирования моделей в данном случае имеет кибернетические корни. Детерминированный вариант жестко предопределяет структуру модели до получения входной информации, и алгоритм получения результата на выходе остается неизменным и неза-

висимым от изменений на входе. Адаптивный подход приспосабливается к изменяющимся входным условиям и обеспечивает соответствующие изменения модели путём поиска оптимальной настройки ее параметров. В качестве критерия оптимальности в исследовании сложных химических объектов чаще всего используют метрологические характеристики и качество получаемых результатов.

Методики на основе детерминированных моделей прекрасно работают при анализе объектов, вариации состава которых ограничиваются изменением количественных соотношений между компонентами, например, в контроле установившихся технологических процессов. Много-компонентность и широкая вариабельность состава природных систем, их лабильность под воздействием внешних факторов, создает трудности физического их моделирования, являющегося основой детерминированного подхода при формировании обучающей выборки, приводит к низкой эффективности применения детерминированных методик при их использовании, к увеличению погрешностей или даже к получению некорректных результатов. Однако до сих пор детерминированные подходы в химии являются преобладающими.

Особенно остра данная проблема при исследовании нефтяных систем и при изучении их поведения под воздействием природно-климатических факторов и в процессах технологической переработки.

Реализация адаптивных подходов стала развиваться возможной с появлением аппаратуры с многоканальными детекторами (диодные матрицы, быстро сканирующие масс- и ИК-Фурье спектрометры). Чаще всего это приборы комбинированного дизайна, включающие хроматографи-ческие блоки для разделения сложных химических объектов на составляющие. При этом появляется возможность проверить адекватность рабочих математических моделей, полученных на обучающих выборках, исследуемым объектам. Это создает предпосылки для использования в исследовании сложных химических объектов хорошо отработанных алгоритмов и многомерных математических процедур для более полного извлечения из экспериментальных данных содержащейся в них информации. Эффективность таких подходов привела к появлению даже самостоятельного раздела науки на стыке химии и математики - хемометри-ки. Однако многочисленные хемометрические публикации в приложении к обсуждаемым задачам носят характер решения лишь частных проблем.

Цель работы - создание методологии для формирования новых и совершенствования существующих методик исследования смесевых образцов и повышения достоверности получаемых результатов за счет адаптивного моделирования сложных химических объектов без использования процедур обучения на основе системного анализа экспериментальных данных и физических процессов, лежащих в основе формирова-

ния аналитических сигналов при использовании аппаратуры с многоканальными детекторами.

Достижение цели осуществлено путем решения комплекса задач, включающего:

- разработку на основе приемов системного анализа общей методологии для создания методик исследования сложных химических объектов путем построения моделей состава, адаптируемых к результатам конкретных аналитических экспериментов при использовании аппаратуры с многоканальными детекторами;

- разработку общих принципов адаптации моделей состава на основе фактической информации о характеристиках исследуемого объекта или набора родственных образцов при отсутствии чистых эталонов для обучения;

- разработку алгоритмов и процедур для оценки диапазона линейности аналитического отклика многоканальных детекторов, обнаружения нелинейностей в наборах данных и корректировки сигналов в случае обнаруженной нелинейности;

- создание методик для исследования не полностью разделенных хроматографических пиков, выделения спектров чистых компонент из спектров смесей, восстановления профилей элюирования компонент при перекрывании хроматографических пиков, обнаружения пиков малой интенсивности в хроматографии с многоканальными детекторами;

- исследование группового и индивидуального состава нефтяных фракций, образцов нефтяного и общего органического загрязнения окружающей среды, и изменение состава нефтяных систем под воздействием природных и технологических факторов.

Объекты и методы исследования: Объектами исследования являлись образцы многокомпонентных смесей органических соединений -сырых нефтей и их фракций, товарных нефтепродуктов, продуктов деградации нефтяных систем в природных и модельных условиях, геологических объектов, органических загрязняющих веществ и примесей в компонентах природной среды и других многокомпонентных систем.

Методы исследования: масс-спектрометрия, хроматомасс-спектрометрия, спектрофотометрия инфракрасного, видимого и ультрафиолетового диапазонов спектра, хроматография, элементный анализ. Методы и средства системного анализа использовались при обработке экспериментальной информации. Вычисления проводились в программной среде МАТЬАВ.

На защиту выносятся:

1. Методология создания методик качественного и количественного анализа сложных химических объектов на основе адаптивных математических моделей состава при многоканальном детектировании аналити-

ческих сигналов. Методология позволяет определять реальную размерность модели, минимизирующую величину остаточной дисперсии в данных, с учетом величины погрешностей, свойств исследуемой материальной системы и влияния на нее аналитической аппаратуры.

2. Алгоритм построения модели материального состава смесей из фиксированного числа компонентов без использования процедур обучения, позволяющий определить ее параметры - размерность (число компонентов), характеристики элементов (спектры компонентов) и соотношения между элементами (содержания компонентов) на основе взаимно однозначной связи концентрационного и признакового симплексов сме-севых образцов.

3. Модель гомологического состава отдельных классов нефтяных соединений и состава нефтяной системы в целом, в рамках которой относительные содержания гомологов внутри класса описываются однопа-раметрическим распределением Пуассона, а состав нефтяной системы в целом - суперпозицией распределений Пуассона гомологов образующих ее классов соединений.

4. Алгоритм и программа для регуляризации решения задачи абстрактного факторного анализа при обработке наборов многомерных данных методами линейного программирования для целенаправленного преобразования с целью получения результатов в физически интерпретируемых терминах, дающих возможность их смысловой интерпретации (спектры и содержания компонентов).

5. Модели динамических материальных систем при исследовании сложных химических объектов и аналитические методики, созданные на основе системного подхода к обработке экспериментальных данных:

- методика масс-спектрометрического анализа группового состава нефтяных фракций с использованием программированного прямого ввода образца и моделированием гомологического состава суперпозицией нескольких распределений Пуассона;

- методика селективного хроматомасс-спектрального детектирования гомологов и изомеров различных классов соединений в многокомпонентных смесях путем реконструкции хроматограммы по значению функционала, представляющего собой комбинацию интенсивностей ионных пиков с различными значениями отношения массы к заряду m/z, которая учитывает индивидуальные и групповые особенности масс-спектров соответствующих соединений;

- методика разложения перекрывающихся хроматографических пиков на составляющие и обнаружения пиков малой интенсивности минорных компонентов при многоканальном детектировании сигнала;

- методика проверки реального динамического диапазона и линейности отклика аналитического прибора концентрациям аналитов при многоканальном детектировании сигналов;

- способ оценки соответствия характеристик исследуемого объекта математической модели, заложенной в основу расчетной методики.

Достоверность защищаемых положений и результатов, выводов и рекомендаций основана на большом объеме экспериментального материала по изучению состава образцов различного состава и происхождения, комплексном использовании различных методов исследования, подтверждена проверкой предложенных алгоритмов и процедур на математических моделях и численных экспериментах, обеспечивается корректным использованием применяемого математического аппарата, подтверждается имеющимися в литературе данными других исследователей.

Научная новизна работы:

1. Впервые в рамках единого недетерминированного методологического подхода предложен алгоритм создания адаптивных математических моделей материального состава объектов, не предусматривающий процедуры обучения. Алгоритм основан на постадийной оптимизации модели в процессе обработки экспериментальных данных. Адаптируемыми параметрами являются размерность модели, аналитические характеристики компонентов и величина остаточной дисперсии в системе наблюдений, не участвующая в построении линейной модели и связанная с погрешностями и шумами в обрабатываемых данных (защищаемое положение 1).

2. Впервые предложена модель взаимно однозначной связи концентрационного симплекса состава смесевых образцов из фиксированного числа компонентов и области пространства описаний характеристик этих объектов — «признакового» симплекса. Признаковый симплекс рассматривается как область многомерного пространства исходных описаний, внутри и на границах которой лежат точки, соответствующие всем теоретически возможным значениям интенсивностей аналитических признаков смесевых образцов (защищаемое положение 2).

3. Впервые доказано, что распределение содержаний гомологов внутри класса для нативных нефтяных соединений на уровне доверительной вероятности 0.99 по критерию Пирсона /2 может быть описано однопараметрическим распределением Пуассона. Дискретность распределения Пуассона отвечает физическому смыслу модели, его однопара-метричность снижает требования к минимальному объему выборки для построения модели (защищаемое положение 3).

4. Предложен новый метод целенаправленного преобразования решения задачи абстрактного факторного анализа для получения резуль-

татов в физически интерпретируемых терминах — содержания компонентов и спектры их характеристик. Метод основан на использовании модели взаимно однозначной связи концентрационного и признакового симплексов и итеративных процедур линейного программирования (защищаемое положение 4).

5. Впервые на основе применения динамических моделей состава смесевых образцов предложены методики анализа сложных материальных объектов, свободные от каких-либо априорных ограничений и предположений о характеристиках их элементов, а также не требующие их предварительного физического моделирования:

- число и характеристики молекулярно-массовых распределений при групповом анализе нефтяных фракций определяются непосредственно в процессе и по результатам анализа конкретного образца;

- модифицированный метод селективного ионного детектирования позволяет дифференцировать изомеры и сопоставлять изомерный состав объектов даже без идентификации веществ, снимая часть существующих ограничений на возможность масс-спектрального различения изомеров;

- впервые предложен метод разложения не разделенных хромато-графических пиков на составляющие без постулирования формы профилей элюирования компонентов и без требований наличия в их масс-спектрах свободных от наложения ионных пиков;

- предложенный метод анализа аппаратного отклика прибора позволяет обнаружить его конструктивные ограничения и недостатки без физических процедур поверки функций отдельных узлов и блоков аппаратуры, часто недоступных пользователю (защищаемое положение 5).

6. Впервые предложен способ оценки соответствия характеристик исследуемого образца математической модели, положенной в основу методики расчета его состава.

Практическая значимость работы. Практические результаты работы выразились в создании адаптивных методик для: анализа нефтяных фракций и нефтяной системы как целого без использования эталонов; анализа состава органических загрязняющих веществ в компонентах окружающей среды; анализа деградации нефтяной системы под воздействием природно-климатических факторов и в технологических процессах. Принципы системного подхода при создании этих методик позволили получить информацию о материальном составе и свойствах перечисленных классов образцов без привлечения априорных ограничений на их характеристики. Предложен и используется химический маркер и способ скрытого маркирования изделий специального назначения, имеющих в своем составе нефтепродукты. Обоснована необходимость пересмотра оценок территории респ. Хакасия на нефтегазоносность.

Личное участие автора в получении научных результатов,

опубликованных в соавторстве, заключается в постановке проблем и задач исследования, получении большей части экспериментальных данных и обработке результатов спектрофотометрических, масс- и хроматомасс-спектрометрических исследований, разработке алгоритмов и подготовке компьютерных программ, обработке и обсуждении результатов, формулировании и обосновании выводов и рекомендаций.

Часть материалов диссертации вошла в отчетные документы плановых НИР Института химии нефти СО РАН, имеющих государственную регистрацию, ФЦП «Интеграция» и программы «СИБИРЬ», соисполнителем которых являлся автор.

Апробация работы. Результаты работы были представлены на более чем 50 Всероссийских и международных конференциях и симпозиумах, в том числе: Всес. конф. «Математические методы и ЭВМ в аналитической химии» (Москва, 1986г); Всеросс. конф. «Аналитика Сибири и Дальнего Востока» (Томск, 1993, Новосибирск, 2004гг); XIX European Congr. on Molec. Spectrosc. (EUCMOS-X1X, Germany, Dresden, 1989); The 1st Intern.l Conf. on Demilitarization Ecology in Central & Eastern Europe & the Former Soviet Union "DEMECO'97", Miskolc-Lillafured, Hungary, 1997; 18th, 20th, 21st Intern. Meetings on Organic Geochemistry IMOG-1997 (Maastricht, Netherlands), IMOG-2001 (Nancy, France), IMOG-2003 (Krakow, Poland); 17th Intern. Symp. on Polycyclic Aromatic Compounds, Bordeaux, France, 1999; 2nd Black Sea Basin Conf. on Analyt. Chem., Istanbul, Turkey, 2003; Intern. Symp. on Computer Applications and Chemomet-rics in Analyt. Chem. SCAC-2004, Lake Balaton, Hungary, 2004; Intern. Conf. on Natural Products and Physiologically Active Substances ICNPAS-2004, Novosibirsk, Russia, 2004; Intern. Congr. on Analytical Sciences ICAS-2006, Moscow, Russia, 2006; 3 Всеросс. конф. «Аналитические приборы». - СПб., 2008; Всеросс. конф. «Химический анализ». - М., 2008; 3 и 4 Всеросс. конф. с междунар. участием «Масс-спектрометрия и ее прикл. проблемы». - М., 2009, 2011гг; Межд. конф. Актуальные проблемы химии природных соединений. - Ташкент, 2010; Всеросс. конф. по анали-тич. спектроск. - Краснодар, 2012.

Основные результаты изложены более чем в 100 научных публикациях, из них 30 - в журналах из списка ВАК.

Объем и структура работы. Диссертация состоит из введения, 6 глав, выводов и списка литературы, включает 24 таблицы, 55 рисунков, 276 литературных ссылок. Объем диссертации 240 стр.

Содержание работы

Во введении обосновывается актуальность темы диссертационной работы, определяются цель и задачи исследования, научная новизна и практическая значимость работы. Приводятся положения, выносимые на

защиту, общие сведения о структуре и объеме диссертации, о публикациях по теме диссертации, отмечен личный вклад автора и апробация результатов исследований.

В первой главе рассмотрены наиболее общие принципы и алгоритмы обработки данных при исследовании сложных химических объектов. Формализм сведен к рассмотрению принципов построения соответствующих математических моделей исследуемых материальных систем, реализуемых на практике в виде методик получения аналитических сигналов и расчетных процедур их обработки.

Обоснована целесообразность системного подхода к процедурам установления материального состава сложных химических объектов и рассмотрены принципы формирования математических моделей, связывающих экспериментальные характеристики объекта с его материальным составом как на качественном, так и на количественном уровнях. Первый - детерминированный - основан на процедурах обучения и априори жестко регламентирует структуру модели и характеристики ее элементов -качественный (компонентный) состав образцов, аналитические характеристики компонентов и допустимый уровень погрешностей в данных. Значения всех этих параметров расчетной методики определяют на этапе ее разработки и аттестации, и в дальнейшем при ее использовании их ревизии не допускают. Второй подход - адаптивный, основан на подборе хотя бы некоторых параметров модели и расчетных методик с учетом конкретных характеристик исследуемого образца, получаемых непосредственно в процессе его анализа. Сформулированы некоторые частные задачи, решение которых может повысить эффективность аналитических процедур и улучшить метрологические характеристики результатов.

Обобщение приемов обработки информации при исследовании сложных химических объектов позволяет рассматривать их как решение основной задачи системного анализа - формирование модели материальной системы и характеристик ее элементов и проверка ее адекватности.

Во второй главе рассмотрены вопросы получения исходной информации для установления и описания структуры сложных химических объектов по данным отклика аналитической аппаратуры в результате взаимодействия ее с образцом. Детально обсужден первый этап исследования - получение отклика аналитической системы, некоторые проблемы детектирования и первичной обработки аналитических сигналов.

При многоканальном детектировании в результате единственного эксперимента получают многомерный образ (вектор), состоящий из набора характеристик исследуемого образца. Приборный отклик - интенсивность сигнала детектора — связывается в дальнейшем с составом исследуемого объекта уравнениями, которые можно рассматривать как ма-

тематические модели аналитического процесса или, во всяком случае, финальной его стадии.

Параметры этой модели, в том числе интервал линейности приборного отклика (т.е. диапазон работоспособности модели) определяют на этапе поверки и калибровки прибора с использованием наборов стандартных образцов или их имитаторов. Однако вопросы соответствия использованного набора стандартов характеристикам реальных образцов остаются вне зоны внимания разработчиков аппаратуры, а оператор вынужден использовать полученные вместе с компьютеризированным прибором базовые характеристики как абсолютные. Такая ситуация может служить источником неконтролируемых погрешностей и требует разработки мер по их обнаружению и возможной компенсации.

На рис. 1 представлены результаты численного эксперимента, который иллюстрирует искажения масс-спектра, формы и площади пика на хроматограмме в случае превышении интенсивности сигнала детектора верхней границы пропускания канала регистрации прибора. Если этот канал пропускает без искажений сигнал интенсивностью до 5,0 усл. ед., когда ни одно из значений i(m/z)j не превышает этой границы (рис. 1, вверху слева), полный ионный ток масс-спектрометра адекватно отслеживает профиль элюирования однокомпонентного хроматографического пика. При ограничении максимальной пропускной способности канала регистрации интенсивностью сигнала в 1,0 усл. ед., вследствие этого ограничения в тех же условиях как сами масс-спектры (рис. 1, вверху справа), так и профиль элюирования хроматографического пика (рис. 1, внизу) будут искажены.

В основу алгоритма обнаружения таких искажений положен анализ обусловленности (эффективного ранга) матрицы экспериментальных данных при регистрации эволюционирующих сигналов с применением многоканальных детекторов - в различных видах хроматографии, в масс-спектрометрии с нестабилизированными во времени режимами испарения образца в источник ионов. Матрица формируется из последовательности экспериментальных спектров, полученных в процессе анализа.

Ухудшение обусловленности матрицы (обнаруживаемое анализом последовательности ее сингулярных значений) будет наблюдаться при наличии рассмотренных искажений, и сигнализировать о необходимости коррекции данных. Для этого сначала обнаруживают и удаляют из матрицы данных аналитические признаки, увеличивающие число ее обусловленности, а затем вносят поправки для компенсации искажений. При корректировке таких искажений в масс-спектрометрии предложено использовать интенсивности тех ионных токов i(m/z)k, которые в процессе элюирования вещества на рассматриваемом участке хроматограммы не достигают пороговых значений канала регистрации i(rn/z)max.

50 -| Imex = 5,0 / / ......'-rnex~ ,0

1 ii, .1 1; ,i -

-jL-Jll !. 1 Ii

r t- t- г t" t-

канала регистрации интенсивности ионного тока масс-спектрапьного

детектора

Компенсация искажений хроматографического пика (его высоты и площади) производится путем деления соответствующих его величин, рассчитанных по усеченным масс-спектрам, содержащим только лишь те ионные пики, которые не достигают предела пропускания канала, на их долю ß в полном ионном токе масс-спектра вещества:

I = Iyc/ß

Определить эту долю можно по спектрам, снятым на начальных и конечных участках хроматографического пика, когда еще ни один ионный пик в масс-спектре не достиг порогового значения. В результате интенсивность усеченного хроматографического сигнала масс-спектрального детектора /,.с представляет сумму лишь «незашкаленных» ионных токов:

Iyc = Z i(nt/z)k, к

где i(m/z)k~ интенсивность Ä-ro ионного пика с массовым числом (m/z)к , к = 1, 2, ... , L; L - число ионных пиков в масс-спектре с интенсивностью i(m/z)ii < i(m/z)max , L < N; j > к; j = 1, 2,... , N; N - общее число ионных пиков в масс-спектре, I - полный (не усеченный) ионный ток масс-спектрального детектора.

р =1ус/1 = 1 ¡(т/г)к / Е ¡(т/г);

к

1

При снижении диапазона пропускания канала регистрации от 5.0 усл. ед. (неискаженный сигнал) до 3.0 и 1.0, количество значимых сингулярных значений (при восстановлении 99,99% суммарной дисперсии матрицы наблюдений) равнялось 1,3 и 6, а числа обусловленности - 1, 105 и 1145 соответственно. При решении модельных задач удавалось скомпенсировать погрешности определения площади пика, достигавшие 50 % отн.

Применение аналогичных приемов к многоканальному фотометрическому детектору (диодной матрице) позволяет обнаруживать наличие нелинейности отклика, обусловленные неоднородностями свойств материала полупроводниковой матрицы, и проводить хотя бы частичную корректировку результатов фотометрических исследований.

В третьей главе обсуждается модель взаимно однозначной связи концентрационного и признакового симплексов, применимая для любых смесевых образцов с фиксированным числом компонентов.

При исследовании сложных химических объектов регистрируют набор косвенных признаков, опосредованно связанных с составом исследуемого материала, которые с помощью математических моделей и расчетных процедур связывают с содержанием компонентов. Поэтому любую аналитическую методику можно рассматривать как моделирование материального состава образца с помощью доступного набора косвенных экспериментальных характеристик. Расчетные процедуры, связывающие интенсивности наблюдаемых аналитических признаков с материальным составом образца, по своей сути являются математическими моделями исследуемого объекта.

Для аддитивных смесей значения характеристик смесевого образца представляют собой суперпозицию значений соответствующих признаков компонентов. Если Аа - интенсивность /-го признака в наборе (спектре) характеристик А-го компонента, ск - концентрация (мольная доля) к-го компонента в смеси из Ь компонентов, то интенсивность /-го признака в спектре любой смеси лг,-:

ь

*=1 , / = 1,2,..., N. к = 1,2,..., ¿. (1)

Для набора нескольких М смесей соответственно будем иметь £

Ху = Е КСщ

У = 1>2,..., М,

(2)

или в матричной форме

Х = ЯС, (3)

где Ху - интенсивность /'-го признака в спектре у'-й смеси, X = - матрица спектров смесей, С = {с^ - матрица мольных долей (концентраций) компонентов в смесях, Н = {Н^ - матрица спектров компонентов. В общем случае расчет состава смесей осуществляют по

С = (НТН)'НТХ = РХ, (4)

где Р = (НТН) 'НТ - псевдообратная к Н матрица. Для элементов Хф //,* и Сц можно ввести набор граничных и нормирующих условий:

()<х,;,Ехц = О,

I

0<йЛ,ГА,* = 0,

(5)

О <ск],Е ск, = о, к

что соответствует неотрицательности аналитических признаков и концентраций компонентов смесей.

Если сопоставить набору признаков у-й смеси {Ху} точку в исходном Л-мерном признаковом пространстве, то множество М точек, отвечающих условиям первой строки в системе (5), будут принадлежать в № мерном пространстве фигуре, именуемой в математике симплексом. В соответствии с определением размерность «признакового» симплекса будет зависеть от числа компонентов Ь в смесях и будет равной Ь-1. В соответствии с (2) и (5) этому же симплексу будут принадлежать все {/«,*}, образуя его подмножество (вершины симплекса). Множество принадлежит «концентрационному» симплексу такой же размерности 1, но уже в другом, «концентрационном» координатном пространстве размерности Ь, где осями координат являются содержания (мольные доли) компонентов в смесях.

Графическая иллюстрация простейших симплексов приведена на рис. 2 для примеров численного эксперимента, где в качестве аналитических признаков выступают содержания элементов в составе компонентов и их смесей (табл.1).

Характеристики любых двухкомпонентных смесей должны принадлежать одномерным симплексам как в признаковом, так и в концентрационном пространствах. Так как одномерный симплекс представляет собой отрезок прямой, все точки при графическом изображении свойств (рис. 2, а) и состава (рис. 2, б) двухкомпонентных смесей лежат на отрезках прямых.

Концентрационный симплекс трехкомпонентных смесей является двумерным и представляет собой равносторонний треугольник (рис. 2 в).

Таблица 1

Элементный состав двух- и трехкомпонентных смесей (антрацен С14Н10, дибензотиофен С12Н85 и карбазол СпНцК, численный эксперимент)_

Мольные доли веществ в образце | Элементный состав, %

Двухкомпонентные смеси

Антрацен Карбазол С Н N

1 1,000 0,000 94,380 5,620 0,000

2 0,923 0,077 93,753 5,602 0,645

3 0,875 0,125 93,361 5,591 1,048

4 0,833 0,167 93,022 5,582 1,397

5 0,750 0,250 92,343 5,563 2,095

6 0,667 0,333 91,663 5,543 2,793

7 0,600 0,400 91,120 5,528 3,352

8 0,500 0,500 90,305 5,505 4,190

9 0,400 0,600 89,490 5,482 5,028

10 0,333 0,667 88,947 5,467 5,587

11 0,250 0,750 88,268 5,448 6,285

12 0,200 0,800 87,860 5,436 6,704

13 0,125 0,875 87,249 5,419 7,333

14 0,077 0,923 86,857 5,408 7,735

15 0,000 1,000 86,230 5,390 8,380

Трехкомпонентные смеси

Антрацен Дибензотиофен Карбазол С Н 8 N

1 1,000 0,000 0,000 94,380 5,620 0,000 0,000

2 0,000 1,000 0,000 78,260 4,350 17,390 0,000

3 0,000 0,000 1,000 86,230 5.390 0,000 8,380

4 0,500 0,500 0,000 86.320 4,985 8,695 0,000

5 0,000 0,500 0,500 82,245 4,870 8,695 4,190

6 0,500 0,000 0,500 90,305 5,505 0,000 4,190

7 0,333 0,333 0,333 86,290 5,120 5,797 2,793

8 0,500 0,250 0,250 88,313 5,245 4,348 2,095

9 0,250 0,500 0,250 84,283 4,928 8,695 2,095

10 0,250 0,250 0,500 86,275 5,188 4,348 4,190

11 0,600 0,200 0,200 89,526 5,320 3,478 1,676

12 0,200 0,600 0,200 83,078 4,812 10,434 1,676

13 0,200 0,200 0.600 86,266 5.228 3,478 5,028

14 0,167 0,333 0,500 84,932 5,082 5,797 4,190

15 0,500 0,167 0,333 88,977 5,332 2,898 2,793

16 0,333 0,500 0,167 84,962 4,947 8,695 1,397

Поскольку элементный состав трехкомпонентных смесей характеризуется четырьмя признаками (содержаниями элементов С, Н, N и Б), таковой же будет требуемая размерность признакового пространства. Вследствие невозможности графического представления четырехмерного изображения, на рис. 3 приведены проекции этого симплекса в трехмерные подпространства соответствующих сочетаний элементов, на ко-

торых все точки принадлежат двумерным симплексам - лежат на границах и внутри областей пространства, ограниченных треугольниками. При этом точки, соответствующие чистым компонентам являются вершинами, бинарные смеси - образуют ребра симплекса, а трехкомпонентные заполняют его внутреннюю область. Для четырехкомпонентных смесей симплексы будут представлять тетраэдры и т.д.

Рис. 2. Симплексы двух-компонентных смесей карба-зола и антрацена (а — «признаковый» в трехмерном пространстве содержаний элементов С, Н и N , б - «концентрационный» в двухмерном пространстве мольных долей) и концентрационный симплекс трехкомпонентных смесей из карбазола, антрацена и дибензотиофена (в). Для любой 1-й точки (Ь-1)-мерного концентрационного симплекса справедливо С1(г) + С2(1) +...+ СЬф = 1.

В качестве координат признакового пространства могут выступать любые аналитические характеристики - интенсивности ионных пиков в масс-спектрометрии, оптические плотности в абсорбционной спектроскопии и т.п.

Таким образом, решение любой задачи анализа состава смесей можно рассматривать как установление взаимно однозначного соответствия между точками, принадлежащими этим двум симплексам - концентрационному и признаковому, а процедуры расчета содержаний ком-

понентов в смесях - как соответствующее преобразование координат.

Ы.'А

Рис. 3. Проекции точек, соответствующих трехкомпонентным смесям, из четырехмерного CHSN пространства в трехмерные координатные подпространства признаков, где оси координат представляют собой сочетания (из четырех химических элементов по три) содержаний элементов в смесевых образцах.

В четвертой главе обсуждается общая методология исследования сложных химических объектов, построенная на адаптивных принципах. При использовании готовых аналитических методик она предусматривает проверку адекватности математической модели состава поведению и характеристикам анализируемого образца или серии образцов в рамках конкретных аналитических процедур. В основу методологии положено использование модели взаимно однозначной связи концентрационного и признакового симплексов и математического аппарата факторного анализа (ФА) для построения оптимального ортогонального базиса на основе экспериментальных данных аналитического исследования. Так как в основе математического аппарата ФА лежат методы построения новой ортогональной системы координат для более компактного представления и описания результатов наблюдения, этот подход предлагается использовать при исследовании сложных химических объектов.

В основе теории ФА лежит понятие о базисной структуре или сингулярном разложении произвольной прямоугольной матрицы (теорема Эккарта-Янга). Если X - произвольная прямоугольная вещественная матрица экспериментальных данных размерности <!УхМ, и если К - ранг

матрицы X, то теорема о базисной структуре или сингулярном разложении утверждает, что для любой матрицы X всегда найдутся такие матричные элементы V, Г и 17, что

Х=угит, (6)

где V- матрица размерности NxK, столбцы которой ортонормированы, V - матрица размерности МхК с ортонормированными столбцами, Г -диаго-нальная матрица порядка К, диагональные элементы которой }>/, у2 ,..., ук называются сингулярными значениями матрицы X.

Из (6) можно получить

У = ХиГ* . (7)

Соотношение (7) определяет преобразование матрицы X из исходного евклидова Д'-мерного пространства в другое, /¡Г-мерное евклидово пространство; при этом М точек матрицы X из исходного пространства проектируются в новое А"-мерное ортогональное пространство. Матрица V определяет координаты этих М точек в новом базисе, а матрица 11Г1 определяет преобразование координат. Таким образом, в факторном анализе решается задача, аналогичная задаче установления состава смесей в аналитической химии — определяется ортогональный базис пространства минимальной размерности (аналог концентрационной системы координат), куда проецируются точки исходной матрицы (спектры смесей).

Вводя обозначения F = КГ ,А = ит, можно записать:

Х=ЕА+Е~ ЕА, (8)

где Г - ортогональная матрица размерности NxL, А - ортогональная матрица размерности ЬхМ (Ь < К), Е - прямоугольная матрица размерности NхМ, называемая матрицей остатков (погрешностей, ошибок).

Вследствие конечной точности измерений матрица X всегда будет матрицей полного ранга, т.е. среди сингулярных значений этой матрицы не будет строго равных нулю. Вследствие этого существенной является проблема определения размерности факторной модели, т.е. параметра Ь в (8). Сингулярное разложение прямоугольной матрицы, записанное в форме

Х=ГА (9)

(в предположении малости Е в (8)) иногда называют решением задачи абстрактного факторного анализа (АФА). АФА позволяет определить число наиболее значимых факторов, влиянием которых обусловлены наблюдаемые в матрице данных X изменения ее элементов и восстановить с точностью до Е эту матрицу данных с помощью элементов факторного разложения - матриц Е и А - в координатном пространстве меньшей размерности К или Ь.

Разложение (9) не является однозначным и дает возможность формального восстановления матрицы наблюдений в виде суперпозиции матричных компонентов Е и А без их смысловой интерпретации - эле-

менты матриц F и А представляют просто наборы чисел, не имеющих физического смысла.

Как следует из сопоставления уравнений (3) и (9), формы записи основной матричной модели АФА (9) и основного уравнения (3) для аддитивных смесей совпадают. Этот факт положен в основу использования ФА для решения задач исследования сложных химических объектов.

Для получения решения в физически интерпретируемых терминах существует формальная процедура целенаправленного преобразования (target transformation) решения задачи АФА:

X=FA=FT¡TA=F*A* (10)

Т — неособенная квадратная матрица-преобразователь, переводящая решение АФА в такую форму, где компоненты решения А* и F* имеют смысл вполне реальных физических характеристик или параметров.

При анализе смесей результатом преобразования решения задачи АФА должны быть концентрации А * и наборы (спектры) характеристик F* компонентов смесей, т.е. F* = Н и А * = С.

Формализм целенаправленного преобразования решения задачи АФА в физически интерпретируемое задан уравнением (10). Но конкретный вид матрицы Т остается неизвестным.

Для исследования сложных химических объектов методами масс-спектрометрии автором был впервые предложен итеративный алгоритм преобразования решения задачи АФА, основанный на использовании граничных и нормирующих условий, налагаемых на компоненты решения в соответствии с физическим смыслом обрабатываемых данных. Метод свободен от каких-либо ограничений на характер спектров компонентов (за исключением их линейной независимости). Появившиеся позднее в литературе варианты подобного преобразования получили название "неотрицательного" (non-negative) факторного анализа.

Алгоритм предложенного итеративного преобразования решения АФА заключается в следующем. Исходя из естественных граничных и нормирующих условий (5) на элементы масс-спектров и концентрации компонентов в смесях (что соответствует неотрицательности элементов масс-спектров и концентраций компонентов, а также нормировке масс-спектров к полному ионному току), элементы решения задачи АФА, то есть элементы матриц А и F в уравнении (10), подвергаются итеративному преобразованию, один цикл которого представлен ниже:

Wя,у <0] => dkj = akj - Оу)тш

4=4- / IX-к

j = 1,2,...,М;тэ j

F = X44r(Л^4tгr1

л*Т\-\

(И)

iк ^ ¡к / с

I

1 = 1,2.....Ы;1ък

Этот итеративный процесс продолжают до выполнения граничных и нормирующих условий

или останавливают после выполнения предельного числа циклов итеративной процедуры (рис. 4).

На каждом этапе этого преобразования сохраняется оптимальность разложения матрицы данных X на матричные элементы А* и Р* в смысле метода наименьших квадратов. Сходимость этой процедуры проверялась на решении как модельных математических (симулированных), так и реальных задач. Полученные на выходе итеративной процедуры (11) элементы матрицы А соответствуют концентрациям компонентов, а элементы матрицы Р - их масс-спектрам. Таким образом может быть получено физически интерпретируемое решение задачи ФА без нахождения в явном виде матрицы-преобразователя Г в уравнении (10).

О сходимости этой процедуры и существования решения необходимо отметить следующее. Совокупность систем линейных уравнений (2) с системой ограничений (5) можно рассматривать как формулировку задачи линейного программирования в канонической форме, решения которой всегда определяют выпуклое многогранное множество, имеющее вершины. Для каждого масс-спектра система линейных уравнений (2) и ограничений (5) в развернутом виде может быть представлена как

0<Л, Г и = о,

(12)

0 < ак), Е ак, = 0,

к

(13)

с, > 0,с2 > 0,..., с£ > 0 X, > 0,х2 > 0,..., хм > 0

Задача заключается в нахождении такого решения этой системы, при

котором целевая функция <р(С) = С, + С2 + . мальное значение, равное единице: <р(С) ■■

. + Cj принимает мини-1.

Поскольку система ограничений (5) в соответствии с физическим смыслом решаемой задачи всегда совместна, а целевая функция ограничена снизу, то, в соответствии с теорией линейного программирования, данная задача всегда разрешима. При этом множество ее решений заполняет некоторую грань выпуклого многогранного множества, определяемого системой ог раничений (5), а решение ее единственно тогда и только тогда, когда эта грань является вершиной (Еремин И. К, Мазуров В.Д., Астафьев H.H. Несобственные задачи линейного и выпуклого программирования. -М„ Наука, 1983).

Рис. 4. Структурная схема алгоритма преобразования решения АФА

Так как на каждом шаге итеративной процедуры (11) сохраняется оптимальность (в смысле метода наименьших квадратов) разложения матрицы Л' на матричные элементы А и /\ то последовательность оценок А* и F* будет нерасширяющейся, и в целом процедура будет сходящейся из любой точки пространства. Формальное рассмотрение процедуры преобразования приводит к заключению о существовании однозначного решения задачи, область определения которого - замкнутое выпуклое много-

гранное множество, имеющее вершины - совпадает с решением, получаемым из рассмотрения физического смысла задачи (концентрационный симплекс). Это означает, что предложенный путь обеспечивает получение искомых физических характеристик - масс-спектров или других спектров компонентов и их содержаний в смесях.

Этот метод преобразования решения задачи АФА был предложен вначале для обработки масс-спектральных данных, а затем распространен на другие инструментальные методы анализа с многоканальными детекторами.

Изложенный математический аппарат позволяет, например, на основе экспериментальных данных, получаемых при исследовании серии смесевых образцов с неизвестным, но хотя бы частично изменяющимся составом, построить модель материальной системы - полностью описать ее состав, т.е. определить число компонентов в смесях, их содержания и получить спектры чистых компонентов. В практике исследования сложных химических объектов подобные задачи являются очень широко распространенными - при анализе не полностью разделенных пиков в хроматографии, перекрывающихся спектральных контуров, обработке данных дистанционных методов анализа и т.п. Примеры практической реализации изложенных алгоритмов для анализа состава смесей и получения расчетных методик, адаптируемых к конкретным наборам экспериментальных данных, приведены в следующих главах.

Формирование, проверка и корректировка моделей при создании и применении аналитических методик продемонстрирована также на решении симулированных и реальных задач в молекулярной спектроскопии. Предложен способ оценки пригодности имеющейся расчетной методики для количественного анализа реального образца. Способ основан на исследовании чисел обусловленности и числа значимых элементов сингулярного разложения матрицы расчетных коэффициентов методики (коэффициентов регрессии) и расширенной матрицы за счет включения в предыдущую спектра аналитических признаков анализируемого образца. Резкое увеличение числа обусловленности расширенной матрицы и увеличение числа значимых элементов сингулярного разложения означает несоответствие модели характеристикам реального образца и требует корректировки модели.

В пятой главе проведено рассмотрение взаимодействия аналитического прибора и исследуемого образца как элементов единой динамической системы. В этом случае аналитический сигнал, несущий информацию о составе образца, модулируется не только количествами и соотношениями компонентов в образце, но и режимами работы прибора. Приведены некоторые примеры получения методик химического анализа на основе адаптивных моделей при исследовании структурно-группового

и индивидуального компонентного состава нефтяных смесей методами масс-спектрометрии.

Изменяя режимы работы масс-спектрометра (энергию ионизирующих электронов, температуру ионизационной камеры и испарителя при прямом вводе образца и др.) можно варьировать в широких пределах характер аналитических сигналов на выходе прибора. Так, снижение энергии ионизирующих электронов позволяет снижать уровень возбуждения и внутреннюю энергию ионов. При этом увеличивается интенсивность молекулярных ионов и упрощается идентификация молекулярных масс исследуемых веществ.

Трудности физического моделирования состава нефтяных смесей (особенно гетероатомных соединений) из-за отсутствия достаточного числа эталонных веществ затрудняют возможность получения корректных расчетных методик на детерминированной основе. Неполнота наших представлений даже о качественном групповом составе гетероатомных соединений в нефти (то есть о числе и свойствах присутствующих в ней соединений) приводит к тому, что детерминированный подход к анализу с априорным регламентированием числа и типов (классов) соединений становится неэффективным.

Было предложено использовать адаптивное моделирование и принципы полной ионизации для оценки содержаний различных классов соединений в нефтяных системах. В приложении к групповому анализу это означает оценку содержаний различных компонентов в нефтяной смеси по долям полного ионного тока, приходящихся на масс-спектры соответствующих компонентов. Для уменьшения влияния взаимных наложений масс-спектров целесообразно применять приведение масс-спектров к моноизотопному виду.

Для математического моделирования структурно-группового состава был детально изучен (экспериментально и по литературным данным) характер молекулярно-массовых распределений гомологов различных классов ароматических нефтяных соединений. Были изучены моле-кулярно-массовые распределения многих классов ароматических соединений, выделенных из различных нефтей - углеводороды СпН2п.12, СпН2п_ 14, СпН2п.18, азотистые основания СпН2п_13М, СпН2п.15Н, СпН2п_171\[, СПН2„. 19^5 СПН2„.2|К. Масс-спектры снимали при энергиях ионизирующих электронов, меньших потенциалов появления осколочных ионов и пересчитывали к моноизотопному виду с учетом естественной распространенности изотопов.

Было установлено, что относительные содержания гомологов основных классов соединений на уровне доверительной вероятности не менее 0.99 по критерию согласия Пирсона могут быть описаны распределением Пуассона:

1(т) = —-ехр(-/1) т\

где т = (Мт-М„)/14, т = О, 1, 2, ...; М„ - молекулярная масса первого наблюдаемого в данном ряду гомолога; Мт - молекулярная масса очередного гомолога с т углеродными атомами в алкильных заместителях;

I - параметр распределения Пуассона; I (т) - экспериментальная интенсивность молекулярного иона; 1(т) - сглаживающая, теоретическая вероятность появления гомолога с тем же значением т. 20

Рис. 5. Молекулярно-массовое распределение азотистых оснований класса С„Н2„.21N нефти Советского месторождения (1) и сглаживающего распределения Пуассона (2); т — число атомов углерода в алкильных замести* телях £

Формирование модели гомологического состава с использованием распределения Пуассона удовлетворяет следующим естественным (в соответствии с физическим смыслом параметров) для данного случая требованиям:

а) дискретность - число атомов углерода в молекуле всегда есть число целое;

б) ограниченность "слева" - молекулярная масса самого легкого представителя любого класса соединений имеет конечное минимальное значение;

в) неограниченность "справа" - значение максимальной молекулярной массы «сверху» не ограничено.

Однопараметричность распределения Пуассона (единственный параметр Я определяет одновременно его дисперсию и математическое ожидание) снижает требования к минимальному объему выборки при создании модели по сравнению с другими распределениями. Близость экспериментального и сглаживающего распределений иллюстрируется рис. 5.

Установленные закономерности позволяют создать иерархическую модель состава нефтяной системы. Если ск - содержание А"-й группы (класса) соединений в нефтяной фракции, % мол.; Ь - число групп соединений в рассматриваемой смеси; Хк - параметр сглаживающего распределения Пуассона для концентраций гомологов й-й группы соедине-

8 ш

ний; к - содержание первого гомолога Аг-й группы соединений; т - порядковый индекс в группе, т = 0,1,2,.., тогда г

2 е*=1

к=1 т

5

Содержание #и-го гомолога А-й группы связано с концентрацией этой группы соединений в нефтяной фракции соотношением

Скт=СкРк(т),

где Рк(т) - Пуассоновская вероятность появления событий т-го класса. Из этого следует, что

Ск=Скп/Рфп),

или

т\

ск ^с^—ехр(-Лк) лк

В частности, для т=0

ск ~ ск схР(-^к )

Таким образом, статистическая модель состава нефтяной фракции может быть записана в виде

ь

ехрм*)=1

к=1

или

^ т\

Р("А) = 1

к=1 Ак

Содержание т-го гомолога к-то класса может быть рассчитано по

А",'

сы =ск —-ехр(-ЯА) т\

»

содержание первого гомолога - по уравнению

Полученная модель связывает содержания отдельных компонентов (гомологов) с составом всей нефтяной фракции. Достаточно простой вид этой зависимости позволяет эффективно использовать ее при разработке методик анализа нефтяных смесей, адаптируемых к составу конкретного образца. Аналогичным образом можно создать соответствующую статистическую модель моноизотопного масс-спектра нефтяной

фракции, которая и используется при расчетах группового состава по масс-спектральным данным.

Пусть интенсивности ионных пиков моноизотопного масс-спектра нормированы к полному ионному току:

N

ы

[Р Jf }ЧР

где N - число ионных пиков в масс-спектре. Если к0, к0,40 - интенсивности пиков молекулярных, осколочных и «квазимолекулярных» перегруппировочных ионов первых гомологов к-и группы соединений в моноизотопном масс-спектре нефтяной фракции, тогда

¿(/* +1{0 + ... + ВДехр(-Л4) = 1

ш , (14)

или, через интенсивности пиков соответствующих ионов произвольного т-го гомолога:

¿('¿п +- + /Г)ехр(-Л) = 1

4=1 (15)

Соотношения (14) и (15) положены в основу создания универсальной методики структурно-группового анализа нефтяных смесей, которая адаптируется к составу конкретного исследуемого образца в соответствии с определенными именно для него числом и параметрами молеку-лярно-массовых распределений, и именно для тех классов веществ, которые реально обнаруживаются в составе данного образца. И уже на базе этой адаптированной к конкретному образцу модели в процессе расчетных процедур анализа производится декомпозиция экспериментального масс-спектра нефтяной смеси на составляющие для нахождения содержаний компонентов.

Этот алгоритм был отработан сначала на решении симулированных задач, а затем использован для разделения перекрывающихся моле-кулярно-массовых распределений гомологических рядов изобарных нефтяных соединений при создании методик группового анализа. Наличие каждого статистически значимого распределения группы молекулярных ионов должно рассматриваться как свидетельство наличия соответствующего ему класса нефтяных соединений (рис. 6). Правильность методики подтверждена анализами тех же образцов методом ГХ-МС.

Поскольку характер распределения молекулярных ионов сохраняется и для фрагментных ионов состава (М-Я)+, эти же принципы пригодны и для разделения перекрывающихся рядов характеристических осколочных ионов. Таким образом, мерой содержания каждого конкретного

класса соединений будет сумма интенсивностей ионных токов, приходящихся на молекулярные М+, фрагментные (М-Я)+ и перегруппиро-вочные «квазимолекулярные» ионы данного класса нефтяных ароматических соединений.

Рис. 6. Разделение полимодального ММР ароматических соединений на составляющие

Построение модели состава нефтяной системы и ход анализа включает: получение масс-спектра смеси; пересчет построение молекулярно-массовых распределений и распределений интенсивностей фрагментных ионов; анализ этих распределений и разделение их в случае неунимодальности; нормирование и суммирование интенсивностей соответствующих ионных пиков и получение нормированного к 100% группового состава смеси.

Для тяжелых нефтяных фракций альтернативных методов анализа нет. В дальнейшем на основании анализа литературных данных он нашел подтверждение и признание в работах многих нефтяных аналитиков.

Модифицированный метод селективного ионного детектирования. Для исследования состава сложных нефтяных смесей был предложен модифицированный метод селективного ионного детектирования (СИД). Стандартный вариант СИД-метода предусматривает селективное детектирование веществ по интенсивностям заранее определенных характеристических ионов в их масс-спектрах. Фактически это означает детерминированность модели на уровне характеристик индивидуальных веществ. Однако попытки такой СИД-регистрации в не полностью разделенных хроматографически нефтяных смесях может приводить к некорректным результатам.

На рис. 7 представлен результат селективного детектирования соединений с молекулярными массами 143 и 157 (RIC 143 и RIC 157) -реконструкция хроматограммы азотистых оснований по интенсивностям молекулярных ионов Сги Сгалкилхинолинов. Однако при анализе полных масс-спектров, соответствующих максимальным пикам с RIC 143 и RIC 157, оказывается, что они отвечают гомологам алкилхинолинов, в масс-спектрах которых ионные пики с m/z 143 и 157 а.е.м. присутствуют как фрагментные, перегруппировочные и "псевдо-молекулярные".

масс-спектров к моноизотопному виду;

Действительно, если рассмотреть фрагментацию молекулярных ионов бутилхинолина (рис. 7), то становится очевидной невозможность селективной регистрации гомологов этого класса соединений по пикам только молекулярных ионов. Близость направлений фрагментации гомологов любого класса нефтяных соединений исключает возможность селективной регистрации по любым отдельным, пусть даже и заметной интенсивности ионам:

Рис. 7. Селективное

детектирование изомеров

алкилхинолинов стандартным СИД-методом (ШС 143, ШС 157) и предложенным модифицированным, учитывающим характер фрагментации молекулярных ионов целевых и мешающих компонентов анализируемой смеси Р{143}, Р{157}.

Игле —*

все они являются групповыми признаками соответствующих классов соединений и не могут служить для дифференциации гомологов и изомеров. Для решения этой задачи реконструкцию хроматограммы предложено вести по интенсивностям пиков не отдельных ионов, как в стандартном методе СИД, а по значению специального функционала от ин-тенсивностей ионных пиков в массиве хроматомасс-спектральных данных. Конкретный вид этого функционала Г{1(т/г)!} должен быть адаптирован к особенностям решаемой аналитической задачи — учитывать основные закономерности фрагментации молекулярных ионов целевых, а также фоновых и мешающих компонентов. Функционал должен удовлетворять следующим требованиям: его значения в реконструируемой зоне хроматомасс-спектрограммы должны иметь максимальные значения для целевых компонентов и нулевые или отрицательные - для всех других (мешающих, фоновых). Наиболее практичным представляется использование для этой цели линейных полиномов от интенсивностей ионных пиков.

Тогда селективную регистрацию изомеров Сгалкилхинолина с молекулярной массой 143 а.е.м. можно осуществить реконструкцией хроматомасс-спектрограммы по разности интенсивности ионного тока ионов с m/z = 143 и суммы интенсивностей молекулярных ионов всех более тяжелых гомологов этого класса, перегруппировка которых может приводить к появлению иона с m/z =143:

F{I{mlz\) = 7(143) - к{1(\ 57) + /(171) + /(185) +...] - 7(143) - ^кДт/z),

i

где к, ki - коэффициенты, учитывающие уменьшение относительной интенсивности молекулярных ионов в масс-спектрах гомологов при увеличении молекулярной массы, А,- =14-5.

Аналогичные комбинации можно выбрать и для изомеров С2-, С3-и других алкилхинолинов. Пример реконструкции приведен на рис. 7. В этом случае при анализе масс-спектров, соответствующих хроматогра-фическим пикам при селективном детектировании изомеров по F{143} и F{157}, подтверждено отсутствие ложных пиков.

В общем виде предложенный способ можно представить в форме реконструкции хроматограммы по значению функционала

где М - масса интересующего нас молекулярного или характеристического иона, 1М - интенсивность ионного пика с массой М, /, - интенсивности интерферирующих ионов.

Предлагаемый метод позволяет получать адаптированную к конкретному объекту модель формирования аналитического сигнала и сопоставлять изомерный состав соединений в различных пробах при стандартизации условий проведения эксперимента. При этом общая структура модели остается неизменной, а адаптируются характеристики ее составляющих. Без идентификации отдельных веществ решаются задачи количественного сопоставления состава, так как площади реконструированных хроматографических пиков будут пропорциональны содержаниям изомеров, и эта пропорциональность сохранится для всех смесей, анализируемых в одинаковых условиях.

В шестой главе приведены примеры практического использования приемов системного анализа информации при исследовании сложных химических объектов и адаптивных моделей в самых различных областях - элементного анализа, геохимии нефти, химии окружающей среды, контроля технологических процессов и криминалистики.

Элементный состав. Элементный состав образцов можно рассматривать как многомерную (размерность совпадает с числом химических элементов) характеристику смесевых образцов. Приведен пример решения модельной задачи. Исходная информация - результаты анализа

элементного состава 16 образцов (табл. 2), представляющих собой смеси из трех веществ - антрацена, дибензотиофена и карбазола, приготовленные из реактивов высокой чистоты в соответствии с табл. 1 (с. 16).

Таблица 2

Элементный состав трехкомпонентных смесей (эксперимент)

Элементный состав, %

С Н Б N

1 94,75 5,25 0,00 0,00

2 77.87 4,52 17,61 0,01

3 85,20 5,90 0,01 8,90

4 87,42 4,51 8,06 0,01

5 82,64 4,95 8,44 3,97

6 90,73 5,02 0,01 4,24

7 86,16 5,25 5,72 2,86

8 87,44 5,57 4,81 2,18

9 85,08 4,26 8,48 2,17

10 85,62 5,70 4,61 4,07

11 89,07 5,15 3,90 1,87

12 82,51 4,16 11,55 1,78

13 84,90 5,82 3,89 5,40

14 84,99 5,03 5,80 4,18

15 89,04 5,48 2,80 2,68

16 84,94 4.52 8.85 1,69

Применение процедур факторного анализа с преобразованием решения к набору этих экспериментальных данных привело к следующим результатам. Сингулярные значения в разложении матрицы данных равны 346.45, 19.16, 7.96 и 1.42. Отсюда размерность модели (размерность ортогонального базиса, восстанавливающего 99.5% суммарной дисперсии матрицы данных и, следовательно, число компонентов) равны трем. Выделение «спектров чистых компонентов» методами факторного анализа с преобразованием решения в данном случае - есть элементный состав компонентов - С, Н, Б и N.

Рассчитанные элементные составы чистых компонентов смесей (антрацена, дибензотиофена и карбазола, табл. 3) и составы смесей отличались от теоретических (и заложенных в модель, табл. 1 на с. 16) не более чем на 3,5 % отн., что укладывается в погрешности использованных методик анализа элементного состава. Округления рассчитанного числа атомов С, Н, N и Б до целого приводят к однозначному установлению формул компонентов. Решение оставалось устойчивым и при удалении первых трех строк из таблицы 2, т.е. когда в наборе смесей отсутствовали чистые компоненты.

Таким образом, имея в распоряжении только результаты анализов набора смесей (табл. 2), не зная ни числа присутствующих в смесях ком-

Таблица 3

Рассчитанные элементные составы и формулы чистых компонентов

№ компон. Элементный состав, %

С Н Б N

1 94,40 5,48 0,10 0,02

2 78,29 4,40 17,31 0,01

3 85,83 5,51 0,16 8,49

Рассчитанные значения мольных долей элементов

%С %Н

1 7,87 5,49 0,00 0,00

2 6,52 4,40 0,54 0,00

3 7,15 5,51 0,01 0,61

Рассчитанные и округленные количества атомов элементов в молекуле

1 14,32 = 14 10 0 0

2 12,06 ~ 12 8,13 = 8 1 0

3 11,79=12 9,08 » 9 0 1

Рассчитанные молекулярные формулы компонентов

1 Антрацен С14Н10

2 Дибензотиофен СпНвв

3 Карбазол

понентов, ни их элементного состава, оказалось возможным установить число компонентов, выделить характеристики чистых компонентов (установить их элементный состав и рассчитать молекулярные формулы) и определить состав смесей, т.е. установить соотношения между содержаниями компонентов в смесях.

Спектроскопия. Аналогичным образом решаются задачи обработки данных в ИК-, УФ-спектроскопии и масс-спектрометрии смесей неизвестного состава. Входной информацией в этих случаях являются спектры смесей с варьированием соотношений между компонентами.

Результат обработки -определение числа компонентов в смесях, расчет спектров

чистых компонентов и определение их

содержаний в смесях.

Рис. 8. Выделение спектров чистых компонентов из спектров смесей в ИК спектроскопии

Во всех случаях сначала методами абстрактного факторного анализа определяют размерность модели и ортогонального базиса, затем решение АФА преобразуют в физически интерпретируемое. Вначале алгоритм и соответствующие программы отрабатывались на решении симулированных задач, затем проверялись на физических моделях, и после этого были использованы для решения реальных задач.

На рис. 8 представлены результаты выделения спектров чистых компонентов из смесевых в ИК спектроскопии (реальная модельная задача). Исходная матрица данных - спектры поглощения 9 смесей гексана и циклогексана в четыреххлористом углероде, спектры представлены 105 значениями оптических плотностей в области поглощения деформационных колебаний С-Н связей. Размерность ортогонального базиса и число компонент определены равными двум, они описывают более 99.5% сумммарной дисперсии системы.

Выделенные спектры гексана и циклогексана с высокой точностью совпадают с экспериментальными, расхождения в оптических плотностях менее 1% отн. Максимальные расхождения между рассчитанными и заложенными в модель концентрациями составили 1,5% отн. Для получения этого решения потребовалось в соответствии с процедурой (11) всего три цикла итераций.

Аналогичным образом решают задачи в абсорбционной спектро-фотометрии видимого и ультрафиолетового диапазона. В модельной задаче исследования УФ-спектров трехкомпонентных смесей антрацена, карбазола и дибензотиофена (см. модельную задачу на элементный анализ, табл. 1 и 2) рассчитанные оптические спектры поглощения чистых компонентов имели расхождение с экспериментальными не более 2,5% отн., а содержания компонентов - не более 3,5 % отн. Исходная матрица данных содержала спектры 12 смесей с 250 оптическими плотностями в диапазоне от 230 до 480 нм. Для получения решения потребовалось 5 циклов итераций, увеличение погрешностей по сравнению с примером ИК-спектроскопии обусловлено более низким классом аппаратуры и увеличением погрешностей в исходных экспериментальных данных.

Успешное решение этих модельных задач с приемлемыми погрешностями показало пригодность разработанных приемов для решения реальных задач в жидкостной хроматографии с многоканальным спек-трофотометрическим детектором - диодной матрицей. Методики используются для анализа биологически активных веществ в растительных экстрактах.

Проверка соответствия характеристик объекта модели, положенной в основу методики анализа. Предложен метод оценки адекватности модели, положенной в основу методики, составу исследуемого объекта. В основе метода лежит исследование псевдорангов и сопостав-

ление чисел обусловленности двух матриц: матрицы спектров стандартных образцов, использованных при создании методики (если они доступны), или псевдообратной матрицы Р (с. 15, ур. (4)), и расширенных предыдущих матриц за счет включения в них спектра исследуемого объекта. В том случае, когда модель адекватна составу реальных образцов, число обусловленности при включении в матрицу спектров образцов изменяется незначительно. В противном случае эти изменения носят драматический характер. Как в численных экспериментах, так и при рассмотрении реальной спектрофотометрической методики, используемой для определения ароматических соединений в нефтяных образцах (.Химия нефти и газа. Под ред. В.А. Проскурякова, А.Е. Драбкиной. Химия, СПб., 1996. С. 139-141), при адекватности модели число обусловленности при включении экспериментальных спектров изменялось от 5 до 7-5-10. В случае неадекватности это число изменялось с 5 на 135 и более.

При этом появляется возможность повышения качества имеющейся методики на основе анализа зависимости чисел обусловленности от набора (состава) аналитических признаков. Если в их наборе присутствует существенно влияющий на обусловленность матрицы спектров (увеличивающий число обусловленности), то его отбраковка может улучшить характеристики методики. Такой процедуре подверглась цитированная методика анализа ароматических углеводородов.

Обнаружение пиков минорных компонентов и разделение перекрывающихся хроматографических пиков в ГХ/МС. Многоканаль-ность масс-спектрального детектора позволяет эффективно решать задачи определения «чистоты» хроматографических пиков, разделения контуров перекрывающихся пиков и выделения спектров чистых компонентов из смесевых пиков в газожидкостной и жидкостной хроматографии. При этом размерность признакового пространства, равная числу ионных пиков в масс-спектрах веществ-компонентов и их смесей (которая всегда достаточно велика), обеспечивает быструю сходимость процедуры итеративного преобразования решения задачи абстрактного факторного анализа. Использование этих приемов позволило решать задачи анализа состава смесей органических веществ самого различного происхождения в различных матрицах. Наибольшую практическую значимость имеют исследования состава разнообразных нефтяных систем и химического загрязнения объектов окружающей среды. Эти задачи объединяет их многокомпонентность и невозможность формулирования априор-ных ограничений на возможный состав компонентов. Многокомпонентность не позволяет получить хроматограммы с полным разделением, а невозможность прогнозирования качественного компонентного состава создает трудности при обнаружении минорных компонентов традиционными методами.

На рис. 9 приведен пример обнаружения и выделения из фона хроматографического пика минорного компонента в образце органического экстракта из загрязненной водной пробы (поверхностная вода вблизи шпалопропиточного завода) с использованием адаптивного моделирования. Интенсивности полного ионного тока (TIC) и выделенного пика (extracted peak) приведены в условных единицах. В этом случае на участке хро-матограммы, где интенсивность сигнала детектора по полному ионному току практически не отличалась от фоновой, с помощью изложенных методов удается обнаружить наличие минорного компонента, восстановить профиль его элюирования и выделить масс-спектр для идентификации.

Рис. 9. Обнаружение и выделение пика минорного компонента в ГХ-МС анализе

При этом максимальные значения хроматографического сигнала, отвечающие пику выделенного минорного компонента, были почти на два порядка меньше суммарного фонового сигнала этом участке хромато-граммы.

Возможности предложенного метода для разделения перекрывающихся хроматографических пиков и выделения масс-спектров чистых компонент из смесевых спектров демонстрируются на решении искусственной модельной задачи. На рис 10 приведены кривые элюирования не полностью разрешенных хроматографических пиков, контур сме-севого пика и «масс-спектры» компонентов.

so wo «о m/z

Как следует из рис. 10, контур смесевого пика имеет симметричную форму, и его многокомпонентность можно обнаружить только с использованием многоканального детектора, в данном случае — масс-спектрального. Расположение хроматографических пиков соответствует хроматографическому разрешению И5 = 0.3.

Массив данных представлял собою матрицу размером 30><20, составленную из смесевых спектров, полученную перемножением матрицы «концентраций» (контуры элюирования) «на масс-спектры» компонентов с добавлением к каждому элементу матрицы случайной нормально распределенной величины с параметрами распределения р = 0, а = 0.031,1

— интенсивность соответствующего пика. При обработке этих данных было установлено, что число компонентов равно двум (последовательность сингулярных значений 98.08, 17.81, 0.11, 0.01, ...), выделенные масс-спектры чистых компонентов практически полностью идентичны заложенным в модель, рассчитанные концентрации отличалась от модельных не более чем на 2%.

Рис. 10. Смесевой хроматографический пик и выделенные «спектры компонентов» симулированной модельной задачи

При компьютерной идентификации в качестве меры близости спектров используют Match Factor, фактор совпадения сравниваемых масс-спектров. Его мерой является умноженное на 1000 значение косинуса угла между сравниваемыми векторами. Значение Match Factor равное «1000» означает полное совпадение. В нашем случае для незашумленных масс-спектров Match Factor = 1000, для содержащих шумы 985, при снижении содержания одного из веществ до 3% отн он снижался до 890. Во всех компьютерных поисковых системах это означает практически 100% надежность идентификации вещества.

Данная симулированная задача идентична литературной (Самохин A.C., Ревельский H.A. Применение метода главных компонент для выделения «чистых» масс-спектров в ГХ/МС анализе// Масс-спектрометрия. 2010. Т. 7. № 2. С. 132-138), в которой для ее решения потребовалось априори знать аналитическую форму кривой элюирования и иметь наличие свободных от наложения пиков компонентов.

1 3 5 Т 3 11 13 15 17 19 21 23 25 27 29

I масс-спектр 1 вещества S! масс-спектр 2 вещества

1 .3 5 7 3 11 13 15 17 1Snh

Во всех приведенных примерах процедура преобразования решения задачи АФА проверялась и подтверждалась сходимостью из произвольной точки пространства с координатами, генерируемыми датчиком случайных чисел.

С использованием предложенной методологии и разработанных методик были исследованы органические примеси в атмосферных выбросах и сточных водах промышленных предприятий, в водах бассейна р. Обь на протяжении всего ее течения, исследован состав примесей и оценены тенденции его изменения при эксплуатации подземных водоносных горизонтов на примере Обь-Томского междуречья и других районов, оценена скорость фильтрации загрязняющих веществ в подземные воды с поверхности, исследован состав экстрактов из разных растений, установлены источники органического загрязнения подземных вод Минусинского мегапрогиба (респ. Хакасия).

На территории респ. Хакасия наблюдается прогрессирующее со временем органическое загрязнение подземных вод. При исследовании причин и источников загрязнения было показано, что эти процессы обусловлены изменениями пьезобарометрических условий подземных флюидов вследствие влияния каскада Енисейских водохранилищ. Идентификация источников показала, что им является рассеянное органическое вещество пород и включений нефтяных флюидов, имеющих уникальный состав ароматических углеводородов.

По результатам проведенных анализов в моделях был выделен общий генетический признак, присущий составу всех перечисленных объектов. Таковым оказался уникальный изомерный состав алкилбензо-лов - арил-изопреноидов. Сопоставление изомерного состава этих веществ модифицированным СИД методом в разных объектах показало их идентичность. Приуроченность конденсированных углеводородных флюидов к трещиноватым базальтам нижнего девона, генетическая близость их состава к составу нефтей северо-западных провинций Китая (которые отделены от Хакасии Саяно-Алтайской горной системой), позволяют пересмотреть существующие сейчас представления о роли глубинных процессов в земной коре и о бесперспективности недр территории на нефтегазоносность.

Таким образом, селективные методики анализа, разработанные на принципах адаптивности их к составу конкретных исследуемых объектов, позволили не только установить источники загрязнения, но и показать общность состава органических флюидов и органических примесей в подземных водах.

Групповой и индивидуальный состав нефтяных фенолов, азотистых оснований и технологических материалов. Формирование моделей группового состава осуществляли с использованием аппрокси-

мации молекулярно-массовых распределений распределением Пуассона. Моделирование индивидуального и изомерного состава осуществляли на основе сформулированных адаптивных принципов и алгоритмов математического моделирования, которые изложены в предыдущих разделах работы.

Выбор объектов исследования обусловлен важностью этих классов веществ для нефтепереработки, нефтехимии, геохимии, а также экологическими аспектами воздействия их на окружающую среду. Вследствие широкой вариабельности состава таких смесей разработка детерминированных аналитических методик сопряжена со множеством сложностей физического их моделирования.

Нефтяные фенолы. При определении параметров модели состава нефтяных фенолов в сырых нефтях и тяжелых дистиллятных фракциях наряду с известными низкомолекулярными компонентами (алкилфено-лами, алкилинданолами и нафтолами), были обнаружены элементы, соответствующие не известным ранее в составе нефтей классам соединений с гомологическими рядами молекулярных масс 200,214, ...,268,282, ..., 306, 320, ... (рис. П, а).

Д: . ТД"| *

£ / \

I / \ А

I ' \)ч

5

5 V ¡х , в

X анод, § сгч ч / \ и О

!-1-1- / \К

Рис. 11. Молекуляр-но-массовые распределения исходных вы сокомолекуляр-ных фенолов (а) и их триметилсилиловых эфиров (б)

он он

В сочетании с химической модификаций исследуемых образцов (превращением их в триметилсилиловые (ТМС) эфиры, рис. 11 б) и привлечением данных ИК-спектроскопии новые классы соединений были идентифицированы как бис-гидроксифенилметаны СпН2п.1402 (1), изобарные им дигидроксифенилы (2), соединения класса СпН2П-22^з с ориентировочной структурой (3) и продукты молекулярного сочетания апкилфенолов и инданолов (4).

Исследование изомерного состава трициклических азотистых оснований С„Н2п_^ в различных нефтях. Предложенный метод повышения селективности СИД-метода за счет адаптивного моделирования

аналитического сигнала в хромато-масс-спектрометрии при неполном хроматографическом разделении пиков компонентов позволили проводить успешное сопоставление изомерного состава нефтяных соединений в различных объектах даже без их идентификации. На рис. 12 приведено сопоставление относительных распространенностей изомеров С2-алкилбензохинолинов в различных образцах.

Рис. 12. Участок реконструированной хроматограммы изомеров бензо-хинолинов СцНцИ с молекулярной массой 207 в различных нефтях

Как следует из приведенного рисунка, изомерный состав этого класса соединений с точностью до погрешностей эксперимента совпадает в нефтях различных нефтяных провинций.

Анализ состава низкомолекулярных продуктов термоокисли-телыюй деструкции атактического полипропилена. Использование аналогичных приемов к обработке результатов ГХ-МС анализа фракций органических материалов средней летучести, полученных при термоокислительной деструкции атактического полипропилена, позволило идентифицировать в них кислородсодержащие вещества различных классов - кетоны, дикетоны и гидроксилсодержащие структуры, включающие циклические и алкеновые фрагменты. Многокомпонентность состава этих материалов не позволяет достичь полного хроматографиче-ского разделения на обычных капиллярных колонках, поэтому выделение масс-спектров чистых компонентов, пригодных для их идентифика-

ции, было возможно только с применением специальных процедур факторного анализа с преобразованием решения.

В низкомолекулярных продуктах окисления обнаружены полиме-тилзамещенные углеводороды уникального строения с то-С3Н7 гомоло-гичностью, которые предложено использовать в качестве химических маркеров веществ и материалов.

Зависимость состава исследуемых образцов от характеристик исходного сырья и режимов его термоокисления позволило оптимизировать состав целевых продуктов в соответствии с их технологическим назначением.

Анализ надмолекулярной структуры комплексов трет.бутнлтриалкилборатов лития. Данный пример демонстрирует эффективность применения динамического моделирования материального состава образца в области ионного источника масс-спектрометра при программировании температуры ввода.

При исследовании реологических и других физико-химических свойств комплексов состава и[В(/-ОС4119)((Ж)з] была обнаружена их способность к полиассоциации и существование сил дисперсионного взаимодействия в системах «комплекс - углеводородная матрица с низкой диэлектрической проницаемостью».

С использованием динамического моделирования состава были исследованы масс-спектры комплексов трет.бутнлтриалкилборатов лития (1л[В(/-ОС4Н9)(СЖ)з], И=С3Н7^С5Ни нормального строения), полученные с программированным прямым вводом образца в источник ионов. На основании полученных данных была уточнена модель надмолекулярной структуры комплексов при их ассоциации. Матрица экспериментальных данных представляла набор из 12 масс-спектров, снятых при различных температурах контейнера прямого ввода и суммарный спектр.

Динамическая модель состава, объясняющая изменения в масс-спектрах в процессе эксперимента, имела размерность, равную трем. При этом она описывала 92 % суммарной дисперсии в системе наблюдений. Этими факторами для приведенного на рис. 13 участка масс-спектра являются три частично перекрывающиеся группы ионных кластеров (А3-Н)+, А3+ и (А3+Н)+. Наличие трех значимых факторов в модели означает, что отдельные ионные кластеры на рис. 13 имеют различные механизмы образования, обусловленные возрастающей температурой испарения образца. Полученное распределение интенсивностей ионных пиков в факторном кластере А3+ существенно отличается от теоретически ожидаемого, рассчитанного с учетом элементного состава А3+ и природной распространенностью элементов — кластер «обогащен» легкими ионными пиками. Наиболее вероятное объяснение этому - включение в

Рис. 13. Разложение полиизотопного ионного кластера в масс-спектрах Ы[В(1-ОС4Н9)(ОК)на составляющие

факторный кластер А3 фрагментных ионов состава (А3-Н)+, которые образуются

Рис. 14. Разложение «факторного» ионного кластера А3, (выделенного методами факторного анализа), на составляющие - молекулярный А3' (теоретический) и фрагментный А3-Н.

при распаде молекулярных ионов тримерного ассоциата состава А3+. Результат разложения факторного кластера А3+ на теоретический молекулярный и фрагментный (А3-Н)т приведен на рис. 14.

Таким образом, наличие ионных кластеров состава А3+ и (А3-Н)+ подтверждает присутствие тримерных ассоциатов, а (А3+Н)+ - о более высокомолекулярных, фрагментами деструкции которых они являются.

Идентификационная криминалистическая экспертиза. Идентификация источников происхождения материалов, веществ или изделий является неотъемлемой частью криминалистической практики. В этой области химии использование адаптивных моделей и методик при решении конкретных задач применяется достаточно широко.

Для повышения надежности результатов экспертизы был предложен способ предварительной скрытой химической маркировки изделий и объектов. Такие химические маркеры могут применяться для маркировки упаковочных материалов, нефтепродуктов, огнестрельного оружия, взрывчатых веществ и зарядов на их основе, наркотических средств.

Сопоставление характеристик моделей состава испытуемого объекта с эталонным по результатам хроматографического анализа маркированных образцов положено в основу экспертизы. Анализ включает предварительное упаривание образца в 15-700 раз (с.и. - степень испарения) для повышения относительного содержания маркера в образце.

Адаптация методики заключается в подборе требуемой степени предварительного испарения в зависимости от свойств нефтепродукта. Идентификация маркированных образцов бензина (т.е. модели состава) осуществляется с использованием углеводородного параметра

¡=28 1=15

где XI - относительное содержание н-алкана с / атомами углерода в молекуле, - площадь хроматографического пика н-алкана с / атомами углерода в молекуле, усл. ед.

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ

1. На основе системного анализа и обработки информации, полученной при исследовании сложных химических объектов, предложена новая методология создания и применения аналитических методик с использованием аппаратуры с многоканальным детектированием, в рамках которой аналитический прибор и исследуемый образец рассматриваются как элементы единой системы. Это позволило реализовать адаптивные принципы в формировании моделей сложных химических объектов, оптимизирующие качество получаемых решений с учетом характеристик исходных экспериментальных данных - величины шумов и погрешностей в них и отклонений от аддитивности.

2. Предложена модель взаимно однозначной связи концентрационного и признакового симплексов, связывающая множество физических характеристик объектов (их аналитических признаков, спектров), с их материальным составом. Предложенная адаптивная модель позволила формализовать процесс получения расчетных процедур при разработке методик анализа как преобразование координат, и дала возможность их создания даже в отсутствие чистых индивидуальных эталонных веществ и без использования процедур обучения.

3. Разработаны алгоритмы и программы для получения модели сложной системы с использованием взаимно однозначной связи концентрационного и признакового симплексов при обработке многомерных данных в варианте целенаправленного преобразования решения задачи абстрактного факторного анализа. Структура модели включает только физически интерпретируемые параметры и характеристики - исходные наблюдаемые переменные (спектры) и концентрации компонентов.

4. Практическая реализация сформулированного системного подхода позволила создать ряд методик для анализа группового, индивидуального и изомерного состава смесей органических соединений различного происхождения - нефтей, нефтяных фракций, продуктов деградации нефтяных систем под воздействием природных и технологических факторов.

5. Показано, что концентрационное распределение гомологов нефтяных классов соединений на уровне доверительной вероятности 0.99 по критерию Пирсона /2 может быть моделировано однопараметрическим

распределением Пуассона. Однопараметричность распределения Пуассона снижает требования к минимальному объему выборки для построения моделей состава, что существенно облегчает их практическое использование.

6. Предложена иерархическая модель материального состава нефтяной системы, элементы которой представляют суперпозицию нескольких распределений Пуассона с различными параметрами. На ее основе разработан метод количественного анализа нефтяных фракций при непосредственном вводе пробы в источник ионов масс-спектрометра.

7. Сформулирован принцип динамического моделирования материального состава и его характеристик на выходе из хроматографиче-ской колонки и новый вариант метода селективного ионного детектирования в хроматомасс-спектрометрии. Метод основан на выборе дифференцирующих комбинаций интенсивностей ионных пиков, учитывающих особенности распределения интенсивностей ионных пиков в масс-спектрах.

8. Разработана методика проверки линейности аналитического отклика многоканальных детекторов, оценки фактического диапазона линейности и апостериорной корректировки экспериментальных данных в случае обнаружения некорректностей в них из-за нарушения линейности по отдельным каналам детектирования.

9. Предложен способ оценки соответствия характеристик реального исследуемого объекта модели состава, заложенной в методику, основанный на сопоставлении чисел обусловленности матрицы расчетных коэффициентов методики (коэффициентов регрессии), и расширенной за счет включения в предыдущую матрицу спектра аналитических признаков исследуемого объекта.

10. Разработан способ идентификации модели материального состава объекта, метод скрытой маркировки и химический маркер для изделий, содержащих в своем составе нефтепродукты. Авторские права на химический маркер защищены патентом РФ.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

В изданиях из списка ВАК:

1. Туров Ю.П., Гончаров И.В. Азотистые основания фракции 18О-360°С Западносибирских нефтей // Нефтехимия. - 1985. - Т. 25. 1. - С. 122-126.

2. Кадычашв П.Б., Туров Ю.П. Методика структурно-группового анализа соединений нефти с применением математической обработки молекулярно-массовых распределений // Нефтехимия. - 1985. - Т. 25. - № 5. - С. 584-588.

3. Дмитриева З.Т., Межибор Н.Г., Кадычагов П.Б., Туров Ю.П. Исследование макроструктуры комплексов трет.бутил-триалкилборатов лития методом масс-спектромег-рии // Коорд. химия. - 1986. - Т. 12. - С. 878-881.

4. Дмитриева З.Т., Родионова Н.М., Сазонова E.H., Кадычагов П.Б., Туров Ю.П. Комплексы трет.бутил-триалкилборатов лития // Коорд. химия. - 1987. - Т. 13. - С. 297-303.

5. Герасимова H.H., Сагаченко Т.А., Туров Ю.П., Бейко O.A. Групповой состав низкомолекулярных азотистых оснований Самотлорской нефти // Нефтехимия. - 1987. -Т. 27.-N»1.-С. 39-41.

6. Туров Ю.П., Сагаченко Т.А., Уигер Ф.Г. Возможности количественного масс-спектрометрического анализа многокомпонентных смесей при прямом вводе образца в камеру ионизации // Журнал аналитической химии. - 1988. - Т. 44. - № 8. - С. 1406-1410.

7. Матис Е.Я. Кураколова Е.А. Туров Ю.П. Буркова В.Н. Каротиноидные пигменты в осадочных породах Восточной Сибири // Геохимия. - 1989. - № 1. - С. 143-147.

8. Туров Ю.П., Шаботкии И.Г. Высокомолекулярные компоненты нефтяных фенолов // Нефтехимия. - 1993. - Т. 33. - С. 505-509.

9. Туров Ю.П., Кадычагов П.Б. Особенности масс-спектрометрического анализа высококипящих фракций нефти при ионизации электронным ударом // Журнал аналитической химии. - 1992. - Т. 47. - № 4. - С. 666-672.

10. Коржов Ю.В., Головко А.К., Туров Ю.П. Изучение состава нефтяных алкилбен-золов методом хроматомасс-спектрометрии // Изв. Сиб. Отдел. АН СССР. Серия химич. наук, 1989. - Вып. 4. - С. 19-24.

11. Туров Ю.П., Пирогова И.Д., Кадычагов П.Б. Исследование экстрагируемых органических загрязняющих веществ в водах Верхней Волги // Оптика атмосферы и океана, 1994.-Т. 7,-№4. - С. 512-520.

12. Нехорошее В.П., Госсен Л.П., Балахонов Е.Г., Туров Ю.П., Слижов Ю.Г. Анализ продуктов термической и термоокислительной деструкции АПП // Пластические массы, 1994. -№ 2. - С. 71-75.

13. Кадычагов П.Б., Туров Ю.П., Лагно И.А. Исследование состава каменноугольного масла для пропитки древесины методом хроматомасс-спектрометрии // Кокс и химия., -1996. -№9. -С. 23-25.

14. Туров Ю.П., Пирогова И.Д., Гузняева М.Ю., Ермашова H.A. Органические примеси в природных водах г. Стрежевого//Водные ресурсы. - 1998. - Т.25. - № 4. - С. 455-461.

15. Гузняева М.Ю., Кадычагов П.Б., Туров Ю.П. Оценка нефтяного загрязнения окружающей среды с использованием компьютерных баз данных // Нефтехимия. - 1999. -Т. 39.-С. 153-159.

16. Туров Ю.П., Кадычагов П.Б., Гузняева М.Ю., Альшанский A.M. Полициклические ароматические углеводороды в подземных водах и почвах Обь-Томского междуречья // Химия в интересах устойчивого развития. - 1999. - Т. 7. - № 3. - С. 291-299.

17. Turov Y.P., Gooznjaeva M. Polycyclic Aromatic Compounds in West Siberia Environment//!. of Polycyclic Aromatic Compounds.-2000. V. 18. - P. 155-168.

18. Конторович А.Э., Шварцев С.Л., Зуев B.A., Туров Ю.П., Рассказов Н.М. Органические микропримеси в пресных природных водах бассейнов Томи и Верхней Оби // Геохимия. - 2000. - № 5. - С. 533-544.

19. Серебренникова О.В., Казаков A.M., Филиппова Т.Ю., Туров Ю.П. Углеводороды и металлопорфирины в вулканогенно-осадочных толщах триаса Сибири // ДАН. -2001. - Т. 379.-С. 659-661.

20. Серебренникова О.В., Васильев Б.Д., Туров Ю.П., Филиппова Т.Ю., Белицкая Е.А., Ананьев Ю.С., Шандыбин М.В. Нефтепроявление «Сохочул» в Северной Хакасии // Известия Томского политехнического университета (Геология и Разработка нефтяных и газовых месторождений). - 2002. - Т. 305. - Вып. 8. - С. 78-83.

21. Серебренникова О.В., Васильев Б.Д., Туров Ю.П., Филиппова Т.Ю. Нафтиды в базальтах нижнего девона Северо-Минусинской впадины // ДАН. - 2003. - T.390. - С. 525-527.

22. Туров Ю.П., Гузняева М.Ю. Моделирование процессов биодеградации нефти // Нефтехимия. - 2004. - Т. 44. - № 5. - С. 393-400.

23. Нехорошее В.П., Туров Ю.П., Нехорошева А.В., Огородников В.Д., Гаевой К.Н. Исследование строения продуктов термоокислительной деструкции атактического полипропилена // Журн. прикл. химии. - 2006. - Т. 79. - Вып. 3. - С. 493-496.

24. Нехорошее В.П., Туров Ю.П., Нехорошева А.В., Огородников В.Д., Гаевой К.Н. Состав и строение низкомолекулярных продуктов термоокислительной деструкции атактического полипропилена// Журн. прикл. химии. - 2006. - Т. 79. - Вып. 5. - С. 845-852.

25. Нехорошее С.В., Туров Ю.П., Нехорошее В.П., Головко А.К. Установление общих источников происхождения изделий промышленно-хозяйственного назначения, содержащих взрывчатые вещества // Журн. прикл. химии. - 2006. - Т. 79. - С. 1202-1206.

26. Нехорошее С.В., Туров Ю.П., Нехорошев В.П., Головко А.К. Идентификация бензинов с углеводородными маркерами//Журн. аналит. химии. 2009. - Т. 64. - С. 1035-1039.

27. Гаевая Л.Н., Туров Ю.П, Нехорошев В.П., Нехорошев С.В., Афанасьев И.П. Идентификация моторных топлив, маркированных смесью углеводородов // Зав лаборат -2011.-Т. 77.-№6.-С. 68-72.

28. Lyutikova М. N.. Turov Y.P. Chemical constituents from wild Oxycoccus palustris fruit from north Tyumen // Chemistry of Natural Compounds. - 2010. - V. 46. - No 6. - P. 848-851.

29. Гаевая Jl.H., Туров Ю.П., Нехорошев В.П. Исследование состава низкомолекулярных продуктов термоокислительной деструкции атактического полипропилена методом газовой хроматографии/масс-спектрометрии // Масс-спектрометрия. - 2011. - Т.8. - С. 161-168.

30. Gaevaya L.N., Turov Y.P., Nekhoroshev V.P. and Nekhoroshev S.V. Structural-group composition of low-molecular-weight products of thermal oxidative degradation of atactic polypropylene // Russian Journal of Applied Chemistry. - 2011. - V. 84. - No 3. - P. 461-467.

В других научных изданиях:

31. Туров Ю.П., Солиенко О.В. Разделение сложного спектрального контура на индивидуальные составляющие// В кн.: Совершенствование методов анализа нефтей Изд ТФ СО АН СССР. - Томск. - 1983.-С. 124-129.

32. Туров Ю.П. Факторный анализ и его применение при исследовании смесей органических соединений // Сб. статей. - Новосибирск. - Наука. - 1987. - С. 67- 82.

36. Туров Ю.П. Недетерминированные модели состава смесей при обработке данных химического анализа компонентов окружающей среды // В кн. "Системы зкоинформа-тики: проблемы, решения". Сб. науч. тр. - Томск, ТФ СО АН СССР. - 1990. - С. 54-70.

37. Turov Y.P., Gooznjaeva M.Y., Kadychagov Р.В. Geochemical Processes of Oil Spill Dissipation in the Environment // MinChem'98. The Sixth Symposium on Mining Chemistry Hungary, Siofok. - Proceedings. - 1998. - P. 325-330.

38. Turov Y.P., Gooznjaeva M.Y., Golovko A.K. Distribution and Degradation of Oil Pollution under Climatological Factors // III Yugoslav Symposium Chemistry and the Environment". Yugoslavia - Proceedings. - 1998.-P. 17-21.

39. Turov Y.P., Gooznjaeva M.Y., Belitskaja H.A., Kadychagov P.B. Persistent Organic Pollutants and Dispersed Particles in the Water Environment - Detection, Spreading and Fate//B кн.: Advances In Incremental Petroleum Production (the 5 l" volume of the Progress in Mining and Oilfield Chemistry), Akademiai Kiado Rt. - Budapest. - 2003. - P. 357-366.

Монография:

Туров Ю.П., Гузняева М.Ю. Многомерный анализ данных в нефтяной геохимии и химии окружающей среды. Сургут, гос. ун-т. - ООО «Типография «Печатное дело», Ханты-Мансийск, 2010. - 212 с.

Патенты:

1. Патент РФ на изобретение № 2088568. Смесь кетонов, включающая непредельные кетоны, в качестве экстрагента технеция / В.П. Нехорошев, Л.П. Госсен, Ю.П. Туров

B.Г. Меркулов // Опубл. 27.08.1997 г., БИ № 24.

2. Патент РФ на изобретение № 2199574. Химический маркер/С.В. Нехорошев,

C.И. Рубаник, В.П. Нехорошев, Ю.П. Туров /У Опубл. 27.02.2003 г., БИ № 6.

Туров Юрий Прокопьевич

СИСТЕМНЫЙ АНАЛИЗ И АДАПТИВНОЕ МОДЕЛИРОВАНИЕ СЛОЖНЫХ ХИМИЧЕСКИХ ОБЪЕКТОВ

05.13.01 - Системный анализ, управление и обработка информации

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

Подписано в печать 14.03.2013 г. Формат 60x84/16. Усл. печ. л. 2,1. Печать трафаретная. Тираж 100. Заказ П-25.

Отпечатано полиграфическим отделом издательского цешра СурГУ. г. Сургут, ул. Энергетиков, 8. Тел. (3462) 76-30-67.

ГБОУ ВПО «Сургутский государственный университет ХМАО - Югры» 628400, Россия, Ханты-Мансийский автономный округ, г. Сургут, пр. Ленина, 1. Тел. (3462) 76-29-00, факс (3462) 76-29-29.

Текст работы Туров, Юрий Прокопьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

ГБОУ ВПО Сургутский государственный университет ХМАО - Югры ФГБУН Институт химии нефти СО РАН

На правах рукописи

05201350801

Туров Юрий Прокопьевич

СИСТЕМНЫЙ АНАЛИЗ И АДАПТИВНОЕ МОДЕЛИРОВАНИЕ СЛОЖНЫХ ХИМИЧЕСКИХ ОБЪЕКТОВ

05.13.01 - Системный анализ, управление и обработка информации

Диссертация на соискание ученой степени доктора физико-математических наук

Научный консультант Унгер Феликс Гергардович доктор химических наук, профессор

Сургут-2013

Оглавление

Введение.......................................................................................................................5

Глава 1. Обработка экспериментальной информации при исследовании сложных объектов как решение задачи системного анализа................................17

1.1. Формирование иерархической модели системы при обработке данных на этапах качественного и количественного анализа..............................................17

1.2. Детерминированные и адаптивные модели объекта как материальной системы....................................................................................................................24

1.3. Многомерные математические методы обработки данных при анализе смесей......................................................................................................................26

Глава 2. Установление и описание структуры материальной системы по результатам отклика аналитической аппаратуры. Анализ линейности модели и контроль линейности приборного отклика при использовании многоканальных детекторов...................................................................................................................33

2.1. Установление внутренней структуры системы и получение моделей подсистем более низкого уровня при использовании тандемных (комбинированных) аналитических приборов....................................................34

2.2. Масс-спектрометрический детектор в хроматографии...............................36

2.3. Многоканальный спектрофотометрический детектор................................47

Глава 3. Использование модели концентрационного симплекса для установления структуры системы при обработке данных в аналитической

химии...........................................................................................................................53

Глава 4. Факторный анализ и другие многомерные методы обработки данных в химии...........................................................................................................................64

4.1. Математический аппарат факторного анализа............................................65

4.2. Факторный анализ химических данных.......................................................69

4.3. Формирование матрицы результатов наблюдений......................................72

4.4. Стандартизация и нормировка данных.........................................................74

4.5. Факторизация данных и решение задачи абстрактного факторного анализа.....................................................................................................................74

4.6. Преобразование решения задачи абстрактного факторного анализа........80

4.7. Формирование, проверка и корректировка моделей при создании и применении аналитических методик...................................................................89

Глава 5. Адаптивное построение динамических моделей материальных систем как основной принцип создания методик анализа нефтяных смесей методами масс-спектрометрии................................................................................................103

5.1. Анализ смесей с использованием прямого ввода образца в ионный источник................................................................................................................103

5.2. Моделирование молекулярно-массовых распределений компонентов в нефти распределением Пуассона........................................................................106

5.3. Модифицированный метод селективного ионного детектирования в хроматомасс-спектрометрии...............................................................................118

Глава 6. Реализация адаптивных подходов к формированию модели системы при обработке данных в аналитической химии и при создании методик анализа различных объектов.................................................................................................123

6.1. Анализ элементного состава смесей...........................................................123

6.2. Абсорбционная спектрофотометрия УФ, видимого и ИК диапазона.....129

6.3. Обнаружение минорных компонентов и разделение перекрывающихся хроматографических пиков в ГХ/МС................................................................132

6.4. Разделение полностью перекрывающихся хроматографических пиков

с совпадающими временами удерживания аналитов.......................................140

6.5. Установление источников нефтяного загрязнения подземных вод Ширинского района респ. Хакасия. Перспективы нефтегазоносности территории............................................................................................................144

6.6. Качественные и количественные изменения массы и углеводородного состава нефти и при ее биодеградации..............................................................151

6.7. Групповой и индивидуальный состав нефтяных компонентов, природных соединений и технологических материалов......................................................161

6.7.1. Анализ группового состава нефтяных фенолов..................................162

6.7.2. Анализ группового состава нефтяных азотистых оснований............167

6.7.3. Исследование изомерного состава трициклических азотистых

оснований СпН2п-^ в различных нефтях......................................................171

6.7.4. Анализ состава низкомолекулярных продуктов термоокислительной деструкции атактического полипропилена....................................................174

6.7.5. Исследование надмолекулярной структуры комплексов трет.бутилтриалкилборатов лития..................................................................191

6.7.6. Идентификационная криминалистическая экспертиза.......................198

6.7.7. Анализ состава растительных экстрактов............................................203

Заключение...............................................................................................................206

Список литературы..................................................................................................211

Введение

Актуальность проблемы. Системный анализ как эффективный инструмент решения самых разнообразных междисциплинарных задач находит все большее распространение. Системный анализ позволяет также реализовать непосредственный контакт и стыковку принципов различных конкретных наук, открывая новые возможности решения наддисциплинарных проблем.

Установление состава сложных химических объектов, строения веществ и материалов является примером междисциплинарной задачи, и лежит в основе регулирования технологических процессов, определения цены товаров при коммерческих сделках, идентификации источников загрязнения окружающей среды, криминалистической экспертизы и играет важную роль в других областях человеческой деятельности.

Обеспечить надежность, правильность и низкие погрешности результатов при решении таких задач чрезвычайно важно, поскольку ошибки обходятся дорого и могут вызвать разнообразные тяжелые последствия: утрату позиций на рынке, прямые и косвенные экономические потери, а также социальные и даже политические последствия, что особенно характерно, например, для рынка энергоносителей - нефти и нефтепродуктов.

Решение таких комплексных задач распадается на два этапа: получение набора исходных характеристик объекта (значений аналитических признаков), а затем математическую обработку полученных данных.

Количественная связь исходных характеристик с исследуемыми свойствами объекта по своей сути является его математической моделью, параметры которой чаще всего устанавливаются заранее с использованием обучающих процедур.

Качество конечных результатов, получаемых на основе используемой модели, определяется множеством не всегда поддающихся непосредственному контролю факторов. Кроме конечной точности измерений, наиболее значимым источником погрешностей является неполное соответствие качественного

состава реальных образцов модельным, включенным в обучающую выборку, на основе которой были разработаны и аттестованы методики анализа. Решению этой проблемы путем более полного физического моделирования за счет увеличения числа модельных смесей в обучающей выборке препятствует широкая вариабельность состава природных объектов и ограниченный набор стандартов - трудно физически моделировать материальную систему, компонентный состав которой априори не определен.

Значимый вклад в снижение качества результатов могут вносить погрешности определения аналитических сигналов за счет неконтролируемых вариаций технического состояния и настроек приборов. Кроме того, разработчики новых поколений аппаратуры с микропроцессорным и компьютерным управлением, стремясь защитить свои программные продукты от неквалифицированного доступа, часто ограничивают функции оператора только лишь регистрацией полученных данных, оставляя функции контроля качества работы аппаратуры фирменным сервисным службам. Поэтому не проявляющие себя явно отклонения от штатных режимов работы отдельных узлов автоматизированной аппаратуры могут долгое время служить источником дополнительных погрешностей.

Поэтому значительная часть результатов, получаемых с использованием методик, аттестованных на модельных обучающих выборках, содержит погрешности, которые не могут быть обнаружены обычными приемами внутрилабораторного контроля качества.

Все перечисленные задачи решаются методами аналитической химии с применением в качестве исходной информации результатов использования различных физико-химических методов [1].

Как показывает практика, при решении многих задач определяющую роль могут играть не только или даже не столько метрологические характеристики используемых методов исследования и аналитической аппаратуры, а степень корректности исходной модели исследуемой материальной системы, адекватное построение плана эксперимента и выбор подходящих методик [2,3].

Для обработки данных в химии давно и успешно применяются самые разнообразные математические алгоритмы. Основной тенденцией последних десятилетий является все более широкое использование методов многомерной статистики для планирования и обработки результатов аналитических экспериментов. Это обусловлено открывшейся в эпоху персональных ЭВМ доступностью высокопроизводительных вычислительных средств, а также появлением и широким распространением аналитической аппаратуры с многоканальными детекторами - диодными матрицами в оптической спектроскопии, быстро сканирующими анализаторами в масс-спектрометрии, радиоспектроскопии и т.п.

Число публикаций, посвященных применению математических методов и компьютеров в аналитической химии, стремительно растет с каждым годом. Появилась даже терминологически выделенная область науки, синтетическая дисциплина на стыке химии и математики - хемометрика [4]. И уже внутри этой новой дисциплины выделено множество самостоятельных рубрик, число которых может варьировать от 4 в цитированной статье до 10 в одном из обзоров журнала Analytical Chemistry [5]. Но, несмотря на огромное разнообразие конкретных задач, которые решаются или могут быть решены в симбиозе математики и аналитической химии, с информационных позиций все они неизменно объединены одной общностью - на основе набора многочисленных, но косвенных характеристик исследуемого объекта, мы в итоге должны получить представление или знание об его составе и строении образующих его компонентов.

Многочисленные хемометрические публикации предлагают в основном варианты решения лишь частных задач, предваряя их требованием выполнения обязательных дополнительных условий, практически нереализуемых при проведении реальных аналитических работ. Такими условиями являются наличие свободных от наложения аналитических признаков для каждого компонента, знание аналитической формы эволюционирующих во времени сигналов (профилей элюирования компонентов в хроматографии, изменения

парциальных давлений компонентов в источнике ионов в масс-спектрометрии) и т.п.

Перспективным является поиск решения задачи установления материального состава образца в рамках модели единой динамической системы, включающей аналитический прибор, характеристики режимов его работы, собственно исследуемый образец, и модель его состава, адаптированная к конкретным целям анализа.

Поэтому разработка адаптивной методологии к исследованию сложных химических объектов, не требующей предварительного обучения, основанной на математической обработке и интерпретации многомерных экспериментальных данных, получаемых при исследовании конкретного объекта, а также разработка алгоритмов и программ для решения этих задач, с использованием системных подходов к анализу экспериментальной информации, является актуальной.

Работа посвящена системному анализу данных с применением адаптивных моделей состава, математическим методам обработки многомерной информации и рассмотрению физических процессов, лежащих в основе формирования аналитических сигналов при использовании аппаратуры с многоканальными детекторами в исследовании сложных химических объектов.

Цель работы - создание методологии для формирования новых и совершенствования существующих методик исследования смесевых образцов и повышения достоверности получаемых результатов за счет адаптивного моделирования сложных химических объектов без использования процедур обучения на основе системного анализа экспериментальных данных и физических процессов, лежащих в основе формирования аналитических сигналов при использовании аппаратуры с многоканальными детекторами.

Достижение цели осуществлено путем решения комплекса задач, включающего:

- разработку на основе приемов системного анализа общей методологии для создания методик исследования сложных химических объектов путем

построения моделей состава, адаптируемых к результатам конкретных аналитических экспериментов при использовании аппаратуры с многоканальными детекторами;

- разработку общих принципов адаптации моделей состава на основе фактической информации о характеристиках исследуемого объекта или набора родственных образцов при отсутствии чистых эталонов для обучения;

- разработку алгоритмов и процедур для оценки диапазона линейности аналитического отклика многоканальных детекторов, обнаружения нелинейностей в наборах данных и корректировки сигналов в случае обнаруженной нелинейности;

- создание методик для исследования не полностью разделенных хроматографических пиков, выделения спектров чистых компонент из спектров смесей, восстановления профилей элюирования компонент при перекрывании хроматографических пиков, обнаружения пиков малой интенсивности в хроматографии с многоканальными детекторами;

- исследование группового и индивидуального состава нефтяных фракций, образцов нефтяного и общего органического загрязнения окружающей среды, и изменение состава нефтяных систем под воздействием природных и технологических факторов.

Объекты и методы исследования: Объектами исследования являлись образцы многокомпонентных смесей органических соединений - сырых нефтей и их фракций, товарных нефтепродуктов, продуктов деградации нефтяных систем в природных и модельных условиях, геологических объектов, органических загрязняющих веществ и примесей в компонентах природной среды и других многокомпонентных систем.

Методы исследования: масс-спектрометрия, хроматомасс-спектрометрия, спектрофотометрия инфракрасного, видимого и ультрафиолетового диапазонов спектра, хроматография, элементный анализ. Методы и средства системного анализа использовались при обработке экспериментальной информации и формировании моделей сложных химических объектов.

На защиту выносятся:

1. Методология создания методик качественного и количественного анализа на основе адаптивных математических моделей состава в аналитической химии смесей органических соединений с многоканальным детектированием аналитических сигналов. Методология предусматривает определение реальной размерности системы, минимизирующей величину остаточной дисперсии в данных, с учетом величины погрешностей, свойств исследуемой материальной системы и влияния на нее аналитической аппаратуры.

2. Алгоритм построения модели материального состава смесей из фиксированного числа компонентов, позволяющий определить ее параметры -размерность (число компонентов), характеристики элементов (спектры компонентов) и соотношения между элементами (содержания компонентов) на основе взаимно однозначной связи концентрационного и признакового симплексов смесевых образцов.

3. Модель гомологического состава отдельных классов нефтяных соединений и состава нефтяной системы в целом, в рамках которой относительные содержания гомологов внутри класса описывается однопараметрическим распределением Пуассона, а состав нефтяной системы в целом - суперпозицией распределений Пуассона гомологов образующих ее классов соединений.

4. Алгоритм и программа для регуляризации неоднозначного решения задачи абстрактного факторного анализа при обработке наборов многомерных данных методами линейного программирования для целенаправленного преобразования с цель�