автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.01, диссертация на тему:Повышение точности количественного хроматографического анализа сложных веществ с использованием нейронных сетей

кандидата технических наук
Хабурзания, Тимур Зурабович
город
Санкт-Петербург
год
2013
специальность ВАК РФ
05.11.01
цена
450 рублей
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Повышение точности количественного хроматографического анализа сложных веществ с использованием нейронных сетей»

Автореферат диссертации по теме "Повышение точности количественного хроматографического анализа сложных веществ с использованием нейронных сетей"

На правах рукописи

<3

ХАБУРЗАНИЯ Тимур Зурабович

ПОВЫШЕНИЕ ТОЧНОСТИ КОЛИЧЕСТВЕННОГО ХРОМАТОГРАФИЧЕСКОГО АНАЛИЗА СЛОЖНЫХ ВЕЩЕСТВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

Специальность 05.11.01 - Приборы и методы измерения (аналитические измерения)

Автореферат диссертации на соискание ученой степени кандидата технических наук

5 ДЕК ¿013

Санкт-Петербург - 2013

005542755

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный политехнический университет»

Научный руководитель -

доктор технических наук, профессор СОЛОПЧЕНКО Геннадий Николаевич

Официальные оппоненты:

ШКОДЫРЕВ Вячеслав Петрович -доктор технических наук, профессор федерального государственного бюджетного образовательного учреждения

высшего профессионального образования «Санкт-Петербургский государственный политехнический университет», заведующий кафедрой систем и технологий управления.

МАНОИЛОВ Владимир Владимирович -доктор технических наук, старший научный сотрудник федерального государственного бюджетного учреждения науки «Институт аналитического приборостроения Российской академии наук», заведующий сектором автоматизации измерений и цифровой обработки сигналов.

Ведущая организация - федеральное государственное унитарное предприятие «Всероссийский научно-исследовательский институт метрологии им. Д.И.Менделеева».

Защита состоится «26» декабря 2013 г. в 14 часов на заседании диссертационного

совета Д 212.229.10 при ФГБОУ ВПО «СПбГПУ» по адресу:

195251, г. Санкт-Петербург, ул. Политехническая, 21, учебный корпус 9, ауд. 121.

С диссертацией можно ознакомиться в фундаментальной библиотеке ФГБОУ ВПО «СПбГПУ».

Автореферат разослан «25» ноября 2013 г.

Ученый секретарь диссертационного совета -кандидат технических наук, доцент БОГАЧ Наталья Владимировна

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Аналитические приборы являются важной разновидностью измерительной техники, предназначенной для исследования и количественного определения состава веществ. Требования к точности химического анализа отмечены в Законе РФ «Об обеспечении единства измерений», в особенности, когда они проводятся по заказу органов арбитража, судов, токсикологических и экологических служб, а также в учреждениях здравоохранения.

Развитие этого направления идет не только по пути улучшения характеристик аналитических приборов, к которым относятся хроматографы, но и по пути совершенствования новых методов обработки и анализа зарегистрированных хроматограмм с целыо устранения искажений, вызванных аппаратным несовершенством применяемых приборов. Эти искажения обычно проявляются в появлении шума, а также в расширении и пересечении хроматографических пиков, которое вызвано сверткой с аппаратной функцией хроматографа, что приводит к снижению разрешающей способности и к значительным погрешностям количественного хроматографического анализа состава сложных веществ. Одним из путей коррекции уширения пиков может быть численное решение операторного уравнения свертки, ядром которого является аппаратная функция, благодаря чему может быть повышена разрешающая способность и точность количественного анализа. Такая задача впервые была сформулирована Рэле-ем в 1871 году применительно к спектроскопии и была названа им редукцией к идеальному прибору, которая есть не что иное, как обращение хода причинно-следственной связи: от выхода ко входу, то есть от следствия к причине. Однако для всех средств измерений, в том числе для аналитических приборов, эта обратная задача является некорректно поставленной и реальный подход к получению устойчивого решения, а именно - регуляризация, был в окончательном виде сформулирован

A.Н.Тихоновым лишь в шестидесятых годах XX века. С этого времени были предложены многочисленные регуляризирующие методы, алгоритмы и программы решения обратной задачи для различных областей и условий измерения. Значительный вклад в развитие математических и практических приемов получения устойчивого решения некорректных задач внесли такие ученые, как М.М.Лаврентьев, В.К.Иванов,

B.П.Танана, А.Б.Бакушинский, В.А.Морозов, В.Ф.Турчин, В.Б.Гласко, А.В.Гончарский, Г.И.Василенко, В.С.Сизиков, Ю.П.Пытьев, В.Г.Романов, Г.Н.Солопченко, а также зарубежные ученые - О.Ь.РЫШрв, .Г.ТЧ.РгапкПп, К.МШег, А.РеПпдег и другие.

Современные хроматографы оснащены компьютерами, и поскольку внедрение программных методов реализуется проще, чем аппаратное усовершенствование, поиск новых алгоритмов решения этой важной прикладной задачи не теряет своей актуальности. Однако решение обратной задачи в хроматографии усложнено тем, что с достаточной уверенностью можно говорить лишь о функциональном виде аппаратной функции хроматографа, в то время как ее параметры неизвестны, они меняются в процессе регистрации хроматограммы и зависят от качества и чистоты адсорбента, наполняющего колонку. По этим причинам, а также из-за многообразия действующих факторов и шумовых эффектов, универсального решения обратной задачи, сформулированной как решение операторного уравнения, до настоящего времени не получено. Известны лишь отдельные приемы и методы решения для конкретных частных случаев.

В настоящей диссертации с целью коррекции уширения хроматографических пиков и тем самым повышения точности хроматографического анализа предпринята

попытка применить искусственные нейронные сети. В области применения нейронных сетей к конкретным случаям хроматографического анализа состава сложных веществ известны работы таких авторов, как М.Х.Салахова, Н.В.Замятина и их коллег. Успешность применения нейросетевых технологий для обработки хроматограмм оправдана тем, что эти технологии обладают способностью к обобщению как полезной информации, так и шума и искажений, а это в конечном итоге может позволить получить устойчивое решение обратной задачи при неизвестной аппаратной функции и в присутствии мешающих факторов. В конечном результате ожидается повышение разрешающей способности хроматографического анализа, выражающееся в разделении пересекающихся пиков, что в свою очередь должно привести к повышению точности определения площадей пиков отдельных компонентов, и значит — к повышению точности измерения массовой концентрации содержания компонентов в сложных веществах и смесях.

Применение нейронных сетей для разделения хроматографических пиков сопоставляется в работе с технологией всйвлст-аппроксИмации хроматограмм, которая в последнее время развивается в работах Л.В.Новикова, В.В.Манойлова, Р.Т.Сайфуллина и их коллег. Выполненное сопоставление помимо близости аппрок-симационных свойств показало преимущество нейронных сетей, которое выражается в возможности распознавания типовых искажений хроматограмм при неполном разделении пиков на основе обобщенных прототипов.

При количественном хроматографическом анализе сложных веществ и сопоставлении эффективности различных методов возникает проблема определения погрешности получаемых результатов. Для решения этой проблемы в диссертации используется способ, основанный на применении цифровых моделей зарегистрированных хроматограмм, который предложен и разрабатывается Ш.Р.Фаткудиновой, Л.А.Русиновым, Г.Н.Солопченко и О.Л.Рутенберг.

Практический интерес представляет также задача выявления «скрытых» свойств сигнала. Для исследования этой задачи сформулированы и обоснованы направления дальнейшего совершенствования разработанной вычислительной технологии на базе принципов искусственного интеллекта.

Целью работы является разработка и исследование нейросетевой технологии обработки измерительной информации с целью решения обратных некорректных задач хроматографического анализа. Для достижения этих целей в диссертации решались следующие задачи:

• сравнительный анализ и выбор вида нейронной сети, обеспечивающей эффективное решение поставленной задачи на модельных и реальных хроматограм-мах,

• сопоставление нейросетевой технологии с технологией вейвлет-аппроксимации на модельных и реальных примерах,

• разработка программного средства, обеспечивающего снижение погрешности измерения массовой концентрации компонентов сложных веществ при хроматографическом анализе за счет разделения пересекающихся хроматографических пиков в условиях действия погрешностей регистрации хроматограмм. Методы исследования. Для решения поставленных задач в работе были использованы теория нейронных сетей, методы математического моделирования, методы вычислительной математики, вейвлет-анализ.

Объектом исследования являются фрагменты хроматограмм, содержащие неполностью разделенные пики, и алгоритмы восстановления сигналов, поступающих с хроматографа.

Научную новизну работы составляет:

• предложенный вариант нейросетевой технологии решения обратной некорректной задачи разделения хроматографических пиков в сложных условиях неопределенности;

• методы и алгоритмы интерактивного разделения хроматографических пиков на основе концепции конкуренции;

• результаты нейросетевого моделирования сигналов сложной формы при хро-матографическом анализе;

• метод сравнительной оценки погрешности определения площади пиков, основанный на моделировании неразделенных и разделенных пиков. Достоверность научных результатов и выводов подтверждается представленными в работе теоретическими выводами, корректностью интерпретации аналитических сигналов при хроматографическом анализе, согласованностью результатов, получаемых в соответствии с разработанной методикой разделения пиков, с точными результатами обработки модельных хроматограмм.

Основные научные результаты:

• сформулированы основные задачи и принципы построения моделей и методов обработки хроматографической информации в рамках конкурирующих нейро-сетевых вычислительных технологий;

• разработана и обоснована структура нейросетевой модели анализа хроматографической информации с целью повышения точности разделения пиков компонент сложных сигналов и надежности распознавании состава исследуемого вещества;

• получены материалы экспериментальных исследований при моделировании сложных процессов в хроматографии.

Практическая ценность работы заключается в следующем:

• разработан нейросетевой алгоритм обработки измерительной информации, существенно повышающий точность измерения площадей пиков при хроматографическом анализе;

• разработано программное средство, реализующее процедуры анализа сигналов сложной формы при решении обратных задач интерпретации измерительной информации, содержащейся в хроматографических сигналах.

Внедрение результатов работы. Разработанные методы, алгоритмы и программное средство были применены при количественном анализе состава нестабильного газового конденсата, образцы хроматограмм которого были предоставлены рядом организаций, и включены в учебное пособие СПбГПУ «Обработка сигналов в информационных системах», которое используется в дисциплине «Цифровая обработка сигналов» на кафедре «Измерительные информационные технологии».

Апробация работы. Основные результаты работы докладывались и обсуждались на национальных и международных научно-технических конференциях, проводимых в Санкт-Петербурге: Международной научно-практической конференции «Измерения в современном мире - 2009»; Всероссийской научно-методической конференции «Телематика - 2009»; Общероссийской конференции молодых ученых и специалистов по морским интеллектуальным технологиям «Моринтех-юниор - 2009»; Международной конференции по мягким вычислениям и измерениям «вСМ - 2010»;

Международной конференции по интеллектуальным системам и технологиям «П18Т -2013». Общая характеристика работы и результаты экспериментов обсуждены на городском научном семинаре «Современные проблемы нейроинформатики», Санкт-Петербург, 2013.

Основные положения, выносимые на защиту:

1. Выбор вида нейронной сети, обеспечивающей эффективное решение обратных задач конкретного типа в хроматографии.

2. Теоретическое обоснование и экспериментальное подтверждение работоспособности ШЗР-сети для решения обратных задач конкретного типа в хроматографии.

3. Результаты сопоставления эффективности ЯВР-сети и вейвлет-аппроксимации для количественного хроматографического анализа состава сложных веществ.

4. Поход к определению и сопоставлению погрешности определение площадей неразделенных и разделенных хроматографических пиков.

5. Программное средство повышения точности количественного хроматографического анализа.

Публикации. По теме диссертации опубликовано 9 работ, из них 1 - в рекомендуемых ВАК журналах «Нейрокомпьютеры: разработка, применение», 2009 г., №11, остальные — в коллективной монографии «Нейрокомпьютеры в интеллектуальных технологиях XXI века», М.: Радиотехника, 2012 г., коллективном учебном пособии «Обработка сигналов в информационных системах», Санкт-Петербург: Изд-во Политехнического университета, 2010 г. и в периодических журналах и трудах отечественных и международных конференций. Объем и структура работы.

Работа состоит из введения, четырех глав, заключения и двух приложений. Объем - 160 страниц, в том числе 78 рисунков (43 в приложении), 18 таблиц. Список литературы включает 168 наименований.

Первая глава диссертации содержит обзор существующих модельных представлений и методов разделения пиков хроматографических сигналов.

Проведенный в первой главе аналитический обзор теоретических исследований и практических приложений в области хроматографии и нейрокомпыотинга включает в себя сравнительное исследование модельных представлений аппаратной функции хроматографов и хроматографических пиков, а также разнообразных методов определения площадей пересекающихся хроматографических пиков, пропорциональных массовой концентрации компонентов сложных веществ. В обзор включены традиционные методы определения площади пиков, такие как метод перпендикуляра и метод касательных, а также методы, опирающиеся на регуляризированное по А.Н.Тихонову решение некорректной обратной задачи.

Применение геометрических методов при неполностью разделенных пиках может быть осложнено отсутствием четко выраженных долин, из минимума которых проводятся перпендикуляры к основанию пиков, и склонов пиков, к которым можно провести касательные, как это видно на рис. 1а, где представлен фрагмент реальной хроматограммы (результат обработки этого фрагмента представлен на рис. 16). Подобные ситуации возникают, например, при анализе сточных вод методом высокоэффективной жидкостной хроматографии или при секвенировании биополимеров методом капиллярного электрофореза.

Вскоре после того, как А.Н.Тихонов сформулировал общий подход к решению некорректных задач, многие исследователи попытались применить этот подход к

п

Рис. 1. Фрагмент реальной хромапограммы с двумя неразделенными пиками (а) и резулыпст ее восстановления (б)

решению задачи разделения хроматографических пиков, реанимируя идею Релея о редукции к идеальному прибору. В соответствии с этим задача разделения пиков сводилась к решению операторного уравнения свертки

Ах(у) = у(у) + 6(у), (1)

в котором оператор А есть оператор свертки неискаженного процессом измерения сигнала на входе хроматографа х(у), у(у) - зарегистрированная хроматограмма, б(у) -погрешность регистрации. В соответствии с методом А.П.Тихонова, который получил название регуляризация, решение уравнения (I) отыскивалось на множестве гладких функций, для чего изначальный оператор А претерпевал небольшое регуляризирую-щее изменение, такое, что обратный ему оператор А~', где а - параметр регуляризации, был непрерывным. В ряде прикладных задач было получено удовлетворительное решение. Однако, анализ реальных хроматограмм и физико-химические свойства хроматографии свидетельствуют о том, что ядро оператора А, то есть аппаратная функция хроматографа, неизвестна, ее ширина изменяется, увеличиваясь по мере увеличения времени выхода и зависит от чистоты и других свойств адсорбента и колонки в целом. Кроме того получение сведений о погрешности 8(у) иногда оказывается затрудненным.

В связи с этим в последнее время благодаря возникновению и широкому применению нейросетевых технологий делаются попытки решения задачи разделения хроматографических и спектрометрических пиков за счет привлечения нейронных сетей, опубликованные в работах Д.В.Медянцева (2005 г), Н.1УПао (1996 г.), У.В.1л (2001 г.), З.ЗеЩеНав (2003 г.) и их коллег, но в них не была учтена некорректность обратной задачи. В работе А.А.Севастьянова (2003 г.) предпринята попытка решить проблему разделения спектрометрических пиков методом статистической регуляризации с помощью байесовского подхода, который требует обширной априорной информации, отсутствующей в хроматографии.

Кроме отмеченных работ в первой главе приводятся и анализируются результаты обработки хроматограмм с помощью вейвлет-аппроксимации, полученные в работах Л.В.Новикова, В.В.Манойлова, Р.Т.Сайфуллина.

В результате выполненного обзора в главе сформулирован подход к решению задачи разделения пересекающихся хроматографических пиков, который предусматривает выбор нейросети подходящего вида, сопоставление этого выбора с предполагаемыми результатами вейвлет-аппроксимации и сравнительное оценивание погрешности конечных результатов.

Вторая глава диссертации посвящена рассмотрению методов и моделей формализации знаний при обработке аналитической информации. Полученные результаты позволяют осуществить синтез программного средства для исследования сложных процессов, характерных для анализа хроматографических сигналов.

Исследуемые алгоритмы обработки хроматографической информации реализованы с использованием конкурирующих вычислительных технологий. Предлагаемый подход призван дополнить существующие решения, в каждом конкретном случае для обработки данных модель будет выбрана по критерию эффективности аппроксимации. Одной из центральных задач реализации такого подхода является формирование ядра программной системы обработки данных хроматографического анализа, включающего в себя предметную область, базу знаний и базу данных. Для создания этой совокупности формируется концептуальная модель аналитического комплекса, ориентированная на решение обратных задач с целью разделения пересекающихся пиков и тем самым эффективного улучшения разрешающей способности применяемых технических средств. В функциональном аспекте такая модель включает следующие компоненты:

8Р = <У;Х;Л":;РР> (3)

8Р={8Р1,...,8РЫ} - совокупность функциональных элементов, определяющих вычислительный комплекс; У = У„ (7 = 1,..т) - множество выходных (поступающих от хроматографа), X = Хр (] = 1,..п) - множество искомых (восстановленных) сигналов; : У —> X - непрерывный регуляризирующий оператор, определяющий процесс функционирования системы 8Р; РР - множество функциональных параметров.

Реализация концептуальной модели осуществляется на основе принципа конкуренции (рис. 2). Использование этого принципа в задачах обработки информации позволяет повысить достоверность результатов анализа за счет выбора наиболее предпочтительной вычислительной технологии в зависимости от особенностей исследуемого сигнала. Здесь "стандартная модель " предполагает использование достижений классической математики при обработке хроматографических сигналов.

Генерация альтернативных решений

Стандартная модель

Нейросетевая модель

Г

Анализ альтернатив и выбор решения

Рис. 2. Реализация принципа конкуренции

Концепция конкуренции реализуется на основе модели выбора, критериальный базис которой основан на интерпретации сравниваемых вычислительных технологий по точности аппроксимации. Такой подход особенно эффективен в сложных ситуациях при наличии значительных помех и скрытых особенностей сигналов. Как показывают результаты исследований, полной редукции к идеальному прибору достигнуть не удается из-за неточного знания аппаратной функции хроматографа, наличия погрешности реализации корректирующего устройства (фильтра), присутствия шума в выходном сигнале и некорректности обратной задачи. Алгоритм обработки информации реализуется в рамках принципа конкуренции (рис. 3). Здесь СА - стандартный алгоритм; НС — нейронная сеть.

Рис. 3. Папок информации при обработке данных измерений

Решение этих задач с использованием нейронных сетей для аппроксимации сигналов ведется с учетом восстановления сигналов измеряемого процесса и наличия погрешности характеристик корректируемого измерительного средства. Рассматривались возможные варианты применения таких нейронных сетей, как многослойные персептроны и сетей на основе радиально-базисных функций. Сети с обратными связями, позволяющие моделировать временные процессы, выходные значения нейронов в которых могут передаваться к их же входам, не рассматривались, так как хромато-граммы обрабатывались не в реальном времени, а по завершению процесса регистрации. Среди сетей с прямыми связями, в которых сигналы от нейрона к нейрону распространяются только от входов сети к ее выходам, были сравнены самые распространенные в задачах аппроксимации - многослойный персептрон (МСП) и сеть на основе радиально-базисных функций (КВР). В результате была выбрана ЯВР-сеть из-за соответствия ее структуры представлениям о физике хроматографического процесса и более высокой скорости аппроксимации для достижения одного и того же значения погрешности, как будет показано дальше. Математическая модель формального нейрона в ГШР-сети имеет вид:

у = Р(Ые1(Х,\У)), (4)

где у - выходной сигнал; Г - функция активации; №ЦХ,\У) - дискриминантная функция:

N

= = , (5)

где X - входной вектор; \¥ - вектор весовых коэффициентов.

Дискриминантная функция представляет собой скалярное произведение Триерного вектора весовых коэффициентов и вектора 1Л(Х), каждая компонента которого является некоторой функцией входного вектора X, Структура вектора 1ДХ) задает свойства нейрона. В задачах обработки аналитической информации дискриминантная функция №1(Х,\¥) (5) может представлять собой отрезок многомерного ряда Тейлора степени Ь. Компоненты вектора 11(Х) могут быть более сложными функциями, чем функции, образующие отрезок ряда Тейлора. В частности, довольно распространенной является функция:

и 1(Х) = Ш (6)

где г,=((Х - С|) (X - С,)) - евклидово расстояние от точки X до заданной точки С; функция С(Г|) задается выражением

Г(П) = ехр (- г2/ 2а2), (7)

где а — параметр, определяющий размах базисной функции, а ЯВР-сеть называют сетью гауссовых базисных функций.

Выполнено исследование времени обучения КВР-ссти и многослойного персептрона на примере восстановления сложного многопикового сигнала. На рис. 4 представлены кривые обучения ЯВР - сети (точки) и многослойного персептрона (сплошная линия) в координатах (итерации обучения, относительная погрешность аппроксимации).

о. ю О.ОЭ 0.08 0.07 О.Об 0.05 0.0'1 О.ОЗ 0.02 О.СИ О.ОО

Рис. 4. Кривые обучения ЯВР-сети

Из приведенных данных следует, что для достижения допустимой погрешности аппроксимации (2 - 3)% для ГШР-сети требуется приблизительно в 1,5 раза меньше времени обучения по сравнению с использованием многослойного персептрона. Среди других преимуществ ЯВР-сетей следует выделить:

• обеспечение моделирования произвольной нелинейной функции с помощью одного промежуточного слоя, в результате чего отпадает необходимость выбора числа слоев нейронной сети;

• возможность оптимизации параметров в выходном слое с помощью методов линейной оптимизации (при обучении отсутствует возможность попадания в локальный минимум).

В результате ЛВР-сеть обучается значительно быстрее, чем многослойный пер-септрон, что показано также в работах Ю.И.Нечаева, Д.А.Тархова, А.Н.Васильева и других исследователей. При этом следует иметь в виду, что в промежуточном слое в процессе обучения для радиальных элементов дополнительно определяются положения их центров и величины отклонений.

Реализация принципов предварительной обработки информации при формировании входных сигналов позволила существенно улучшить как параметры обучения (длительность, сложность алгоритма оптимизации функционала ошибки), так и функционирование используемой нейросетевой технологии в целом. Вопросы структурного и параметрического синтеза ЯБР-сетей рассмотрены с учетом конкретных прикладных задач.

В третьей главе решается задача моделирования, анализа и интерпретации сложных хроматографических сигналов, оптимизации архитектуры и методов обучения ЯБР-сетей для различных классов задач обработки аналитической информации. Обоснованность и достоверность результатов нейросетевого моделирования подтверждается следующими основными положениями:

• правильный выбор исходных постановок задач нейросетевого моделирования исследуемых физических процессов;

• результаты экспериментов по разделению пиков сопоставлялись с регуляризи-рующим методом на основе принципа минимального модуля в пространстве Фурье-образов, разработанным Г.Н.Солопченко;

• получены удовлетворительные результаты нейросетевого анализа и численных экспериментов восстановления реальных хроматограмм тестовых смесей, параметры процесса элюирования которых намеренно были выбраны такими, чтобы получить неполностью разделенные пики.

Численные эксперименты с использованием 11ВР-сети проводились для ядра Коши и ядра Гаусса, применение которых для описания формы хроматографических пиков было обосновано в работе Э.А.Юоллика и коллег (1978 г.), а также для разности двух гауссиан (используется в вейвлет-анализе, т.н. с1о§-вейвлет). Так как в хроматографии чаще применяется ядро Гаусса, эта функция была выбрана в качестве основной. Для неё проводилась большая часть численных экспериментов. В связи с большим объемом вычислительных экспериментов, в диссертации обсуждаются только самые характерные из них.

При аппроксимации хроматограмм минимизация функционала ошибки обучения сети (сумма квадратов отклонений выходов сети от зарегистрированной хромато-граммы) осуществлялась на основе разных подходов - минимизация по всем параметрам одновременно и без заранее фиксированного числа нейронов, при котором нейроны добавляются в процессе обучения. Для получения приемлемой точности первый подход требует использования сети, состоящей из достаточно большого числа нейронов, что приводит к существенному росту времени обучения. Для реализации второго подхода определялись веса добавляемого нейрона (нейронов) и особенности последующего итерационного процесса. Для линейно входящих весов решалась соответствующая система линейных уравнений. Если добавлять один нейрон, то центр базисной функции разумно взять в точке с максимальной ошибкой. Этот вариант в дальнейшем использовался в качестве основного. Добавление нескольких нейронов значительно усложняет алгоритм, но не дает ощутимого выигрыша в достоверности восстановления сигнала.

В качестве алгоритма нелинейной оптимизации использовалась комбинация метода 11Ргор и метода виртуальных частиц - каждая точка облака в малой окрестности начального значения подбираемого параметра движется в соответствии со знаками координат суммарного градиента по всем точкам облака.

Первая серия экспериментов была связана с оценкой влияния числа нейронов и тестовых точек при обучении сети. Преодолеть неустойчивый характер процесса обучения позволяет увеличение числа тестовых точек. Более точные оценки дисперсии достигнуты для большего числа нейронов. С определенного количества нейронов дальнейшее увеличение их числа в используемых сетях не приводило к значительному улучшению результата.

Уменьшение ошибки обучения сети достигнуто путем увеличения числа тестовых точек, однако это приводило к замедлению процесса обучение сети. Для ускорения процесса обучения выполнялся предварительный анализ функционала, который является квадратичным по параметрам амплитуд базисных функций. Начальные значения этих параметров подбирались путем решения соответствующей системы линейных уравнений. Такой подход оказался весьма продуктивным при использовании ядра Коши, но для ядра Гаусса его результативность оказалась сильно зависящей от

выбора начальных значений параметров (характерного линейного размера) крутизны экспонент.

Интересные результаты экспериментов получены при оценке влияния степени искажения хроматограммы действием аппаратной функции. В этом эксперименте была смоделирована хроматограмма путем свертки 4 отдельно стоящих пиков с аппаратной функцией. На рис. 5 приведены результаты восстановления (сплошные линии) одной и той же смоделированной хроматограммы (точки), полученные при разном объеме вычислений при поиске параметров гауссиан. Чем сильнее пересекаются пики в зарегистрированной хроматограмме, тем большее количество итераций при одном и том же числе нейронов требуется для достоверного восстановления сигнала.

V

А

Л,

Л1

1.....

а) 6)

Рис. 5. Смоделированная и 2 восстановленных хромапограммы при различном объеме вычислений, (а) - 200 ипераций, (б) - 2000 ипераций

Важным аспектом проведенного эксперимента является работа в ситуации, когда к зарегистрированному сигналу добавляется шум. Для случая, когда случайная добавка имеет амплитуду 0.01, её влияние практически незаметно. Для сильно зашум-ленного сигнала (рис. 6а) увеличение амплитуды шума до 0.5 приводит к вполне удовлетворительному восстановлению хроматограммы (рис. 66), однако при дальнейшем росте амплитуды шума эффективность восстановления снижается.

й

11

А

# V

Л чУ ■

а) б)

Рис. 6. Зарегистрированная сильно зашумленная хромапограмма (а), исходная и восстановленная хромапограммы при амплнпуде шума 0.5 (б)

Сравнение результатов восстановления хроматограмм при использовании в выбранном алгоритме обучения сети базиса гауссиан и ск^-вейвлетов показало на примере восстановления хроматограммы, представленной на рис. 1а, что для подбора параметров с^-вейвлетов требуется примерно в 1.5 раза больше вычислений, однако при равном времени обучения сети достигаются схожие результаты восстановления.

Так как форма пиков в виде гаусеиан в большей степени соответствует хроматографи-ческой практике, то использование этого базиса предпочтительней при идентификации пиков по времени элюирования.

Анализ применения КВР-сетей содержится в табл.1, где представлены результаты для типичных задач обработки хроматографической информации, которые нашли применение в традиционных алгоритмах решения обратных задач измерительной техники. Цифры во втором столбце этой таблицы указывают достигнутую относительную погрешность аппроксимации.

Таблица I .Резулашты анализа применения RBF-свпей

Характеристика сигнала Расхождение данных, % Число шагов обучения

Однопиковый сигнал с фоном 1,38 750

Двухпиковый сигнал с фоном 1,29 800

Трехпиковый сигнал с фоном 3,50 850

Многопиковый сигнал с фоном 3,97 970

Сигнал с асимметричными пиками 5,79 750

Сильно зашумленный сигнал 7,55 1250

Хорошее разделение сигналов 1,14 800

Разделение аналитических пиков 1,64 900

Из табл.1 видно, что во всех случаях достигнуты удовлетворительные результаты обучения RBF-сегей при сравнительно ограниченном количестве шагов. При появлении более сложных сигналов можно переобучить нейросетевые модели на восприятие новой информации. Логика функционирования программного средства (рис. 2) позволяет реализовать процедуры обработки измерительной информации для различных конфигураций аналитических сигналов.

Эксперимент по восстановлению сигналов проводился на серии из 3 хромато-грамм одного и того же нестабильного газового конденсата с Астраханского месторождения, которая была предоставлена для исследования Всероссийским научно-исследовательским институтом метрологии имени Д.И. Менделеева (ВНИИМ). На рис. 9 точками изображен один из трех экземпляров, непрерывной линией - результат восстановления. Хроматограммы были получены в одинаковых условиях на газовом хроматографе Хроматэк - Кристалл 5000 с колонкой длиной 10 м., диаметром 0.53 мм., температура которой изменялась от 0.20°С до 160°С со скоростью 15°С/мин и от 160°С до 250°С со скоростью 20°С/мин. и с пламенно-ионизационным детектором (ПИД) с температурой 180°С. Для анализа был выбран временной фрагмент хромато-грамм между 2.5 и 3 мин., содержащий 3 неполностью разделенных пика.

Первичная идентификация и разметка пиков была выполнена в автоматическом режиме программным обеспечением «Хроматэк Аналитик 2.6». Исходя из априорной информации об анализируемой пробе экспертами ВНИИМа по базе данных National Institute of Standards and Technology (NIST) индексов удерживания Ковача между опорными пиками пентана и гексана (значения индексов 500 и 600 соответственно) были идентифицированы неполностью разделенные циклопентан (566.80), 2,3-диметилбутан (569.24) и 2-метилпентан (573.7). Первые два обладают весьма схожими физико-химическими свойствами и не могут быть разделены лучше с применением данной хроматографической методики.

На рис. 7 представлен результат нейросетевого восстановления одной из трех хроматограмм. Приведенные данные в табл. 2 свидетельствуют о достаточно надежной аппроксимации реального сигнала с помощью ЯВР-сети.

п

Рис. 7. Результст восстановления участка хромапограммы

Расчет площадей стандартным методом опускания перпендикуляра к базовой линии приводил в данном случае к некорректной оценке соотношения концентраций этих компонентов с погрешностью, достигавшей 32%, которую, используя предложенный алгоритм восстановления хроматограмм, удалось снизить до 5%. Отклонения площадей пиков и концентраций компонент вычисляются относительно интерполирующих хроматограмм.

Таблица 2. Сравнгтельные резултхты обрабапки хромспюграмм

Площади пиков, мВ2

Зарегистрированные хромапограммы Игтерпол ирующие хромапограммы Восстановленные хро.\ 1апограмл / ы

1 пик 2 пик 3 пик 1 пик 2 пик 3 пик 1 пик 2 пик 3 пик

791.12 642.09 5029.88 619.83 938.41 4902.64 641.21 911.65 4908.03

769.64 635.12 4937.06 671.68 836.44 4833.49 677.32 829.07 4835.23

782.48 636.72 4993.55 605.94 938.01 4868.90 633.71 903.73 4875.43

Отосгтельные массовые конценпрации компонент, %

1 к-т 2 к-т 3 к-т 1 к-т 2 к-т 3 к-т 1 к-т 2 к-т 3 к-т

12.24 9.93 77.82 9.59 14.52 75.88 9.92 14.11 75.97

12.14 10.01 77.85 10.59 13.19 76.22 10.68 13.07 76.25

12.20 9.93 77.87 9.45 14.63 75.92 9.88 14.09 76.03

Отосгтельные погрешности, %

27.64 -31.58 2.60 - - - 3.45 -2.85 0.11

14.58 -24.07 2.14 - - - 0.84 -0.88 0.04

29.13 -32.12 2.56 - - - 4.58 -3.65 0.13

Анализ результатов нейросетевого моделирования и данных, полученных на основе классических методов обработки хроматографической информации, позволяет сделать следующие выводы:

1. Наибольший эффект использования нейронных сетей достигается при интерпретации сигналов сложной формы, особенно многопиковых и зашумленных сигналов.

2. Ошибка нейроаппроксимации во всех рассмотренных случаях не превышала ошибку восстановления сигнала, полученного на основе классических методов.

3. Выполненное с помощью RBF-сети разделение пиков и последующее определение их площади показывает многократное уменьшение погрешности по сравнению с классическими геометрическими методами.

В четвертой главе рассмотрены результаты сравнительного анализа различных вычислительных технологий контроля сложных сигналов при обработке данных хро-матографических измерений, позволяющие осуществлять реализацию программного повышения точности средства для исследования аналитических сигналов. При совершенствовании методов решения задач обработки измерительной информации в качестве конкурирующей вычислительной технологии рассмотрено приложение разработанной концепции RBF-сетей при построении и анализе ансамблей сигналов на выходе хроматографа. Обосновано построение и предложена структура выделения нестандартных сигналов сложной формы при формировании базы данных и знаний прецедентов. Разработанный алгоритм обобщает подход к выявлению «скрытых» знаний при интерпретации зашумленной информации, полученной на выходе хроматографа.

На реальных хроматограммах проведено тестирование разработанной вычислительной технологии обработки измерительной информации на основе RBF-сетей, показавшее преимущества этой технологии при восстановлении многопиковых и за-шумленных сигналов в сравнении с использованием многослойного персептрона и метода минимального модуля на основе обратного преобразования Фурье. Сформулированы пути расширения функциональных возможностей и модернизации разработанного алгоритма и программного средства обработки сложных сигналов при хрома-тографическом анализе на основе концепции Data Mining и вейвлет-преобразования. Показана взаимосвязь концепции Data Mining с рассмотренными методами интерпретации «скрытых» знаний с помощью ансамбля RBF-сетей и базы данных прецедентов.

ЗАКЛЮЧЕНИЕ

В диссертационной работе предложены алгоритмы и программное средство обработки данных измерений в аналитическом приборостроении применительно к задачам восстановления сложных хроматографических сигналов. В результате проведенных исследований сформулированы и обоснованы следующие основные научные и практические результаты:

1. Разработаны подход и нейросетевая модель решения обратной задачи измерительной техники при хроматографическом анализе. Построена структурная модель свойств сигнала и интерпретации результатов измерений.

2. Обоснован выбор эффективной нейронной сети. На основе структуры RBF-сетей разработана нейросетевая модель разделения пиков при хроматографическом анализе в условиях сложной структуры сигнала и наличия шумовых эффектов.

3. Произведено теоретическое и экспериментальное подтверждение работоспособности модели RBF-сети в задачах хроматометрического анализа. На основе этих данных сформулирован критериальный базис оценки эффективности функционирования алгоритма контроля хроматографической информации в рамках концепции конкуренции.

4. Выполненное сопоставление результатов применения RBF-сети на основе аппаратных функций в виде функций Гаусса и вейвет-аппроксимации помимо близости аппроксимационных свойств показало преимущество RBF-сетей, которое выражается в возможности распознавания типовых искажений хромато-грамм при неполном разделении пиков на основе обобщенных прототипов.

5. Разработано программное средство, реализующее анализ и интерпретацию результатов хроматографических измерений для сложных сигналов при различном числе пиков и зашумленности исходных данных. В ряде случаев применение нейросетевой технологии разделения пиков приводит к многократному снижению погрешности определения площадей пересекающихся пиков, что, в свою очередь, обеспечивает повышение точности количественного хромато-графического анализа состава сложных веществ.

Публикации автора

В изданиях, входящих в перечень ВАК РФ:

1. Хабурзания, Т.З. Использование нейронных сетей в задачах обработки аналитических сигналов // Нейрокомпьютеры: разработка, применение. - 2009. -№11. С.53-63.

Прочие публикации:

2. Хабурзания, Т.З. Особенности решения некорректных задач обработки аналитической информации с помощью нейронных сетей // Труды XVI всероссийской научно-методической конференции «Телематика - 2009» (Санкт-Петербург, 22-25 июня 2009 г.). - СПб.: «Университетские телекоммуникации». -2009. С.440-441.

3. Хабурзания, Т.З. Нейросетевые технологии при обработке сложных сигналов в системах поддержки принятия решений // Материалы Пятой общероссийской конференции молодых ученых и специалистов по морским интеллектуальным технологиям (Санкт-Петербург, 10-12 ноября 2009 г.). - СПб.: Изд-во СПбГМТУ. - 2009. С.67-69.

4. Хабурзания, Т.З. Нейросетевой алгоритм решения обратной задачи. // Измерения в современном мире - 2009: сборник научных трудов Второй междунар. науч.-практ. конф. (Санкт-Петербург, 8-10 декабря 2009 г.). — СПб.: Изд-во Политехи, ун-та. - 2009. С. 169-170.

5. Хабурзания, Т.З. Обработка сигналов в информационных системах: учебное пособие / Н.В.Богач, Г.Б.Гублер, В.Е.Евдокимов, З.В.Кулешова, С.А.Перепелица, Т.З.Хабурзания. - СПб.: Изд-во Политехи, ун-та, 2010. - 222 с.

6. Хабурзания, Т.З. Нейросетевое моделирование при решении обратных задач обработки аналитической информации // Искусственный интеллект. - Донецк: Институт проблем искусственного интеллекта МОН Украины и HAH Украины. -2010. №4. С.688-696.

7. Хабурзания, Т.З. Принципы реализации нейросетевых технологий в обратных задачах измерительной техники // SCM - 2010: сборник докладов XIII международной конференции по мягким вычислениям и измерениям (Санкт-Петербург, 23-25 июня 2010 г.). - СПб.: Изд-во СПбГЭТУ ЛЭТИ. - 2010. Т. 1. С.23-27.

8. Хабурзания, Т.З. Нейросетевой алгоритм анализа и прогноза параметров морского волнения в бортовых интеллектуальных системах / Ю.И.Нечаев, Д.Г.Тихонов, Т.З.Хабурзания // Нейрокомпьютеры в интеллектуальных технологиях XXI века. - М.: Радиотехника. - 2012. - С.287-305.

9. Khaburzaniya, T.Z. Deconvolution of overlapping chromatographic peaks by radial basis function neural network / G.N.Solopchenko, T.Z.Khaburzaniya // Proceedings of the Distributed Intelligent Systems and Technologies Workshop (Saint-Petersburg, Russia, 1-4 July 2013). - SPb.: Politechnika-service. - 2013. - P. 101-108.

Подписано в печать 21.11.2013. Формат 60x84/16. Печать цифровая. Усл. печ. л. 1,0. Тираж 100. Заказ 11272Ь.

Отпечатано с готового оригинал-макета, предоставленного автором, в типографии Издательства Политехнического университета. 195251, Санкт-Петербург, Политехническая ул., 29. Тел.: (812)550-40-14 Тел./факс: (812)297-57-76

Текст работы Хабурзания, Тимур Зурабович, диссертация по теме Приборы и методы измерения по видам измерений

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования «Санкт-Петербургский государственный политехнический университет»

04201455410

ХАБУРЗАНИЯ Тимур Зурабович

На правах руш

ПОВЫШЕНИЕ ТОЧНОСТИ КОЛИЧЕСТВЕННОГО ХРОМАТОГРАФИЧЕСКОГО АНАЛИЗА СЛОЖНЫХ ВЕЩЕСТВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

Специальность 05.11.01 - Приборы и методы измерения (аналитические измерения)

Диссертации на соискание ученой степени кандидата технических наук

Научный руководитель -доктор технических наук, профессор СОЛОПЧЕНКО Геннадий Николаевич

Санкт-Петербург - 2013

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ............................................................................................................................4

Глава 1. Особенности методов разделения хроматографических пиков...............7

1.1. Проблемы совершенствования методов обработки хроматографических сигналов............................................................................................................................9

1.2. Представление хроматографических сигналов..............................................13

1.3. Обзор имеющихся исследований.....................................................................18

1.4. Постановка задачи исследования.....................................................................41

Выводы по первой главе................................................................................................45

Глава 2. Концептуальная модель и программное средство обработки хроматографических сигналов.....................................................................................47

2.1. Концептуальная модель построения системы обработки хроматографических сигналов.....................................................................................47

2.2. Синтез программно-аппаратных средств обработки хроматографических сигналов..........................................................................................................................51

2.3. Стандартная модель обработки хроматографических сигналов..................63

2.4. Обоснование выбора и структурный синтез нейросетевой модели обработки хроматографических сигналов...................................................................66

2.5. Обучение и параметрический синтез 11ВР-сети при обработке хроматографических сигналов.....................................................................................70

Выводы по второй главе................................................................................................80

Глава 3. Нейросетевое моделирование и анализ хроматографических сигналов. .............................................................................................................................................82

3.1. Особенности задачи моделирования процессов обработки хроматографических сигналов.....................................................................................82

3.2. Моделирование хроматографических сигналов с помощью нейросетевых технологий......................................................................................................................85

3.3. Результаты нейросетевого моделирования хроматографических сигналов88

3.4. Сравнительный анализ результатов конкурирующих вычислительных технологий......................................................................................................................97

3.5. Оценка качества работы нейросетевой модели..............................................99

Выводы по третьей главе.............................................................................................103

Глава 4. Сравнительный анализ функционирования программного средства обработки хроматографических сигналов...............................................................105

4.1. Сравнительный анализ результатов обработки информации с помощью ансамбля нейронных сетей..........................................................................................105

4.2. Сравнительный анализ обработки хроматографических сигналов на основе базы прецедентов.........................................................................................................108

4.3. Тестирование программного средства...........................................................113

4.4. Дальнейшие развитие исследований по совершенствованию программного средства.........................................................................................................................115

Выводы по четвертой главе ........................................................................................119

ЗАКЛЮЧЕНИЕ................................................................................................................120

ЛИТЕРАТУРА..................................................................................................................122

Приложение 1. Результаты нейросетевого моделирования............

Приложение 2. Особенности реализации программного средства

137 158

ВВЕДЕНИЕ

Аналитическое приборостроение является интенсивно развивающейся областью измерительной техники, предназначенной для исследования состава и свойств веществ. Развитие этого направления идет по пути улучшения характеристик аналитических приборов и новых методов анализа результатов измерений. Совершенствование методов и средств обработки аналитической информации позволяет повысить достоверность результатов оценки сигналов сложной формы, что особенно важно при восстановлении хроматографических сигналов.

Среди прикладных задач хроматографического анализа следует выделить разрежение, функциональное преобразование, фильтрация, детектирование и разделение наложенных пиков, а также их коррекцию. Обработка таких сигналов ведется с использованием хроматографов - приборов для количественного химического анализа веществ. В рамках этих исследований следует выделить задачу повышения точности хроматографических измерений за счет разработки эффективных программных средств контроля данных на выходе прибора. Теоретической базой для создания новых методов и моделей служит математический аппарат решения некорректных задач математической физики: по сигналу с измерительного устройства установить, что именно было измерено до того, как процесс измерения внес возмущение в среду и исказил результат.

Задачу восстановления сигнала впервые сформулировал Релей еще в 1871 г., использующий в качестве математического описания уравнение свертки. Решение задачи восстановления сигнала Релей назвал «редукцией к идеальному прибору». Излучение спектрометров проходило через узкую щель, которая вызывала дифракцию, хорошо описываемую аппаратной функцией щели. Решение этой задачи позволило бы повысить разрешающую способность таких средств аналитических измерений, как хроматографы и спектрометры, выполняющие количественный химический анализ сложных веществ. Но в то время эта задача не могла быть решена в силу ее некорректности в смысле Адамара [11],[118]. Только в 1943 году А.Н.Тихонов высказал идею о возможности решения подобных задач, а в 1963 году эта идея была полностью формализована А.Н.Тихоновым в виде

принципа регуляризации. До этого времени подобную задачу пытались решать разными методами, которые не давали практически удовлетворительного решения. На основе концептуальных решений А.Н.Тихонова исследователи использовали различные подходы к решению этой сложной задачи восстановления сигналов.

Однако до настоящего времени исчерпывающего решения по причинам сложности восстановления сигналов в условиях многообразия действующих факторов и шумовых эффектов не получено. Поэтому в диссертации была поставлена задача применения к ее решению нового аппарата обработки информации, состоящего в реализации нейросетевых технологий. Преимущества такого подхода к обработке аналитической информации неоднократно подтверждались применительно к задачам анализа измерительных сигналов в различных областях научно-технических приложений, в том числе и при исследовании аналитических сигналов.

При обработке хроматографических сигналов задача использования нейросетевых моделей на основе радиально-базисных сетей поставлена впервые. Разработанная нейросетевая технология анализа и интерпретации хроматографической информации открывает возможность создания универсального программного средства моделирования, обеспечивающего решение разнообразных задач количественного хроматографического анализа при обработке аналитической информации.

Таким образом, актуальность предлагаемого подхода при анализе хроматографических сигналов определяется повышением точности решения обратной задачи преобразования информации и поиском эффективных методов выделения закономерностей процессов при наличии шумовых возмущений. Разработка методов разделения пересеченных пиков и построение соответствующего алгоритма обработки информации, экономичного в вычислительном отношении, обеспечит получение приемлемых результатов в сложных помехо-сигнальных структурах исследуемого процесса в условиях шумовых возмущений.

Практический интерес также представляет задача выявления «скрытых» закономерностей сигнала. Для исследования этой задачи в диссертации сформулированы и обоснованы направления дальнейшего совершенствования

разработанной вычислительной технологии на базе достижений искусственного интеллекта.

Теоретические основы разработанной вычислительной технологии базируются на фундаментальных результатах, сформулированных в работах по теории восстановления сигналов исследованиях А.Н.Тихонова, М.М.Лаврентьева, В.К.Иванова, В.П.Тананы, А.Б.Бакушинского, В.А.Морозова, В.Ф.Турчина, В.Б.Гласко, A.B.Гончарского, Г.И.Василенко, В.С.Сизикова, Ю.П.Пытьева, В.Г.Романова, Г.Н.Солопченко, а также зарубежных ученых - D.L.Phillips, J.N.Franklin, K.Miller, A.Felinger и других.

Глава 1. Особенности методов разделения хроматографическнх пиков

Рассматриваемая задача находится на стыке измерительной техники и математической физики. Она впервые была рассмотрена Рэлеем в 1871 году [20]. В измерительной технике решение этой задачи осуществлялось за счет физического совершенствования детекторов хроматографов и спектрометров, а также за счет использования методов преобразования информации. Однако задача повышения разрешающей способности приборов сохраняет актуальность до настоящего времени. Примерами является выделение сигнала на уровне шума при анализе запахов, разделение пересекающихся пиков в жидкостной хроматографии при анализе сточных вод [4],[ 15],[20],[27],[34].

Математическое решение задачи менее трудоемкое, чем техническое усовершенствование хроматографов. Редукция к идеальному прибору - обратная некорректная задача. В этом направлении развивались математические подходы ее решения, как некорректной задачи. Тихонов А.Н. построил теорию решения некорректных задач, используя параметр регуляризации, описание которого априори не известно [118] - [120].

При определении некорректных задач на основе выводов Тихонова А.Н. важно ответить на вопрос, почему обратные задачи - некорректные. В этих задачах при плохообусловленном операторе преобразования информации при малых изменениях анализируемого сигнала сколь возможны сколь угодно большие отклонения в решении. Выход из этой ситуации достигается за счет обоснованного выбора параметра регуляризации [30],[89][105],[144]. Используя достаточно близкий гладкий оператор, можно вести решение по устойчивому пути, и сохранить физический смысл. Однако проблема выбора параметра регуляризации представляет собой одно их важных направлений совершенствования методов решения некорректных задач. Среди имеющихся вычислительных технологий следует выделить нейронные сети, хорошо зарекомендовавшие себя при поиске скрытых зависимостей [15],[83]. Хотя и здесь сохраняется неопределенность - аппроксимация пиков с помощью гауссиан, би-гауссиан, функций Лоренца, похожих на встречающиеся виды пиков [ 168], связана с необходимостью дополнительных исследований по интерпретации таких решений.

Экспоненциально-модифицированная гауссиана (ЭМГ) широко используется для аппроксимации формы хроматографических пиков [32],[35], [49],[53],[75],[81],[136]. Одно из основных преимуществ - соответствующая ей физическая модель. Такая форма получится, если после идеальной хроматографической колонки, дающей гауссову форму пика, поставить камеру смещения, моделирующую неидеальность колонки. Недостаток этого подхода связан с трудностями построения аналитического вида формы ЭМГ.

Решение этой задачи разделения хроматографических пиков связано с построением модели, обеспечивающей сложный механизм преобразования данных измерений на выходе хроматографа. Реакция этого прибора на какой-либо компонент анализируемого вещества представляет собой функцию уи(х) от независимого аргумента х. Эта функция зависит от механизма функционирования хроматографа, который определяется процессами сорбции и диффузии и имеет вид функции Гаусса [31]. Реакция хроматографа зависит от характеристик преобразователя «свойство — выходной сигнал». На выходе хроматографа наблюдается аналитический сигнал ур(х), обусловленный реакцией идеального прибора уи(х) и функцией А(х). Эта функция для большинства аналитических приборов имеют конечную площадь, т.е. имеют вид пика (например, Гауссова).

Если ширина функции уи(х) много меньше ширины функции А(х), то наблюдаемый аналитический сигнал имеет вид [20]:

оо

ур(х)~ А(х-х^у„(х1)с1х1 =К1А(х-х{)} (и)

о

где К] - константа. Реальный сигнал на выходе прибора в этом случае соответствует функции прибора. Если же ширина функции уи(х) много больше ширины функции А(х). то наблюдаемый сигнал описывается выражением [20]:

оо

У Р (*) « У и О) I А(х - ) =К2Уи(х 1) , (1.2)

о

где Кг - константа, а реальный сигнал соответствует сигналу на выходе идеального прибора.

При сравнимой ширине функции и реакции прибора возникает погрешность, определяемая видом функции А(х). Большая часть поступающих на вход

аналитических систем сигналов нестандартны и требуют предварительной обработки по устранению возникающей погрешности. Это достигается с помощью специально разработанных алгоритмов обработки аналитической информации, которые реализуются с помощью современных вычислительных средств, встраиваемых в аналитический прибор. В результате такой интеграции создаются аналитические комплексы, имеющие достаточный объем памяти (особенно необходимый в хроматографическом эксперименте) и способные работать в режиме реального времени (в такте эксперимента).

Повышение точности выделения пиков в сложных зашумленных сигналах и надежности распознавания состава исследуемого вещества в диссертационной работе достигается за счет интеграции традиционных решений с методами А.Н.Тихонова. На основе такой интеграции сформулирован новый подход к исследованию проблемы с помощью моделей искусственных нейронных сетей (ИНС) для эффективного решения задачи разделения хроматографических пиков. В процессе анализа построена и обоснована топология нейронной сети для исследования конкретного метода разделения пиков и особенностей площади элементов сигнала. В рамках этой вычислительной технологии проведено систематическое исследование нейросетевых методов разделения хроматографических пиков и сравнительный анализ преимуществ применения нейронных сетей в отношении повышения точности количественного хроматографического анализа сложных веществ.

1.1. Проблемы совершенствования методов обработки хроматографических

сигналов

Использование и развитие методов и моделей обработки измерительной информации ведется в рамках подхода к решению «некорректно поставленных задач», сформулированного в начале 60-х годов А.Н.Тихоновым [118] - [120]. Этот подход породил целое направление к развитию теории некорректных задач и ее приложений в различных областях естествознания и техники. Среди них следует выделить работы М.М.Лаврентьева [60] - [63], В.К.Иванова [47],[48], С.Н.Сычева [125], их учеников и последователей А.Б.Бакушинского и А.В.Гончарского [10],[11],

Г.Н.Солопченко [108] - [111], В.П.Танана [114], а также зарубежных математиков A.Felinger [152],[153], J.N.Franklin [154], K.Miller [164] и др.

Особенность некорректных задач состоит в том, что малой погрешности в исходных данных соответствует сколь угодно большая погрешность в решении. Решение некорректных задач связано с одной из основных проблем прикладной математики - обеспечением надежности результатов вычислений при учете неизбежных погрешностей в задании коэффициентов и параметров математической модели, по которой производятся расчеты [44],[48],[65],[70][107],[136]. Термин «обратная задача» пришел в область измерительной техники из математической физики. Он относится к задаче восстановления сигнала по известной информации об операторе физического прибора (аппаратной функции) и об отклике этого прибора на входной сигнал [6],[20],[33],[49].

Корректность решения задачи по А.Н.Тихонову выполняется при следующих условиях:

1) априори известно, что решение у существует и принадлежит некоторому гладкому множеству (множеству корректности) М eY: у еМ\

2) решение единственно в классе функций, принадлежащих М, т.е. оператор А обратим на множестве М;

3) существует непрерывная зависимость решения у от правой части /, когда бесконечно малым вариациям /, не выводящим решение у за пределы М, соответствуют бесконечно малые вариации решения у, т.е. обратный оператор является непрерывным.

Таким образом, отличие формулировок корректности по А.Н.Тихонову и Адамару заключается во введении понятия множества корректности, существенно сужающего класс возможных решений.

В тех случаях, когда полученное решение не