автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод сжатия и визуализации обобщенных спектральных данных объектов пищевой и химической промышленности

кандидата технических наук
Чернов, Евгений Александрович
город
Воронеж
год
2014
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Метод сжатия и визуализации обобщенных спектральных данных объектов пищевой и химической промышленности»

Автореферат диссертации по теме "Метод сжатия и визуализации обобщенных спектральных данных объектов пищевой и химической промышленности"

На правах рукописи

ш

ЧЕРНОВ Евгений Александрович

МЕТОД СЖАТИЯ И ВИЗУАЛИЗАЦИИ ОБОБЩЕННЫХ СПЕКТРАЛЬНЫХ ДАННЫХ ОБЪЕКТОВ ПИЩЕВОЙ И ХИМИЧЕСКОЙ ПРОМЫШЛЕННОСТИ

Специальность 05.13.01 — Системный анализ, управление и обработка информации (пищевая и химическая промышленность)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

4 ДЕК 2014

Воронеж-2014 005556403

005556403

Работа выполнена в ФГБОУ ВО «Московский государственный университет технологий и управления им. К.Г. Разумовского (Первый казачий университет)».

Научный руководитель: доктор физико-математических наук, профессор

Краснов Андрей Евгеньевич

(ФГБОУ ВО «Московский государственный университет технологий и управления имени К.Г. Разумовского (Первый казачий университет)», заведующий кафедрой Информационных технологий).

Официальные оппоненты: Панова Светлана Анатольевна

доктор технических наук, профессор (Московский государственный университет тонких химических технологий им. М.В. Ломоносова (МИТХТ), профессор кафедры Информационных технологий).

Степанова Елена Борисовна,

кандидат физико-математических наук, доцент (Национальный исследовательский ядерный университет (МИФИ), доцент кафедры Системного анализа).

Ведущая организация Учреждение Российской академии наук Институт

программных систем имени А.К. Айламазяна РАН (г. Переславль-Залесский).

Защита диссертации состоится 29 декабря 2014 г. в 13 часов 30 минут на заседании диссертационного совета Д 212.035.02 при ФГБОУ ВПО «Воронежский государственный университет инженерных технологий» по адресу: 394036, г. Воронеж, проспект Революции, д. 19, конференц-зал.

Отзывы на автореферат (в двух экземплярах), заверенные гербовой печатью учреждения, просим направлять по адресу: 394036, г. Воронеж, проспект Революции, д. 19, ФГБОУ ВПО «Воронежский государственный университет инженерных технологий».

Текст автореферата и объявление о защите размещены в сети Internet на сайте Министерства образования и науки РФ http://vak.ed.gov.ru 24 октября 2014 года.

С диссертацией можно ознакомиться в научной библиотеке ФГБОУ ВПО «Воронежский государственный университет инженерных технологий».

Автореферат разослан ¿2 /^РсСс^г^г ¿О/е?

Учёный секретарь диссертационного совета у.

к.т.н., доцент Хаустов И.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Для качественного и количественного представления и последующего анализа многомерных данных (сигналов, спектров, набора различных параметров) применяются методы их отображения на плоскости — методы визуализации данных. В качестве основных применений методов визуализации можно указать следующие: сжатие информации, заключенной в данных; анализ содержания баз данных; кластеризация данных; распознавание образов; поддержка экспертных систем; картография; восстановление пробелов в данных; решение задач прогнозирования и построения зависимостей между отдельными представителями выборок из исходных данных.

С позиции системного анализа визуализация многомерных данных заключается в нахождении такого способа отображения из исходного пространства на двумерную плоскость, при котором сохраняются некоторые исходные свойства данных: их геометрические и топологические особенности, внутренние зависимости между данными, кластерная структура, информация о расположении данных в исходном пространстве и т.д.

Используют различные варианты решения задачи проецирования: ортогональное проецирование (Pearson К., Горбань А.Н., Айвазян, С.А.), когда минимизируется сумма квадратов расстояний от плоскости проецирования до точек данных, неэффективное лишь для нормально распределенных многомерных данных; линейный дискриминантный анализ (Fisher R.A., Duda R., Hart Р.), минимизирующий отношение «разброса» данных внутри классов к «расстоянию» между классами и эффективный для малого числа помеченных классов; многомерное шкалирование (Davison М., Терехина А.Ю., Бухштабер В.М.), минимизирующее меру искажения взаимных расстояний между точками в исходном и результирующем пространстве отображения, но используемое лишь в том случае, когда исходная информация изначально представлена не в виде таблицы типа "объект-признак", а в виде квадратной таблицы удаленностей объектов друг от друга; синтез криволинейных поверхностей (Горохов B.JL, Витковский В.В., Набоков, Н.В.), связанный со значительными топологическими проблемами; нейросетевое проектирование (Розенберг Г.С., Шитиков В.К., Костина Н.В.), в котором число входов равно размерности пространства, а количество выходов равно размерности моделирующего многообразия; самоорганизующиеся карты (Зиновьев А.Ю., Kohonen Т., Deboeck G.), являющиеся представителями нейросетей, объединившими в себе кластеризацию и визуализацию многомерных данных, но достаточно сложные в настройке.

Диссертационная работа посвящена исследованию актуальной задачи уменьшения объема исходных данных, а также времени их обработки для дальнейшего анализа получаемой информации в различных сферах деятельности человека, основополагающим элементом которого является сжатие обобщенных спектральных данных или обобщенных спектров (положительно определенных дискретных функций). Обобщенные спектры встречаются в задачах оптического спектрального анализа (физически-однородные спектры видимого и инфракрасного диапазонов) химических и пищевых технологий (спектры различной физической природы).

Цель и задачи работы. Целью настоящей диссертации является разработка метода сжатия и визуализации обобщенных спектральных данных любой физической природы объектов химической и пищевой технологий, сохраняющего их геометрические и топологические особенности при минимальных затратах на обработку информации, для дальнейшего использования в комплексах моделей и методов при решении задач оперативного управления качеством продуктов пищевой и химической промышленности.

Для достижения цели в работе решаются следующие основные задачи:

- сжатие и визуализация обобщенных спектров однородной физической природы путем редукции их фазовых портретов Гильберта;

- сжатие и визуализация обобщенных спектров разнородной физической природы на основе квазинейросетевого агрегирования;

- разработка математических моделей визуализации многомерных данных;

-разработка алгоритма построения индикаторов обобщенных спектров разнородной

физической природы;

- разработка программного комплекса для проведения вычислительного эксперимента, рекомендаций по использованию разработанных подходов и методов к задачам визуализации обобщенных спектральных данных, характерных для технологических задач химической и пищевой промышленности.

Методы исследований. Выполненные исследования базируются на использовании методов: системного анализа, математической статистики, математического моделирования, экспертных систем. При разработке программного комплекса использовалась технология модульного программирования и объектно-ориентированный подход.

Научная новизна работы. В диссертационной работе получены следующие результаты, характеризующиеся научной новизной:

- разработан и обоснован метод сжатия и отображения на плоскость обобщенных спектральных данных однородной физической природы на основе линейных функциональных преобразованиях их фазовых портретов Гильберта;

- разработан и обоснован метод сжатия и отображения на плоскость обобщенных спектральных данных разнородной физической природы на основе квазинейросетевого агрегирования;

- разработан алгоритм агрегирования обобщенных спектров разнородной физической природы на основе алгебры индикаторов, характеризующих состояние агрегатов на разных уровнях их иерархии;

- разработана структура программного комплекса, включающая инвариантную составляющую, в которой реализованы базовые методы, и проблемно-ориентированную составляющую для решения задач визуализации обобщенных спектральных данных, характерных для технологических задач химической и пищевой промышленности.

Практическая значимость работы. Предложенный в диссертационной работе метод сжатия и визуализации обобщенных спектральных данных может быть предложен для задач оперативного управления качеством продукции химической и пищевой промышленностей, реализации агрегированного представление информации, заключенной в различных многомерных спектрах для контроля качества пищевых спиртов и углеводородных соединениях. Разработанный метод может оказаться полезным также для решения ряда задач в экономической сфере (различные показатели деятельности) для идентификации состояний компаний, образовании (аккредитационные показатели и показатели успеваемости студентов) для задач мониторинга состояний университетов, медицине (данные биохимического анализа крови) для идентификации заболеваний.

Положения, выносимые на защиту. На защиту выносятся методы сжатия и визуализации обобщенных спектральных данных любой физической природы объектов химической и пищевой промышленности, алгоритмы и комплекс проблемно-ориентированных программ:

- метод фазового портрета Гильберта для сжатия визуализации обобщенных спектров однородной физической природы;

- метод квазинейеронного агрегирования для визуализации обобщенных спектров раз-

нородной физической природы путем их декомпозиции на подсистемы и последующего агрегирования на основе алгебры индикаторов, характеризующих состояние агрегатов на разных уровнях их иерархии;

- алгоритм агрегирования обобщенных спектров разнородной физической природы;

- комплекс проблемно-ориентированных программ для решения задач визуализации обобщенных спектральных данных, характерных для технологических задач химической и пищевой промышленности.

Реализация и внедрение результатов работы. Результаты работы реализованы в ряде фундаментальных и хоздоговорных НИР, выполненных МГУТУ, где автор выступал в качестве соисполнителя. Разработанный в диссертации подход к визуализации обобщенных спектральных данных любой физической природы был реализованы в ряде НИР, выполненных в рамках научной школы кафедры Информационных технологий МГУТУ: «Разработка принципов построения интеллектуальных экспертных систем реального времени для контроля состояний многопараметрических объектов и процессов». Аналитическая ведомственная целевая программа «Развитие научного потенциала высшей школы», мероприятие 1 «Проведение фундаментальных исследований в рамках тематических планов», № гос. регистрации 1.1.06, 2006 — 2010;«Разработка принципов метрологического обеспечения менеджмента качества вузов на основе совокупности базовых показателей учебной, научной и инновационной деятельности», проведенной в рамках аналитической ведомственной целевой программы «Развитие научного потенциала высшей школы» (мероприятие 3 «Проведение прикладных научных исследований в области образования, молодежной и социальной политики в области образования», № гос. регистрации 3.4.1/6057, 2009-2011 г.г.); «Разработка принципов описания многокомпонентных систем на основе объединения алгебры нечетких множеств и нейроподобных алгоритмов». Аналитическая ведомственная целевая программа «Развитие научного потенциала высшей школы», мероприятие 1 «Проведение фундаментальных исследований в рамках тематических планов», 2011; «Разработка принципов построения экспертных систем реального времени для оперативного контроля и управления качеством пищевых продуктов». Аналитическая ведомственная целевая программа «Развитие научного потенциала высшей школы», мероприятие 1 «Проведение фундаментальных исследований в рамках тематических планов», 2012, 2013.

Результаты работы внедрены в следующих организациях: ВНИИНП, ВНИИПБТ. Теоретические и практические результаты диссертации вошли в содержание дисциплин профессионального цикла по кафедре информационных технологий ФГБОУ ВПО «МГУТУ им. К.Г. Разумовского». Результаты работы могут непосредственно использоваться в научно-исследовательских работах и оказании консультационных услуг по данному профилю.

Апробация работы. Основные результаты исследований докладывались на следующих научных форумах: IV Международная конференция «Современные информационные технологии в образовании, науке и промышленности» (Москва, МГУТУ им. К.Г. Разумовского, 14-15 мая 2014), Международная научно-практическая конференция «Инновационные информационные технологии (12Т)» (Прага, 21-25 апреля, 2014); Международная научно-практическая конференция «Инновационные информационные технологии (12Т)» (Прага, 22-26 апреля, 2013); II международная научно-практическая конференция «Методологические основы формирования компетентностного подхода в условиях реализации требований ФГОС ВПО» (Москва, МГУТУ им. К.Г. Разумовского, 1 декабря 2010);ХУП Международная научно-техническая конференции «Интеллектуализация современных информационных средств и систем» (Москва, МГУТУ им. К.Г. Разумовского, 20 - 22 октября 2009 г.); научно-практическая конференция «Инженерные инновационные технологии автоматизации и

управления в агропромышленном комплексе» (Москва, МГУТУ им. К.Г. Разумовского, 27 -28 октября 2009 г.).

Публикации. Основные результаты работы опубликованы в 9 научных работах, в том числе 4 - изданиях, рекомендованных ВАК РФ. В работах, опубликованных в соавторстве, лично соискателю принадлежат: [1] -теоретические результаты, [2] - экспериментальные результаты, связанные с машинным моделированием проектирования обобщенных спектральных данных однородной физической природы на плоскость методом фазового портрета Гильберта, [3] - экспериментальные результаты, связанные с машинным моделированием проектирования обобщенных спектральных данных разнородной физической природы на плоскость методом квазинейеронного агрегирования, [4] — экспериментальные результаты, связанные с машинным моделированием проектирования обобщенных спектральных данных на плоскость методом Фишера.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 144 наименований, и 2-х приложений. Работа изложена на 123 страницах (105 страниц основного текста, 18 страниц приложения), содержит 13 таблиц, 48 рисунков.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность методов сжатия многомерных обобщенных спектральных данных для их визуализации с целью дальнейшей обработки информации (интеллектуальной поддержки задач кластеризации и распознавания образов, построения зависимостей), определены задачи исследования, сформулирована научная новизна и отражена практическая значимость работы.

В первой главе проведен обзор современных методов сжатия информации для визуализации многомерных данных, проанализированы существующие системные подходы и математические модели визуализации многомерных данных, используемые в настоящее время для многочисленных задач обработки информации.

Для отображения на плоскости оптических и инфракрасных (ИК) спектральных данных в главе основное внимание уделено методу фазового портрета (ФП), разработанному Красновым А.Е. специально для распознавания электромагнитных сигналов и двумерных оптических полей.

Для отображения на плоскости обобщенных спектральных данных разнородной физической природы, характеризующих состояния многомерных динамических объектов, в главе рассмотрен квазинейросетевой метод агрегирования, также предложенный Красновым А.Е.

На основании проведенного обзора скорректированы основные задачи диссертации.

Во второй главе описан разработанный метод сжатия и визуализации обобщенных спектральных данных любой физической природы на основе их фазовых портретов Гильберта, а также квазинейросетевого подхода на основе информационной технологии агрегирования.

Многомерные обобщенные спектральные данные.

В химической и пищевой промышленностях для экспресс анализа состояний сырья и готовой продукции широко используют методы спектрального анализа в различных диапазонах длин электромагнитных волн (от ультрафиолетового и видимого диапазона (0,4-0,7) мкм до ближнего инфракрасного (ИК) - (0,9-1,2) мкм, а также среднего и дальнего ИК -(4000-16000) см"1 диапазонов).

Также используются спектры различных физических и химических свойств исследуе-

мых веществ (масс-спектрометрические и хроматографические — распределения молекулярных концентраций их компонентов, зависящие от молекулярных масс; распределения или наборы концентраций различных химических компонентов; и т.п.).

Такие спектры будем называть обобщенными спектральными данными или обобщенными спектрами (ОС). Формальное описание ОС задается в виде вектора Т7 - набора положительно определенных данных /?г= (7ч, ..., ^я), где 0 для V« = 1, 2, ..., N. Таким данным соответствуют одномерные положительно определенные дискретные функции У7,,, как показано на рисунке 1.

Как правило, состояния сырья и готовой продукции при их экспресс анализе описывают не одним ОС, а совокупностью ОС различной физической природы. Данная совокупность представляет, т.н., многомерные спектральные данные (в отечественной литературе) или мультиспектральные данные (в зарубежной литературе).

О

1

N

Рисунок 1 — Положительно определенная дискретная функция Г„.

Функционально-структурная схема метода сжатия и визуализации ОС. На рисунках 2-^7 приведена функционально-структурная схема метода сжатия и ви-2.1. Подготовка спектральных данных

зуализации ОС.

Исследуемое сырье или готовый продукт

Обучающие выборки обобщенных спектральных данных

(ОС разной физической природы)

УФ

Кр

Длина волны, мкм

Длина волны, мкм

ИК

Волновое число, см"1

Рисунок 2 - Функционально-структурная схема подготовки ОС.

Как следует из рисунка 2, получаемы многомерные ОС исследуемого сырья или гото вого продукта декомпозируются на физически-однородные группы спектров, полученные I различных диапазонах длин электромагнитных волн (ультрафиолетовые — УФ, красные -КР, инфракрасные - ИК).

Далее ОС оцифровываются и вводятся в память ЭВМ для дальнейшей обработки -

сжатию данных, которое осуществляется на основе полосовой и режекторной фильтраций (рисунок 3).

Полосовая фильтрация выделяет из первоначальных спектральных данных наиболее информативные участки (т.н., характеристические линии) и удаляет ненужные данные.

2.2. Фильтрация спектральных данных

УФ

Ввод ОС

Полосовая фильтрация ОС

Длина волны, мкм

ПК

Вычисление дисперсий ОС

43з-

Волновое число, см"'

УФ

Задание порогов режекторнойфильтрации

и К

43и

Построение режекторных фильтров

Длина волны, мкм F УФ

3

47^

? Гильб >рных 4

Построение Гильберт-образов режекторных фильтров

Волноб 10, см"1 Р ик

Резкекторная фильтрация ОС

Длина волны, мкм -о- Волновое число, см"1

Рисунок 3 - Функционально-структурная схема сжатия ОС.

2.3. Вычисление координат обобщенных фазовых портретов ОС ___

Вычисление двумерных координат X, У обобщённых спектров

(скалярных произведений ОС с режекторными фильтрами и их Гильберт-образами)

х

43Ь

Рисунок 4 - Функционально-структурная схема построения обобщенных фазовых портретов Гильберта.

Пороги режекторной фильтрации первоначально задаются по значениям вычисленных дисперсий, например — в два раза ниже значений максимальных дисперсий. Режектор-ная фильтрация выделяет из спектральных данных только те значения, дисперсия которых равна или превышает заданные пороги.

К сформированным режекторным фильтрам добавляют их Гильберт-образы, необходимые для построения обобщенных фазовых портретов Гильберта (рисунок 4).

2.3. Оптимизация обобщенных фазовых портретов ОС.

_-О-_

Измерение взаимных расстояний между точками обобщенных фазовых портретов

Вычисление критериев оптимизации:

дискриминанта Фишера или максимума минимальных расстояний между точками обобщенных фазовых портретов

.Изменение порогов режекторн ой фильтрации

Минимальные расстояния возможно увеличить ?

нет

Сохранение координат обобщенных фазовых портретов ОС

Рисунок 5 — Функционально-структурная схема визуализации ОС.

2.4. Вычисление индикаторов агрегирования

^О-_

у

Вычисление индикаторов I агрегирования ОС, как- мер близости обобщенных фазовых портретов с центрами тяжести или остовами обучающих выборок

-О-

Рисунок 6 — Функционально-структурная схема агрегирования ОС.

2.5. Квачинейросетевое агрегирование ОС

F\a,Fm, ...,Fna ■■■ Fxc.Fic, ...,Fnc ... F\E,F2E, ... ,Fne

Рисунок 7 - Функционально-структурная схема агрегирования ОС.

Математические модели обобщенных фазовых портретов Гильберта (ФПГ).

В соответствие с теорией ФПГ каждому ОС F ставится в соответствие его Гильберт-образ Н, формируемый в виде циклической свертки:

H«=~Zkh Л> h = (—,-1/5,0,-1/3,0,-1,0,1,0,1/3,0,1/5,...);

п-к к п 3 3 ' ' ' ' ' '

У Я F = 0. 0)

п II

Дискретный ФПГ ОС будем формировать, как двумерное распределение w[F,H\ -распределение на плоскости совместных значений F„n Нк : N[F , Н ]

^Fn,Hk-]= -N * , ylFjHJ-l, N[Fn.Hk-[ = N, (2)

где N[F„, Нк\ - количество точек на фазовой плоскости {F, Н}, имеющих координаты {F„ Нк).

Одноточечное отображение ОС на плоскость редукцией их ФПГ.

Для отображения ФПГ ОС w[F,H\ на плоскость в виде точки введем два функциональных преобразования:

1 (3)

где и Ч'у^ Я^]-двумерные дискретные функции.

Возможен различный подход к заданию Т № Д1 ГР Я 1.

Л"- п к' У1 „' к1

В простейшем случае зададим данные функции в виде:

чу^] = РпЧу\Рп,Нк] = НкЩ?к,Щ\ (4)

где -некоторая функция от значений отсчетов ОС Fи их вариации 8.Г,,.

В этом случае преобразования(З) примут вид проектирования ОС ^ и его Гильберт-образа Н на линейные подпространства, определяемые векторами х=(х\,х2, ...,хм)тиу= (у\,уг,

Х=2„ *„ Р„ . = (5) Рк

Преобразование (5) возможно упростить:

Х = И„ х р . 7 = Х У Р , У = Л , а х,, У г а х = 0. (6)

/1 л л л л п-к к к 'п п л

Преобразования (6), формирующие обобщенные фазовые портреты Гильберта (ОФПГ) имеют простой физический смысл - ОС ^ проецируется на два ортогональных линейных подпространства, образованных вектором л; и его Гильберт-образом

Адаптивная фильтрация ОС.

В работе использовано два подхода на основе алгоритмов адаптивной фильтрации ОС с использованием критерия, вычисляемого на основе расстояний между точками обобщенного фазового портрета Гильберта (ОФПГ):

1 • В первом алгоритме вектора л: выбирается на основе максимизации дискрими-нантного критерия Фишера (дискриминанта Фишера). При этом вектор л; выбирается ортогональным аппликате - среднему вектору всех анализируемых ОС, а его компоненты формируются путем вращения х вокруг аппликаты. Алгоритм и результаты его экспериментального исследования подробно описаны в главе 3.

2. Во втором алгоритме вектор л: выбирается на основе максимизации критерия «минимум расстояний» между точками ОФПГ. При этом компоненты вектора л; формируются на основе режекторной фильтрации:

[1, если 5>62^

х„= -I порог (7)

[О, в других случаях;

Пороговое значение режекторной фильтрации подбирается на основе макси-

порог

мизации минимальных расстояний между точками фазовых портретов. Результаты экспериментального исследования алгоритмов приведены в главах 3 и 4.

Квазинейросетевое агрегирование обобщенных спектральных данных.

Многие задачи управления качеством продуктов в химической и пищевой промышленности связаньгс анализом различных ОС, получаемых с помощью специализированных приборов. Так, например, в задачах контроля качества пищевых спиртов одновременно используют флуоресцентные спектры, оптические спектры видимого и ИК ближнего диапазонов. Для визуализации таких многомерных обобщенных спектральных данных необходимо решать задачу их агрегативного сжатия.

11

Декомпозиция и агрегирование обобщенных спектральных данных.

Исходные вектора^ = (/¡¡, К,,...,наблюдения состояния исследуемой системы£ обобщенных спектральных данных разбивается на небольшое количество групповых ОС:

компоненты которых соответствуют функционально однородным группам показателей {Ил + N11 +...= АО или получены различными физическим методами. Образуются декомпозированные элементарные подсистемы/1, В, С, ... ОС первого иерархического уровня.

На следующем шаге вычисляют оценки групповых или дифференциальных индикаторов 1а, 1в, 1с-.. (0</<1) состояний элементарных подсистем первого иерархического уровня декомпозиции, а также весовые коэффициенты цл,(1 ..., верифицирующие их

групповые значимости для образования соответствующих агрегатов - подсистем второго уровня иерархии (цл + ця + цс = ], = 1 )•

Алгоритмы вычисления индикаторов состояний элементарных подсистем зависят от моделей наблюдения ОС на фоне помех (Краснов А.Е., Красников С.А.).,

В простейшем случае нормально-распределенных помех данные индикаторы возможно строить, например, как некоторые меры близости точек обобщенных фазовых портретов Гильберта с центрами тяжести их обучающих выборок (см. рис. 6).

Агрегирование на последующих иерархических уровнях производится по аналогии с приведенной процедурой, как показано на ориентированном графе рисунка 7.

При таком параметрическом описании агрегированной системы, кроме знания о том какие ее подсистемы необходимо объединять, основная проблема заключается в построении индикаторов 1лвс, Ье', ¡авсое соответствующих агрегатов.

Структура приведенной в виде ориентированного графа модели агрегирования (см. рис. 7) во многом соответствует описанию работы квазинейронной сети. При этом наблюдаемые данные^п (п = 1, 2, ..., Ы) ОС формируют входные сигналы сети. Агрегаты А, В, С, Д Е; АБС, ИЕ', АВСйЕ соответствуют нейронам. Все индикаторы /— суть функции отклика нейронов. Однако, в отличие от нейронных сетей, в нейроподобной модели все связи устанавливаются жестко, путем описанной выше процедуры декомпозиции и иерархической группировки.

Алгебра индикаторов обобщенных спектральных данных.

В качестве исходной в работе принята алгебра индикаторов обобщенных спектральных данных, основанная на их слабом и сильном парных взаимодействиях:

, _ ^ЛУУ.-^А^в У и (9)

ЛВ ■"л + '"В _ е <"Л

1 _ е"к "в У в (10)

Рм^А + Рв-еРл Рв>

где е- коэффициент парного взаимодействия (0 < е < 2). Показано, что оптимальными для слабого взаимодействия являются е = 1, а для сильного 8 = 2.

На основании алгебры парных взаимодействий с помощью (7, 8) рекурсивно строится оценивание индикатора для системы £ • состоящей из любого количества подсистем.

Предположим, что к агрегированной подсистеме АВ = (рлв, 1ав) добавляется элементарная подсистема С = (рс, /с). При этом:

J е^дУд. (11)

Назовем системы типа А/? и ЛВС смесями элементов (Л, К и А, В, С соответственно). Тогда, для смеси /4ВС на основании (11) получим:

+ ^С ~ £ Wí - £ ^С ~£ ^С +£2

+_£2 "¿^сУЛ_

^ ~£ Wb - £ ^с -Е Wc +£2

Слагаемое В2 (J.А\ХIс соответствует тройным взаимодействиям элементарных подсистем.

Предположим, что в систему объединяются две подсистемы — смеси ЛВ = (\íab, 1лв) и CD = (цо>, /со). При этом, + = 1,цс + = 1, а ц^ + = 1. Тогда:

J 7 ^с7с+%7д-е^д7с7д

• со 1_8цл

/ = /;лв7ав + ^ср7ср~ g /¿ab//cd/ab 7сп п3\

ab.cd \-fun

Агрегированную систему ЛВ, CD из (13) будем называть композитом (смесь смесей).

Для визуализации динамики состояний агрегированной системы возможно использовать плоскость, образованную как разными индикаторами Iab, Icd, так и координатами / иД/ гдеД-символ приращения.

I*, ^ I' /V1), 1J

В третьей главе описаны алгоритмы и результаты экспериментального статистического исследования визуализации обобщенных спектральных данных - инфракрасных (ИК) спектров углеводородных соединений (на примере бензинов и вин) (УВС) для химической и пищевой промышленности на основе дискриминанта Фишера.

Визуализация обобщенных спектров с помощью дискриминанта Фишера

для химической и пищевой промышленности.

Результаты экспериментальных исследований приведены на рисунках 8-^10.

На рисунке 8 представлены ОС - ИК спектры бензинов: «80_нормаль»; «92_регуляр»; «95_премиум»; «98_супер». Наглядно видна сложность их различения.

Для визуализации данных ОС в главе описан алгоритм, основанный на вращении двумерной гиперплоскости Хо Y в многомерном пространстве обобщенных спектров для максимизации дискриминанта Фишера. При этом вращаемая ось х строилась как вектор, ортогональный среднему вектору всех помеченных ОС обучающей выборки, а ось у — с помощью преобразования Гильберта векторах (см. стр. 12).

На рисунке 9, 10 представлен результат визуализации трех марок бензинов и трех марок вин на основе множественного дискриминанта Фишера в пакете Mathcad.

13

отсчеты

2,500000

2,000000 1,500000 1,000000 0,500000

'80_нормаль ■92_Регуляр 95_Премиум 98_Супер

0,000000

Рисунок 8 - ИК спектры углеводородных соединений (бензины с различными октановыми числами).

Y32j ♦ ♦ ♦

Y33j

•coo W3

A i-2-

Y31j « « ®

Y32j ♦ ♦ ♦

Y33j

AAA

W6

К

W7

Wg ,_

BBi -30

-20

-10 ,

Y21 j,Y22j ,Y23j .Z21.Z22.Z23

Рисунок 9 - Визуализации трех марок бензинов

(«80_нормаль»; «92_регуляр»; «98_супер»).

-гъ-

421 ] , Y22j, Y23j ,Ъ2\,Ъ22,Ъ2Ъ

Рисунок 10 Визуализация трех марок вин (кружки - «полусладкое», ромбики — «сухое», треугольники - «сладкое»).

Как показали эксперименты, существенным ограничительным условием использования рассмотренной технологии визуализации обобщенных спектральных данных на основе дискриминанта Фишера является наличие ЭВМ с высоким уровнем вычислительной мощности. А именно, необходимо:

- несколько часов времени численных расчетов на ЭВМ с тактовой частотой 2 гигагерца для множественного дискриминанта Фишера;

- более часа на ЭВМ с тактовой частотой 2 гигагерца для парного дискриминанта Фишера.

Другим не менее существенным ограничительным условием использования рассмотренного алгоритма является необходимость предварительной классификации анализируемых объектов — обобщенных спектров, что является обременительным свойством любого алгоритма.

В четвертой главе описаны алгоритмы и результаты экспериментального статистического исследования визуализации обобщенных спектральных данных — инфракрасных (ИК) спектров углеводородных соединений (УВС) для химической и пищевой промышленности, а также многомерных люминесцентных спектров и оптических спектров поглощения спиртов для пищевой промышленности.

Результаты экспериментальных исследований приведены на рисунках 11-М 2.

На рисунке 11 представлен результат визуализации четырех марок бензинов на основе метода обобщенного фазового портрета Гильберта в пакете Excel.

0,400 0,300 0,200 0,100

А Ая ♦

0,000

-0,100 ■0,200 -0,300 -0,400 -0,500

о,; оо о.зоо 0,400 о,5оо 81 о,бве 0,700 0,800

А д

г

Рисунок 11 - Визуализация ИК спектров углеводородных соединений (бензины: квадраты — «80_нормаль»; ромбы - «92_регуляр»; треугольники — «95_премиум»; окружности - «98_супер»).

Визуализация многомерных спектральных данных на основе индикаторов квазинейросетевого агрегирования.

На рисунках 12 представлены отфильтрованные ИК спектры УВС, а в таблице фильтрованные спектры показателей качества УВС.

1 - от-

4,50 4,00 3,50 3,00 2,50 2,00 1,50 1,00 0,50 0,00

Опт плотность

, А

-80_норм -92_рег

95_прем ~98_суп

468,00 768,00 1068,001368,001668,001968,002268,002568,002868,003168,00 Обр СМ

Рисунок 12 - Отфильтрованные ИК УВС.

Таблица

Значение для марок

Наименование показателя Нормаль-80 ОКП 02 51123701 Регулнр-92 КП 02 5112 3705 Премиум-95 ОКП 02 5112 3703 Супер-98 ОКП 02 51123704

1. Октановое число, не менее:

по моторному методу 76,0 83,0 85,0 88,0

по исследовательскому методу 80,0 92,0 95,0 98,0

2 .Плотность пои 15 °С. кг/мЗ 700,0 725,0 750,0 780,0

3. Давление насыщенных паров бензина. Па. ДНП

мин. 35,0 55,0 60,0 80,0

макс. 70,0 90,0 95,0 100,0

4. Фракционный состав: Пределы перегонки, °С, не выше:

10% 75,0 65,0 60,0 55,0

50% 120,0 110,0 105,0 100,0

90% 190,0 180,0 170,0 160,0

5. Объем испарившегося бензина. %, пои температуре:

70 °С мин. 10,0 15,0 15,0 15,0

макс. 45,0 47,0 50,0 50,0

100 °С мин. 35,0 40,0 40,0 40,0

макс. 65,0 70,0 70,0 70,0

6. Индекс испаряемости, не более 900 1100 1200 1300

На рисунке 13 приведен пример визуализации многомерных обобщенных спектральных данных УВС по четырем обучающим выборкам различных марок.

Рисунок 13 — Визуализация многомерных обобщенных спектральных данных углеводородных соединений.

0,000

200 ___________

Рисунок 14 — Типичный ВИП спектр образца пищевого спирта (Абрамова И.М.).

Абрамовой И.М.(ВНИИПБТ) проведено исследование влияния исходного сырья и способа получения спирта этилового различного происхождения на спектры возбуждения - испускания - поглощения (ВИП - спектры) следовых количеств люминесцирующих микропримесей (рисунок 14).

В диссертации была проведена визуализация многомерных обобщенных спектров некоторых спиртов двух сортов (1 и 2), содержащих различные микропримеси.

Таблица 2

Таблица 3

Ли,1) А.и,нм

А.в,нм 360 380 400 420 440

220 0.20 0.15 0.10 0.10 0.10

240 0.30 0.20 0.15 0.15 0.10

260 0.15 0.60 0.50 0.20 0.10

280 0.30 0.15 0.75 0.60 0.15

300 0.45 0.20 0.50 1.05 0.90

3 I

/^(/■-пДи, 1) Ли, нм

Я,в,нм 360 380 400 420 440

220 0.10 0.45 0.50 0.30 0.10

240 0.30 0.30 0.40 0.15 0.30

260 0.10 0.20 0.45 0.20 0.10

280 0.05 0.10 0.10 0.05 0.10

300 0.00 0.10 0.30 0.10 0.00

Визуализация производилась по фрагментам соответствующих ВИП-спектров (^(Л,вДи) — таблицы 2, 3) и оптических спектров (Л(\) поглощения - рисунок 15) для разных концентраций -Э примесей.

0,50 0.55 0,60 0,65 0,70 0,75 0,00 0,В5 0.90 0,95 1,00 Длина волны, мкм

0,700

0,600 0,800 1,000

Рисунок 15 — Оптические спектры поглощения микропримесей с концентрацией 9, в спиртах двух сортов.

Рисунок 16 - Визуализация многомерных обобщенных спектральных данных спиртов двух сортов.

На рисунке 16 приведен пример визуализации многомерных обобщенных спектральных данных двух сортов спиртов по шести обучающим выборкам. Из рисунка видно, что спирты разных сортов легко идентифицируются в пространстве индикаторов, а в каждом кластере возможно ввести регрессионную зависимость индикаторов от концентраций примесей.

1) Разработан метод сжатия и визуализации обобщенных спектральных данных любых объектов пищевой и химической промышленности, включающий:

- отображение на плоскость обобщенных спектральных данных однородной физической природы на основе линейных функциональных преобразованиях их фазовых портретов Гильберта с применением разработанной адаптивной фильтрации;

- отображение на плоскость обобщенных спектральных данных разнородной физической природы на основе индикаторов квазинейросетевого агрегирования с применением разработанной алгебры агрегирования индикаторов спектральных данных с учетом их парных взаимодействия.

2) Проведено экспериментальное исследование сжатия и визуализации инфракрасных спектров углеводородных соединений для решения задач оперативного управления качеством продуктов пищевой и химической промышленности на основе алгоритма, использующего вращение гиперплоскости в многомерном пространстве обобщенных спектров для максимизации дискриминанта Фишера. При этом установлено, что:

- алгоритм эффективен при классифицированных обучающих выборках обобщенных спектральных данных;

- алгоритм предъявляет высокие требования к вычислительной мощности ЭВМ.

3) Проведен сравнительный анализ методов сжатия и визуализации обобщенных спектральных данных, указаны преимущества различных подходов при определенных условиях осуществления анализа визуализации обобщенных спектральных данных.

4) Представлены рекомендации в использовании различных подходов для анализа визуализации обобщенных спектральных данных при решении задач оперативного управления качеством продуктов пищевой и химической промышленности.

5) Проведена серия экспериментальных (тестовых) исследований сжатия и визуализации обобщенных спектральных данных (инфракрасных спектров и спектров физико-химических показателей углеводородных соединений, а также многомерных люминесцентных и оптических спектров) при решении задач оперативного управления качеством продуктов химической и пищевой промышленности на основе алгоритмов, использующих ме-

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

тод фазовых портретов Гильберта и индикаторов квазинейросетевого агрегирования, подтвердившая высокую производительность разработанного метода.

СПИСОК ПУБЛИКАЦИЙ

Список статей, рекомендованных ВАК РФ

1. Яньков, В.Ю.К оптимальной кластеризации многомерных векторов [текст] / В.Ю. Яньков, Е.А. Чернов //Технологии XXI века в лёгкой промышленности (электронное научное издание). № 7. Раздел 4. Часть II. - 2013. -№9 (60%).

2. Красников, С.А. Агрегированное описание состояний сложных систем на основе парных взаимодействий их элементарных подсистем [текст] /С.А. Красников, Ю.Л. Саги-нов, Н.О. Феоктистова, Е.А. Чернов. // Технологии XXI века в лёгкой промышленности (электронное научное издание). №7. Часть II. Раздел 4. — 2013. — №5 (25%). j

3. Краснов, А.Е. Оптимальная кластеризация многомерных векторов [текст] / А.Е. Краснов, В.Ю. Яньков, С.А. Красников, Е.А. Чернов. // Технологии XXI века в лёгкой промышленности (электронное научное издание). № 6. Часть II. — 2012. — №24 (25%).

4. Николаева, C.B. Автоматизированные инструментальные методы оценки качества многокомпонентных сред [Текст] / C.B. Николаева, М.В. Сартаков, И.Н. Дмитриев, Е.А. Чернов // Автоматизация и современные технологии. - 2009. — № 11. — С. 11 — 13. (20%)

Статьи и материалы конференций

5. Дроханов, А.Н. Информационно-измерительный комплекс для экспресс-анализа качества многокомпонентных сред. [Текст] / А.Н. Дроханов, С.А. Красников, Е.А. Чернов. // Техника и технология. № 1. - 2010. -С. 23 - 25 (30%).

6. Krasnov, А.Е. Method of the compression of phase portraits of generalized spectral data for solving their clustering and recognition. [Текст] / А.Е. Krasnov, S.A. Krasnikov, E.A. Chernov // International Scientific - Practical Conference "Innovative Information Technologies" (Part 2. «Innovative information technologies in science» Prague, 21-25 April 2014, 664-670 p.p.) (40%).

7. Чернов, Е.А. Обобщенное представление спектральных данных на плоскости для решения задач их кластеризации и распознавания. [Текст] / Е.А. Чернов // IV Международная конференция «Современные информационные технологии в образовании, науке и промышленности» (электронное издание) —М.: МГУТУ, 14-15 мая 2014. (100%).

8. Краснов, А.Е. Агрегированное параметрическое описание состояний сложных систем на разных уровнях иерархии [Текст] / А.Е. Краснов, С.А. Красников, C.B. Николаева, Е.А. Чернов // Сборник трудов II Международной научно-практической конференции «Инновационные информационные технологии (12Т)» (Прага, 22-26 апреля, 2013). Том 2 «Инновационные информационные технологии в науке». - М.: МИЭМ НИУ ВШЭ. - 2013. - С. 278 - 285. (25%).

9. Краснов, А.Е. Автоматизация процесса идентификации горюче-смазочных материалов. [Текст] / А.Е. Краснов, С.А. Красников, Д.О. Морозов, Е.А. Чернов // Сборник «Информационные средства и технологии». - Материалы XVII Международной научно-технической конференции (Москва, 20 —22 октября 2009 г.). — М.: Издательский дом МЭИ -2009.-С. 29-34. (30%).