автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы и модели контроля состояния сложных динамических объектов на основе измерительной информации с использованием алгоритмов интеллектуального анализа данных
Автореферат диссертации по теме "Методы и модели контроля состояния сложных динамических объектов на основе измерительной информации с использованием алгоритмов интеллектуального анализа данных"
На правах рукописи
■ПП
Жукова Наталия Александровна
МЕТОДЫ И МОДЕЛИ ОПЕРАТИВНОГО КОНТРОЛЯ СОСТОЯНИЯ СЛОЖНЫХ ДИНАМИЧЕСКИХ ОБЪЕКТОВ НА ОСНОВЕ ИЗМЕРИТЕЛЬНОЙ ИНФОРМАЦИИ С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Специальность1 05 13 01 - Системный анализ, управление и обработка информации (технические системы)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
□□3172138
Санкт-Петербург - 2008
003172138
Работа выполнена в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» им В И Ульянова (Ленина)
Научный руководитель - доктор технических наук, профессор Геппенер В В
Официальные оппоненты
заслуженный деятель науки РФ, доктор технических наук,
профессор Нечаев Ю И
кандидат технических наук, доцент Егоров С С
Ведущая организация - Санкт-Петербургский институт информатики и автоматизации РАН
Защита диссертации состоится « ХЪ » и.юи* 2008 г в Д Ч часов на заседании диссертационного совета Д 212 238 07 Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» им В И Ульянова (Ленина) по адресу 197376, Санкт-Петербург, ул Проф Попова, 5
С диссертацией можно ознакомиться в библиотеке университета Автореферат разослан «¿С?» „ид. & 2008г
Ученый секретарь диссертационного совета
Цехановский В В
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы Современный этап развития техники и технологий характеризуется быстрым ростом сложности создаваемых технических систем Такие системы как ракетно-космические комплексы, сложные производственные системы содержат многие тысячи датчиков, с которых поступает огромный объем информации Информация должна обрабатываться в реальном или близком к реальному масштабу времени Для решения этой задачи в течение многих лет успешно используются системы сбора и обработки телеметрической информации (ТМИ), которые позволяют достаточно эффективно решать задачи, связанные со сбором, первичной обработкой и накоплением информации, поступающей от сложных динамических объектов (СДО) Обычно собранная информация накапливается в базах данных (БД) Для ее обработки могут использоваться средства OLAP (online analytical processing), экспертные системы
Типовой задачей, решаемой системами сбора и обработки ТМИ, явчяется задача контроля состояния СДО, в частности, автоматическое выявление аномальных и преданомальных ситуаций, возникающих в процессе функционирования объектов В настоящее время уже создано и используется достаточно много систем такого типа.
К сожалению, существующие системы обладают рядом недостатков, такими, как высокая стоимость разработки и эксплуатации и относительно низкая эффективность функционирования Это обуставлено тем, что, с одной стороны, каждая из создаваемых систем является, по существу, уникальной, а, с другой стороны, все более или менее сложные системы предполагают активное участие экспертов в процессе обработки и анализа ТМИ Таким образом, важными задачами являются задачи уменьшения стоимости и повышения эффективности систем контроля состояния СДО
Действенным средством решения проблемы повышения эффективности функционирования систем контроля состояния СДО, является переход от систем обработки данных к системам обработки знаний На сегодняшний день это одно из магистральных направлений развития информационных технологий, в рамках которого уже созданы достаточно эффективные средства работы со знаниями и инструментальные средства, необходимые для построения прикладных систем В первую очередь, это касается таких технологий, как data mining и семантический веб Использование интеллектуальных технологий, ориентированных на работу со знаниями, позвочяет решать следующие задачи
- автоматизация процесса обработки всего комплекса ТМИ,
- упрощение процесса настройки системы на конкретный объект контроля посредством занесения в базу знаний (онтологию) информации об объекте
Для использования преимуществ, которые дает переход от работы с данными к работе со знаниями, необходимо решить ряд задач, связанных с разработкой процедур извлечения, хранения и использования знаний из накопленной в БД "ЩИ, в частности, необходимо разработать онтологию для работы с ТМИ
Целью диссертационной работы является разработка методов интеллектуальной обработки измерительной информации, разработка основанного на работе
со знаниями комплексного подхода к автоматическому выявлению аномальных и преданомальных ситуаций, возникающих в процессе функционирования СДО
В соответствии с указанной целью в работе сформулированы и решены следующие задачи
1 Анализ современных методов контроля состояния СДО, оценка применимости методов интеллектуального анализа данных для контроля состояния СДО, классификация методов интеллектуального анализа
2 Разработка лринципов построения систем контроля состояния СДО на основе методов интеллектуального анализа, включая разработку модели сигналов и базовых алгоритмов анализа эталонных и поступающих сигналов, описание методов принятия решения о наличии аномальной ситуации на основе результатов сопоставления шаблонов сигналов
3 Разработка алгоритмов, ориентированных на использование в интеллектуальных системах контроля состояния СДО, включая разработку метода сокращения размерности признакового пространства и разработку метода визуализации состояния СДО
4 Исследование вопросов проектирования и программной реализации систем контроля состояния СДО, включая выделение типовых архитектурных решений систем и условий их применения.
Предмет и методы исследования. Предметом исследования являются системы контроля состояния СДО При решении поставленных задач использовался аппарат математической статистики, теория цифровой обработки сигналов, теория искусственного интеллекта
Научную иовизну работы составляют следующие положения
1 Подход к анализу ТМИ, позволяющий автоматизировать процесс анализа за счет перехода от обработки данных к обработке знаний В соответствии с подходом выделяется пять основных этапов предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ, визуализация результатов.
2 Многоуровневая модель представления телеметрических сигналов, соответствующая различным этапам анализа ТМИ, алгоритмы построения моделей различных уровней Использование предлагаемой модели позволяет использовать все множество разработанных средств работы со знаниями
3 Метод сокращения размерности анализируемых признаков и их ранжирование
4 Метод визуализации зависимостей телеметрических параметров, основанный на построении решетки понятий
Научные положения, выносимые на защиту:
1 Подход к анализу ТМИ, в соответствии с которым выделяется пять основных этапов предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ, визуализация результатов
2 Многоуровневая модель сигнала и методы формирования описания сигнала в соответствии с предлагаемой моделью К методам формирования описания модели первого уровня относятся модификация метода сегментации медленно меняющихся телеметрических параметров, метод сегментации быстро меняющихся
телеметрических параметров К методам формирования описания модели второго уровня относится модификация метода секвенциального анализа,
3 Метод формирования набора значимых признаков из множества поступающих признаков и способ ранжирования значимых признаков
4 Метод визуализации зависимостей телеметрических параметров, основанный на построении решеток понятии
Практическая значимость работы заключается в том, что предложен ряд моделей и методов, которые могут быть использованы при создании реальных систем контроля состояния СДО, включая метод формирования набора значимых признаков из множества поступающих признаков, метод ранжирования значимых признаков и метод визуализации зависимостей телеметрических параметров, основанные на построении решетки понятий
Достоверность результатов исследования подтверждается корректным использованием математического аппарата, результатами экспериментальных исследований на программных моделях и результатами испытаний реальных систем, при создании которых использовались предложенные модели и методы
Внедрение результатов работы заключается в использовании разработанных моделей и методов при проведении в Научно-инженерном центре СПбГЭТУ (г Санкт-Петербург) 4 НИР и 1 ОКР, в рамках которых разработано 3 макета и 1 программный комплекс Созданные программные продукты успешно используются для решения практических задач Работа поддержана персональным грантом ректора СПбГЭТУ среди студентов и аспирантов за 2005 г, персональным грантом фонда содействия развитию малых форм предприятий в научно-технической сфере по программе УМНИК на выполнение НИОКР по теме «Разработка системы контроля состояния сложных динамических объектов» (№ У-2007-3/3-1 «Объект», 2007) за 2007г
Апробация результатов исследования. Основные положения и результаты работы докладывались и обсуждались на следующих конференциях
1 Двенадцатая международная конференция "Математика Компьютер Образование", г, Пущино, 17-22 янв 2005 г
2 Научная сессия МИФИ-2005, М, 24-28 янв 2005 г
3 Технологии Microsoft в теории и практике программирования, СПб., 1-2 марта 2005 г
4 Научная сессия МИФИ-2006, М, 23-27 янв 2006 г
5 Тринадцатая международная конференция "Математика Компьютер Образование", г Дубна, 23 - 28 янв 2006 г.
6 Четвертая региональная конференция по научному программному обеспечению "Практика применения научного программного обеспечения в образовании и научных исследованиях", СПб, 2-3 февр 2006 г
7 61-я научно-техническая конференция, посвященная дню радио, СПб, 2931 марта 2006 г
8 Международная конференция по мягким вычислениям и измерениям, СПб , 27-29 июня 2006 г
9 Десятая национальная конференция по искусственному интеллекту с международным участием КИИ-2006, г Обнинск, 25-28 сент 2006 г
10 Научная сессия МИФИ-2007, М , 22-26 янв 2007 г
11 Технологии Microsoft в теории и практике программирования, СПб, 1314 марта 2007 г.
12 Девятая международная научно-техническая конференция и выставка "Цифровая обработка сигналов и ее применение". М, 28-30 марта 2007 г
13 Международная конференция по мягким вычислениям и измерениям, СПб, 25-28 июня 2007 г.
Публикации. По теме диссертации опубликованы 19 научных работ, включая 6 статей ( 1 статья опубликована в изданиях, определенных ВАК) и 13 работ в материалах международных, национальных и региональных конференций Структура и объем работы.
Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 80 наименований Основная часть работы изложена на 145 страницах машинописного текста Работа содержит 40 рисунков и 12 таблиц
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность диссертационной работы, определяются цель и задачи исследования, формулируются научная новизна и практическая ценность результатов
В первой главе вводятся основные понятия и определения, анализируются современные подходы к построению систем оперативного контроля состояния СДО (ОКССДО), анализируются функции, реализуемые системами данного типа, приводится обзор алгоритмов, используемых в системах ОКССДО Вводится понятие интеллектуальной системы ОКССДО, выделяются перспективные подходы к построению такого рода систем, конкретизируются задачи исследования
Основная задача систем ОКССДО заключается в обнаружении изменения технического состояния объекта на основе поступающей телеметрической информации При этом сведения о техническом состоянии объекта необходимо получить, а часто и обработать в режиме близком к режиму реального времени В этом случае решается задача оперативного контроля состояния объекта
Основными требованиями, предъявляемыми к системам ОКССДО, являются высокая скорость и автоматизация процесса обработки ТМИ, обеспечение заданной точности обработки и возможность автоматически настраивать системы на работу с разными объектами
Типовая система ОКССДО состоит из трех основных подсистем информационно-телеметрического комплекса, подсистемы первичной обработки данных и подсистемы вторичной обработки данных
Основными операциями первичной обработки ТМИ являются дешифровка данных, отбраковка ошибок, усреднение отсчетов, выделение экстремальных значений параметров, контроль за отклонением от номинальных значений и др Вторичной обработкой или анализом ТМИ называется часть обработки ТМИ, связанная с формированием данных, необходимых оператору или системе для принятия решения о состоянии СДО
Функции телеметрической системы могут быть логически сгруппированы по уровням, между которыми установлены связи, и представлены в виде иерархической модели в соответствии с эталонной моделью взаимодействия эталонных систем (081) Международные стандарты разработаны комитетом по космическим системам передачи данных (ССЗБЭ) только для этапа первичной обработки данных
Для этапа вторичной обработки ТМИ стандартов не существует, идет активный процесс поиска методов для вторичной обработки ТМИ Как показал анализ используемых методов, современные системы ОКССДО требуют активного участия эксперта при обработке данных на этапе вторичной обработки ТМИ, кроме того, для каждого нового объекта требуется разрабатывать новую систему, что, учитывая сложность контролируемых объектов, приводит к необходимости привлечения большого числа высококвалифицированных экспертов
Одним из перспективных направлений устранения перечисленных недостатков является использование методов интеллектуального анализа данных на этапе вторичной обработке ТМИ и переход к интеллектуальным системам ОКССДО
Под интеллектуальной системой ОКССДО понимается система оперативного контроля состояния сложных динамических объектов, обладающая двумя следующими свойствами
- накопленные данные об объекте при различных режимах функционирования (штатное функционирование, не штатное функционирование) используются для извлечения знаний о характере функционирования объекта,
- в процессе анализа новых данных система использует извлеченные знания
Во второй главе предлагается и анализируется обобщенный подход к построению автоматических систем ОКССДО В рамках данного подхода рассматривается процесс анализа телеметрических сигналов и многоуровневая модель представления сигнала, которая позволяет описать сигнал на различных уровнях представления, каждый из которых соответствует определенному этапу обработки
Под моделью сигнала в настоящей работе понимается некоторая стандартная форма представления информации о сигнале или группе сигналов Термин модель употребляется в разных смыслах Можно выделить следующие варианты использования этого термина
- модель в смысле структуры контейнера, в котором хранятся данные о конкретном сигнале, что соответствует понятию класса в терминах ООП,
- модель конкретного сигнала, полученная, например, после предварительной обработки реального сигнала, что соответствует понятию экземпляра класса (объекту) в терминах ООП
С точки зрения формы представления информации можно говорить о 2 типах моделей математических (структурных моделях) и информационных моделях, определяющих способ хранения информации о сигналах.
Предлагаемая иерархия моделей, включает 4 уровня описания На нулевом уровне рассматривается исходный сигнал и сигнал, получаемый после предварительной обработки данных Сигнал представляется как множество пар 5=(Т,У), где I, е Т - момент измерения, у, е V - значение сигнала в момент времени Построение моделей первого, второго и третьего уровней предполагает извлечение знаний
о сигнале с использованием методов статистической обработки данных и методов Data Mining Модель сигала первого уровня представляет собой помеченную последовательность интервалов (6,,,с,),(А2,/2,с2),(63,/3,с3),(¿4,/4,с4) , с, 6 С где Ь, и / обозначают соответственно начальный момент времени, когда начинает наблюдаться состояние с„ и заключительный момент времени, когда состояние больше не наблюдается, а С - множество всех возможных различимых состояний сигнала Модель сигнала второго уровня стоится на основе модели сигнала первого уровня и представляется в виде упорядоченной пары получившей назва-
ние стандартного шаблона, где С - множество состояний, R - множество допустимых связей (закономерностей в следовании) между состояниями Модель третьего уровня позволяет интегрировать извлеченные знания о сигнале со знаниями о предметной области, представленными в форме онтологии, и использовать стандартные механизмы вывода Модель сигнала третьего уровня стоится на основе модели сигнала второго уровня и представляется в виде набора ассоциативных правил вида X =>relation Y, где X сС, Ус С иХп У= 0 При этом в качестве отношения (relation) может рассматриваться один из элементов множества R допустимых связей между состояниями С
Описанные модели соответствуют представлению сигналов на различных этапах обработки ТМИ Ниже приведены основные этапы обработки ТМИ и методы построения моделей на различных этапах для статического режима обработки.
Этап 1 «Предварительная обработка данных» На этапе проводится предварительная обработка и анализ данных, в частности исключаются выбросы, шумы, тренды
Этап 2 «Сегментация данных» Этап предполагает разбиение сигнала на участки, обладающие постоянными свойствами Отдельно рассматривается процесс сегментации для медленно меняющихся и для быстро меняющихся телеметрических параметров
Этап 3 «Кластерный анализ» Кластерный анализ полученной последовательности сегментов для быстроменяющихся параметров решает задачу автоматической группировки выделенных сегментов с целью выделения групп "схожих" сегментов Степень схожести сегментов определяется по заданному критерию
Этап 4 «Секвенциальный анализ» Этап включает формирование на основе полученной последовательности классов стандартных (характерных для сигнала) последовательностей (шаблонов) При анализе эталонных сигналов происходит заполнение библиотеки шаблонов В процессе анализа новых сигналов полученные последовательности классов сопоставляются с шаблонами При несоответствии шаблонов принимается решение о наличии аномальной ситуации.
Этап 5 «Визуализация результатов» В режиме анализа эталонных сигналов визуализируются исходные данные и соответствующие им модели При анализе новых данных отображаются сигналы, в которых была найдена разладка и указывается момент ее возникновения
В работе предлагаются модификация метода сегментации для меняющихся параметров (ММП), метод сегментации быстро меняющихся параметров (БМП), модификация алгоритма секвенциального анализа для ТМ параметров и метод со-поставпения шаблонов
Сегментация медленно меняющихся параметров При сегментации ММП к исходным сигналам применяются алгоритмы сглаживания функций Сглаженные функции представляют собой функции, значения которых в момент времени t определяется значением функции в моменты времени близкие к t В простейшем случае значение сглаженной функции определяется с помощью функции ядра как линейная комбинация соседних значений Функция ядра к(и) либо стремится, либо равна 0, при | и |> О Уровень сглаживания функции зависит от коэффициента
Сглаженная функция представляет собой свертку исходного сигнала с функцией ядра fit) = (ks * f)(t) В качестве функции ядра целесообразно использовать функцию Гаусса, поскольку только использование функции Гаусса гарантирует не увеличение числа экстремумов при увеличении к, что является необходимым условием при обработке сигнальных данных Проводится построение набора сглаженных функций с различными масштабирующими коэффициентами для исходных данных и выделение эталонных сегментов В качестве эталонных предлагается рассматривать семь сегментов, соответствующих возможным комбинациям значений (положительные/ отрицательные/ нуль) первой и второй производных (исключаются два случая, для которых первая производная равна нулю, а вторая производная отлична от нуля) Наиболее устойчивыми, и, следовательно, представляющими интерес, являются те характеристики сигнала (границы сегментов сигнала), которые наблюдаются в возможно большем числе сглаженных функций Для сглаживания функции требуется 0{п) операций. Поскольку объем исследуемых данных велик, то решение задачи сглаживания может потребовать больших вычислительных ресурсов, поэтому предлагается алгоритм сглаживания заменить алгоритмом с дырами (algorithm к trous), который основан на быстром вычислении двоичного вейв-лет-преобразования Использование алгоритма с дырами для построения набора сглаженных функции не нарушает условие неувеличения числа экстремумов, поскольку в алгоритме используются двоичные сплайн-вейвлеты Предлагаемый метод позволяет сократить время обработки до 10 раз
Сегментация быстро меняющихся параметров Сегментацию БМП предлагается осуществлять в частотной области на основе расчета спектральной плотности
Предлспаечся оригинальный подход для сегментации сигнала При этом рассматривается кусочно-постоянная модель, описывающая поведение анализируемого сегмента, и осуществляется в рамках сегмента поиск стационарного процесса с некоторой спектральной плотностью Алгоритм включает в себя следующие шаги вычисление выборочных значений оцененной спектральной плотности, проведение процедуры кластерного анализа вычисленных значений спектральной плотности
Дтя оценки спектральной плотности в статистике используется периодограмма Периодограмма 1{со) основанная на выборочных значениях Х0, , А'г_, оп-
2
, где aj это Фурье частоты, а. = 2я j :Т ,
ределяется в виде /(<»,) =
2 жТ
2>
/=[-7У2]+1, ,-1,0,1,. , [Г/2] Для любого множества Фурье частот а\,со2, ,а„ таких, что 0 < < <о\<л, 1{а>.) является асимптотически независимой экспоненциальной случайной величиной со средними g(<ol) и дисперсиями ^(а,))1, где % - спектральная плотность Следовательно, периодограмма не является состоятельной оценкой $(со) Сглаживание периодограммы'позволяет получить состоятельную оценку для g Для работы с выборкой произвольного объема, а не только кратного степени 2, используется модифицированный вариант недецицимированных вейв-лет-преобразований
На шаге кластерного анализа делается предположение о том, что все множество векторов коэффициентов П, полученных на первом шаге, может быть представлено в виде П = |о,,ш2, ,®„}, где со, (| = 1,и) - подклассы, рассматриваемые как кластеры Плотность вероятности распределения, соответствующая ^ имеет вид Ф(х) = где / (х | й>) - условная плотность распределения, соот-
ветствующая кластеру со,, Р, - априорная вероятность появления объектов из подкласса со,
Алгоритмы кластеризации на основе показа векторов обучающей выборки и заданных условий объединения объектов в кластер позволяют определить совместную плотность распределения и найти ее существенные максимумы, которые являются искомыми центрами кластеров Основными требованиями к алгоритму кластерного анализа при решении задачи сегментации сигналов являются- высокая скорость работы, поскольку данные имеют большой объем, автоматическое определение числа кластеров в процессе работы алгоритма, что связано со сложностью структуры анализируемых сигналов и невозможностью определить точное значение числа кластеров на основе графического представления сигнала Сформулированным требованиям отвечает алгоритм адаптивного выбора подклассов
Построение шаблонов сегментированных сигналов Применение алгоритмов секвенциального анализа к последовательности сегментов позволяет перейти к компактной форме описания сигнала в виде набора шаблонов и предоставляет простой механизм сопоставления шаблонов
В основе алгоритмов секвенциального анализа лежит понятие шаблона Размерность шаблона Р - это количество входящих в него сегментов п Если = п, то шаблон Р называется «-мерным. Закономерности следования сегментов в Шаблоне строятся на базе темпоральной логики Аллена, описывающей отношения между временными интервалами Для любой пары интервалов в работе определено допустимое множество отношений Основной характеристикой шаблона является поддержка шаблона, которая показывает, как часто шаблон появляется в анализируемой последовательности, и которая численно равна количеству экземпляров временного шаблона в последовательности Если последовательность сегментов оказывается слишком длинной, то подсчет поддержки шаблонов становится нетривиальной задачей Проблема, связанная с протяжённостью шаблонов по времени, решается путём введения скользящего окна
Предлагаемей алгоритм построения шаблонов является итерационным и состоит из трех этапов генерация кандидатов в шаблоны, расчет поддержки шаблонов, отбор шаблонов Совместное применение при построении шаблонов скользящего окна, свойства анти монотонности и таблиц транзитивности Алена позволяет сократить время построения шаблонов до 5 раз.
При анализе новых данных с помощью скользящего окна определяется наличие в новых данных выявленных шаблонов Каждый шаблон в любой момент времени относится к одной из трех групп, потенциальные шаблоны, пассивные шаблоны, активные шаблоны При перемещении скользящего окна шаблоны переходят из одного состояния в другое Использование перехода, отличного от набора допустимых, означает наличие в последовательности разладки
Третья глава посвящена исследованию алгоритмов, ориентированных на использование в интеллектуальных системах ОКССДО В ней рассматриваются метод сокращения размерности анализируемых признаков (телеметрических параметров) и метод визуализации зависимостей параметров на основе использования решеток понятий Выбор данных задач обуславливается тем, что именно эти задачи возникают при проектировании реальных систем, и в настоящее время автору не удалось найти готовых решений
Основной задачей сокращения размерности признакового пространства является выбор и ранжирование наиболее значимых для объекта признаков (параметров, анализ которых является наиболее информативным)
На первом этапе к исходному набору признаков применяется один из методов преобразования количественных признаков в качественные В случае, если целевой признак является кочичественным, он также преобразуется в качественный К полученному набору качественных признаков применяется один из алгоритмов ассоциации Значимыми считаются те признаки, которые используются в построенных ассоциативных правилах Последовательность обработки признаков определяется достоверностью правил, в состав которых признаки входят Данная методика позволяет сократить объем анализируемых данных при оперативной обработке ТМИ до 2 раз без существенного ухудшения качества результатов анализа
На сегодняшний день наиболее широко используемым и хорошо зарекомендовавшим себя алгоритмом является алгоритм Арпоп, который используется во многих коммерческих и свободно распространяемых системах С точки зрения анализа данных основным достоинством алгоритма Арпоп является его гибкость Имеется возможность задавать два основных параметра минимальную поддержку и минимальную достоверность правила, что позволяет получать существенно различные группы правил Использование только алгоритма Арпоп является недостаточным При обработке ТМИ в ряде случаев сложно задать значения параметров минимальной поддержки и минимальной достоверности В этом случае удобно применять алгоритм РгесЬсПуеАрпоп, который осуществляет поиск наиболее точных правил На вход алгоритма Рге&сИуеАрпоп подается только число правил, которые следует найти.
Поскольку данные алгоритмы не предполагают наличия целевой переменной, для решения задачи анализа ТМИ предтагается модификация данных алгоритмов В частности модифицирован этап "генерация наборов кандидатов" и этап
"построение правил" На этапе "генерация наборов кандидатов" рассматриваются только кандидаты, в состав которых входит целевая переменная При построении правил строятся только правила, в левой части которых расположена целевая переменная
Во второй части третьей главы предлагается метод визуализации зависимостей телеметрических параметров, который позволяет эксперту на основе построенных шаблонов выявить группы зависимых параметров по совокупности экспериментов Установлено, что существующие методы визуализации не позволяют решить поставленную задачу. Задача может быть решена при применении методов визуализации, оперирующих с шаблонами параметров на понятийном уровне К числу таких методов, в первую очередь, относится метод анализа формальных понятий, который основан на использовании прикладной алгебраической теории решеток
В работе для анализа зависимостей телеметрических параметров предлагается использовать следующий формальный контекст при построении решетки понятий К={Т£,1), где Т - множество параметров объекта, полученных в результате различных экспериментов, Б - множество шаблонов, соответствующих телеметрическим параметрам, поступающим с объекта, I - отношение инцидентности имеющее место для геГ, ясЯ, тогда и только тогда, когда параметр г не соответствует шаблону 5 Соответствие определяется на основе сравнения параметра с шаблоном.
При построении модели, отражающей зависимости параметров в СДО, возникает необходимость работы с нечеткими отношениями, поскольку результатом сопоставления шаблонов с параметрами является показатель соответствия, который находится в интервале от 0 до 1 В случае если показатель соответствия может быть преобразован в качественный показатель, целесообразно использование многозначного контекста, который определяется как четверка (Г 5, J, IV), где И7 — множество значений качественного показателя соответствия, ./ Гх 5 У/ — отображение, сопоставляющее паре «параметр - шаблон» значение из ¡V
В случае, если описанный переход к категориальным признакам не возможен контекст можно определить как (Г, 5, У, Р), где У Г х 5 Р — отображение, сопоставляющее паре «параметр - шаблон» показатель соответствия Р. При работе с параметрами СДО для каждого сформированного понятия определяется среднее значение показателя соответствия. Подобное представление позволяет наглядно представить значимость сформированных понятий
Для упрощения получаемой решетки предлагается строить набор решеток с учетом структуры объекта, каждая из которых соответствует заданному уровню детализации объекта. Под "верхнем" уровнем детализации (г=1) понимается представление объекта в виде набора систем, входящих в состав объекта Для каждой из систем может быть построена детализирующая решетка, в которой в качестве множества Т рассматривается набор параметров, характеризующий соответствующую подсистему (уровень детализации г=2) На верхних уровнях детализации вместо конкретных параметров рассматривается оценка состояния соответствующей системы (подсистемы), получаемая на основе анализа совокупности параметров соответствующей системы (подсистемы)
В четвертой главе рассматриваются основные подходы к построению интеллектуальных систем ОКССДО подход, основанный на использовании баз данных, подход, основанный на использовании экспертных систем, и онтологический подход В работе приводится сравните чьный анализ подходов и делается вывод о предпочтительности использования онтоло! ического подхода, к основным достоинствам которого можно отнести следующее
- онтология позволяет представить описание объекта, т е данные и знания в стандартной общепринятой форме, что позволяет их свободно использовать отдельно от системы, при этом описание объекта является полным,
- для работы с онтологиями на сегодняшний день разработано большое количество эффективных инструментов, все эти инструменты могут быть в полной мере использованы,
- разработанная онтология может быть повторно используема, т е она достаточно легко настраивается для работы с новыми объектами
При построении онтологии в качестве ключевых можно выделить четыре группы понятий
- понятия, описывающие внутреннюю структуру объекта (примерами понятий являются система, подсистема, агрегат, узел, датчик), для каждого объекта заполняется формуляр, содержащий информацию об объекте,
- понятия, описывающие эксперименты, т е результаты функционирования объекта за некоторый период времени (примерами понятий являются поступившие сигналы, описание штатной эксплуатации и эксплуатации в нештатных ситуациях),
- понятия, описывающие методы обработки ТМИ, в качестве основных групп методов рассматриваются статистические методы, методы сегментации, методы кластерного анализа, методы построения ассоциативных привил и методы секвенциального анализа,
-понятия, описывающие структуру сигнала на основе предлагаемой модели сигнала.
Структура знаний о сигналах соответствует структуре уровней описания сигналов В качестве языка описания на нулевом уровне используется XML/XML Schema, на первом и втором уровнях - RDF/ RDFS, а на третьем уровне - язык описания знаний SWRL
В диссертации приведена архитектура системы ОКССДО на основе онтологического подхода, в состав которой входят следующие подсистемы подсистема автоматического извлечения знаний, в состав которой входят блоки предварительной обработки и набор методов Data Mining, подсистема обработки знаний, которая включает реализацию адаптированных для предметной области механизмов обработки знаний, в частности, предоставляет механизмы визуализации, модификации и коррекции знаний, подсистема управления знаниями, предоставляющая эффективный механизм управления знаниями, центральное место в котором занимает онтология предметной области, и подсистема настройки ролей различных пользователей
Реализован прототип системы ОКССДО в среде Eclipse с использованием Protégé API и библиотеки Jess Эксперименты на реальных и модельных сигналах подтвердили работоспособность системы
В качестве исходных данных для анализа рассматривались данные, полученные в результате экспериментов, проводимых над 4 СДО. Из них 3 эксперимента проводилось над объектами одного типа (два из них завершились в штатном режиме и один в аварийном) и один эксперимент над объектом другого типа. Общее число рассматриваемых параметров для каждого эксперимента составляло примерно 500 параметров. Результаты работы алгоритмов оценивались на основе сравнения с экспертной оценкой. Неточности в работе алгоритмов выявлено не было. Алгоритмы оперативного контроля применялись в качестве алгоритмов для экспресс оценки результатов.
В качестве примера рассмотрены 3 сигнала, из них сигнал 1 (Рис. 1 а)) - сигнал, полученный при функционировании объекта (объекта 1) в нормальном состоянии, сигнал 2 (Рис. 1 г)) - сигнал, полученный с того же объекта (объекта 1), но при аварийном функционировании, сигнал 3 (Рис. 1 ж)) - сигнал, полученный с объекта (объект 2), отличающегося от объекта 1. К сигналам были последовательно применены алгоритмы сегментации (Рис, 1 б), д), ж)), кластерного анализа (Рис. 1 в), е), и)) и секвенциального анализа (таблица 1).Для сигнала 2 выявлено несоответствие для 1,2 и б сегментов, для сигнала 3 выявлено несоответствие для всех сегментов.
Сигнал 1
а;
Сигнал 2
б)
..Рис:1
г)
Сигнал 3
з)
Рис.1
Таблица 1
№ Дис- Энергия Среднее Среднее Ме- Макс Миним Асим- Эксцесс
сегм персия значение абс откл от среднего диана значение значение метрия
Сигнал 1
1 4122 19696715 148 8 45 5 152 218 4 ■1 14 0 41
2 261 1,38Е+08 205 9 43 205 218 200 07 ■0 64
3 05 4,7Е+08 199 06 04 199 201 198 0.49 0 67
4 08 7 5.3Е+08 193 42 26 193 199 189 0 23 •12
5 06 6 5.12Е+08 157 42 45 2 189 193 29 -1 28 -0 04
6 1510 546881 23 62 3 8 24 30 0 -1 95 8 32
Сигнал 2
1 4379 3 18982732 145 87 47 62 150 255 2 -0 95 0 04
2 163 2 6.35Е+08 200 51 4 13 199 255 4 -6 93 97.17
3 07 08 5,05Е+08 193 16 2 92 193 200 187 0 23 -1 23
(4 01 6 4,48Е+08 189 3 07 189 253 186 19 46 9162
5 1618 5 58380136 120 8 34 77 111 193 66 0 45 ■ 1 12
б 770 9 8063426 26 7 20 96 27 255 0 2 42 14 62
Сигнал 3
1 2660 7 1010356 79 39 44 41 65 165 7 03 -121
2 69 7 32030930 174 62 7 76 174 187 162 -0 03 -1 45
3 8 1.05Е+08 184 44 2 15 185 189 180 ■0 2 -1 37
4 30 9 2,26Е+08 198 4 22 200 204 184 -0 67 -0 78
5 23.9 2,55Е+08 200 8 3 46 202 206 188 -1 13 0 35
6 3824 9 5451412 58 15 50 63 26 199 9 1 33 0 049
Основные результаты работы
1 Выполнен анализ современных подходов к обработке ТМИ и принципов построения систем контроля состояния СДО Установлено, что современные системы работают в полуавтоматическом режиме и жестко привязаны к объекту контроля. Выпочнен анализ существующих групп методов интеллектуальной обработки данных, показано, что основной интерес представляют методы сегментации, кластерного анализа, секвенциального анализа Показано, что основные пути совершенствования систем контроля состояния СДО связаны с автоматизацией процесса обработки всего комплекса ТМИ, уменьшением трудоемкости работы эксперта в процессе принятия решений и упрощением процесса настройки системы на конкретный объект управления
2 Предложен обобщенный подход к построению систем контроля состояния СДО, в соответствии с которым выделяется четыре основных этапа предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ, визуализация результатов Подход основан на работе со знаниями и позволяет автоматизи-
ровать процесс анализа ТМИ, Рассмотрен процесс обработки ТМИ как в статическом, так и в динамическом режимах
Предложена многоуровневая модель сигнала, которая позволяет описать сигнал на различных уровнях представления Каждый уровень представления соответствует одному из этапов обработки Предложены методы формирования описания сигнала в соответствии с предлагаемой моделью, в частности, предложены модификация алгоритма сегментации медленно меняющихся параметров, оригинальной алгоритм сегментации быстро меняющихся параметров, модификация алгоритма секвенциального анализа Применение предлагаемого подхода позволяет автоматизировать процесс обработки, сократить время обработки до 10 раз, а также открывает возможность использования методов и инструментов работы со знаниями для обработки ТМИ
3 Предложен метод формирования набора значимых признаков (параметров) из множества поступающих признаков и способ ранжирования значимых признаков, основанный на использовании алгоритмов кластерного анализа и методов построения ассоциативных правил Применение данного метода позволяет в автоматическом режиме проанализировать набор признаков и выявить те признаки, которые позволяют наиболее точно определить состояние контролируемого объекта, установить порядок их анализа Предлагаемый метод позволяет сократить число анализируемых параметров при проведении оперативного анализа до 2 раз
4 Предложен метод визуализации зависимостей телеметрических параметров, основанный на построении решеток понятий Описана вычислительная модель и соответствующая ей решетка применительно к решению задачи визуализации зависимостей телеметрических параметров, приведены методы упрощения модели Метод позволяет наглядно представить зависимости в поведении параметров по результатам нескольких экспериментов
5 Предложена обобщенная модель функционирования интеллектуальной системы контроля состояния СДО, выполнен анализ типовых подходов к программной реализации системы контроля состояния СДО Выделяются три основных типа программных архитектур архитектуры, основанные на использовании БД, архитектуры, основанные на использовании экспертных систем, и архитектуры, основанные на использовании онтологий Выполнен сравнительный анализ подходов к реализации Выделены основные достоинства и недостатки каждой из возможных реализаций
Опубликованные работы по теме диссертации в изданиях, рекомендованных ВАК
1 Методы и модели интеллектуальнго анализа сигналов геофизических полей Нейрокомпьютеры разработка и применение/ В В Геппенер, Н А Жукова, А Б Тристанов, А В Экало//-М. Радиотехника, 2007 -Вып 6 - С 49-54.
и в других изданиях
2. Балтрашевнч В Э Интеллектуальная обработка телеметрической информации / В Э Балтрашевич, НА Жукова, ДВ, Тихонов // Научная сессия МИФИ-2005. Сб науч трудов М, 24-28янв 2005 г,- М , 2005. - С 124-125
3 Балтрашевич В Э Интеллектуальная обработка телеметрической информации на основе алгоритмов ассоциации / В.Э Балтрашевич, Н А Жукова, Д В Тихонов // Научная сессия МИФИ-2006 Сб науч. трудов, М, 23-27 янв 2006 г, -М, 2006 - С 69-70
4 Жукова Н А Система обработки телеметрической информации на основе алгоритмов ассоциации /НА Жукова, А В Мазурин, Д В Тихонов // IV регионал конф Практика применения научного программного обеспечения в образовании и научных исстедованиях Сб трудов, СПб , 2-3 февраля 2006 г - СПб, 2006 - С 2527
5. Геппенер В В Система интеллектуальной обработки телеметрической информации / В В Геппенер, Д В Тихонов, Н А Жукова // Девятая междунар конф по мягким вычислениям и измерениям Сб докл., СПб., 27-29 июня, 2006 г -СПб,2006 - С 151-155
6 Жукова Н А Использование алгоритмов ассоциации в интеллектуальных системах обработки телеметрической информации / НА Жукова // Десятая нац конф по искусственному интеллекту с междунар участием КИИ-2006 Сб научн трудов, г Обнинск, 25-28 сент 2006 г - М , 2006, - С 141-149
7 Жукова Н А Обработка телеметрической информации на основе алгоритмов ассоциации/ Н А Жукова// Известия СПбГЭТУ "ЛЭТИ" (Известия Государственного Электротехнического университета) Сер. Информатика, управление и компьютерные технологии - СПб., 2006 -Вып 3 -С.100-103
8 Тристанов А Б Использование алгоритмов кластеризации и классификации для обработки телеметрической информации / А Б Тристанов, Н А Жукова // Научная сессия МИФИ-2007. Сб науч. трудов, М, 22-26 янв 2007 г, - М , 2005 -С 184-185
9 Применение алгоритмов кластеризации и классификации в задачах обработки и интерпретации телеметрической информации / А В Васильев, В В Геппенер, Н А Жукова, А Б Тристанов // 9-я междунар конф и выставка Цифровая обработка сигналов и ее применение Сб докл , М, 28-30 марта, 2007 г - М, 2007 -С 389-392
10 Васильез А В Анализ состояния сложных динамических объектов с использованием алгоритмов интеллектуальной обработки данных / А. В Васильев, В В Геппенер, И В Горбачева, Н А Жукова // Междунар научн -технич конф. Компьютерное моделирование 2007- Сб трудов, СПб , 26-27 июня 2007 г - СПб , 2007 - С 88-90
11 Методы кластеризации в обработке геофизических данных / В В Геппенер, Н А Жукова, А Б Тристанов, П П Фирстов // Десятая междунар конф по мягким вычислениям и измерениям- Сб докл ; СПб, 25-27 июнь, 2007 г - СПб, 2007-Т 2 -С 186-188
12 Жукова Н А Система контроля состояния сложных динамических / Н А Жукова // Десятая международная конференция по мягким вычислениям и измерениям С5 докл , СПб, 25-27 июнь, 2007 г - СПб , 2007 - Т 2 - С 80-83
13. Методы сегментации медленно меняющихся телеметрических сигналов / Васильев А В , Геппенер В В , Жукова Н А, Клионский ДМ// Десятая междунар конф по мягким вычислениям и измерениям Сб докл , СПб, 25-27 июнь, 2007 г -СПб, 2007-Т 1 -С 112-115
14 Методы обработки телеметрической информации на основе алгоритмов Data Mining/ А.В Васильев, В В Геппенер, Н А Жукова, А Б Тристанов// Известия СПбГЭТУ "ЛЭТИ" (Известия Государственного Электротехнического университета), Сер. Информатика, управление и компьютерные технологии. Спец выпуск -СПб,2007 -Вып 1 -С 3-10
15 Геппенер В В Обработка телеметрической информации на основе алгоритмов сегментации и секвенциального анализа / В В Геппенер, Н А Жукова // Известия СПбГЭТУ "ЛЭТИ" (Известия Государственного Электротехнического университета) Сер Информатика, управление и компьютерные технологии - СПб, 2007 -Вып 2 -С37-41
16 Методы обработки телеметрической информации на основе алгоритмов секвенциального анализа / Васильев А В., Геппенер В. В , Горбачева И В , Жукова Н А , Тристанов А Б // Известия СПбГЭТУ "ЛЭТИ" (Известия Государственного Электротехнического университета) Сер Информатика, управление и компьютерные технологии Специальный выпуск - СПб, 2007 - Вып 2 - С 24-31
17 Жукова Н А Методы контроля состояния сложных динамических объектов /НА Жукова, А Б Тристанов // Вестник компьютерных и информационных технологий -М Машиностроение,2007 -Вып 9 - С 2-11
18 Automatic control system of complex dynamic objects state on the base of telemetering information analysis (Система контроля состояний сложных динамических объектов на основе телеметрической информации) / A Vasiljev, V Geppener, N, Zhukova, A Tristanov, A Ecalo // 8-th International Conference "Pattern Recognition and Image Analysis New Information Technologies" Conference Proceedings, Yoshkar-Ola,Oct 8-12,2007 - Vol 2 -P 376-379.
19 Zhukova N Segmentation and cluster analysis of piecewise constant random processes on the base of spectral charactensties by using wavelet technology (Сегментация и кластеризация кусочно-постоянных случайных процессов по спеюральным характеристикам с использованием вейвлет-технологии) / N Zhukova, N Oreshko, A Ecalo // 8-th International Conference "Pattern Recognition and Image Analysis New Information Technologies" Conference Proceedings, Yoshkar-Ola, Oct 8-12, 2007 -Vol 2 -P 388-391
Подписано в печать 16 05 2008 Формат 60x84/16 Отпечатано с готового оригинал-макета в типографии ЗАО «КопиСервис» Печать ризографическая Заказ № 1/0519 П л 1 0 Уч -изд л 1 0 Тираж 100 экз
ЗАО «КопиСервис» Адрес 197376, Сднкт-Петербург, ул Проф Попова, д 3 тел (812) 327 5098
Оглавление автор диссертации — кандидата технических наук Жукова, Наталия Александровна
Введение.
Глава 1. Анализ современного состояния, тенденций и перспектив развития систем оперативного контроля состояния сложных динамических объектов.
1.1. Основные понятия и определения.
1.2. Анализ современных подходов к построению систем оперативного контроля состояния сложных динамических объектов на основе анализа ТМИ.
1.2.1. Основные требования к современным системам ОКССДО на основе ТМИ
1.2.2. Типовая структура систем ОКССДО на основе ТМИ.
1.2.3. Методы анализа ТМИ на этапе вторичной обработки.
1.2.4. Оценка современных систем ОКССДО на основе ТМИ.
1.3. Интеллектуальные системы ОКССДО.
1.3.1. Понятие интеллектуальной системы ОКССДО.
1.3.2. Обобщенная структура интеллектуальной системы ОКССДО.
1.4. Сравнительный анализ алгоритмов интеллектуального анализа, используемых для обработки данных.
1.4.1. Алгоритмы сегментации.
1.4.2. Алгоритмы кластерного анализа.
1.4.3. Алгоритмы классификации.
1.4.4. Алгоритмы ассоциации.
1.4.5. Алгоритмы секвенциального анализа.
1.5. Цель и задачи исследования.
1.6. Выводы по главе 1.
Глава 2. Разработка обобщенного подхода, моделей и алгоритмов анализа ТМИ, используемых в интеллектуальных системах ОКССДО.
2.1. Разработка обобщенного подхода к решению задачи ОКССДО на основе ТМИ
2.2. Разработка моделей сигналов.
2.2.1. Типы используемых моделей.
2.2.2 Структурная модель сигнала нулевого уровня.
2.2.3 Структурная модель сигнала первого уровня.
2.2.4 Структурная модель сигнала второго уровня.
2.2.5 Структурная модель сигнала третьего уровня.
2.3. Разработка методов выделения сегментов в ТМ сигналах.
2.3.1. Постановка задачи сегментации.
2.3.2. Особенности ТМ сигналов.
2.3.3. Обобщенная схема построения модели первого уровня.
2.3.4. Метод сегментации ММС.
2.3.5. Метод сегментации БМС.
2.3.6 Метод улучшения качества сегментации БМС на основе алгоритмов совместной сегментации коррелированных сигналов.
2.4. Разработка алгоритмов кластерного анализа для формирования классов состояний БМС.
2.4.1. Постановка задачи кластеризации.
2.4.2.Алгоритм кластерного анализа для ТМ сигналов.
2.4.3. Определение принадлежности к сформированным классам сегментов контролируемых сигналов.
2.5. Разработка алгоритмов секвенциального анализа для обработки ТМ сигналов
2.5.1. Постановка задачи секвенциального анализа.
2.5.2. Алгоритм построения шаблонов ТМ сигналов.
2.5.3. Алгоритм выявления аномальных и преданомальных ситуаций в новых данных на основе сфолрмированных шаблонов.
2.6. Выводы по главе 2.
Глава 3. Разработка алгоритмов, ориентированных на использование в интеллектуальных системах ОКССДО.
3.1. Разработка метода сокращения размерности набора анализируемых признаков
3.1.1. Постановка задачи сокращения размерности набора анализируемых признаков.
3.1.2. Разработка алгоритмов ассоциации для сокращения набора анализируемых признаков.
3.1.2.2. Схема применения алгоритмов ассоциации при обработке ТМИ.
3.1.2.3. Формирование компактных групп объектов на основе алгоритмов кластерного анализа.
3.1.2.4. Модификация алгоритма Арпоп.
3.1.2.5. Модификация алгоритма РгесИсЙуеАрпоп.
3.1.2.6. Особенности применения алгоритмов ассоциации при обработке ТМИ
3.2. Разработка метода визуализации телеметрических параметров с использованием решеток понятий.
3.2.1. Постановка задачи визуализации.
3.2.2. Метод анализа формальных понятий.
3.2.3. Вычислительная модель решетки понятий.
3.2.4. Метод упрощения вычислительной модели решетки понятий.
3.2.5. Дополнение вычислительной модели решетки понятий.
3.2.6. Пример анализа параметров СДО на основе дополненной модели.
3.3. Выводы по главе 3.
Глава 4. Проектирование и программная реализация систем ОКССДО.
4.1. Обобщенная модель функционирования интеллектуальных систем ОКССДО
4.2. Варианты организации хранения и использования данных и знаний в системах ОКССДО.
4.2.1. Принципы построения систем ОКССДО на основе баз данных.
4.2.2. Принципы построения систем ОКССДО на базе экспертных систем.
4.2.3. Принципы построения систем ОКССДО с использованием онтологического подхода.
4.4.2. Оценка вариантов организации хранения и использования данных и знаний в системах ОКССДО.
4.3. Архитектура системы ОКССДО на основе онтологического подхода.
4.4. Реализация прототипного варианта системы ОКССДО.
4.4.1. Описание основных пользовательских интерфейсов прототипного варианта системы.
4.4.2. Экспериментальные исследования на реальных сигналах.
4.5. Выводы по главе 4.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Жукова, Наталия Александровна
Актуальность темы. Современный этап развития техники и технологий характеризуется быстрым ростом сложности создаваемых технических систем. Такие системы как ракетно-космические комплексы, сложные производственные системы содержат многие тысячи датчиков, с которых поступает огромный объем информации. Информация должна обрабатываться в реальном или близком к реальному масштабу времени. Для решения этой задачи в течение многих лет успешно используются системы сбора и обработки телеметрической информации (ТМИ), которые позволяют достаточно эффективно решать задачи, связанные со сбором, первичной обработкой и накоплением информации, поступающей от сложных динамических объектов (СДО). Обычно собранная информация накапливается в базах данных (БД). Для ее обработки могут использоваться средства OLAP (online analytical processing), экспертные системы.
Типовой задачей, решаемой системами сбора и обработки ТМИ, является задача контроля состояния СДО, в частности, автоматическое выявление аномальных и преданомальных ситуаций, возникающих в процессе функционирования объектов. В настоящее время уже создано и используется достаточно много систем такого типа.
К сожалению, существующие системы обладают рядом недостатков, такими, как высокая стоимость разработки и эксплуатации и относительно низкая эффективность функционирования. Это обусловлено тем, что, с одной стороны, каждая из создаваемых систем является, по существу, уникальной, а, с другой стороны, все более или менее сложные системы предполагают активное участие экспертов в процессе обработки и анализа ТМИ. Таким образом, важными задачами являются задачи уменьшения стоимости и повышения эффективности систем контроля состояния СДО.
Действенным средством решения проблемы повышения эффективности функционирования систем контроля состояния СДО является переход от систем обработки данных к системам обработки знаний. На сегодняшний день это одно из магистральных направлений развития информационных технологий, в рамках которого уже созданы достаточно эффективные средства работы со знаниями и инструментальные средства, необходимые для построения прикладных систем. В первую очередь, это касается таких технологий, как data mining и семантический веб. Использование интеллектуальных технологий, ориентированных на работу со знаниями, позволяет решать следующие задачи:
- автоматизация процесса обработки всего комплекса ТМИ;
- упрощение процесса настройки системы на конкретный объект контроля посредством занесения в базу знаний (онтологию) информации об объекте.
Для использования преимуществ, которые дает переход от работы с данными к работе со знаниями, необходимо решить ряд задач, связанных с разработкой процедур извлечения, хранения и использования знаний из накопленной в БД ТМИ, в частности, необходимо разработать онтологию для работы с ТМИ.
Целью диссертационной работы является разработка методов интеллектуальной обработки измерительной информации, разработка основанного на работе со знаниями комплексного подхода к автоматическому выявлению аномальных и преданомальных ситуаций, возникающих в процессе функционирования СДО.
В соответствии с указанной целью в работе сформулированы и решены следующие задачи:
Анализ современных методов контроля состояния СДО, оценка применимости методов интеллектуального анализа данных для контроля состояния СДО, классификация методов интеллектуального анализа.
2. Разработка принципов построения систем контроля состояния СДО на основе методов интеллектуального анализа, включая разработку модели сигналов и базовых алгоритмов анализа эталонных и поступающих сигналов, описание методов принятия решения о наличии аномальной ситуации на основе результатов сопоставления шаблонов сигналов.
3. Разработка алгоритмов, ориентированных на использование в интеллектуальных системах контроля состояния СДО, включая разработку метода сокращения числа анализируемых параметров (сокращение размерности признакового пространства) и разработку метода визуализации состояния СДО.
4. Исследование вопросов проектирования и программной реализации систем контроля состояния СДО, включая выделение типовых архитектурных решений систем и описание условий их применения.
Предмет и методы исследования. Предметом исследования являются системы контроля состояния СДО. При решении поставленных задач использовался аппарат математической статистики, теория цифровой обработки сигналов, теория искусственного интеллекта.
Научную новизну работы составляют следующие положения:
1. Подход к анализу ТМИ, позволяющий автоматизировать процесс анализа за счет перехода от обработки данных к обработке знаний. В соответствии с подходом выделяется пять основных этапов: предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ, визуализация результатов.
2. Многоуровневая модель представления телеметрических сигналов, соответствующая различным этапам анализа ТМИ, алгоритмы построения моделей различных уровней. Использование предлагаемой модели позволяет использовать все множество разработанных средств работы со знаниями.
3. Метод сокращения размерности анализируемых признаков и их ранжирование.
4. Метод визуализации зависимостей телеметрических параметров, основанный на построении решетки понятий.
Научные положения, выносимые на защиту:
1. Подход к анализу ТМИ, в соответствии с которым выделяется пять основных этапов: предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ, визуализация результатов.
2. Многоуровневая модель представления телеметрических сигналов и методы формирования описания сигналов в соответствии с предлагаемой моделью. К методам формирования описания модели первого уровня относятся: модификация метода сегментации медленно меняющихся телеметрических параметров (ММП), метод сегментации быстро меняющихся телеметрических параметров (БМП). К методам формирования описания модели второго уровня относится модификация метода секвенциального анализа.
3. Метод формирования набора значимых признаков из множества поступающих признаков и способ ранжирования значимых признаков.
4. Метод визуализации зависимостей телеметрических параметров, основанный на построении решеток понятий.
Практическая значимость работы заключается в том, что предложен ряд моделей и методов, которые могут быть использованы при создании реальных систем контроля состояния СДО, включая метод формирования набора значимых признаков из множества поступающих признаков, метод ранжирования значимых признаков и метод визуализации зависимостей телеметрических параметров, основанные на построении решетки понятий.
Достоверность результатов исследования подтверждается корректным использованием математического аппарата, результатами экспериментальных исследований на программных моделях и результатами испытаний реальных систем, при создании которых использовались предложенные модели и методы.
Внедрение результатов работы заключается в использовании разработанных моделей и методов при проведении в Научно-инженерном центре СПбГЭТУ (г. Санкт-Петербург) 4 НИР и 1 ОКР, в рамках которых разработано 3 макета и 1 программный комплекс. Созданные программные продукты успешно используются для решения практических задач. Работа поддержана персональным грантом ректора СПбГЭТУ среди студентов и аспирантов за 2005 г., персональным грантом фонда содействия развитию малых форм предприятий в научно-технической сфере по программе УМНИК на выполнение НИОКР по теме «Разработка системы контроля состояния сложных динамических объектов» (№ У-2007-3/3-1 «Объект», 2007) за 2007г.
Апробация результатов исследования. Основные положения и результаты работы докладывались и обсуждались на следующих конференциях:
1. Двенадцатая международная конференция "Математика. Компьютер. Образование", г. Пущино, 17-22 янв. 2005 г.
2. Научная сессия МИФИ-2005, М., 24-28 янв. 2005 г.
3. Технологии Microsoft в теории и практике программирования, СПб., 1-2 марта 2005 г.
4. Научная сессия МИФИ-2006, М., 23-27 янв. 2006 г. I
5. Тринадцатая международная конференция "Математика. Компьютер. Образование", г. Дубна, 23 - 28 янв. 2006 г.
6. Четвертая региональная конференция по научному программному обеспечению "Практика применения научного программного обеспечения в образовании и научных исследованиях", СПб., 2-3 февр. 2006 г.
7. 61-я научно-техническая конференция, посвященная дню радио, СПб., 29-31 марта 2006 г.
8. Международная конференция по мягким вычислениям и измерениям, СПб., 27-29 июня 2006 г.
9. Десятая национальная конференция по искусственному интеллекту с международным участием КИИ-2006, г. Обнинск, 25-28 сент. 2006 г.
10. Научная сессия МИФИ-2007, М., 22-26 янв. 2007 г.
11. Технологии Microsoft в теории и практике программирования, СПб., 13-14 марта 2007 г.
12. Девятая международная научно-техническая конференция и выставка "Цифровая обработка сигналов и ее применение", М., 28-30 марта 2007 г.
13. Международная конференция по мягким вычислениям и измерениям, СПб., 25-28 июня 2007 г.
Публикации. По теме диссертации опубликованы 19 научных работ, включая 6 статей (1 статья опубликована в изданиях, определенных ВАК) и 13 работ в материалах международных, национальных и региональных конференций.
Заключение диссертация на тему "Методы и модели контроля состояния сложных динамических объектов на основе измерительной информации с использованием алгоритмов интеллектуального анализа данных"
4.5. Выводы по главе 4
Ниже перечислены основные результаты, полученные в главе 4.
1. Показана обобщенная модель функционирования интеллектуальных систем ОКССДО и основные пути реализации модели, приведены основные достоинства и недостатки каждой из возможных реализаций.
2. Описаны принципы построения систем ОКССДО с использованием базы данных. В рамках системы все данные и знания о контролируемом объекте хранятся в таблицах базы дынных.
3. Описаны принципы построения систем ОКССДО с использованием экспертных систем. Показаны пути наполнения базы знаний знаниями в ручном, автоматическом и полуавтоматическом режимах.
4. Описаны принципы построения систем ОКССДО с использованием онтологического подхода, предложена и описана модель знаний С ДО. Приведено описание системы ОКССДО, основанной на применении онтологического подхода.
5. Разработан прототип системы ОКССДО на основе онтологического подхода, с использованием разработанного прототипа проведены эксперименты на реальных данных.
ЗАКЛЮЧЕНИЕ
Ниже перечислены основные результаты работы.
1. Выполнен анализ современных подходов к обработке ТМИ и принципов построения систем контроля состояния СДО. Установлено, что современные системы работают в полуавтоматическом режиме и жестко привязаны к объекту контроля. Выполнен анализ существующих групп методов интеллектуальной обработки данных, показано, что основной интерес представляют методы сегментации, кластерного анализа, секвенциального анализа. Показано, что основные пути совершенствования систем контроля состояния СДО связаны с автоматизацией процесса обработки всего комплекса ТМИ, уменьшением трудоемкости работы эксперта в процессе принятия решений и упрощением процесса настройки системы на конкретный объект управления.
2. Предложен обобщенный подход к построению систем контроля состояния СДО, в соответствии с которым выделяется четыре основных этапа: предварительная обработка, сегментация, кластерный анализ, секвенциальный анализ. Подход основан на работе со знаниями и позволяет автоматизировать процесс анализа ТМИ. Рассмотрен процесс обработки ТМИ как в статическом, так и в динамическом режимах.
Предложена многоуровневая модель сигнала, которая позволяет описать сигнал на различных уровнях представления. Каждый уровень представления соответствует одному из этапов обработки. Предложены методы формирования описания сигнала в соответствии с предлагаемой моделью, в частности, предложены модификация алгоритма сегментации медленно меняющихся параметров, оригинальный алгоритм сегментации быстро меняющихся параметров, модификация алгоритма секвенциального анализа. Применение предлагаемого подхода позволяет автоматизировать процесс обработки, сократить время обработки до 10 раз, а также открывает возможность использования методов и инструментов работы со знаниями для обработки ТМИ.
3.Предложен метод формирования набора значимых признаков из множества поступающих признаков и способ ранжирования значимых признаков, основанный на использовании алгоритмов кластерного анализа и методов построения ассоциативных правил. Применение данного метода позволяет в автоматическом режиме проанализировать набор признаков и выявить те признаки, которые позволяют наиболее точно определить состояние контролируемого объекта, установить порядок их анализа. Предлагаемый метод позволяет сократить число анализируемых параметров при проведении оперативного анализа до 2 раз.
4. Предложен метод визуализации зависимостей телеметрических параметров, основанный на построении решеток понятий. Описана вычислительная модель и соответствующая ей решетка понятий применительно к решению задачи визуализации зависимостей телеметрических параметров, приведены методы упрощения модели. Метод позволяет наглядно представить зависимости в поведении параметров по результатам нескольких экспериментов.
5. Предложена обобщенная модель функционирования интеллектуальной системы контроля состояния СДО, выполнен анализ типовых подходов к программной реализации системы контроля состояния СДО. Выделяются три основных типа программных архитектур: архитектуры, основанные на использовании БД, архитектуры, основанные на использовании экспертных систем, и архитектуры, основанные на использовании онтологий. Выполнен сравнительный анализ различных подходов к реализации. Определены основные достоинства и недостатки каждой из возможных реализаций.
Библиография Жукова, Наталия Александровна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Айвазян, С. А. Классификация многомерных наблюдений Текст. / С. А. Айвазян, 3. И. Бежаева, О. В. Староверов — М.: Статистика, 1974. 240 с.
2. Айфичер, Э.С. Цифровая обработка сигналов: практический подход Текст. / Э.С. Айфичер, Б.У. Джервис; 2-е изд.: Пер. с англ. М.: Вильяме, 2004.-992 с.
3. Балтрашевич В.Э. Интеллектуальная обработка телеметрической информации / В.Э. Балтрашевич, H.A. Жукова // Технологии Microsoft в теории и практике программирования: Сб. науч. трудов; СПб., 1-2 марта 2005 г. СПб., 2005. -С.165-166.
4. Балтрашевич В.Э. Интеллектуальная обработка телеметрической информации / В.Э. Балтрашевич, H.A. Жукова, Д.В. Тихонов // Научная сессия МИФИ-2005: Сб. науч. трудов; М, 24-28 янв. 2005 г., М., 2005. - С. 124-125.
5. Балтрашевич В.Э. Интеллектуальная обработка телеметрической информации на основе алгоритмов ассоциации / В.Э. Балтрашевич, H.A. Жукова, Д.В. Тихонов // Научная сессия МИФИ-2006: Сб. науч. трудов; М., 23-27 янв. 2006 г., М.,2006. С. 69-70.
6. Белицкий, В. И. Телеметрия Текст. / В.И. Белицкий, В.И. Зверев, В.М. Морозов. Л.: МО СССР, 1984. -465 с.
7. Вапник, В.Н. Теория распознавания образов. Статистические проблемы обучения Текст. / В.Н. Вапник, А.Я. Червоненкинс. — М.: Наука, 1974. 415 с.
8. Геппенер В. В. Об одном подходе к задачам классификации /В. В. Геппенер, Г. М.Емельянов // Известия ЛЭТИ (Известия Ленинградского электротехнического института). СПб., 1969, - № 85. - С. 29-33.
9. Геппенер В.В. Система интеллектуальной обработки телеметрической информации / В.В. Геппенер, Д.В. Тихонов, Н.А.Жукова // Девятая междунар. конф. по мягким вычислениям и измерениям: Сб. докл.; СПб., 27-29 июня, 2006 г. СПб., 2006. - С.151-155.
10. Горелик, А. Л. Методы распознавания Текст.: учеб. пособие для вузов / А. Л. Горелик, В. А. Скрипкин. Изд. 3-е, перераб. и доп. — М.: Высш. шк., 1989. -232 с.
11. Дуда, Р. Распознавания образов и анализ сцен Текст. / Р. Дуда, П. Харт — М.: Мир, 1978. 510 с.
12. Жукова H.A. Использование алгоритмов кластеризации и классификации для обработки телеметрической информации / H.A. Жукова, А.Б. Тристанов // Научная сессия МИФИ-2007: Сб. науч. трудов; М., 22-26 янв. 2007 г., М., 2005. - С. 184-185.
13. Жукова H.A. Система контроля состояния сложных динамических объектов / H.A. Жукова // Десятая международная конференция по мягким вычислениям и измерениям: Сб. докл.; СПб., 25-27 июнь, 2007 г. СПб., 2007.- Т. 2. - С.80-83.
14. Зверев, Р.И. Основы радиотелеметрии Текст.: учеб. пособие. В 2 ч. Ч. 1. / Р.И. Зверев, И.В. Шитов. Л.: МО СССР, 1978. - 0000 с.
15. Кузнецов С. Алгоритмы построения множества всех понятий формального контекста и его диаграммы Хассе / С. Кузнецов, С. Объедков // Известия Академии наук. Сер. Теория и системы управления. 2001. - Вып. 1. - С. 120- 129.
16. Кузнецов С.О. Интерпретация на графах и сложностные характеристики задач поиска закономерностей определенного вида Текст. / С.О. Кузнецов // НТИ, Сер. 2, 1889-С. 23-28.
17. Лольер, Ж.-Л. Системы искусственного интеллекта Текст. / Ж.-Л. Лольер: пер. сфр. -М.:Мир, 1991.-586 с.
18. Люгер, Д.Ф. Искусственный интеллект Текст. / Д.Ф. Люгер: пер. с англ. -М.: Вильяме, 2003 863 с.
19. Малла, С. Вейвлеты в цифровой обработке сигналов Текст. / С. Малла. -М.: Мир, 2005.-671 с.
20. Мандель, И.Д. Кластерный анализ Текст. / И.Д. Мандель. М.: Финансы и статистика, 1988. - 176 с.
21. Марпл.-мл., C.JI. Цифровой спектральный анализ и его приложения Текст. / C.J1. Марпл.-мл.: пер. с англ. М.: Мир, 1990. - 547 с.
22. Методы и модели интеллектуальнго анализа сигналов геофизических полей. / В.В. Геппенер, H.A. Жукова, А.Б. Тристанов, А.В.Экало // Нейрокомпьютеры: разработка и применение М.: Радиотехника, 2007. - Вып. 6. - С. 49-54.
23. Методы кластеризации в обработке геофизических данных / В.В. Геппенер, H.A. Жукова, А.Б. Тристанов, П.П. Фирстов // Десятая междунар. конф. по мягким вычислениям и измерениям: Сб. докл.; СПб., 25-27 июнь, 2007 г. СПб., 2007.- Т. 2. -С.186-188.
24. Назаров, A.B. Современная телеметрия в теории и на практике. Уч.курс Текст. / A.B. Назаров, Г.И. Козырев, И.В. Шитов и др. СПб.: Наука и техника, 2007. - 672 с.
25. Рассел, С. Искусственный интеллект. Современный подход Текст. / С. Рассел, П. Норвиг. М.: Вильяме, 2006.
26. Сафарав, Р.Т. Телеметрия Текст. / Р.Т. Сафарав, Н.Н. Буга, Р.И. Зверев, И.В. Шитов. М.: Мин. обороны СССР, 1983.
27. Agrawal, R. Fast algorithms for mining association rules in large databases Текст. / R. Agrawal, R. Srikant // Proceedings of the 20th International Conference on Very Large Databases. San Francisco: Morgan Kaufmann Publishers, 1994. - P. 487-499. [42]
28. Allen, J.F. Maintaining knowledge about temporal intervals Текст. / J.F. Allen // Communications of the ACM 26, 11, November 1983. 1983. - P. 823-843. [43] [44] [45]
29. Basseville, M. Detection of Abrupt Changes: Theory and Application Текст. / M. Basseville, I. Nikiforov. Prentice-Hall, NJ, US, 2005. - P. 447
30. Birkhoff, G.D. Lattice Theory Текст. / Birkhoff G.D. Amer. Math. Soc., 1979.49.
31. Bramer, M. Principles of Data Mining Текст. / Bramer M. Springer, 2007 [50]
32. Brickley D., Guha R. "RDF Vocabulary Description Language 1.0: RDF Schema." W3C Working Draft. April 30, 2002. (http://www.w3.org/TR/rdf-schema/. )
33. Carpineto, C. A lattice conceptual clustering system and its application to browsing retrieval / C. Carpineto, G. Romano //Machine Learning. -1996. №24, pp. 95122.
34. Carroll J., Roo J. "Web Ontology Language (OWL) Test Cases." W3C Working Draft. October 24, 2002. (http://www.w3.org/TR/2002/WD-owl-test-20021024/., http://www.w3.org/2001/sw/web0nt/ for more recent versions.).
35. Casey, M. Semantic Web Methodologies for Spatial Decision Support. Текст. / M. Casey, M. Austin. University of Maryland, Institute for Systems Research and Department of Civil and Environmental Engineering. November, 2001.
36. Chaudri, V. Open Knowledge Base Connectivity Specification. Текст. / V. Chaudri, A. Farquhar, R. Fikes, P. Karp, J. Rice. Specification V. 2.0.31. SRI and Knowledge Systems Laboratory. Stanford University, 1998.
37. Chengqi, Z. Association rule mining: models and algorithms. Текст. / Z. Chengqi, Z. Shichao. Springer, 2002.
38. Daconta, M. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management Текст. / M. Daconta, L. Obrst, K. Smith.- Indiana: Wiley, 2003.
39. Data mining and knowledge discovery approaches based on rule induction techniques Текст. / Edited by Triantaphyllou E., Felici G. Springer, 2007.
40. Data mining and knowledge discovery handbook Текст. / Edited by Maimon O., Rokach L. Springer, 2005.
41. Ganter, B. Formal Concept Analysis: Mathematical Foundations Текст. / В. Ganter, R. Wille. Heidelberg: Springer, 1999.
42. Ganter, B. Formalizing hypotheses with concepts / B. Ganter, S. Kuznetsov // Proceedings, 8th International Conference on Conceptual Structures, ICCS 2000, Lecture Notes in Artificial Intelligence, 1867. Darmstadt, Germany, 2000 - P. 342-356.
43. Guarino, N. Ontologies and Knowledge Bases: Towards a Terminological Clarification Текст. / N. Guarino, P. Giaretta // In Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing, edited by N. Mars. Amsterdam: IOS Press, P. 25-32.
44. Halgamuge, S., Wang L. Classification and Clustering for Knowledge Discovery Текст. / S. Halgamuge, L. Wang/ Springer, Germany, 2005.
45. Han, J. Data Mining: concepts and techniques Текст. / J. Han, M. Kamber. -Morgan Kaufman Publishers, 2005.
46. Holschneider, M. Wavelets, Time-Frequency Methods and Phase Space Текст. / M. Holschneider, R. Kronland-Martinet, J. Morlet, and P. Tchamitchian. Springer, Berlin, 1989.
47. Keogh, E. An Online Algorithm for Segmenting Time Series / E. Keogh, S. Chu, D. Hart, M. Pazzani // In Proceedings of IEEE International Conference on Data Mining -2001.-P 289-296.
48. Larsen, R. An Introduction to Mathematical Statistics and Its Applications / R. Larsen, M. Marx. Prentice Hall, Englewood, Cliffs, N.J. 2nd Edition. 1986.
49. Lindeberg T. Scale-Space Theory in Computer Vision ./ T. Lindeberg // Int. Series in Engineering and Computer Science, Robotics: Vision, Manipulation and Sensors. Kluwer Academic Publishers. Dordrecht, 1994.
50. Morrison, D. Multivariate Statistical Methods Текст. / D. Morrison. — New York: McGraw-Hill, 1990.
51. Moxon, B. Defining Data Mining Текст. / В. Moxon. DBMS Data Warehouse Supplement, 1996.
52. Murthy S. Automatic construction of decision trees from data: A Multi-disciplinary survey Текст. / S. Murthy // Data Mining and Knowledge Discovery, 1998. -1998. Vol. 2, № 4. P. 345-389.
53. Pensky, M. Bayesian decision theoretic scale-adaptive estimation of log-spectral density / M. Pensky, B. Vidakovic // Georgia Inst Techn. Technical Report No 1. 2003. (http://www.isye.gatech. edu/ -brani/isyestat/).
54. Povinelli, R. Time Series Data Mining: Identifying temporal Patterns for Characterization and Prediction of Time Series Events Текст. / R. Povinelli Milwaukee, Wsconsin, December, 1999.
55. Ross, Q. C4.5: Programs for Machine learning Текст. / Q. Ross New York: Morgan Kaufmann Publishers, 1993.
56. Theodoridis, S. Koutroumbas K. Pattern Recognition Текст. / S. Theodoridis.
57. Academic Press, New York, 1999.
58. Vapnik, V. Statistical learning theoryTeiccT. / V. Vapnik. Wiley, 1998.
59. Visual Data Mining: Techniques and tools for data visualization and mining Текст. Wiley, 2002.
60. Wille, R. Restructuring lattice theory: an approach based on hierarchies of concepts / R. Wille // In I. Rival (ed) Ordered Sets. Dordrecht-Boston: Reidel, 1982. - pp. 445—470.
-
Похожие работы
- Разработка аппарата формализации измерительных знаний
- Алгоритмы адаптации параметров измерительной системы к минимуму оценки динамической погрешности
- Информационно-измерительная система для управления эндогазогенератором
- Модели и метод параметрической оптимизации измерительных преобразователей стохастических сигналов
- Интеллектуальная информационно-измерительная система разграничения потоков данных при мониторинге сложных объектов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность