автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Робастные модели обнаружения аномальных измерений для мобильного измерительного комплекса лесозаготовительного производства

кандидата технических наук
Гоголевский, Анатолий Сергеевич
город
Санкт-Петербург
год
2014
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Робастные модели обнаружения аномальных измерений для мобильного измерительного комплекса лесозаготовительного производства»

Автореферат диссертации по теме "Робастные модели обнаружения аномальных измерений для мобильного измерительного комплекса лесозаготовительного производства"

На правах рукописи

Гоголевский Анатолий Сергеевич

РОБАСТНЫЕ МОДЕЛИ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ ДЛЯ МОБИЛЬНОГО ИЗМЕРИТЕЛЬНОГО КОМПЛЕКСА ЛЕСОЗАГОТОВИТЕЛЬНОГО ПРОИЗВОДСТВА

05.13.01 — системный анализ, управление и обработка информации (промышленность)

АВТОРЕФЕРАТ ДИССЕРТАЦИИ НА СОИСКАНИЕ УЧЕНОЙ СТЕПЕНИ КАНДИДАТА ТЕХНИЧЕСКИХ НАУК

I з МАП 23и

Санкт-Петербург - 2014 005549165

005549165

Работа выполнена на кафедре информационных систем и технологий федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный лесотехнический университет им. С.М.Кирова»

Научный руководитель: Уткин Лев Владимирович

доктор технических наук, профессор, заведующий кафедрой управления, автоматизации и системного анализа федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Санкт-Петербургский

государственный лесотехнический университет им. С.М.Кирова»

Официальные оппоненты: Дюк Вячеслав Анатольевич

доктор технических наук, профессор, ведущий научный сотрудник федерального государственного бюджетного учреждения науки Санкт-Петербургского института информатики и автоматизации Российской академии наук (СПИИРАН)

Шеховцов Олег Иванович

кандидат технических наук, доцент, доцент кафедры автоматизированных систем обработки информации и управления федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В.И. Ульянова (Ленина)»

Ведущая организация: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики», г. Санкт-Петербург

Защита состоится 30 июня 2014 г. в_на заседании совета по защите диссертаций на

соискание ученой степени кандидата наук, на соискание ученой степени доктора наук Д 212.230.03 в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный технологический институт (технический университет)» по адресу: 190013, Санкт-Петербург, Московский пр., 26, ауд._

С диссертацией можно ознакомиться в фундаментальной библиотеке СПбГТИ(ТУ) и на официальном сайте Санкт-Петербургского государственного технологического института (технологического университета) по ссылке: technolog.edu.ru/ru/documents/category/78-2014.html.

Замечания и отзывы в двух экземплярах, заверенные печатью, просим направлять на имя ученого секретаря по адресу: 190013, Санкт-Петербург, Московский пр., 26, Санкт-Петербургский государственный технологический институт (технический университет). Справки по тел.: (812) 494-93-75; факс: (812) 712-77-91; е-таП: dissowet@technolog.edu.ru.

Автореферат разослан // _2014 г.

Ученый секретарь совета по защите диссертаций на

соискание ученой степени кандидата наук, на соискание

ученой степени доктора наук Д 212.230.03 /

доктор технических наук, профессор / В.И. Халимон

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы

Решение задач рачительного и неистощительного лесопользования напрямую зависит от качества проведения мероприятий технологической подготовки лесозаготовительного производства, влияющих на эффективность производства, уровень трудозатрат, экономических и экологических рисков. Принятие обоснованных решений на этапе технологической подготовки определяет дальнейшую эффективность ведения лесозаготовительной деятельности.

Получение достоверных данных о параметрах лесосеки является важной задачей для построения трасс трелевки с целью принятия решения для ведения лесозаготовительного производства. От качества построения трасс трелевки зависит также, будут ли применены штрафные санкции за не соблюдение размеров площади выделенной для построения этих трасс. Данные санкции регламентируются п.56 приказа Рослесхоза № 337 "Об утверждении правил заготовки древесины" от 1 августа 2011 г.

Задачи, решаемые в ходе технологической подготовки лесозаготовительного производства, объемны и трудно формализуемы. К ним можно отнести: получение достоверных результатов измерений параметров лесосеки в ходе ее исследования; подготовка технологической карты лесосеки на основе реализации устойчивых моделей обнаружения аномальных измерений и выбор средств для освоения лесных участков и т. д.

В ходе исследования лесосеки проводится большой объем работ связанных с измерениями и анализом фактического состояния лесного участка, сбором и передачей информации для расчетов.

Современные информационные технологии и средства позволяют автоматизировать процессы, связанные с различными измерениями и расчетами. Они обеспечивают сокращение сроков подготовки лесосеки к эксплуатации, минимизацию материальных, трудовых, финансовых затрат и экологических рисков, повышение качества результатов за счет оперативности и точности измерений.

К таким системам относится мобильный измерительный комплекс (МИК), обеспечивающий процесс автоматизации и повышения качества прокладки трелевочных трасс.

Анализ показывает, что автоматизация измерительных процедур, осуществляющих МИКом не гарантирует требуемого уровня достоверности и точности из-за довольно частого возникновения аномальных ситуаций в ходе проведения измерений в реальных условиях, что приводит к неточности построения трелевочных трасс и технологических карт.

Отсутствие эффективных способов управления измерениями и методов выявления аномалий в трудноформализуемых процессах, делает задачу разработки методов и моделей эффективного обнаружения аномальных измерений актуальной.

Цель работы

Целью диссертационной работы является разработка новых робастных моделей обнаружения аномальных измерений в мобильном измерительном комплексе, предназначенном для моделирования условий работы лесных машин при исследовании лесосеки в ходе подготовки лесозаготовительного производства.

Задачи, решаемые в работе

Для достижения указанной цели в диссертационной работе поставлены и решены следующие задачи:

1. Разработан метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения;

2. Для мобильного измерительного комплекса разработаны робастные модели обнаружения аномальных измерений на основе метода одноклассовой классификации с применённым в ней Гауссовым ядром;

3. Разработаны модели и программный комплекс обнаружения аномальных измерений для МИКа с применением метода обучения, основанного на алгоритме простого скользящего среднего;

4. Проведены исследования и получены результаты моделирования системы обнаружения аномальных измерений мобильного измерительного комплекса с применением разработанных моделей.

Методы исследования

Для решения указанных задач в работе использованы методы: математического моделирования, теории вероятностей и математической статистики, теории принятия решений, оптимизации, системного анализа в лесозаготовительном производстве.

Научная новизна

1. Разработана робастная модель одноклассовой классификации состояний мобильного измерительного комплекса, использующая классы распределений вероятностей, определенных на обучающей выборке, и учитывающая малый период предварительных измерений различных параметров лесосеки и трелевочной машины.

2. Разработан метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения, интегрированный в структуру МИК.

3. Разработан метод обучения системы обнаружения аномальных измерений при исследовании лесосеки основанный на алгоритме простого скользящего среднего.

Практическая значимость

1. Разработан программно реализованный моделирующий комплекс обнаружения аномальных измерений для МИК с использованием предложенных в работе моделей.

2. Получены результаты работы системы обнаружения аномальных измерений в различных режимах, которые могут быть использованы при исследовании и подготовке лесосеки.

Программно реализованная система обнаружения аномальных измерений мобильного измерительного комплекса в отличие от известных позволяет повысить вероятность правильной классификации и обнаружения аномалий на 10-18 процентов, что позволяет сократить сроки подготовки лесосеки к эксплуатации, минимизировать материальные, трудовые, финансовые затраты и экологические риски.

Реализация и внедрение результатов работы.

Результаты работы были использованы при разработке системы электротехнического обеспечения и АСУ ИК промышленного объекта по ОКР «Развязка» на предприятии ОАО «Научно-производственное предприятие «Пирамида» расположенное в г. Санкт-Петербурге, что подтверждается актом о внедрении.

Основные результаты внедрены в НИР кафедры информационных систем и технологий СПбГЛТУ, выполненной по договору № 1.6.02.11 х/д «Разработка алгоритмического обеспечения отказоустойчивого прибора комплексирования сигналов навигационно-измерительных датчиков скоростных судов (отказоустойчивого навигационного сервера)».

Основные положения, выносимые на защиту

1. Робастная модель одноклассовой классификации состояний мобильного измерительного комплекса, использующая классы распределений вероятностей, определенных на обучающей выборке, и учитывающая малый период предварительных измерений различных параметров лесосеки и трелевочной машины.

2. Метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения, интегрированный в структуру МИК.

3. Метод обучения системы обнаружения аномальных измерений при исследовании лесосеки основанный на алгоритме простого скользящего среднего.

4. Программно реализованный моделирующий комплекс обнаружения аномальных измерений для МИК с использованием предложенных в работе моделей.

Апробация работы

Результаты диссертационной работы были представлены в виде устных докладов на конференциях: XIV, XV и XVI Международные конференции по мягким вычислениям и измерениям (SCM'2011, SCM'2012, SCM'2013), проходившие в СПбГЭТУ в г. Санкт-Петербурге: 23-25 июня 2011 г., 25-27 июня 2012г., 23-25 мая 2013г. - соответственно; 8 и 9 Международные научно-технические конференции «Актуальные проблемы развития лесного комплекса», проходившие в ВоГТУ в г. Вологде: 7-9 декабря 2010 г., 6 декабря 2011 г. - соответственно; научно-практическая конференция в рамках Политехнического фестиваля, проходившего в СПбГПУ в г. Санкт-Петербурге с 16-17 декабря 2012г.; XLIII научная и учебно-методическая конференция, проходившая в НИУ ИТМО в г. Санкт-Петербурге 28-31 января 2014 г.; международные научно-практические конференции молодых ученых «Современные проблемы и перспективы рационального лесопользования в условиях рынка», проходившие в СПбГЛТА (СПбГЛТУ) в г. Санкт-Петербурге: 10-11 ноября 2010г.; 10-11 ноября 2011г.; 10-11 ноября 2012г.; ежегодные научно-технические конференции профессорско-преподавательская состава СПбГЛТУ имени С.М. Кирова 2010-2013 гг.; 16 и 17 Санкт-Петербургские ассамблеи молодых учёных и специалистов, проходившие в г. Санкт-Петербурге в 2011г. и 2012 г.

Основные научные результаты были получены в рамках научных грантов и представлены на следующих конкурсах:

1. Диплом ПСП № 11123 победителя конкурсного отбора 2011 года о присуждении премий Правительства Санкт-Петербурга для студентов, аспирантов вузов и академических институтов, расположенных на территории Санкт-Петербурга, в соответствии с распоряжением Комитета по науке и высшей школе Правительства Санкт-Петербурга от 25.10.2011 №72;

2. Диплом ПСП № 12077 победителя конкурса 2012 года для студентов вузов, расположенных на территории Санкт-Петербурга, аспирантов вузов и академических институтов, расположенных на территории Санкт-Петербурга, в соответствии с распоряжением Комитета по науке и высшей школе от 30.10.2012 №74.

На разработанный программный комплекс получено свидетельство о государственной регистрации программ для ЭВМ № 201461057 «Система обнаружения аномальных измерений «Novelty detection ver. 1.0»» от 15 января 2014 г.

Публикации

По теме диссертации опубликовано 14 печатных работ. Из них 2 статьи в журналах, рекомендованных ВАК РФ.

Структура и объем работы

Диссертационная работа состоит из введения, четырёх глав, выводов, списка литературы и трех приложений. Работа изложена на 131 страницах печатного текста и содержит 13 таблиц, 34 рисунках. Список литературы содержит 112 наименований.

КРАТКОЕ СОДЕРЖАНИЕ

Во введении рассматривается актуальность темы диссертационной работы, сформулирована ее цель, задачи, изложены основные научные результаты, приведена апробация работы и дана краткая характеристика ее содержания.

В первой главе обоснована актуальность темы диссертационной работы. Дается описание области применения системы обнаружения аномальных измерений МИКом при исследовании и подготовки лесосеки.

Дана краткая характеристика мобильного измерительного комплекса, который является технологическим механизмом, предназначенным для моделирования условий работы трелевочной техники при исследовании лесосеки, измерения ее параметров и характеристик трелевочной машины. Подготовительные работы выполняются до начала основных эксплуатационных работ. Они включают в себя лесосырьевую, технологическую и транспортную подготовки; подготовку территории лесосек, лесопогрузочных пунктов и трелевочных волоков на основе полученных измерений параметров.

Проведенный анализ литературы позволил выяснить, что на подготовительные работы приходится 35 - 40% от всех трудозатрат. Исходя из этого, делается вывод, что одним из важнейших условий обеспечения высокой эффективности проведения основных эксплуатационных работ по заготовке древесины и, в дальнейшем, условием повышения себестоимости лесозаготовительных работ, является качественное проведение подготовительных работ.

Одним из основных видов подготовительных работ является технологическая подготовка. Она заключается в исследовании лесоэксплуатационных условий, построении трасс трелевки; выбор места для размещения погрузочных площадок и мастерского участка; разработка технологического процесса лесозаготовок; составление технологической карты разработки лесосеки.

Важнейшей из перечисленных процедур является составление технологической карты, включающей выбор эффективной схемы разработки лесосеки и ее транспортного освоения, для составления которой используются измеренные МИКом параметры.

На основе этого задача диссертационной работы сформулирована следующим образом: требуется повысить качество функционирования

мобильного измерительного комплекса за счет разработки и внедрения робастных моделей обнаружения аномальных измерений основанных на алгоритмах машинного обучения, обеспечивающих качественное проведение подготовительных работ при исследовании и подготовки лесосеки.

Формальная постановка задачи определена следующим образом.

Пусть Х„ - обучающее множество состояний МИК, где п -количество состояний. Состояние МИК - это вектор хе!^, состоящий из параметров, поступающих с измерительных устройств МИК. Каждый вектор х принадлежит одному из двух классов у: класс нормальных и класс аномальных значений. Данные в систему поступают с определенным шагом дискретизации и в строгой последовательности.

Требуется найти решающую функцию / по обучающей выборке, решение которой определяет к какому классу относится новое значение х.

Далее в первой главе производится обзор основных идей стандартных методов машинного обучения (распознавание образов, методы статистического анализа) и методов фильтрации.

В результате произведенного обзора и анализа классических методов машинного обучения и фильтрации в первой главе сделан вывод, что в качестве основы системы обнаружения аномальных измерений выбран метод опорных векторов (БУМ), требующий дальнейшего улучшения.

Во второй главе разрабатывается метод обнаружения аномальных измерений в мобильном измерительном комплексе. В основе данного метода лежит решение задачи одноклассовой классификации с помощью модифицированного метода опорных векторов. Задача одноклассовой классификации формулируется следующим образом.

Пусть имеется обучающая выборка х,(0>—>хи(*)сХ , где х(/) -состояние мобильного измерительного комплекса в определенный момент времени, которое определяется вектором параметров данного комплекса; п -количество состояний в обучающей выборке; X - множество состояний за определенный период времени, обозначенное, как подмножество .

Модель обнаружения аномальных измерений подразумевает нахождение функции /, которая в графическом виде представляет собой гиперплоскость, принимающую значение +1 в небольшой области, покрывающей большинство точек обучающей выборки, считающейся областью нормальных значений, и -1 вне этой области, то есть область аномальных измерений.

Основной проблемой построения такой функции является то, что в большинстве случаев она должна быть нелинейной.

Требуется разработать эффективный метод построения функции / на основе одноклассовой классификации при ограниченной обучающей выборке. Ограничение по обучающей выборке обусловлено анализом функционирования мобильного измерительного комплекса, где данные поступающие с измерительного оборудования зависят как от времени, так и от характера условий местности, где данный комплекс может применяться.

Далее, во второй главе производится обзор моделей обнаружения аномалий. В результате обзора принимается решение о выборе модели обнаружения аномалий Шелкопфа в качестве основы разрабатываемого метода обнаружения аномальных измерений.

Однако для непосредственного ее использования необходимо было осуществить ее доработку.

Стандартная модель обнаружения аномальных измерений Шелкопфа подразумевает определение параметрической функции /, которая принимает значение +1 в небольшой области, покрывающей большинство точек обучающей выборки, и -1 вне этой области. В связи с тем, что в данной диссертационной работе рассматривается система, в которой функция / является нелинейной, этот факт существенно затрудняет ее определение и вычисление ее параметров. Поэтому основная идея, заложенная в этой модели обнаружения аномальных измерений или одноклассовой классификации, заключается в отображении точек обучающей выборки в некоторое пространство (3 (рисунок 1), в котором разделяющая функция / становиться линейной. Такое отображение также называется спрямляющим.

ф (Гауссово ядро)

Рисунок 1 - Отображение точек обучающей выборки в спрямляющем пространстве б

Пусть имеется обучающая выборка х1,...,х„ сХ , где х, - вектор состояния системы с двумя параметрами: измеряемый параметр и его приращение; п - количество измерений в обучающей выборке в фазовом пространстве; X - множество состояний мобильного измерительного комплекса, также его можно представить в виде компактного подмножества

Пусть ф - такое отображение состояний системы X С, при котором точки обучающей выборки отображаются в пространстве признаков большей размерности й. В задачах одноклассовой классификации отображение ф обычно переводит пространство-прообраз в часть сферы с центром в точке 0 е С.

Для построения отображения ф может использоваться произвольное ядро Мерсера К(х,у) = (ф(х),ф(у)). Предпочтение отдается, по ряду причин, гауссову ядру, в связи с его эффективностью. Гауссовое ядро имеет вид:

Л:(х,у) = ехр(-о--||х-у||2). (1)

Здесь а ~ параметр ядра, определяющий геометрическую структуру выборки в пространстве С. Он принимает значение <ту0 .

При использовании гауссова ядра отображенные точки обучающей выборки ложатся на поверхность сферы в пространстве признаков й с единичным радиусом, так как ф(х) ■ ф(х) = К(х,х) = 1. Таким образом, их можно отсечь от аномальных точек при помощи плоскости /(х,\¥) = {\у,^(х))-/Р = 0, которая является линейной. При этом надо отсечь область сферы, где измерения наиболее сконцентрированы, т.е. сделать параметр Р как можно большим, так, чтобы объем полупространства, определяемого ограничением > р, был как можно меньше.

Вводиться параметр V е[0;1], который обозначает долю нормальных данных обучающей выборки, для которых выполняется условие (w,{г^(x))>/7. Для разделения данных необходимо решить задачу квадратичной оптимизации:

тЯ^Н|2+ —' (2)

при ограничениях

£>0, 1 = 1,..„и.

Вспомогательные переменные используются для ослабления слишком жесткого условия, согласно которому все точки должны лежать на отсеченной полусфере.

Принятие решения осуществляется на основе решающей функции

g(x, \г, р) = вдп (Дх, \у)) = вдп ((\у, ф(х)) -р), (3)

которая положительна в области нормальных измерений.

Используя множители Лагранжа а,, Д > 0, запишем лагранжиан

2 уп

-¿а,. ф(х1)) - р + ) - ¿Д ■ £. (4)

¡=1 <=1

В результате несложных преобразований и вычислений производных по переменным \у, р, получаем двойственную задачу квадратичной оптимизации в виде:

2 п п

Т1 7 ЕЕ а1 • • /. ). (5)

^ 1=1 j=l

при ограничениях

о<«,.<-!-, ¿«, = 1.

УП

1=1

Значение р вычисляется для любого j от 1 до и как

р = = (6)

После подстановки полученного решения в выражение для решающей функции g получаем

( " } g(x,■w,p) = sдn (7)

V /=1 )

Для применения данного метода требуется получить дополнительную информацию о системе.

Во второй главе описывается подход получения дополнительной информации, основанный на анализе системы в фазовом пространстве.

Основная идея подхода заключается в том, чтобы состояние системы с «-параметрами в фазовом пространстве дополняется еще и другими параметрами, а именно, приращениями данных параметров. В результате, фазовое пространство будет представлять собой множество параметров X, в определенный момент времени и приращения данных параметров: АХ, = Х,-Х,_1. В общем виде, при меняющемся шаге приращение измерения

X —X

рассчитывается по формуле с1Х1 =—-—, где Л - шаг измерения.

И

Еще одной проблемой, решаемой во второй главе, является выбор длины п обучающей выборки, которая определяется эмпирическим путем. Предполагается, что она должна быть максимально минимальной.

В рамках второй главы был проведен выбор параметра Гауссова ядра о и С, а также нахождение максимально минимального окна обучающей выборки. Также был выявлен ряд закономерностей по параметру о.

Данная модификация метода опорных векторов для одноклассовой классификации на основе фазового пространства позволяет более точно строить разделяющую функцию/при малой обучающей выборке.

В третьей главе разработана обобщенная модель обнаружения аномальных измерений, основанная на робастном методе е - засорения. Она придает устойчивость методу, разработанному во второй главе, к возможным ошибкам в обучающей выборке из-за ее малости.

В главе рассматриваются две основные стратегии принятия решений: минимаксная и миниминная стратегии выбора оптимального распределения М(е).

Согласно минимаксной стратегии выбирается такое распределение вероятностей из М(£), при котором функционал риска R(w,p) достигает максимума для каждого фиксированного набора w, р. Следует отметить, что оптимальное распределение вероятностей может быть различным для различных параметров w и р.

Другой противоположной стратегией является миниминная или оптимистическая стратегия, согласно которой выбирается распределение вероятностей из М(£), минимизирующее функционал риска R(yv,p) для различных параметров w и р.

В диссертационной работе также рассмотрена стратегия, являющаяся линейной комбинацией двух представленных ранее стратегий с некоторым коэффициентом у, который называется параметром «осторожности». Эта стратегия в литературе называется осторожной. А обе вышеприведенные стратегии являются крайними случаями ее. Из этого следует, что «осторожная» стратегия является общей или обобщенной стратегией для выбора оптимального распределения из множества М(г).

Пусть h = (l\,...,hn) - распределение вероятностей из М(г). Тогда «осторожная» стратегия принятия решений с параметром у определяет функционал риска при фиксированных значениях w и р как

R (w, р) = у max R(xv, р) + (1 - у) min R{w, р). (8)

1 ЛеМ(г) АеМ(е)

Функционал риска для «осторожной» стратегии принимаем вид: (w op, » Pop, ) = min Rr (w, p) =

= min I r max Ä(w,p) + (l-r) min Ä(w,p)>. (9)

w,p l' ЛеМ(гг) 'heM(e) ^ J

Минимаксный функционал риска может быть найден при помощи следующей задачи линейного программирования:

п

max Ä(w,p) = max У h ■ Ь(уч,р,ф(хЛ)-pv =

äeM(s) he

n

= max У ((1 - £)n~' + sq\L{vf,р,ф(хУ) -pv =

n

= (1 - £)Remp(w,p) + s ■ max£ qi ■ L(yv,р,ф{х^) - pv, (W) 4 /=1

при ограничениях

0<9i<l, qi+... + qn=\.

Полученная задача является линейной с переменными оптимизации ql,...,qn, но целевая функция зависит от w и р. Поэтому ее нельзя решить известными численными методами. Однако заметим, что все значения q

принадлежат симплексу 5(1,и) в пространстве конечной размерности, так как являются вероятностями. В соответствии с положениями теории линейного программирования оптимальное решение данной задачи достигается на крайних точках симплекса, число которых равно п. Крайние точки симплекса 5(1,и) имеют простой вид:

(1Д....0), (0,1.....0).....(0,0.....1).

Отсюда следует, что

п

шах Л(w, р) = (1 - £)п~х У /(w, р, ф(*,)) +

ЛеМ(е)

+£--rnax/(w,yO,^(x/))- pv. (Ш

/=1г..,л

Таким же образом можно найти нижнюю границу функционала риска

п

min R(w,p) = (1 - £)п

AeM(e) f'=l....."

f=l

Отсюда получаем

n

Rr (w, P) = (i - ^ К1 X z(w> P' ^(x/)> - Py +

и

+£/ max l{w,p, ф(х)) + £(1 - y) min l(w,p, )). (13)

i=lr..,n ¡=1.....n

Следующая задача - минимизация функционала риска Ry(\\,p) по

параметрам w и р. Задача решается в рамках метода обнаружения аномальных измерений. Используя данный метод для вычисления

параметров w и р, добавим член регуляризации к целевой функции

и введем новые переменные

£ = max{o,p-(w,^(x))}, G = max£. (И)

Это приводит к задаче квадратичного программирования

п /=1

+syG-pv + £(\-y)mm%, min , (15)

/-1.....Н w .p,G.£,

при ограничениях

£>p-(w,<#(x)), £>0, i = l,„„и, G>£, i = \,...,n.

Очевидно, что целевая функция может быть записана как множество локальных целевых функций

1 , . (1-г)^ _ z п

+eyG-pv + e(\-y)^k -> min , (16)

»v.ö.G.i.

так что функционал риска определяется как

^(wopt,popt) = minw.....nRyk (17)

Таким образом, необходимо решить п задач оптимизации. Оптимальные параметры wopt и рор1 соответствуют наименьшему значению функционалов Ryk, к = \,...,п.

Вместо минимизации целевой функции Ryk можно записать двойственную задачу оптимизации, называемую лагранжианом. Целевая функция двойственной задачи, обозначаемая Ly к, должна быть

максимизирована

Lr^U^ + V-^-iz+erG-pv + eil-r)^-

-1V (6 -Р + ММ)- ij!, (G - £)• (18)

i=1 Í=1 ¡=1 Здесь i=\,...,n - множители Лагранжа. Следовательно, они

удовлетворяют условиям t]¡> 0,^,>0Д,. >0 для всех i=l,...,n. Вычислим производные

л

dLrJ¡ldp = -v + Y/P,= 0,

dLr¿/dG = ye-fjTlt= 0,

¡=1

SLyJí / = (1 - s)n1 - Я,. - + 7,. + ff(1 ■- r)h (0 = 0,

dLrJ¡ !aW¡ = = 0, j = 1,...,от.

i=i

Здесь - индикаторная функция, принимающая значение 1, если i=k. Используя полученные равенства, мы упрощаем целевую функцию

Lk=~'Y¿í9,-4>J-K{x„xJ)t (19)

¿ м м

при ограничениях

0 < <р, < (1 - е)п1 + ч + e(l-r)h (0, i = 1,.... и,

п п

ZV, = V, ^Д = re, Л, > о, / = 1,...,«. /=i í=i

В результате, целевая функция не отличается от целевой функции, полученной в стандартном методе опорных векторов с эмпирическим распределением вероятностей. Однако, основное отличие содержится в ограничениях.

Функция Дх) может быть переписана в терминах множителей Лагранжа

/(x,w ) = 2>,К(х„х)-р. (20)

i=i

Отсюда находим оптимальное значение р, принимая /(x,w) = 0, т.е.

п

р = 2>Д(х,.,х,). (21)

В главе среди множества случаев рассматривается два частных, крайних случая.

При первом случае имеется одно распределение вероятностей и s = 0. Отсюда ^=0 и ограничения для принимают вид:

п

0<<р, <1/п, (Pj = v.

В результате опыта при данных параметрах решается стандартный метод опорных векторов.

В другом случае рассматривается полная неопределенность, когда s = 1. В этом случае только одна из точек обучающей выборки с наибольшей функцией потерь i(w,p,^(x,.)) определяет решающую функцию.

Оба случая при £ = 1 и £ = 0 нельзя использовать в новой робастной модели обнаружения аномальных измерений. Так как, в первом случае, при £ = 1 исходные данные полностью определяются, как аномальные измерения; а во втором случае, система становиться не чувствительной к ошибкам в обучающей выборке. Поэтому задача нахождения оптимального параметра £, решается эмпирическим путем.

В итоге в диссертационной работе принято решение использовать крайний вариант «осторожной» стратегии при у= 1 для выбора оптимального распределения из множества М(г), другими словами, использовать минимаксную стратегию. Это обусловлено тем, что использовать «осторожную» стратегию с неизвестным параметром у в реальных условиях по условиям поставленной задачи не представляется возможным, так как этот процесс выбора оптимального параметра осторожности у является трудоемким и неоднозначным. Также нельзя использоваться миниминную стратегию, так как система будет полностью не устойчива к ошибкам в исходных данных.

В главе для применения предложенных в диссертационной работе моделей разработан метод обучения, в основе которого лежит алгоритм простого скользящего среднего.

Основная идея метода обучения на основе алгоритма простого скользящего среднего состоит в том, что при поступлении нового значения состояния МИК х„+! высчитывается математическое ожидание окна, в которое входит само новое значение и из которого убирается первое. Затем полученное математическое ожидание сравнивается с интервал изменения математического ожидания, определенного на обучающем окне.

В четвертой главе приведено описание разработанного программного комплекса моделирования функционирования системы обнаружения аномальных измерений «Novelty detection», схема которого представлена на рисунке 3. В нем реализованы все разработанные робастные модели.

Комплекс моделирования обнаружения аномальных измерений построен по модульному принципу и включает:

I. Подсистему получения и преобразования данных:

• модуль сервера баз данных;

• модуль внесения данных с модулем генератора данных;

• модуль сбора информации;

• модуль «файл-сервер»;

• модуль преобразования данных.

И. Подсистему анализа данных:

• модуль управления самообучением;

• контроллер обучения и обнаружения;

• контроллер оценивания;

• модуль регистрации аномалий.

III. Подсистему хранения и вывода результатов анализа.

• модуль «файл-сервер»;

• модуль сервера баз данных;

• монитор.

Рисунок 3 - Схема комплекса моделирования функционирования системы обнаружения аномальных измерений

Подсистема получения и преобразования данных предназначена для работы с исходными данными.

Подсистема анализа данных предназначена для обнаружения аномальных измерений в исходных данных, поступивших с модуля преобразования данных.

Подсистема хранения и вывода результатов анализа предназначена для организации и представления результатов работы системы обнаружения аномальных измерений для дальнейших исследований.

С использованием разработанного программного комплекса проведены исследования моделей на реальных данных, полученных с датчиков мобильного измерительного комплекса.

Анализ результатов показал, что применение робастной модели одноклассовой классификации с Гауссовым ядром и с минимаксной стратегией для выбора распределения М( Б) позволяет повысить вероятность правильной классификации и обнаружения аномалий на 10-18 процентов, что обеспечивает сокращение сроков подготовки лесосеки к эксплуатации, минимизировать материальные, трудовые, финансовые затраты и экологические риски.

ЗАКЛЮЧЕНИЕ

1. Разработана робастная модель одноклассовой классификации состояний мобильного измерительного комплекса, использующая классы распределений вероятностей, определенных на обучающей выборке, и учитывающая малый период предварительных измерений различных параметров лесосеки и трелевочной машины.

2. Разработан метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения, интегрированный в структуру МИК.

3. Разработан метод обучения системы обнаружения аномальных измерений при исследовании лесосеки основанный на алгоритме простого скользящего среднего.

4. Разработан программно реализованный моделирующий комплекс обнаружения аномальных измерений для МИК с использованием предложенных в работе моделей.

5. Получены результаты работы системы обнаружения аномальных измерений в различных режимах, которые могут быть использованы при исследовании и подготовке лесосеки. Программно реализованная система обнаружения аномальных измерений мобильного измерительного комплекса в отличие от известных позволяет повысить вероятность правильной классификации и обнаружения аномалий на 10-18 процентов, что позволяет сократить сроки подготовки лесосеки к эксплуатации, минимизировать материальные, трудовые, финансовые затраты и экологические риски.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Гоголевский A.C., Уткин JI.B., Хабаров С.П. Метод обнаружения аномальных измерений в системах реального времени на основе алгоритмов машинного обучения// Известия Санкт-Петербургской лесотехнической академии. - 2014. - Вып. 206. - С. 108-115.

2. Уткин Л.В., Гоголевский A.C. Задача классификации объектов лесных систем при дистанционном зондировании и малом объеме обучающей выборки на основе множеств распределений вероятностей // Известия Санкт-Петербургской лесотехнической академии.-2011.-Вып. 194.-С. 156-164.

3. Гоголевский A.C. Нечеткая байесовская регрессионная модель с зависимыми переменными// Материалы международной конференции по мягким вычислениям и измерениям. - СПб: ЛЭТИ,- 2011. - С.205 - 208.

4. Хабаров C.B., Гоголевский A.C. Интеллектуальная система принятия решений для обнаружен™ аномального поведения на основе одноклассовой классификации II Материалы международной конференции по мягким вычислениям и измерениям. — СПб: ЛЭТИ. - 2012. - С. 183 - 207.

5. Гоголевский A.C. Метод преобразования данных для обнаружения аномального поведения системы // Материалы международной конференции по мягким вычислениям и измерениям. — СПб: ЛЭТИ. - 2013. -С. 164-166.

6. Гоголевский A.C., Уткин Л.В. Метод опорных векторов в задаче классификации объектов лесных систем // Материалы международной научно-технической конференции: «Актуальные проблемы развития лесного комплекса». — Вологда: ВоГТУ. - 2011. - С. 3-5.

7. Гоголевский A.C., Уткин Л.В. Постановка задачи классификации различных объектов лесных систем при дистанционном зондировании и малом объеме обучающей выборки // Материалы международной научно-технической конференции: «Актуальные проблемы развития лесного комплекса». — Вологда: ВоГТУ.-2010.-С. 3-5.

8. Гоголевский A.C. Модель обнаружения аномального поведения динамических систем реального времени на основе алгоритмов машинного обучения // Сборник материалов Политехнического фестиваля для студентов и молодых ученых. — СПб: Издательство «Полторак». - 2012. - С. 264 - 267.

9. Гоголевский A.C. Постановка задачи выбора рационального варианта лесопользования // Сборник материалов Международной научно-практической конференции молодых ученых, проходившей 11-12 ноября 2008 года в Санкт-Петербургской государственной лесотехнической академии "БИОЛОГИЧЕСКОЕ РАЗНООБРАЗИЕ, ОЗЕЛЕНЕНИЕ, ЛЕСОПОЛЬЗОВАНИЕ"- СПб.: СПбГЛТА. -2008.-С. 164- 166.

Ю.Гоголевский A.C., Илющенко В.В. Анализ методов линейной классификации при ограниченной обучающей выборке применительно задачам лесного комплекса // Сборник материалов Международной научно-практической интернет-конференции "Леса России в XXI веке". Октябрь 2010 г. / Под ред. Авторов; Министерство образования и науки РФ Государственная образовательное учреждение высшего профессионального образования "Санкт-Петербургская государственная лесотехническая академия имени С.М.Кирова" - Санкт-Петербург. - 2010.-С.209- 211.

11. Гоголевский A.C. Интеллектуальная система обнаружения аномальных измерений на основе одноклассовой классификации // Сборник тезисов семнадцатой Санкт-Петербургской Ассамблеи молодых ученых и специалистов - СПб.: Издательство РГГМУ. - 2012. - С. 198 - 200.

12.Гоголевский A.C. Разработка методов и моделей классификации различных объектов лесных систем при ограниченной обучающей выборке // Сборник тезисов шестнадцатой Санкт-Петербургской Ассамблеи молодых ученых и специалистов - СПб.: Издательство РГГМУ.-2011.-С. 105- 107.

13.Заяц A.M., Гоголевский A.C. Вариант автоматизированного управления процессами в экспертно-консалтинговой информационно-образовательной платформе «Учебные Электронные Лесничества» // Сборник научных трудов. Экономические проблемы лесного сектора. / отв. Ред.А.И. Кораблев. - СПб.: СПбГЛТА. - 2011. - С. 123 - 129.

14.Илющенко В.В., Гоголевский A.C. Выбор метода линейной классификации при ограниченной обучающей выборке применительно задачам лесного комплекса // Сборник материалов Международной научно-практической интернет-конференции "Леса России в XXI веке". Октябрь 2010 г. / Под ред. Авторов; Министерство образования и науки РФ Государственная образовательное учреждение высшего профессионального образования "Санкт-Петербургская государственная лесотехническая академия имени С.М.Кирова" - Санкт-Петербург. - 2010. - С. 198 - 203.

Подписано в печать «26 »апреля 2014 г. Формат 60x84/16 Бумага офсетная. Печать офсегаая. Усл. печ. л. 1,3- Тираж 100 экз. Заказ № 303685

Типография «Восстания -1» 191036, Санкт-Петербург, Восстания, 1.

Текст работы Гоголевский, Анатолий Сергеевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЛЕСОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ С.М. КИРОВА»

6420460221 На правах рукописи

ГОГОЛЕВСКИЙ АНАТОЛИЙ СЕРГЕЕВИЧ

РОБАСТНЫЕ МОДЕЛИ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ ДЛЯ МОБИЛЬНОГО ИЗМЕРИТЕЛЬНОГО КОМПЛЕКСА ЛЕСОЗАГОТОВИТЕЛЬНОГО ПРОИЗВОДСТВА

05.13.01 - системный анализ, управление и обработка информации

(промышленность)

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата технических наук

Научный руководитель: доктор технических наук, профессор Уткин Л.В.

Санкт-Петербург - 2014

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ----------------------------------------------------------------------------------------5

ГЛАВА 1 АНАЛИЗ И ПОСТАНОВКА ЗАДАЧИ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ В МОБИЛЬНОМ ИЗМЕРИТЕЛЬНОМ КОМПЛЕКСЕ------------------------------------------------------------------------------------12

1.1 Область применения системы обнаружения аномальных измерений------12

1.2 Актуальность и постановка задачи-------------------------------------------------15

1.3 Формальная постановка задачи-----------------------------------------------------16

1.4 Распознавание образов. Классические методы статистического

анализа обнаружения аномальных измерений------------------------------------------18

1.4.1 Классификация. Стандартная постановка задачи классификации------19

1.4.2 Многоклассовая классификация-----------------------------------------------21

1.4.3 Обзор методов решения задач классификации-----------------------------23

1.4.3.1 Байесовский классификатор. Наивный байесовский классификатор-------------------------------------------------------------------------------23

1.4.3.2 Метод к-ближайшего соседа----------------------------------------------------24

1.4.3.3 Метод опорных векторов--------------------------------------------------------25

1.4.3.4 Нейронные сети-------------------------------------------------------------------26

1.5 Кластеризация. Постановка задачи кластеризации-----------------------------29

1.5.1 Алгоритм к-внутригрупповых средних (к-теаш)--------------------------30

1.6 Классические алгоритмы фильтрации---------------------------------------------30

1.6.1 Кусочно-линейная аппроксимация для исключения выбросов----------30

1.6.2 Медианная фильтрация----------------------------------------------------------34

1.6.3 Фильтр Калмана-------------------------------------------------------------------35

1.7 Анализ существующих методов обнаружения аномальных измерений—36 Выводы по первой главе--------------------------------------------------------------------39

ГЛАВА 2 МЕТОД ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ, КАК ЗАДАЧА ОДНОКЛАССОВОЙ КЛАССИФИКАЦИИ НА ОСНОВЕ

ФАЗОВОГО ПРОСТРАНСТВА--------------------------------------------------------------40

2.1 Формальная постановка задачи обнаружения аномальных измерений —40

2.2 Постановка задачи одноклассовой классификации-----------------------------42

2.3 Выбор метода обнаружения аномальных измерений на основе перехода в фазовое пространство---------------------------------------------------------44

2.3.1 Получение дополнительной информации о системе----------------------44

2.3.2 Стандартные методы обнаружения аномальных измерений на

основе перехода в фазовое пространство----------------------------------------------47

2.3.3 Модель обнаружения аномалий Тэкса и Дьюина--------------------------48

2.3.4 Линейная модель обнаружения аномалий Кэмпбела и Беннет----------50

2.3.5 Модель обнаружения аномалий Шелкопфа--------------------------------52

2.4 Анализ и выбор параметра предложенной математической модели--------56

2.4.1 Скользящий контроль или кросс-валидация--------------------------------56

2.4.2 Выбор параметров Гауссова ядра а и С--------------------------------------58

2.4.3 Определение обучающего окна------------------------------------------------67

Выводы по второй главе--------------------------------------------------------------------68

ГЛАВА 3 НОВАЯ РОБАСТНАЯ СТАТИСТИЧЕСКАЯ МОДЕЛЬ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ МОБИЛЬНОГО ИЗМЕРИТЕЛЬНОГО КОМПЛЕКСА-------------------------------------------------------69

3.1 Формальная постановка задачи робастности------------------------------------69

3.2 Робастная модель е - засорения----------------------------------------------------70

3.3 Существующие робастные модели классификации----------------------------72

3.4 Новая робастная модель обнаружения аномальных измерений на

основе е-засорения----------------------------------------------------------------------------74

3.5 Обобщенная или «осторожная» стратегия выбора оптимального распределения из множества М(у?)-------------------------------------------------------76

3.6 Обобщенная стратегия для робастного метода обнаружения аномальных измерений----------------------------------------------------------------------78

3.7 Метод обучения системы обнаружения аномальных измерений------------81

3.8 Выбор оптимального параметра робастности £--------------------------------84

Выводы по третьей главе--------------------------------------------------------------------93

ГЛАВА 4 РЕАЛИЗАЦИЯ МОДЕЛИ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ

ИЗМЕРЕНИЙ МОБИЛЬНОГО ИЗМЕРИТЕЛЬНОГО КОМПЛЕКСА---------------94

4.1 Требования, предъявляемые к системе моделирования-----------------------94

4.2 Выбор языка программирования для реализации системы моделирования--------------------------------------------------------------------------------95

4.3 Моделирующий комплекс. Описание модулей----------------------------------95

4.3.1 Описание системы----------------------------------------------------------------96

4.3.3 Подсистема анализа данных--------------------------------------------------100

4.3.4 Подсистема хранения и вывода результатов анализа--------------------102

4.4 Применение новых робастных моделей с реальными данными-----------103

Выводы по четверной главе--------------------------------------------------------------117

ЗАКЛЮЧЕНИЕ--------------------------------------------------------------------------------118

СПИСОК ЛИТЕРАТУРЫ-------------------------------------------------------------------119

ПРИЛОЖЕНИЕ AI---------------------------------------------------------------------------129

ПРИЛОЖЕНИЕ А2---------------------------------------------------------------------------130

ПРИЛОЖЕНИЕ Б-----------------------------------------------------------------------------131

ВВЕДЕНИЕ

Актуальность работы

Решение задач рачительного и неистощительного лесопользования напрямую зависит от качества проведения мероприятий технологической подготовки лесозаготовительного производства, влияющих на эффективность производства, уровень трудозатрат, экономических и экологических рисков. Принятие обоснованных решений на этапе технологической подготовки определяет дальнейшую эффективность ведения лесозаготовительной деятельности.

Получение достоверных данных о параметрах лесосеки является важной задачей для построения трасс трелевки с целью принятия решения для ведения лесозаготовительного производства. От качества построения трасс трелевки зависит также, будут ли применены штрафные санкции за не соблюдение размеров площади выделенной для построения этих трасс. Данные санкции регламентируются п.56 приказа Рослесхоза № 337 "Об утверждении правил заготовки древесины" от 1 августа 2011 г.

Задачи, решаемые в ходе технологической подготовки лесозаготовительного производства, объемны и трудно формализуемы. К ним можно отнести: получение достоверных результатов измерений параметров лесосеки в ходе ее исследования; подготовка технологической карты лесосеки на основе реализации устойчивых моделей обнаружения аномальных измерений и выбор средств для освоения лесных участков и т. д.

В ходе исследования лесосеки проводится большой объем работ связанных с измерениями и анализом фактического состояния лесного участка, сбором и передачей информации для расчетов.

Современные информационные технологии и средства позволяют автоматизировать процессы, связанные с различными измерениями и расчетами. Они обеспечивают сокращение сроков подготовки лесосеки к эксплуатации, минимизацию материальных, трудовых, финансовых затрат и

экологических рисков, повышение качества результатов за счет оперативности и точности измерений.

К таким системам относится мобильный измерительный комплекс (МИК), обеспечивающий процесс автоматизации и повышения качества прокладки трелевочных трасс.

Анализ показывает, что автоматизация измерительных процедур, осуществляющих МИКом не гарантирует требуемого уровня достоверности и точности из-за довольно частого возникновения аномальных ситуаций в ходе проведения измерений в реальных условиях, что приводит к неточности построения трелевочных трасс и технологических карт.

Отсутствие эффективных способов управления измерениями и методов выявления аномалий в трудноформализуемых процессах, делает задачу разработки методов и моделей эффективного обнаружения аномальных измерений актуальной.

Цель диссертационной работы

Целью диссертационной работы является разработка новых робастных моделей обнаружения аномальных измерений в мобильном измерительном комплексе, предназначенном для моделирования условий работы лесных машин при исследовании лесосеки в ходе подготовки лесозаготовительного производства.

Задачи, решаемые в работе

Для достижения указанной цели в диссертационной работе поставлены и решены следующие задачи:

1. Разработан метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения;

2. Для мобильного измерительного комплекса разработаны робастные модели обнаружения аномальных измерений на основе метода одноклассовой классификации с применённым в ней Гауссовым ядром;

3. Разработаны модели и программный комплекс обнаружения аномальных измерений для МИКа с применением метода обучения, основанного на алгоритме простого скользящего среднего;

4. Проведены исследования и получены результаты моделирования системы обнаружения аномальных измерений мобильного измерительного комплекса с применением разработанных моделей.

Объект исследования

Объектом исследования является мобильный измерительный комплекс моделирования условий работы лесных машин при исследовании лесосеки.

Предмет исследования

Предметом исследования являются методы решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации.

Методы исследования

Для решения указанных задач в работе использованы методы: математического моделирования, теории вероятностей и математической статистики, теории принятия решений, оптимизации, системного анализа в лесозаготовительном производстве.

Научная новизна

1. Разработана робастная модель одноклассовой классификации состояний мобильного измерительного комплекса, использующая классы распределений вероятностей, определенных на обучающей выборке, и

учитывающая малый период предварительных измерений различных параметров лесосеки и треловочной машины.

2. Разработан метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения, интегрированный в структуру МИК.

3. Разработан метод обучения системы обнаружения аномальных измерений при исследовании лесосеки основанный на алгоритме простого скользящего среднего.

Практическая значимость работы

1. Разработан программно реализованный моделирующий комплекс обнаружения аномальных измерений для МИК с использованием предложенных в работе моделей.

2. Получены результаты работы системы обнаружения аномальных измерений в различных режимах, которые могут быть использованы при исследовании и подготовке лесосеки.

Программно реализованная система обнаружения аномальных измерений мобильного измерительного комплекса в отличие от известных позволяет повысить вероятность правильной классификации и обнаружения аномалий на 10-18 процентов, что позволяет сократить сроки подготовки лесосеки к эксплуатации, минимизировать материальные, трудовые, финансовые затраты и экологические риски.

Реализация и внедрение результатов работы

Результаты кандидатской диссертационной работы были использованы при разработке системы электротехнического обеспечения и АСУ ИК промышленного объекта по ОКР «Развязка» на предприятии ОАО «Научно-производственное предприятие «Пирамида» расположенное в г. Санкт-Петербурге, что подтверждается актом о внедрении (см. Приложение А1).

Основные результаты внедрены в НИР кафедры информационных систем и технологий СПбГЛТУ, выполненной по договору № 1.6.02.11 х/д «Разработка алгоритмического обеспечения отказоустойчивого прибора комплексирования сигналов навигационно-измерительных датчиков скоростных судов (отказоустойчивого навигационного сервера)» (см. Приложение А2).

Достоверность результатов

Достоверность полученных в диссертационной работе основных сформулированных научных положений и выводов обеспечивается корректностью примененного математического аппарата и используемых методов исследования, их практической реализацией, математической строгостью преобразований при получении доказательств, утверждений и аналитических зависимостей и результатами исследований алгоритмов при помощи моделирующего программного комплекса.

Основные положения, выносимые на защиту

1. Робастная модель одноклассовой классификации состояний мобильного измерительного комплекса, использующая классы распределений вероятностей, определенных на обучающей выборке, и учитывающая малый период предварительных измерений различных параметров лесосеки и трелевочной машины.

2. Метод обнаружения аномальных измерений на основе перехода из временной области в фазовое пространство для построения нормальных и аномальных множеств с применением алгоритмов машинного обучения, интегрированный в структуру МИК.

3. Метод обучения системы обнаружения аномальных измерений при исследовании лесосеки основанный на алгоритме простого скользящего среднего.

4. Программно реализованный моделирующий комплекс обнаружения аномальных измерений для МИК с использованием предложенных в работе моделей.

Апробация работы

Научные результаты диссертации были представлены на различных конференциях:

> XIV, XV и XVI Международные конференции по мягким вычислениям и измерениям (8СМ'2011, 8СМ'2012, 8СМ'2013), проходившие в СПбГЭТУ в г. Санкт-Петербурге: с 23-25 июня 2011 г.; с25-27 июня 2012г.; с 23-25 мая 2013г. - соответственно;

> 8-ая и 9-ая Международные научно-технические конференции «Актуальные проблемы развития лесного комплекса», проходившие в ВоГТУ в г. Вологде: с 7 - 9 декабря 2010 г. и 6 декабря 2011 г. -соответственно;

> научно-практическая конференция в рамках Политехнического фестиваля, проходившего в СПбГПУ в г. Санкт-Петербурге с 16-17 декабря 2012г.;

> ХЫИ научная и учебно-методическая конференция, проходившая в НИУ ИТМО в г. Санкт-Петербурге с 28-31 января 2014 г.;

> XVIII международная научно-методическая конференция «Высокие интеллектуальные технологии и инновации в образовании и науке», проходившая в СПбГПУ в г. Санкт-Петербурге с 17-18 февраля 2011 г.;

> ежегодные научно-технические конференции профессорско-преподавательского состава СПб ГЛТУ имени С.М. Кирова 2010-2013 гг.

> международные научно-практические конференции молодых ученых «Современные проблемы и перспективы рационального лесопользования в условиях рынка», проходившие в СПбГЛТА (СПбГЛТУ) в г. Санкт-Петербурге: с 10-11 ноября 2010-2012 гг.

> шестнадцатая и семнадцатая Санкт-Петербургские ассамблеи молодых учёных и специалистов, проходившей в г. Санкт-Петербурге в 2011-2012 гг.

Основные научные результаты были получены в рамках научных грантов и представлены на следующих конкурсах:

1. Диплом ПСП № 11123 победителя конкурсного отбора 2011 года о присуждении премий Правительства Санкт-Петербурга для студентов, аспирантов вузов и академических институтов, расположенных на территории Санкт-Петербурга, в соответствии с распоряжением Комитета по науке и высшей школе Правительства Санкт-Петербурга от 25.10.2011 №72;

2. Диплом ПСП № 12077 победителя конкурса 2012 года для студентов вузов, расположенных на территории Санкт-Петербурга, аспирантов вузов и академических институтов, расположенных на территории Санкт-Петербурга, в соответствии с распоряжением Комитета по науке и высшей школе от 30.10.2012 №74.

На разработанный программный комплекс получено свидетельство о государственной регистрации программ для ЭВМ № 201461057 «Система обнаружения аномальных измерений «Novelty detection ver. 1.0»» от 15 января 2014 г.(см. Приложение Б).

Публикации

По теме диссертации опубликовано 14 печатных работ. Из них 2 статьи в журналах, рекомендованных ВАК РФ.

Структура и объем работы

Диссертационная работа состоит из введения, четырёх глав, выводов, списка литературы и трех приложений. Работа изложена на 131 страницах печатного текста и содержит 13 таблиц, 34 рисунка. Список литературы содержит 112 наименований.

ГЛАВА 1 АНАЛИЗ И ПОСТАНОВКА ЗАДАЧИ ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ В МОБИЛЬНОМ ИЗМЕРИТЕЛЬНОМ КОМПЛЕКСЕ

Первая глава посвящена описанию области применения методов, разрабатываемых в диссертационной работе. Обоснована актуальность работы. Проведен обзор основных классических методов статистического анализа и методов фильтрации, наиболее часто применяемых на практике. Поставлена задача обнаружения аномальных измерений.

1.1 Область применения системы обнаружения аномальных измерений

Система обнаружения аномальных измерений, разрабатываемая в диссертационной рабо�