автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Средства интеллектуального анализа структуры связей по данным мониторинга сложных технологических объектов

кандидата технических наук
Ерома, Алексей Анатольевич
город
Москва
год
2004
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Средства интеллектуального анализа структуры связей по данным мониторинга сложных технологических объектов»

Автореферат диссертации по теме "Средства интеллектуального анализа структуры связей по данным мониторинга сложных технологических объектов"

На правах рукописи

Ерома Алексей Анатольевич

СРЕДСТВА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА СТРУКТУРЫ СВЯЗЕЙ ПО ДАННЫМ МОНИТОРИНГА СЛОЖНЫХ ТЕХНОЛОГИЧЕСКИХ ОБЪЕКТОВ

Специальность 05.13.01 - "Системный анализ, управление и обработка информации (промышленность)"

Автореферат на соискание учёной степени кандидата технических наук

Москва 2004

Диссертация выполнена на кафедре "Автоматизированные системы обработки информации и управления" (ИТ-7) Московской Государственной Академии Приборостроения и Информатики (МГАПИ).

Научный руководитель: кандидат технических наук,

профессор Р.А. Ашинянц

Официальные оппоненты: доктор технических наук, зав. каф.,

Анохин Алексей Никитич, кандидат технических наук, Леонов Александр Александрович.

Ведущая организация: Всероссийский Научно-Исследовательский Институт по

эксплуатации Атомных Электростанций (ВНИИАЭС)

Защита диссертации состоится «21» декабря 2004 года в 12 часов на заседании диссертационного Совета № Д212.119.02 Московской Государственной Академии Приборостроения и Информатики по адресу: 107076, Москва, ул. Стромынка, 20.

С диссертацией можно ознакомиться в библиотеке МГАПИ.

Автореферат разослан «17» декабря 2004 Учёный секретарь

диссертационного Совета М.В. Ульянов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы.

Существует класс сложных технологических объектов, для которых в настоящее время отсутствуют надёжные методы анализа данных оперативного мониторинга. Этот класс объектов характеризуется:

1. Невозможностью организации активного эксперимента с целью создания математической модели;

2. Большим числом доступных для измерения параметров (сотни);

3. «Дрейфом» во времени отдельных параметров;

4. Отсутствием обоснований для необходимости измерений значительного числа параметров;

5. Отсутствием точных данных о взаимосвязях между параметрами и их влиянии на качество наблюдаемых процессов.

Объектами данного класса являются и атомные электростанции (АЭС), для которых оперативный мониторинг радиационной и технологической обстановки является чрезвычайно важной задачей при эксплуатации АЭС и неотъемлемым условием обеспечения безопасной и устойчивой работы.

Задаче анализа потока данных оперативного мониторинга сложных технологических систем, до настоящего времени не уделено должного внимания. В то время как во многих других сферах деятельности, таких как, телекоммуникации и т.п., массивы информации, накопленные в базах данных, активно используются для выявления скрытых внутренних закономерностей с последующим практическим применением извлечённых знаний. В качестве обзорной работы в направлении интеллектуального анализа данных можно назвать Holsheimer M, Siebes (1994). Примером успешного применения методов интеллектуального анализа к проблеме мониторинга в телекоммуникационных сетях служит работа Lane Т., Bradley C.E. (1997).

В связи с этим актуальной является задача разработки методов и алгоритмов для системного анализа вектора данных оперативного мониторинга сложных технологических объектов с применением современных методов интеллектуального анализа данных, в целях усовершенствования характеристик существующих систем мониторинга. Эффективный анализ данных мониторинга возможен при создании средства интеллектуального анализа данных с использованием методов индукции статистических моделей, позволяющих выявить внутреннюю структуру вектора параметров оперативного мониторинга. Создание подобных систем «интеллектуального» мониторинга и средств автоматизированного анализа данных

гас НАЦИОНАЛЬНАЯ

БИБЛИОТЕКА

С.

м

мониторинга позволит повысить эффективность системы мониторинга и будет способствовать повышению уровня безопасности при эксплуатации АЭС.

Разработка методов и алгоритмов для извлечения знаний из массива данных оперативного мониторинга сложных технологических объектов с использованием современных методов искусственного интеллекта и интеллектуального анализа данных, с последующим приложением разработанных алгоритмов и программ применительно к объектам атомной энергетики делают тему диссертации актуальной как в прикладном отношении, так и в научно-техническом плане. Цели и задачи исследования.

Целями настоящего исследования являются:

1. Создание методов интеллектуального анализа данных сложных технологических объектов;

2. Создание средств для системного анализа и обработки данных мониторинга;

3. Использование программных средств для обучения специалистов. Для достижения этих целей нами поставлены следующие задачи:

1. Провести обзор методов интеллектуального анализа данных;

2. Разработать модифицированный алгоритм индукции, использующий знания экспертов предметной области в качестве эвристики при построении модели;

3. Разработать модифицированный алгоритм индукции нелинейных моделей, оценить сложность алгоритма;

4. Разработать методику мониторинга на основе индукции статистических моделей по данным оперативного мониторинга;

5. Разработать программный комплекс для оценки эффективности и точности алгоритмов методики на вычислительных экспериментах и данных наблюдения.

Методы исследований, примененные в диссертационной работе, опираются на теоретические и методологические основы теории статистики, теории машинного обучения и теории баз данных и методы интеллектуального анализа данных. Научная новизна исследования.

1. Модифицированный алгоритм индукции, использующий знания экспертов предметной области;

2. Модифицированный алгоритм индукции нелинейных моделей;

3. Методика интеллектуального оперативного мониторинга состояния сложных технологических объектов на базе индукции модели объекта по данным наблюдения;

Практическая значимость результатов исследования и их внедрение в практику.

На базе разработанных методик и алгоритмов интеллектуального оперативного мониторинга создан программный комплекс «Пионер» для тренинга специалистов по поддержке принятия решений в случае радиационных аварий на АЭС. Разработанная система представляет собой эффективный инструмент для проведения тренинга служб радиационной разведки. Программный комплекс внедрён в практику работы Технического кризисного центра (ТКЦ) ИБРАЭ РАН, о чём имеется соответствующий акт.

Предложенная в настоящей работе методика интеллектуального мониторинга позволяет повысить эффективность систем мониторинга АЭС и способствует решению важных прикладных задач в области обеспечения экологической безопасности и безопасности персонала АЭС. Апробация работы.

Основные результаты диссертационной работы докладывались на конференциях:

1. V Международной научно-практической конференции "Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права" — Москва, 2002;

2. Всероссийской научно-технической конференции "Новые информационные технологии" — Москва, 2003;

3. IV конференции стипендиатов ИБРАЭ РАН, Москва, 2003;

4. Конференции Школы молодых ученых ИБРАЭ РАН, Москва, 2004.

Публикации.

По теме диссертации опубликовано 6 научных работ, в том числе, 1 препринт (№ИБРАЭ-2004-05). Исследования по диссертации отражены в научно-исследовательских отчётах Института проблем безопасного развития атомной энергетики РАН (ИБРАЭ РАН). Объём и структура диссертации.

Диссертационная работа изложена на 167 страницах машинописного текста, состоит из введения, 4 глав, отражающих результаты исследований автора, заключения, библиографического указателя, включающего 93 источника, иллюстрирована 35 рисунками и 19 таблицами.

СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы, поставлены цели и задачи исследований. В первой главе приведён обзор и сравнение существующих методов в области интеллектуального анализа данных применительно к задаче анализа вектора данных мониторинга. Отмечены трудности, возникающие, при использовании существующих методов интеллектуального анализа в связи со спецификой данных оперативного

мониторинга состояния сложных технологических объектов. Вид знаний, которые мы ожидаем получить в результате анализа, определяет как возможные формы представления знаний, так и методы интеллектуального анализа, которые могут быть использованы для извлечения знаний соответствующего вида из данных. С прикладной точки зрения, большой интерес представляют знания о закономерностях внутренней структуры объекта мониторинга, извлекаемые методами индукции. На основе анализа работ, посвященных системам представления знаний и методам извлечения знаний из данных, сделан вывод, что методы индукции статистических моделей могут быть успешно применены как для задачи структуризации вектора параметров оперативного мониторинга, так для задачи анализа данных оперативного мониторинга с целью выявления структурных отклонений. В конце первой главы сформулирована постановка задачи исследования.

Вторая глава посвящена разработке оригинальной методики интеллектуального мониторинга состояния сложных технологических объектов на основании выделения статистических моделей. От анализа значений отдельных показателей предлагается перейти к анализу изменений в системе взаимосвязей объекта мониторинга. Отличия между типичной и предлагаемой системами мониторинга показано на рис. 1.

рис. 1. Отличия типичной и предлагаемой систем мониторинга.

Предложена обобщённая схема процесса интеллектуального мониторинга отклонений на основе индукции статистических моделей, а также показана роль методов индукции в процессе мониторинга- см. рис. 2.

данные оперативного мониторинга -

рис. 2 Схема процесса интеллектуального мониторинга отклонений на основе индукции статистических моделей

В настоящей методике в качестве инструмента для построения статистических шаблонов, вместо традиционных методов интеллектуального анализа данных, используются методы индукции статистических моделей. Методы индукции позволяют извлечь из данных наблюдения не только знания об определённых закономерностях функционирования объекта мониторинга, но и знания о структуре объекта. Использование в целях мониторинга извлечения знаний подобного вида, с учётом специфики исходных данных мониторинга, принципиально отличают методику интеллектуального мониторинга, предлагаемую в настоящей работе, от аналогичных методик в других областях. Место «шаблона» занимает статистически выведенная структурная модель объекта мониторинга.

Интеллектуальный мониторинг определим как итеративный процесс извлечения знаний о внутренней структуре объекта по данным оперативного мониторинга, поступающим в реальном времени, с последующей оценкой отклонений текущей структуры данных относительно структуры соответствующей нормальному функционированию объекта. Под внутренней структурой данных понимается совокупность статистических зависимостей, определённых на исходном множестве параметров.

Методика интеллектуального мониторинга имеет статистическую основу, что накладывает определённые ограничения на данные и предполагает наличие этапа подготовки данных для анализа.

Индукция каузальной модели представляет собой процесс эвристического поиска модели, в достаточной степени, согласующейся с исходными статистическими данными.

Индукция модели объекта проводится на основании статистической информации о взаимосвязях между параметрами, поэтому на следующем этапе осуществляется расчёт матрицы взаимозависимостей. В общем случае выбор критерия оценки зависимости двух параметров определяется в зависимости от специфики данных, в настоящей работе за основу взят коэффициент корреляции Пирсона, в качестве меры зависимости двух параметров.

Нет необходимости в выполнении индукции модели для каждого нового вектора значений параметров, поскольку, при большой длине окна мониторинга отдельные вектора значений не будут оказывать существенного влияния на корреляционную матрицу, и, как следствие, модели, построенные и на (I + 1)-OM шаге, не будут отличаться.

Предпочтительным является проведение повторной индукции тогда, когда проверка ранее выведенной модели по текущим данным, показывает значительные расхождения. Это означает, что когда наблюдаются существенные отличия текущей корреляционной матрицы от корреляционной матрицы, прогнозируемой моделью. Эта проверка выполняется на этапе оценки необходимости повторной индукции модели.

На этапе индукции и расчёта структурной модели объекта по данным мониторинга осуществляется построение модели объекта. В общем случае, модель, полученная при индукции, будет отличаться от фактической модели объекта. Отличия между индуцированной и аналитической моделью определяются статистической природой процесса индукции модели. Так, например, малозначащие функциональные связи и редко проявляющие себя связи с большой вероятностью вообще не будут представлены в модели. С другой стороны, одна и та же совокупность исходных данных может одинаково хорошо описываться не одной единственной моделью, а целым множеством различных моделей. Не располагая какими-либо темпоральными или экспертными данными о направленности взаимосвязей параметров, невозможно сделать выбор в пользу одной модели из этого множества Структурная вычислительная модель здесь представляет собой ацикличную аддитивную модель и определяется следующим образом:

I 0)

где — коэффициенты регрессии или прямого влияния параметра ]' на параметр ¡, £ —

необъяснённая составляющая параметра (ошибка). Для алгоритмов индукции принимается: исходная модель является марковской моделью, т.е. её граф не содержит направленных циклов, а ошибки некоррелированны между собой М ] = 0.

Индукцию модели объекта по данным мониторинга можно проиллюстрировать на следующем примере. Имеется набор данных мониторинга по пяти параметрам. Корреляционная матрица на множестве этих параметров представлена в табл. 1. Индукция модели позволяет нам перейти от полносвязанного графа изображённого на рис. 3 а) к частично-ориентированному графу рис. 3 Ь). При наличии дополнительной информации об ориентации остальных связей можно получить полностью ориентированный граф и, применяя аппарат множественной регрессии, перейти к рассчитанной модели объекта мониторинга рис. 3 с).

* А В С Б Е

А 1.00

В 0.00 1.00

С 0.71 0.00 1.00

о 0.50 0.50 0.35 1.00

Е 0.00 0.71 0.00 0.71 1.00

табл. 1. Корреляционная матрица по параметрам мониторинга для примера индукции модели объекта.

А

В А

В

А

В

С- [)—- Е С

N

1.0

а)

О*—Е

Ь)

С —Е

1.0

с)

рис. 3. Индукция модели объекта, матрица по которому представлена в табл. 1. а) — исходный полносвязанный граф, Ь) — частично-ориентированный граф, полученный из исходного графа в результате индукции, с) — структурная модель объекта, построенная с привлечением дополнительных знаний для уточнения направленности отдельных связей

На следующем этапе производится оценка отклонения текущей модели от эталонной модели. Под эталонной моделью понимается некоторая, сгенерированная ранее, модель объекта, относительно которой оцениваются все текущие структурные изменения. Можно выделить следующие подходы оценки отклонений от эталонной модели:

• Равномерная оценка. Различные связи в модели полагаются равнозначными. При этом в качестве оценки может выступать сумма квадратов отклонений весов связей в текущей модели от эталонной модели или соответствующие максимальные значения;

• Взвешенная оценка. Каждой связи в модели соответствует некоторый вес, определяющий степень важности изменений этой связи по сравнению с остальными. При этом можно выделить два подхода к выработке соответствующих весов:

о Экспертная взвешенная оценка. В рамках этого подхода эксперты предметной области количественно определяют степень важности каждой выявленной или потенциально возможной взаимосвязи. о Взвешенная оценка по сети. Каузальная модель представляет собой сеть связанных параметров, поэтому оценку важности связи можно определить по степени её влияния на систему в целом. В главе проведено исследование вопросов определения и предварительной подготовки вектора исходных данных мониторинга. Обоснована необходимость применения методов анализа внутренней структуры данных для эффективного выявления структурных отклонений в функционировании объекта мониторинга, приведён пример использования методов индукции для выявления структурных отклонений. По результатам численных экспериментов получены оценки взаимосвязи времени реакции и точности системы мониторинга.

До настоящего момента предполагалось, что связи объекта мониторинга носят относительно стабильный характер. В действительности связи могут изменяться не только под воздействием внештатных причин, но и в штатном порядке - в соответствии с

различными технологическими и организационными процессами. В данном разделе проведена адаптация методики интеллектуального мониторинга для объектов с динамически изменяющимися связями. Процесс мониторинга с использованием нескольких эталонных моделей и их динамическим обновлением представлен на рис. 4.

Наиболее приемлемым решением в данном случае нам представляется идентификация возможных состояний объекта в процессе инициализации (обучения) системы мониторинга с последующим мониторингом отклонений относительно выявленных допустимых состояний.

Под состоянием объекта понимается модель взаимосвязей объекта с рассчитанными коэффициентами. Для идентификации возможных состояний объекта мониторинга из множества генерируемых моделей в процессе инициализации системы мониторинга модели предпочтительным является использование методов кластеризации для выделения кластеров моделей и их наиболее характерных представителей. Мерой расстояния между соответствующими моделями объекта в конкретный момент времени, является выбранный ранее критерий оценки отклонений текущей модели от эталонной модели. После идентификации возможных состояний объекта, в процессе мониторинга отклонений. Наиболее характерные представители классов моделей, выделенные на этапе кластеризации моделей, играют роль эталонных моделей.

Проведённый на вычислительных экспериментах, анализ факторов, влияющих на точность и скорость реакции на структурные изменения системы мониторинга, показал:

1. При наличии достаточного объема данных, обеспечивается надёжная работа (т.е. выдерживаются приемлемые частоты ложных срабатываний и пропусков структурных отклонений) системы мониторинга.

2. Для конкретного объекта мониторинга и объёма выборки («окна» индукции), можно выбрать оптимальное значение порогового коэфф., которое обеспечивает минимальные частоты ложных срабатываний и пропусков событий.

3. С увеличением объёма выборки (длины окна индукции), скорость реакции системы мониторинга на отклонения снижается.

Пример зависимости частоты ложных срабатываний и частоты игнорирования событий от порогового коэффициента для модели из 5 переменных и объёма выборки (длины окна индукции) W = 500 приведён на рис. 5. Зависимость времени обнаружения отклонения от объёма выборки приведена на рис. 6.

рис. 6. Зависимость времени обнаружения изменения структуры объекта от объёма выборки (длины окна индукции) Wnpu пороге ^=0.1 для модели из 5 параметров.

Это ставит перед нами дилемму: при малой длине окна индукции появляются проблемы с ложными срабатываниями и игнорированием событий, но при этом мы можем относительно

быстро реагировать на изменения. При большей длине окна мы выигрываем в точности мониторинга, но теряем в возможности быстрого прогнозирования отклонений.

Конкретные значения параметра длины окна индукции и порога значимости определяются спецификой объекта наблюдения и должны выявляться на этапе предварительной настройки системы мониторинга.

Третья глава посвящена вопросам построения модели объекта по эмпирическим данным оперативного мониторинга. Рассмотрен вопрос о привлечении знаний экспертов предметной области для решения задач идентификации исходной модели в процессе индукции. Включение знаний экспертов предметной области в процесс индукции моделей позволяет решить проблемы статистической эквивалентности и идентифицируемости модели. Для этого предложен следующий формализм представления знаний экспертов:

Предикат Матем. формулировка в терминах связей графа <7 Смысловая нагрузка

<1(х,у) -» у, X у, X - у} П б Ф 0 Существует ли прямая связь х-у.

п{х,у) геБ ху Существует направленная опосредованная или прямая связь направленная х —>... —> у.

р(х,у) {л- —> у) е (5 или ^(х,у)пп(х,у) Существует ли прямая связь между параметрами х, у, направленная х -> у.

Ь(х) Ух*у,Ь(х)-+-,р(у,х) Параметр х не зависит от других и является экзогенным (внеш.) по отношению к системе.

Ф) \/х*у,е(х)->-1р(х,у) Параметр х является выходным параметром и не влияет напрямую на др. параметры системы.

Знания эксперта предметной области, выраженные с использованием формализма, представляют собой базовые знания о структуре объекта. Принимается допущение о том, что любые изменения в структуре объекта согласуются со знаниями эксперта. Т.е. знания экспертов полагаются абсолютными и верными при любых изменениях в структуре объекта.

Разработанный модифицированный алгоритм индукции с использованием дополнительных знаний выглядит следующим образом:

1. Для каждой пары переменных (а,Ь), производится поиск множества наборов : переменных таких, что УСе5аЬ имеет место 1(А,В\С). Если 5^=0 и.

выполняются -\1(А,В|0) и , то поместить неориентированную дугу 1

— 1 !

аЪ между этими переменными . >

2. Для каждой пары несвязанных напрямую переменных (а,Ь) с общей соседней | вершиной с, если сё С, \/С е и ориентация стрелок в сторону с не противоречит базе фактов (т е. для базы фактов выполняется {-1/?(а,с);-1р(й,с);-1л(а,с);-1п(6,с);п(с,а);и(с,6);-1е(а);-1е(6)}п^ = 0), то

направить стрелки в сторону с, т.е. а -> с <- Ъ.

3. Для каждой ненаправленной связи аЪ в графе, если выполняется

(6, а); (6, а); и (а, 6); 6 (а); е (6)} п * 0, то направить связь а —> Ь. [

4. Далее рекурсивно производится ориентация дуг графа в соответствии со | следующими двумя правилами:

а если для ненаправленной связи аЬ в графе существует направленный путь из а в

Ь, то направить а Ь;

Ь. если для пары несвязанных напрямую переменных (а,Ь) существует

вершина с, такая что а-*с,с-Ь, то если п(с,6);и(6,с);6(6);е(с)}п^ = 0,

направить связь с -> Ъ, иначе удалить связь с-Ь.

В четвёртой главе проведена адаптация существующих методов индукции нелинейных моделей.

Линейная модель в отдельных случаях достаточно грубо описывает систему взаимосвязей объекта и приближения, даваемого методикой мониторинга с использованием метода индукции линейных аддитивных моделей, в её исходном виде, будет явно не достаточно для эффективной работы системы мониторинга. Это требует развития существующих алгоритмов индукции для получения адекватных структурных моделей объекта по данным мониторинга, и для эффективной работы системы мониторинга, в целом, в условиях нелинейности взаимосвязей и наличия временных задержек.

Под моделью с нелинейными взаимосвязями будем понимать ацикличную модель с некоррелированными аддитивными ошибками, описываемую уравнениями вида:

1 При этом знания эксперта считаются более приоритетными, чем статистический вывод о независимости, из-за возможного проявления ошибок индукции, например, в моделях с избыточными связями

где u:j — коэффициенты регрессии или прямого влияния параметра j на параметр /', <ptj —функция передачи влияния j на i, £ —случайная сост. параметра (ошибка).

= (3)

где aljk — коэффициент при к-ом члене разложения передаточной функции <ptJ при передаче возмущения от параметра Xt к параметру Xt, рк (Х,)— к-ый член разложения передаточной функции <ри норм, по условию А/ [ft)] = О, Z) [ft (Ху )J = 1, а х,, — ошибка аппроксимации параметра X, параметром Xг

Для разработки модифицированного алгоритма индукции, за основу взят не исходный /С-алгоритм индукции (Pearl J., Verma TS., "A Statistical Semantics for Causation", Preprint Cognitive Systems Laboratory, Computer Science Department, University of California, 1991), основанный на принципе условной независимости, а предложенный ранее в настоящей работе модифицированный алгоритм индукции с использованием знаний экспертов предметной области. Это позволяет применять в процессе индукции дополнительные знания в виде различных эвристик, основанных на обнаружении асимметрий в исходном статистическом распределении. Для получения модифицированного алгоритма индукции необходимо предложить:

- критерий условной независимости двух параметров;

- эвристику для ускорения процесса индукции модели (если это возможно);

Для нелинейного сл. определим предикат условной независимости Iм (X, Y \ S^):

ч [TRUE,p" кк,». 1 V [FALSE, р^>=кш\

где — коэффициент условной корреляции между переменными Х,Упрп исключении влияния переменных 5, в условиях нелинейности взаимосвязи.

(5)

где Х^Ур — переменные Х,У при исключении влияния переменной 2, а у^ — функция влияния переменной У на переменную X, при исключении влияния 2.

Х\ (6)

ГМГ-*Л2)) (7)

Используется эвристика: если наблюдается -+п(х,у) и

влияние технологического фактора при этом исключено, то взаимосвязь между переменными х,у направлена х-> у. Условие (Л")2 отсекает случайные вариации коэффициенты корреляции, возникающие вследствие ограниченности выборки.

Разработанный модифицированный метод индукции нелинейных моделей, который позволяет точнее описывать нелинейные структурные взаимосвязи объекта мониторинга, и приводит к более корректным моделям, что и расширяет сферу применения предложенной методики мониторинга.

В настоящем исследовании решена задача распространения методики мониторинга на случай нелинейности взаимосвязей, случай наличия временных задержек и для смешанного темпорально-нелинейного случая. Разработан модифицированный метод индукции моделей с временными задержками, что позволяет учитывать специфику объекта мониторинга и получать корректные модели с временными задержками. Приведены оценки временной сложности модифицированных алгоритмов индукции. По результатам численного моделирования сделан вывод относительно практической применимости модифицированных алгоритмов индукции. Предложен метод индукции для обобщённого темпорально-нелинейного случая, и приведены оценки его временной сложности и практической применимости.

ЗАКЛЮЧЕНИЕ

Основные результаты исследования проведённого в настоящей диссертации состоят в следующем:

Разработанный модифицированный алгоритм индукции использует знания экспертов предметной области. Знания выражаются в форме предикатов первого порядка. Это позволяет повысить скорость индукции модели по исходным данным и уменьшить неопределённость получаемой модели.

Разработанный модифицированный алгоритм индукции нелинейных моделей делает возможным индукцию моделей при наличии нелинейной взаимосвязи между параметрами. Предложенная для этого алгоритма эвристика, основанная на наличии асимметрии вследствие нелинейности, способствует ускорению процесса индукции, уменьшению неопределённости и уточнению получаемой модели. Проведённая оценка временной сложности нового алгоритма индукции показала возможность индукции небольших моделей (десятки параметров) на современных компьютерах в реальном времени;

Предложенная новая комплексная методика интеллектуального оперативного

мониторинга состояния сложных технологических объектов на базе индукции

17

статистической модели объекта позволяет, в отличие от существующих методик, выявлять структурные отклонения в технологических цепях по данным наблюдения; Проведённый на вычислительных экспериментах, анализ факторов, влияющих на точность и время реакции системы мониторинга, построенной на базе статистической индукции внутренней модели объекта, показал возможность надёжной работы (т.е. выдерживаются приемлемые частоты ложных срабатываний и пропусков структурных отклонений) подобной системы мониторинга, при условии достаточности данных наблюдения;

Проведённый на вычислительных экспериментах, анализ точности и скорости алгоритмов индукции моделей в зависимости от количества рассматриваемых параметров модели и других характеристик исходных моделей, показал, что для групп параметров небольшой размерности (десятки параметров) индукция модели и, соответственно, процесс интеллектуального мониторинга могут проводиться в режиме реального времени на современных компьютерах;

На базе разработанных методик и алгоритмов интеллектуального оперативного мониторинга создан программный комплекс «Пионер» для тренинга специалистов по поддержке принятия решений в случае радиационных аварий на АЭС. Разработанная система представляет собой эффективный инструмент для проведения тренинга служб радиационной разведки. Программный комплекс практику работы Технического кризисного центра (ТКЦ) ИБРАЭ РАН, о чём имеется соответствующий акт.

СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Ашинянц Р.А., Ерома А.А., Формальный концептуальный анализ в задачах извлечения знаний // Сборник трудов V Международной научно-практической конференции "Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права", Кн. "Информатика", М.: МГАПИ, 2002.С.6-10.

2. Ерома А.А. Индукция причинно-следственных связей в интеллектуальном анализе данных // Сборник трудов VI Всероссийской научно-технической конференции "Новые информационные технологии", М: МГАПИ, 2003.Т.2.С. 112-115.

3. Ерома А.А. "Автоматизированный анализ данных оперативного мониторинга" // Сборник трудов VI Всероссийской научно-технической конференции "Новые информационные технологии", М.: МГАПИ, 2003.Т.2.С. 115-117.

4. Ерома А.А., Никишин Д.А., Разработка автоматизированной информационной системы «Экологический мониторинг» // Сборник трудов IV конференции стипендиатов ИБРАЭ РАН (24-25 апреля 2003), М.: ИБРАЭ, 2003.С. 17-19.

5. Ашинянц Р.А., Ерома А.А. Методика интеллектуального оперативного мониторинга состояния сложных технологических объектов // Известия РАН. Энергетика. 2004.№5.С. 117-122.

6. Ерома А.А. Развитие методов интеллектуального анализа данных мониторинга сложных технологических объектов. Препринт №ИБРАЭ-2004-05. М.:ИБРАЭ,2004.35с.

»24181

Оглавление автор диссертации — кандидата технических наук Ерома, Алексей Анатольевич

ВВЕДЕНИЕ.

ГЛАВА 1. МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ.

1.1 АНАЛИЗ МЕТОДОВ.

1.1.1 КЛАССИФИКАЦИЯ.

1.1.2 КЛАСТЕРИЗАЦИЯ.

1.1.3 ПОИСК АССОЦИАТИВНЫХ ПРАВИЛ.

1.1.4 АНАЛИЗ ПОСЛЕДОВАТЕЛЬНОСТЕЙ.

1.1.5 ФОРМАЛЬНЫЙ КОНЦЕПТУАЛЬНЫЙ АНАЛИЗ.

1.1.6 ИНДУКЦИЯ КАУЗАЛЬНЫХ МОДЕЛЕЙ.

ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ.

ГЛАВА 2. МЕТОДИКА ИНТЕЛЛЕКТУАЛЬНОГО МОНИТОРИНГА СЛОЖНЫХ ТЕХНОЛОГИЧЕСКИХ ОБЪЕКТОВ.

2.1 ЗАДАЧА МОНИТОРИНГА.

2.2 ИНТЕЛЛЕКТУАЛЬНЫЙ МОНИТОРИНГ СЛОЖНЫХ ТЕХНОЛОГИЧЕСКИХ

ОБЪЕКТОВ.

2.3 ОПРЕДЕЛЕНИЕ НАБОРА ИСХОДНЫХ ДАННЫХ.

2.3.1 ВЫДЕЛЕНИЕ ГРУПП ПАРАМЕТРОВ.

2.3.2 УДАЛЕНИЕ ИЗБЫТОЧНОСТИ В НАБОРАХ ПАРАМЕТРОВ.

2.4 ПРЕДВАРИТЕЛЬНАЯ ПОДГОТОВКА ИСХОДНЫХ ДАННЫХ.

2.5 ОЦЕНКА ОТКЛОНЕНИЙ В РЕАЛЬНОМ ВРЕМЕНИ.

2.6 ДИНАМИЧНОСТЬ СВЯЗЕЙ ОБЪЕКТА МОНИТОРИНГА.

ВЫВОДЫ.

ГЛАВА 3. ПОСТРОЕНИЕ МОДЕЛИ ОБЪЕКТА ПО ДАННЫМ НЕПРЕРЫВНОГО МОНИТОРИНГА СЛОЖНЫХ ТЕХНОЛОГИЧЕСКИХ ОБЪЕКТОВ.

3.1 ИНДУКЦИЯ МОДЕЛИ ОБЪЕКТА ИЗ ДАННЫХ.

3.2 РАСЧЁТ МОДЕЛИ.

3.3 ИНТЕГРАЦИЯ ЗНАНИЙ ЭКСПЕРТОВ ПРЕДМЕТНОЙ ОБЛАСТИ.

3.4 ИНКРЕМЕНТАЛЬНАЯ ИНДУКЦИЯ МОДЕЛЕЙ.

ВЫВОДЫ.

ГЛАВА 4. РАСПРОСТРАНЕНИЕ МЕТОДИКИ МОНИТОРИНГА НА СЛУЧАЙ НЕЛИНЕЙНОСТИ ВЗАИМОСВЯЗЕЙ И НАЛИЧИИ ВРЕМЕННЫХ ЗАДЕРЖЕК.

4.1 НЕЛИНЕЙНОСТЬ ВЗАИМОСВЯЗЕЙ ПАРАМЕТРОВ.

4.2 МОДИФИКАЦИЯ МЕТОДИКИ ДЛЯ УЧЁТА ФАКТОРА ВРЕМЕННОЙ

ЗАДЕРЖКИ.

4.3 НЕЛИНЕЙНЫЕ МОДЕЛИ С ВРЕМЕННОЙ ЗАДЕРЖКОЙ.

ВЫВОДЫ.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Ерома, Алексей Анатольевич

1. Актуальность проблемы

Существует класс сложных технологических объектов, для которых в настоящее время отсутствуют надёжные методы анализа данных оперативного мониторинга. Этот класс объектов характеризуется:

1. Невозможностью организации активного эксперимента с целью создания математической модели;

2. Большим числом доступных для измерения параметров (сотни);

3. «Дрейфом» во времени отдельных параметров;

4. Отсутствием обоснований для необходимости измерений значительного числа параметров;

5. Отсутствием точных данных о взаимосвязях между параметрами и их влиянии на качество наблюдаемых процессов.

Объектами данного класса являются и атомные электростанции (АЭС), для которых оперативный мониторинг радиационной и технологической обстановки является чрезвычайно важной задачей при эксплуатации АЭС и неотъемлемым условием обеспечения безопасной и устойчивой работы.

Задаче анализа потока данных оперативного мониторинга сложных технологических систем, до настоящего времени не уделено должного внимания. В то время как во многих других сферах деятельности, таких как, телекоммуникации и т.п., массивы информации, накопленные в базах данных, активно используются для выявления скрытых внутренних закономерностей с последующим практическим применением извлечённых знаний. В качестве обзорной работы в направлении интеллектуального анализа данных можно назвать [13]. Примером успешного применения методов интеллектуального анализа к проблеме мониторинга в телекоммуникационных сетях служит работа [38].

В связи с этим актуальной является задача разработки методов и алгоритмов для системного анализа вектора данных оперативного мониторинга сложных технологических объектов с применением современных методов интеллектуального анализа данных, в целях усовершенствования характеристик существующих систем мониторинга. Эффективный анализ данных мониторинга возможен при создании средства интеллектуального анализа данных с использованием методов индукции статистических моделей, позволяющих выявить внутреннюю структуру вектора параметров оперативного мониторинга. Создание подобных систем «интеллектуального» мониторинга и средств автоматизированного анализа данных мониторинга позволит повысить эффективность системы мониторинга и будет способствовать повышению уровня безопасности при эксплуатации АЭС.

Разработка методов и алгоритмов для извлечения знаний из массива данных оперативного мониторинга сложных технологических объектов с использованием современных методов искусственного интеллекта и интеллектуального анализа данных, с последующим приложением разработанных алгоритмов и программ применительно к объектам атомной энергетики делают тему диссертации актуальной как в прикладном отношении, так и в научно-техническом плане.

2. Цель и задачи исследования

Целями настоящего исследования являются:

1. Создание методов интеллектуального анализа данных сложных технологических объектов;

2. Создание средств для системного анализа и обработки данных мониторинга;

3. Использование программных средств для обучения специалистов.

Для достижения этих целей нами поставлены следующие задачи:

1. Провести обзор методов интеллектуального анализа данных;

2. Разработать модифицированный алгоритм индукции, использующий знания экспертов предметной области в качестве эвристики при построении модели;

3. Разработать модифицированный алгоритм индукции нелинейных моделей, оценить сложность алгоритма;

4. Разработать методику мониторинга на основе индукции статистических моделей по данным оперативного мониторинга;

5. Разработать программный комплекс для оценки эффективности и точности алгоритмов методики на вычислительных экспериментах и данных наблюдения.

3. Научная новизна исследования

1. Модифицированный алгоритм индукции, использующий знания экспертов предметной области;

2. Модифицированный алгоритм индукции нелинейных моделей;

3. Методика интеллектуального оперативного мониторинга состояния сложных технологических объектов на базе индукции модели объекта по данным наблюдения.

Методы исследований, применённые в диссертационной работе, опираются на теоретические и методологические основы теории статистики, теории машинного обучения и теории баз данных и методы интеллектуального анализа данных.

4. Практическая значимость результатов исследования и их внедрение в практику

На базе разработанных методик и алгоритмов интеллектуального оперативного мониторинга создан программный комплекс «Пионер» для тренинга специалистов по поддержке принятия решений в случае радиационных аварий на АЭС. Разработанная система представляет собой эффективный инструмент для проведения тренинга служб радиационной разведки. Программный комплекс внедрён в практику работы Технического кризисного центра (ТКЦ) ИБРАЭ РАН, о чём имеется соответствующий акт.

Предложенная в настоящей работе методика интеллектуального мониторинга позволяет повысить эффективность систем мониторинга АЭС и способствует решению важных прикладных задач в области обеспечения экологической безопасности и безопасности персонала АЭС.

5. Апробация работы

Основные результаты диссертационной работы докладывались на конференциях:

1. V Международной научно-практической конференции "Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права" — Москва, 2002;

2. Всероссийской научно-технической конференции "Новые информационные технологии" — Москва, 2003;

3. IV конференции стипендиатов ИБРАЭ РАН, Москва, 2003;

4. Конференции Школы молодых ученых ИБРАЭ РАН, Москва, 2004.

6. Публикации

По теме диссертации опубликовано 6 научных работ, в том числе, 1 препринт (№ИБРАЭ-2004-05). Исследования по диссертации отражены в научно-исследовательских отчётах Института проблем безопасного развития атомной энергетики РАН (ИБРАЭ РАН).

7. Объём и структура диссертации

Диссертационная работа изложена на 167 страницах машинописного текста, состоит из введения, 4 глав, отражающих результаты исследований автора, заключения, библиографического указателя, включающего 93 источника, иллюстрирована 35 рисунками и 19 таблицами.

Заключение диссертация на тему "Средства интеллектуального анализа структуры связей по данным мониторинга сложных технологических объектов"

выводы

Предложен модифицированный алгоритм индукции нелинейных моделей, проведена проверка практической применимости алгоритма с использованием численного моделирования. Для нелинейного случая предложена эвристика, основанная на наличии нелинейной асимметрии, для ускорения процесса индукции и последующего уточнения модели. Применение эвристики позволяет снизить сложность задачи индукции модели и уменьшает неопределённость конечного класса эквивалентных моделей. Проведённая оценка вычислительной сложности модифицированного алгоритма индукции показывает возможность индукции нелинейных моделей в реальном масштабе времени, что делает возможным реализацию систем интеллектуального мониторинга для объектов с наличием выраженной нелинейности при передаче воздействия между отдельными узлами.

Разработан модифицированный алгоритм индукции моделей с временными задержками передачи воздействия. Предложенный метод позволяет проводить индукцию моделей с выраженными временными задержками передачи взаимодействия при использовании простых разделителей. Для данного случая предложена эвристика, основанная на наличии временной асимметрии, для ускорения процесса индукции и последующего уточнения модели. Применение эвристики снижает сложность задачи индукции модели и уменьшает неопределённость конечного класса эквивалентных моделей. Проведённая оценка временной сложности модифицированного алгоритма индукции показала возможность индукции моделей с временными задержками в реальном масштабе времени, что делает возможным реализацию систем интеллектуального мониторинга для объектов с наличием выраженных временных задержек при передаче воздействия. Для отдельного подкласса моделей, а именно для моделей с согласованными временными задержками (СВЗ), процесс индукции сводится к индукции обычных линейных моделей, при этом сложность алгоритма незначительно превосходит сложность индукции обычных линейных моделей, что позволяет для данного класса моделей вести мониторинг большого числа параметров.

Предложен модифицированный алгоритм индукции для общего темпорально-нелинейного случая. Целью подобной интеграции является анализ структуры данных мониторинга независимо от наличия нелинейной или временной составляющих. Для общего случая, также предложено использовать эвристику, основанную на асимметрии передачи воздействия для уменьшения пространства поиска. Тем не менее, оценки вычислительной сложности алгоритмов индукции говорят о сильной ресурсоёмкое™ этого общего метода, что объясняется необходимостью перебора многократно большего пространства поиска, по сравнению с нелинейным или временным подходом в отдельности. Это обстоятельство существенно ограничивает возможности практического использования обобщённого метода нелинейно-временной индукции для задач интеллектуального мониторинга. Для класса нелинейных моделей с согласованными временными задержками (НСВЗ) процесс индукции сводится к индукции нелинейных линейных моделей, при этом сложность алгоритма незначительно превосходит сложность индукции нелинейных моделей, что позволяет для класса НСВЗ-моделей вести мониторинг вести интеллектуальный мониторинг в полном объёме. Рассмотрен вопрос о возможности практической реализации модифицированного алгоритма и сформулированы направления для дальнейших исследований.

ЗАКЛЮЧЕНИЕ

В работе выполнен системный анализ существующих методов интеллектуального анализа данных. Результаты настоящей работы состоят в следующем:

S Предложенная новая комплексная методика интеллектуального оперативного мониторинга состояния сложных технологических объектов на базе индукции статистической модели объекта, позволяет, в отличие от существующих методик мониторинга, выявлять структурные отклонения в технологических цепях по данным оперативного мониторинга;

S Анализ факторов, влияющих на точность и время реакции системы мониторинга, построенной на базе статистической индукции внутренней модели объекта, проведённый на вычислительных экспериментах, показал возможность надёжной работы (т.е. выдерживаются приемлемые частоты ложных срабатываний и пропусков структурных отклонений) подобной системы мониторинга, при условии достаточности данных наблюдения;

S Анализ точности и скорости алгоритмов индукции моделей в зависимости от количества рассматриваемых параметров модели и других характеристик исходных моделей, проведённый на численных экспериментах, показал, что для групп параметров небольшой размерности (десятки параметров) индукция модели и, соответственно, процесс интеллектуального мониторинга могут проводиться в режиме реального времени на современных ПЭВМ;

S Предложенная модифицированная методика интеллектуального мониторинга с использованием множества эталонных моделей и динамическим обновлением эталонов, позволяет выявлять структурные отклонения в технологических цепях по данным оперативного мониторинга не только для объектов с фиксированными внутренними связями, но также и для объектов с изменяющимися внутренними связями;

S Разработанный на базе существующего алгоритма индукции (/С-алгоритма) новый алгоритм индукции, использующий знания экспертов предметной области, выраженные при помощи логики предикатов первого порядка, в качестве направляющей информации, позволяет повысить скорость индукции модели по исходным данным и уменьшить неопределённость получаемой модели.

S Предложенная дополнительная эвристика, позволяет существенно ускорить процесс индукции моделей в случае периодически повторяющейся индукции моделей по данным оперативного мониторинга;

S Разработанный на базе существующего алгоритма индукции (/С-алгоритма) новый алгоритм индукции нелинейных моделей, делает возможным индукцию моделей даже при наличии нелинейной взаимосвязи между параметрами. Предложенная для этого алгоритма эвристика, основанная на наличии асимметрии вследствие нелинейности, способствует ускорению процесса индукции, уменьшению неопределённости и уточнению получаемой модели. Проведённая оценка временной сложности нового алгоритма индукции показала возможность индукции небольших моделей (десятки параметров) на современных ПЭВМ в реальном времени;

S Разработанный на базе существующего алгоритма индукции (/С-алгоритма) новый алгоритм индукции моделей с временными задержками передачи воздействия, позволяет извлекать модели даже при наличии временного запаздывания при передаче воздействия между параметрами. Предложенная для этого алгоритма эвристика, основанная на наличии временной асимметрии, способствует ускорению процесса индукции, уменьшению неопределённости и уточнению получаемой модели. Проведённая оценка временной сложности нового алгоритма индукции показала возможность индукции небольших моделей (десятки параметров) для тривиального случая с временными задержками (СВЗ-модели) и малых моделей (десяток параметров) для общего случая на современных ПЭВМ в реальном времени;

S Разработанный на базе существующего алгоритма индукции (/С-алгоритма) новый алгоритм индукции нелинейных моделей с временными задержками передачи воздействия, позволяет извлекать модели, как при наличии временного запаздывания, так и при наличии нелинейности при передаче воздействия. Предложенная эвристика, использующая нелинейную и временную асимметрии, позволяет существенно ускорить процесс индукции. Тем не менее, проведенные оценки временной сложности модифицированного алгоритма индукции показали, что индукция подобных моделей в реальном времени на современных ПЭВМ возможна лишь для малых моделей (менее десяти параметров);

S Разработанный в рамках настоящего исследования оригинальный программный комплекс позволяет оценить эффективность и точность работы алгоритмов индукции и предложенной методики интеллектуального оперативного мониторинга на вычислительных экспериментах и реального данных оперативного мониторинга. Программный комплекс внедрён в Кризисный Центр Института проблем безопасного развития атомной энергетики (ИБРАЭ РАН), о чём имеется соответствующий акт.

Разработка и экспериментальная апробация комплексной методики интеллектуального оперативного мониторинга, а также развитие существующих методов индукции для использования знаний экспертов предметной области и для индукции нелинейных моделей и моделей с временными задержками стали возможным благодаря комплексному использованию теоретических и экспериментальных методов исследования. В частности, в рамках настоящей работы разработан программный комплекс, в рамках которого осуществляется моделирование системы датчиков сложного технологического объекта и реализуется экспериментальный мониторинг состояния объекта в рамках предложенной методики. Экспериментальные и теоретические исследования и разработка программного комплекса проводились на экспериментально-технической базе Института проблем безопасного развития атомной энергетики Российской Академии Наук (ИБРАЭ РАН).

Предложенная в настоящей работе методика интеллектуального мониторинга позволяет повысить эффективность систем мониторинга АЭС и способствует решению важных прикладных задач в области обеспечения экологической безопасности и безопасности персонала АЭС.

Первый Института развития (ИБМЭ

Библиография Ерома, Алексей Анатольевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Agrawal R., Imielinski Т., Swami A., "Mining association rules between sets of items in large databases", // In Proc. Of the ACM SIGMOD Int'l Conf. On Management of Data (ACM SIGMOD '93), Washington, USA, May 1993.

2. Agrawal R., Srikant R., "Fast algorithms for mining association rules", // In Proc. of the 20th Int'l Conf. on Very Large Databases (VLDB '94), Santiago, Chile, June 1994.

3. Hipp J., Guntzer U., Nakhaeizadeh G., "Algorithms for Association Rule Mining A General Survey and Comparison", // SIGKDD Explorations, July 2000, Volume 2, Issue 1, Pages 58-64.

4. Hilderman R. J., Hamilton H. J., "Knowledge Discovery and Interestingness Measures: A Survey" // Computer Science Department, University of Regina, technical report TR-04, 1999.

5. Rainsford C.P., Roddick J.F., "Database issues in knowledge discovery and data mining" // The Australian Journal of Information Systems AJIS Editions Vol 6, №2,1999.

6. Manilla Heikki. "Methods and problems in data mining" // Database Theory ICDT'97, 6th International Conference, Delphi, Greece, January 1997, p. 41-55.

7. Han J., Fu Y., "Dynamic Generation and Refinement of Concept Hierarchies for Knowledge Discovery in Databases" // In Proc. AAAI'94 Workshop on Knowledge Discovery in Databases (KDD'94), p. 157-168, Seattle, WA, July 1994.

8. Han J., Fu Y., "Discovery of Multiple-Level Association Rules from Large Databases", // In Proc. of the 21th Int'l Conf. on Very Large Databases (VLDB '95), Zurich, Swizerland, 1995.

9. Kuok C.M., Fu A., Wag H., "Mining Fuzzy Association Rules in Databases" // SIGMOD Record, Vol. 27, No. 1, March 1998, pp. 41-46.

10. Mannila H., "Local and Global Methods in Data Mining: Basic Techniques and Open Problems", // To appear in: ICALP 2002, 29th International Colloquium on Automata, Languages, and Programming, Malaga, Spain, July 2002.

11. Mannila H., Toivonen H., "Discovering generalized episodes using minimal occurrences" // 2nd International Conf. On Knowledge Discovery and Data Mining, August 1996.

12. Manilla H., Toivonen H., Verkamo A.I., "Discovery of frequent episodes in event sequences", // Series of Publication C, Report C-1997-15, Department of Computer Science, University of Helsinki, Finland, 1997.

13. Holsheimer M., Siebes A.P.J.M. "Data Mining: the search for knowledge in databases", // Report CS-R9406, Computer Science/Department of Algorithmics and Architecture, CWI, 1994.

14. Rousu J., "Efficient Range Partitioning in Classification Learning", // Department of Computer Science, Series of Publications A, Report A-2001-1, University of Helsinki, Finland, 2001.

15. Matheus C.J., Chan P.K., Piatetsky-Shapiro G., "Systems for Knowledge Discovery in Databases", // To appear in the IEEE TKDE special issue on Learning & Discovery in Knowledge-Based Databases, 1993.

16. Agrawal R., Ghosh S., Imielinski Т., Swami A., "An Interval Classifier for Database Mining Applications", // In Proc. 18th International Conference on Very Large Data Bases, pages 560-573, Vancouver, Canada, 1992.

17. Cai Y., Cercone N., Han J., "An attribute-oriented approach for learning classification rules from relational databases", // In Proc. 6th International Conference on Data Engineering, Los Angeles, CA, IEEE Computer Science Press, Pages 281-288,1990.

18. Chan K.C.C., Wong A.K.C., "A statistical technique for extracting classificatory knowledge from databases", // In Knowledge Discovery in Databases, AAAI Press/MIT Press, Cambridge, MA, Pages 107-123, Ch. 6, 1991.

19. Smyth P., "Clustering using Monte Carlo Cross-Validation", // In Proc. Second International Conference on Knowledge Discovery and Data Mining (KDD '96), Portland, Oregon, AAAI Press, Menlo Park, California, Pages 126-133,1996.

20. Berkhin P., "Survey of Clustering Data Mining Techniques", // San Jose, С A, Accrue Software, 2002.

21. Olson C., "Parallel algorithms for hierarchical clustering", // Parallel Computing, №21, 1995, p. 1313-1325.

22. Ester M., Kriegel H.P., Sander J., Xu X., "A density-based algorithm for discovering clusters in large spatial database with noise", // In Proceeding of the 2nd ACM SIGKDD, Portland, Oregon, 1996, p. 226-231.

23. Hinneburg A., Keim D., "An efficient approach to clustering large multimedia databases with noise", // In Proceeding of the 4th ACM SIGKDD, 58-65, New York, NY, 1998.

24. Wille R., "Conceptual Structures of Multicontexts", // ICCS1996, p. 23-39.

25. Wille R., "Why can concept lattices support knowledge discovery in databases?", // Preprint / Techn. Univ. Darmstadt, N 2158-01, 2001.

26. Stumme, G., Wille, R., Wille, U., "Conceptual Knowledge Discovery in Databases Using Formal Concept Analysis Methods", // PKDD '98, LNAI1510, p. 450-458,1998.

27. Stumme G., R. Taouil, Y. Bastide, "Fast Computation of Concept lattices Using Data Mining Techniques", // KRDB 2000, p. 129-139.

28. Prediger S., "Logical Scaling in Formal Concept Analysis", // Preprint / Techn. Univ. Darmstadt, N1907, 1998.

29. Herrmann C., Holldobler S., Strohmaier A., "Fuzzy Conceptual Knowledge Processing", // SAC 1996, p. 628-632, 1996.

30. Stumme G., Taouil R., Bastide Y., Pasquier N., Lakhal L., "Intelligent Structuring and Reducing of Association Rules with Formal Concept Analysis", // KI/OGAI2001, p. 335350,2001.

31. Cohen P.R., Ballesteros L.A., Gregory D.E., Amant R.St., "Automating Path Analysis for Building Causal Models from Data", // Technical Report 93-38 / Department of Computer Science, University of Massachusetts, 1993.

32. Cohen P.R., Ballesteros L.A., Gregory D.E., Amant R.St., "Regression Can Build Predictive Causal Models", // Technical Report 94-15 / Department of Computer Science, University of Massachusetts, 1994.

33. Pearl J., Verma TS., "A Statistical Semantics for Causation", // Preprint // Cognitive Systems Laboratory, Computer Science Department, University of California, 1991.

34. Pearl J., Verma T.S., "A Theory of Inferred Causation", Statistics and Computing, №2, 1991.

35. Borgelt C., Kruse R., "A Critique of Inductive Causation", // Preprint / Department of Knowledge Processing and Language Engineering, Otto-von-Guericke-University of Magdeburg, 1999.

36. Ballestros L., "Regression Based Causal Induction With Latent Variable Models", In Proceedings of the Twelfth National Conference on Artificial Intelligence, AAAI Press / MIT Press, 1994.

37. Lane Т., Brodley C.E. "An Application of Machine Learning to Anomaly Detection", // In Proc. 20th NIST-NCSC National Information Systems Security Conference, 1997.

38. Agrawal R., Srikant R. "Mining Sequential Patterns", // In Proc. of the 11th Int'l Conference on Data Engineering, Taipei, Taiwan, March 1995.

39. Michalski R.S., Carbonell J.G., Mitchell T.M., "Machine learning an artificial intelligence approach", // Springer-Verlag, Berlin, 1984.

40. Fisher D., "Optimization and simplification of hierarchical clustering", // In Proc. First International Conference on Knowledge Discovery and Data Mining (KDD-95), Montral, Quebec, Canada, AAAI Press, Menlo Park, California, p. 344-346, 1995.

41. Quinlan J.R., "Induction of Decision Trees" // Machine Learning №1, pp. 81-106, Kluwer Academic Publishers, 1986.

42. Sibson R., "SLINK: An optimally efficient algorithm for the singlelink cluster method", Сотр. J.1973,16, pp. 30-34.

43. Defays. D., "An Efficient Algorithm for a Complete Link Method" // "The Computer Journal", Vol. 20, № 4, pp. 364-366,1977.

44. Kaufman L., Rousseeuw P. J., "Finding Groups in Data: an Introduction to Cluster Analysis", // John Wiley & Sons, 1990.

45. Ester M., Kriegel H.P., Sander J., Xu X.: "A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise" // 2nd int. Conf. on Knowledge Discovery and Data Mining (KDD'96), Portland, Oregon, 1996, AAAI Press, 1996.

46. Hinneburg A., Keim D.A., "An Efficient Approach to Clustering in Large Multimedia Databases with Noise" // "Knowledge Discovery and Data Mining", pp. 58-65,1998.

47. Mannila H., Toivonen H., Verkamo A.I., "Efficient Algorithms for Discovering Association Rules" // KDD Workshop 1994, pp. 181-192, 1994.

48. Agrawal R., Srikant R., "Fast Algorithms for Mining Association Rules" // IBM Research Report RJ9839, IBM Almaden Research Center, San Jose, California, USA, 1994.

49. Park J.S., Chen M.S., Yu P.S. "An Effective Hash Based Algorithm for Mining Association Rules", // Proceedings of the 1995 ACM SIGMOD International Conference on Management of Data, San Jose, California, pp. 175—186, 1995.

50. Savasere A., Omiecinski E., Navathe S.B., "An Efficient Algorithm for Mining Association Rules in Large Databases" // Proceedings of 21th International Conference on Very Large Data Bases, September 11-15, 1995, Zurich, Switzerland, pp. 432-444, 1995.

51. Srikant R., Agrawal R., "Mining Generalized Association Rules", // Proceedings of 21th International Conference on Very Large Data Bases, September 11-15, 1995, Zurich, Switzerland, pp. 407-419,1995.

52. Srikant R., Agrawal R., "Mining Quantitative Association Rules in Large Relational Tables", Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, Montreal, Quebec, Canada, June 4-6, pp. 1-12, ACM Press, 1996.

53. Reichenbach H., "The Direction of Time", // University of California Press, Berkeley and Los Angeles, 1956.

54. Schemes R., "Estimating Latent Causal Influence: TETRAD II Model Selection and Bayesian Parameter Estimation", In Proceedings of the 6th International Workshop on Artificial Intelligence and Statistics, 1996.

55. Spirtes P., "Building Causal Graphs from Statistical Data in the Presence of Latent Variables", in Logic, Methodology, and the Philosophy of Science IX, ed. by D. Prawitz, B. Skyrms, and D. Westerstahl, Elsevier Science, pp. 813-829, 1994.

56. Spirtes P., Richardson Т., Meek C., "Heuristic Greedy Search Algorithms for Latent Variable Models", In Proceedings of the 6th International Workshop on Artificial Intelligence and Statistics, 1996.

57. Spirtes, P., Schemes, R., Glymour, C., "Simulation Studies of the Reliability of Computer Aided Model Specification using the TETRAD, EQS,and LISREL Programs", // Sociological Methods and Research, Vol. 19, No. 1, pp. 3-66,1990.

58. Pearl J., "Graphs, Causality, and Structural Equation Models", // Technical Report (R-253) Department of Computer Science, University of California, Los Angeles, To appear in Sociological Methods and Research, Special Issue on Causality, 1998.

59. Tian J., Paz A., Pearl J., "Finding Minimal D-separators", Cognitive Systems Laboratory Computer Science Department University of California, Los Angeles, Department of Computer Science, 1998.

60. J. An and A. Owen, "Quasi-regression", Technical report, Stanford University, Statistics Department, 1999.

61. L.R. Rabiner, "A tutorial on Hidden Markov Models and selected applications in speech recognition", // In Proceeding of the IEEE, 1989.

62. P. Smyth, "Hidden Markov monitoring for fault detection in dynamic systems", // Pattern Recognition, p. 149-164, 1994.

63. P. Smyth, "Markov monitoring with unknown states". // IEEE Journal on Selected Areas in Communications, special issue on intelligent signal processing for communications, p. 1600-1612, 1994.

64. A. Pozdnukhov, V.Timonin, M. Kanevski, E. Savelieva, S. Chernov "Classification of Environmental Data with Kernel Based Algorithms" // Preprint IBRAE-2002-09, Moscow: Nuclear Safety Institute RAS, 2002, p. 22.

65. Шеннон К. Э., "Работы по теории информации и кибернетике" (Под ред. P.JI. Добрушина, О.Б. Лупанова), Москва, ИЛ, 1963.

66. Андерсон Т., "Статистический анализ временных рядов", Мир, Москва, 1976.

67. Кендэл М., "Временные ряды", «Финансы и статистика», Москва, 1981.

68. Айвазян С.А., Енюков И.С., Мешалкин Л.Д., "Прикладная статистика: Исследование зависимостей", «Финансы и статистика», Москва, 1989.

69. Браверман Э.М., Мучник И.Б., "Структурные методы обработки эмпирических данных", Наука, Москва, 1983.

70. Лумельский В.Я., "Группировка параметров на основе квадратной матрицы связей", АиТ, №1. С. 133-143, 1970.

71. Олдендерфер М.С., Блэшфилд Р.К. "Факторный, дискриминантный и кластерный анализ", «Финансы и статистика», Москва, 1989.

72. Оре О., "Теория графов", Наука, Москва, 1968.

73. Леман Э., "Теория точечного оценивания", Наука, Москва, 1991.

74. Бриллинджер Д., "Временные ряды: Обработка данных и теория", Мир, Москва, 1980.

75. Бокс Дж., Дженкинс Г., "Анализ временных рядов. Прогноз и управление", Выпуск 1,2, Мир, Москва, 1974.

76. Бендат Дж., Пирсол А., "Применение корреляционного и спектрального анализа", Мир, Москва, 1983.

77. Бендат Дж., Пирсол А., "Прикладной анализ случайных данных", Мир, Москва, 1989.

78. Г. Корн и Т. Корн., "Справочник по математике для научных работников и инженеров", Пер. с англ. под общей редакцией И. Г. Арамановича, Наука, Москва, 1968.

79. Браверман Э.М., "Методы экстремальной группироваки параметров и задача выделения существенных факторов" // журнал "Автоматика и телемеханика", №1, стр. 123-132, Наука, Москва, 1970.

80. Заруцкий В.И., "Классификация нормальных векторов простой структуры в пространстве большой размерности", // В кн. "Прикладной многомерный статистический анализ", М., 1978, с. 37-51.

81. Заруцкий В.И., "О выделении некоторых графов связей для нормальных векторов в пространстве большой размерности", // В кн. "Алгоритмическое и программное обеспечение прикладного статистического анализа", М. 1980, с. 189-208.

82. Лумельский В.Я., "Группировка параметров на основе квадратной матрицы связи" // журнал "Автоматика и телемеханика", №1, стр. 133-142, Наука, Москва, 1970.

83. Савельева Е.А., "Аналитический обзор методов анализа и оптимизация сети мониторинга" // Препринт ИБРАЭ-2000-03, Москва, ИБРАЭ, 2000, 39 р.

84. Ашинянц Р.А., "Логические методы анализа данных" // Труды Международной научно-технической конференции IEEE AIS'02, "Искусственные интеллектуальные системы", Москва, Физматлит, 2002.

85. Ерома А.А. "Индукция причинно-следственных связей в интеллектуальном анализе данных" // Сборник трудов VI Всероссийской научно-технической конференции "Новые информационные технологии", том 2, стр. 112-115, МГАПИ, Москва, 2003.

86. Ерома А. А. "Автоматизированный анализ данных оперативного мониторинга" // Сборник трудов VI Всероссийской научно-технической конференции "Новые информационные технологии", том 2, стр. 115-117, МГАПИ, Москва, 2003.

87. Ерома А.А., Никишин Д.А., "Разработка автоматизированной информационной системы «Экологический мониторинг»" // Сборник трудов IV конференции стипендиатов ИБРАЭ РАН, 24-25 апреля 2003, стр. 17-19, ИБРАЭ, Москва, 2003.

88. Ашинянц Р.А., Ерома А.А. "Методика интеллектуального оперативного мониторинга состояния сложных технологических объектов", Известия Академии Наук 2004 г. №5, книга "Энергетика", стр. 117-122, Москва, 2004.

89. Ерома А.А. "Развитие методов интеллектуального анализа данных мониторинга сложных технологических объектов" // Препринт №ИБРАЭ-2004-05, Институт проблем безопасного развития атомной энергетики, 35с., Москва, 2004.