автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Синтез нейросетевых структур для моделирования управляемых объектов с распределенными параметрами
Автореферат диссертации по теме "Синтез нейросетевых структур для моделирования управляемых объектов с распределенными параметрами"
На правах рукописи
Трофимов Александр Геннадьевич
СИНТЕЗ НЕЙРОСЕТЕВЫХ СТРУКТУР ДЛЯ МОДЕЛИРОВАНИЯ УПРАВЛЯЕМЫХ ОБЪЕКТОВ С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ
Специальность 05.13.01 - системный анализ, управление и обработка информации (научное обслуживание)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Автор.
Москва-2008
003169081
Работа выполнена в Московском инженерно-физическом институте (государственном университете)
Научный руководитель кандидат технических наук, доцент
МИШУЛИНА Ольга Александровна
Официальные оппоненты доктор технических наук, профессор
ГАЛУШКИН Александр Иванович, Центр информационных технологий и систем органов исполнительной власти
кандидат технических наук, доцент ТЮМЕНЦЕВ Юрий Владимирович, Московский авиационный институт (государственный технический университет)
Ведущая организация Московский государственный технический
университет им Н Э Баумана
Защита состоится «04» июня 2008 г в 16 час 00 мин на заседании диссертационного совета Д212 130 03 при Московском инженерно-физическом институте (государственном университете) по адресу Москва. Каширское ш , 31 (ауд 408 главного корпуса)
С диссертацией можно ознакомиться в библиотеке Московского инженерно-физического института (государственного университета)
Отзывы в двух экземплярах, заверенные печатью, просьба направлять по адресу Каширское ш, 31, диссертационные советы МИФИ (тел 323-95-26)
Автореферат разослан «23 » апреля 2008 г
Ученый секретарь диссертационного совета, д т н, профессор
Шумилов Ю Ю
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследований. Распределенные динамические объекты встречаются в различных областях науки и техники физике, экономике, медицине, геологии и пр В отличие от систем с сосредоточенными параметрами, состояние которых в каждый момент времени характеризуется вектором конечной размерности, для распределенных систем состояние описывается функцией одной или нескольких переменных, обычно интерпретируемых как пространственные координаты Проблема моделирования и управления такими объектами связана не только с их распределенностью и нелинейностью, но и с возможным отсутствием априорной информации о внутреннем устройстве моделируемой системы и закономерностях ее функционирования В этом случае практически единственным подходом к построению модели объекта остается использование экспериментальных данных о его функционировании
Активное развитие классической теории идентификации, наблюдавшееся в 70-80-ых годах прошлого века, преимущественно было направлено на моделирование систем с сосредоточенными параметрами, в то время как распределенным системам уделялось существенно меньшее внимание Основными причинами этого являлись сложность распределенной природы моделируемого объекта и трудности применения классических подходов
В последнее время наблюдается рост интереса к применению современных информационных технологий, в частности, нейросетевой технологии, к задачам моделирования распределенных динамических объектов Связано это, по всей видимости, с целым рядом факторов, среди которых можно отметить разнообразие практических приложений, трудности применения стандартных методов идентификации вследствие нелинейности моделей, большого объема данных, неточности их измерений, высокая вычислительная сложность классических методов моделирования распределенных систем
Успех применения нейронных сетей в математическом моделировании в основном связан с задачами обработки статических данных, в то время как нейросетевому моделированию динамических объектов уделяется существенно меньшее внимание Математические модели в классе нейронных сетей обладают рядом замечательных свойств, связанных с их
адаптивностью и способностью к генерализации данных, что говорит об их перспективности в рассматриваемой области
Большинство методов идентификации распределенных объектов предполагают известным вид уравнения с частными производными, описывающего моделируемый объект, а задача идентификации сводится к подбору параметров этого уравнения, при которых удовлетворяются заданные граничные и начальные условия или обеспечивается наилучшее соответствие результатам наблюдений В зависимости от типа этого уравнения, как правило, применяются различные методы решения Нейросетевой подход позволяет единым способом решать задачи идентификации объектов, описываемых дифференциальными уравнениями различных типов.
Среди отечественных научных исследований, посвященных проблеме нейросетевого решения уравнений математической физики, особо можно выделить работы Д А Тархова, А Н Васильева, В И Горбаченко Многие работы в этой области являются узкоспециализированными и посвящены нейросетевому решению уравнений определенных типов либо предполагают нейросетевую реализацию классических методов их численного решения
В связи с этим создание нейросетевых моделей и методов идентификации систем с распределенными параметрами в отсутствие информации о виде описывающих систему дифференциальных уравнений и конструирование соответствующих нейросетевых алгоритмов представляют актуальную и недостаточно изученную научную проблему
К управляемым распределенным процессам относится процесс энерговыделения в активной зоне ядерного реактора Знание трехмерного поля энерговыделения требуется для обеспечения безопасности эксплуатации реактора Это связано с тем обстоятельством, что только на трехмерном поле энерговыделения можно определить критические теплофизические параметры безопасности
В настоящее время существует ряд программных моделей поля энерговыделения, используемых на атомных электростанциях (АЭС) и для проведения научных исследований Эти модели имеют приемлемую погрешность восстановления локального энерговыделения в стационарном или медленно меняющемся состоянии реактора, в то время как в переходных режимах точность расчетов значительно ухудшается Поскольку физические модели основаны на численном решении уравнений математической физики, повышение требований к точности неизбежно приводит к снижению их быстродействия Кроме того, для физического расчета необходима
адекватная информация о состоянии и параметрах активной зоны, которая не всегда известна с требуемой точностью
В связи с этим актуальна проблема построения адекватной быстродействующей модели поля энерговыделения в активной зоне реактора, возможное использование которой в качестве советчика оператора позволит повысить эффективность эксплуатации ядерной энергетической установки
Объектом исследования диссертации являются управляемые системы с распределенными параметрами, к которым относится активная зона ядерного реактора типа ВВЭР-1000
Предметом исследования являются методы идентификации управляемых систем с распределенными параметрами на основе экспериментальных данных в классе нейросетевых моделей
Цель и задачи диссертационной работы. Диссертация посвящена созданию нейросетевых моделей и методов идентификации управляемых систем с распределенными параметрами и методических рекомендаций по их применению Достижение поставленной цели предполагает решение следующих основных задач
1 Формальное описание и теоретическое обоснование класса моделей, в рамках которого предполагается решать задачу идентификации управляемого распределенного объекта
2 Интерпретация моделей в нейросетевых терминах, позволяющая использовать для идентификации методы теории нейронных сетей, и синтез соответствующих нейросетевых моделей
3 Разработка методов и алгоритмов настройки параметров нейросетевых моделей в соответствии с выбранным критерием оптимальности
4 Формирование набора показателей для оценки точности обученных нейросетевых моделей управляемых распределенных объектов и предложений по их использованию
5 Разработка специализированной программной системы для проведения исследований нейросетевых моделей рассматриваемого типа
6 Применение предложенных нейросетевых моделей и алгоритмов для решения прикладной задачи идентификации распределенных процессов энерговыделения в активной зоне ядерного реактора при совершении маневра мощности
7 Экспериментальные исследования построенных моделей энерговыделения средствами разработанного программного обеспечения и оценка их точности и обобщающей способности
Методы исследования. Основой для создания нейросетевых моделей и алгоритмов и проведения экспериментальных исследований являются теория идентификации динамических систем, теория нейронных сетей, теория дифференциальных уравнений в частных производных и обыкновенных дифференциальных уравнений, численные методы решения дифференциальных уравнений, методы оптимизации и статистические методы анализа данных
Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной
1 Предложены и теоретически обоснованы два новых класса моделей управляемых объектов с распределенными параметрами, в рамках которых возможна декомпозиция задачи идентификации на отдельные подзадачи
2 Предложена нейросетевая интерпретация моделей указанных классов в виде нейросетевых структур - совокупности связанных нейросетевых модулей различных архитектур Применение нейроструктурных моделей является новым подходом в теории идентификации распределенных систем
3 Разработаны два подхода к обучению нейросетевых структур рассматриваемых классов последовательное и совместное обучение Предложенный алгоритм совместного обучения обобщает классический метод обратного распространения ошибки во времени на случай нейросетевых структур и является новым в теории нейронных сетей
4 Нейроструктурный подход применен для решения задач моделирования распределенных процессов энерговыделения в активной зоне ядерного реактора Построенные нейроструктурные модели являются новыми и не применялись ранее в математическом моделировании физических процессов в реакторной установке
5 Проведены серии компьютерных экспериментов, подтверждающие точность и обобщающую способность построенных нейроструктурных моделей процессов энерговыделения в активной зоне реактора
Обоснованность и достоверность результатов обеспечиваются корректностью применения математического аппарата и сопоставлением результатов компьютерных экспериментов созданных нейроструктурных моделей с данными сертифицированной программы NOSTRA, реализующей численный расчет соответствующих физических моделей
Практическая значимость работы.
1 Нейроструктурные модели энерговыделения, обученные на реальных данных, полученных с помощью датчиков системы внутриреакторного контроля (СВРК) АЭС, могут быть использованы в качестве советчика оператора Использование такой быстродействующей модели совместно с аппаратурой СВРК позволит повысить безопасность эксплуатации ядерной энергетической установки в маневренном режиме
2 Построенная динамическая модель управляемого аксиального профиля энерговыделения в активной зоне может быть использована для коррекции показаний датчиков аппаратуры контроля нейтронного потока, что позволит получить более точную информацию о состоянии активной зоны и, как следствие, повысить эффективность эксплуатации ядерной энергетической установки в маневренном режиме
3 Разработанное в диссертации методическое, алгоритмическое и программное обеспечение может быть использовано в учебных курсах по современным методам математического моделирования и нейроинформатике, что позволит повысить уровень подготовки специалистов
4 Предложенные модели и методы идентификации динамических систем в классе нейросетевых структур могут быть применены для решения прикладных задач в других проблемных областях В работе описаны две подобные задачи моделирование процессов гибели опухолевых клеток в живых тканях в условиях гипертермического воздействия и траекторное управление самолетом, который совершает оборонительный маневр от атакующей его ракеты
Реализация результатов работы. Математические модели, методы, алгоритмы и научно-практические рекомендации диссертации применены при решении задач моделирования физических процессов в активной зоне реактора ВВЭР-1000 и могут быть использованы при решении задач управления
Полученные в диссертационной работе результаты используются в учебном процессе кафедр "Кибернетика" и "Теплофизика" МИФИ (Москва)
Созданное методическое и алгоритмическое обеспечение, а также практические рекомендации по обучению нейросетевых структур были применены при разработке системы распознавания символьной информации (ООО "ACT", Москва)
Использование результатов диссертационной работы и достигнутый при этом эффект подтверждены соответствующими актами
Апробация работы. Основные положения диссертации докладывались на следующих всероссийских и международных семинарах и конференциях
• Международная научно-техническая конференция "Интеллектуальные и многопроцессорные системы" (Геленджик, 2003)
• Всероссийская научно-техническая конференция "Нейроинфор-матика" (Москва, МИФИ, 2005,2006, 2008)
• Всероссийская конференция "Нейросетевые алгоритмы решения задач математической физики" (Москва, НИИАА, 2007).
• Междисциплинарный научный семинар "Экобионика" (Москва, МГТУ им Н Э Баумана, 2008)
• Annual Meeting of the European Society for Hyperthermic Oncology (Berlin 2006, Prague 2007)
• World Congress on Medical Physics and Biomedical Engineering (Seoul 2006)
• Научная сессия Российского научно-технического общества радиотехники, электроники и связи им А С Попова (Москва, 2007)
• Научная сессия МИФИ (Москва, МИФИ, 2005, 2006, 2007, 2008)
• Международный научно-технический семинар "Современные технологии в задачах управления, автоматики и обработки информации" (Алушта, МАИ, 2005, 2006,2007,2008)
Результаты диссертации использованы в отчетах по проектам РФФИ (№ 05-08-01421) и МНТЦ (#2221)
Публикации результатов. Основные результаты диссертации опубликованы в 26 печатных научных работах, среди которых 2 статьи - в периодических научных изданиях, рекомендованных ВАК России, 8 работ -в статьях и материалах конференций
На защиту выносятся:
1 Новый тип нейросетевых математических моделей управляемых объектов с распределенными параметрами - нейросетевые структуры - в рамках которых предлагается решать задачу идентификации
2 Два подхода к обучению нейроструктурных моделей последовательное, предполагающее обучение отдельных модулей структуры в определенной последовательности, и совместное, основанное на алгоритме обратного распространения ошибки во времени Оба подхода допускают обобщение на более широкий класс нейросетевых структур
3 Построенные в классе нейросетевых структур модели управляемых распределенных процессов энерговыделения в активной зоне ядерного реактора типа ВВЭР-1000 модель энерговыделения в фиксированном узле активной зоны, модель аксиального профиля энерговыделения тепловыделяющей сборки, модель поля энерговыделения активной зоны
4 Результаты компьютерных экспериментов построенных нейроструктурных моделей энерговыделения, демонстрирующих точность и обобщающие способности моделей в ограниченной области типовых управляющих воздействий, а также практические рекомендации по их обучению
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, библиографического списка и четырех приложений Основная часть работы содержит 148 страниц машинописного текста, включая 14 таблиц, 58 рисунков и перечень использованной литературы из 128 наименований
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы исследования, формулируются цель и решаемые в работе задачи, отмечаются научная новизна, практическая значимость работы, приводятся основные положения, выносимые на защиту, кратко излагается содержание диссертации
В первой главе дается формулировка задачи идентификации управляемого динамического объекта с распределенными параметрами Определяется исследуемый класс математических моделей распределенных систем
= ,s?(x,0,u(t),uXt), ym,(0,Y«)>
y{x,t) = ^(x,s{x,t),j{x)], x eQ, t&T,
где t,x - время функционирования и пространственные координаты соответственно, u(t) - вектор управляющих воздействий в момент времени t, s(x, t), у(х, t), у(х) - векторы состояния, выходов и параметров системы соответственно, ф - оператор эволюции системы, \\i - функциональное преобразование устройства наблюдения
В главе рассматриваются существующие подходы к идентификации систем с распределенными параметрами (СРП) и известные классические
методы идентификации В результате анализа литературы установлено, что все методы идентификации на основе данных наблюдений над объектом типа "вход-выход" предполагают аппроксимацию бесконечномерной распределенной системы некоторой конечномерной сосредоточенной системой (редукцию СРП) В связи с этим рассмотрение методов идентификации распределенных систем невозможно без рассмотрения методов идентификации систем с сосредоточенными параметрами В диссертации обсуждаются проблемы, связанные с использованием классических способов редукции и методов численного моделирования
Применение нейросетевого подхода для идентификации распределенных систем позволяет преодолеть ряд проблем классических методов, среди которых можно выделить их высокую вычислительную сложность
При использовании нейронных сетей для идентификации исследователь сталкивается с двумя основными проблемами определение архитектуры нейросетевой модели и выбор (или разработка) процедуры ее обучения В главе приводится обзор и классификация архитектур нейронных сетей, применяемых для решения задач идентификации динамических объектов В результате анализа литературы сделан вывод, что все нейросетевые архитектуры, применяемые для решения задач идентификации, могут быть разделены на три группы
1) В первую группу входят статические нейронные сети, как правило, включающие линии задержек управляющего и выходного сигналов объекта, с помощью которых в сеть привносится память
2) Вторую группу образуют нейросети с обратными связями -рекуррентные, или динамические, нейросети Такие сети вызывают гораздо больший интерес исследователей при решении задач идентификации динамических систем Выбор динамической сети в качестве модели динамического объекта представляется более обоснованным
3) В третью группу входят специальные архитектуры нейронных сетей, построенные на нейронах высших порядков или нейронах с неклассическими моделями
Проводится сравнительный анализ, указываются преимущества и недостатки рассматриваемых нейросетевых архитектур Учитывая опыт авторов публикаций, для многих из рассмотренных нейросетевых моделей приводятся сложности, с которыми сталкивается исследователь при их построении и использовании, а также рекомендации по их применению
Анализируется состояние проблем нейросетевой идентификации систем с распределенными параметрами Отмечается, что эта область малоизученна, в ней имеется относительно небольшое число монографий и публикаций, что, по всей видимости, связано со сложностью решаемых задач
Во второй главе представлены методические и алгоритмические основы идентификации управляемых систем с распределенными параметрами в классе нейросетевых моделей Предложены два подхода к редукции модели распределенной системы (1) Первый подход - редукция в пространственной области - предполагает аппроксимацию бесконечномерной модели СРП (1) совокупностью систем с сосредоточенными параметрами в конечном числе пространственных точек с последующей дискретизацией во времени В результате получена система разностных уравнений, в которых пространственная координата х рассматривается как параметр Основываясь на теории вложения, для этой системы записана нелинейная авторегрессионная модель (Nonlinear AutoRegressive model with eXogenous inputs, iV/lÄAf-модель) с вектором параметров w, зависящим от * jy(x,t) = F(w,y(x,t-l), ,Xx,t-n),u(OMt-l), ,w(f-m)), [w = G(x,y), ieO, yeГ,
где t - дискретное время, t = 0, T, m, n - число задержек в линии управления и цепи обратной связи соответственно, F- функция авторегрессии
Задача идентификации распределенной системы, таким образом, сводится к задаче аппроксимации функций F и G в модели (2) Учитывая универсальные аппроксимирующие способности нейронных сетей, для аппроксимации функции авторегрессии F предложено использовать ЛгЛ7?Аг-нейросеть (рис 1), для аппроксимации функции G - многослойный персептрон MLP Схема полученной нейросетевой модели приведена на рис 2
Рис 1 Нейросетевая NARX- модель
Рис 2 Схема модели управляемой распределенной системы, основанной на редукции в пространственной области
Введено понятие нейросетевой структуры (НСС) как вычислительной модели, включающей совокупность взаимосвязанных нейросетевых модулей, в общем случае, различных нейросетевых архитектур Пример нейросетевой структуры изображен на рис 2
Второй подход - редукция во временной области - основан на представлении выхода распределенной системы в каждый момент времени t, t = О, Г, в виде некоторой параметрической функции y{x,t) = G*(x,p(t,у)), iefi, у е Г,
где p(t, у) - вектор параметров функции G* в момент времени t В этом случае динамика пространственного распределения у(х, t) связана с динамикой управляемого вектора p{t, у) Предполагая, что вектор p(t, у) удовлетворяет разностному уравнению, для которого может быть записана Л^ЙХ-модель, предложен еще один класс моделей для идентификации y(x,t) = G* (x,p(t,y)), xeQ, ye Г,
• p(t) = F'{w\p(t-l), ,p(t-n),u(t),u(t-1),. ,u{t-mj), (3)
w'=H'(у), у еГ,
где m, n - число задержек в линии управления и цепи обратной связи соответственно, F* - функция авторегрессии, w - вектор параметров
Модель (3) также может быть реализована в виде нейросетевой структуры (рис 3) В качестве нейросетевой модели функции F выбрана Л^Л¥-нейросеть, в качестве аппроксиматоров функций G и Я -многослойные персептроны
Рис 3 Схема модели управляемой распределенной системы, основанной на редукции во временной области
В диссертации рассмотрены математическая модель NARX-нейросети и алгоритм ее обучения, основанный на модификации метода обратного распространения ошибки во времени {Back Propagation Through Типе, ВРТТ) Для обучения предлагаемых нейросетевых структур используется
совокупность результатов наблюдений Е = = 1,р| распределенного
объекта в конечном числе пространственных точек xr, xr е Q , г = 1, R , проведенных в дискретные моменты времени t, t = 0,T Результат р-го наблюдения я^ определен как совокупность
= {c^,(u^{t),t = Qj),(^\t),t = Щ,у(р>),
где cw - идентификатор начального состояния s[p)(x), в котором находилась СРП при проведении р-го эксперимента, Т - конечное число временных тактов, u^Xt) - вектор управляющих воздействий на такте времени t,
G(p\t) = {a{p\x„t), ,oip)(xR,t)j =(oUp\t), .,oR{p)(t))T - вектор наблюдаемых выходов системы на такте времени t в пространственных точках х\ ,xR, /еО, r = l,R, у'р> - вектор параметров СРП, при которых проводился эксперимент
В диссертации предложены два подхода к обучению нейросетевых структур Первый подход основан на последовательном обучении нейросетевых модулей структуры, используя многошаговую процедуру Второй - на вычислении частных производных критерия обучения по всем настраиваемым параметрам НСС Эти подходы названы последовательным и совместным (параллельным) обучением соответственно
Суть последовательной процедуры обучения НСС, полученной в результате редукции в пространственной области (рис 2), состоит в следующем На основе результатов наблюдений п® для каждой фиксированной пространственной точки /, г = i,R, строится отдельная нейросетвая NARX-модепь, характеризующаяся вектором параметров w(xr) В результате многократного обучения будет получена конечная совокупность Л^ЯХ-нейросетей, соответствующих отдельным пространственным точкам Далее проводится аппроксимация векторов w(xr) в пространственной области ГЗ с помощью многослойного персептрона MLP-G В диссертации приводятся особенности, преимущества и недостатки последовательной схемы обучения, одним из которых является необходимость формирования и хранения вспомогательных выборок данных, используемых для обучения многослойного персептрона MLP-G
Совместное обучение модулей НСС предполагает оптимизацию критерия обучения в пространстве всех настраиваемых параметров структуры
min (4)
2 р=1 i=o v
В связи с тем, что вектор выходов w сети MLP-G представляет собой вектор параметров NA RX- не йр о с е ти, то рассматриваемая НСС характеризуется только вектором v синаптических коэффициентов сети MLP-G, в пространстве которых решается задача оптимизации критерия (4)
В диссертации предлагается метод расчета градиента критерия (4) при совместном обучении модулей НСС, обобщающий метод обратного распространения ошибки во времени В отличие от классического метода ВРТТ, обратное распространение в структуре происходит не через нейроны сети, а через отдельные нейросетевые модули, рассматриваемые как элементарные объекты сети, в общем случае имеющие различные математические модели Предлагаемый метод обучения может быть применен для более широкого класса нейросетевых структур
Для сокращения размерности пространства параметров обучаемых ЛШ^-нейросетей и повышения эффективности обучения в диссертации предлагается модификация нейросетевой jV^iLY-модели, основанная на параметризации синаптических коэффициентов нейронов первого слоя многослойного ядра NARX-сети, и рассматривается алгоритм ее обучения Введение такой параметризации для ряда динамических систем соответствует физическим представлениям о закономерностях их функционирования
Для оценки точности нейросетевых моделей объектов с распределенными параметрами приводится набор показателей, которые используются при обучении, валидации и тестировании сети, а также в критериях останова итерационной обучающей процедуры Формулируются практические рекомендации по организации процесса обучения НСС
Третья глава посвящена применению предложенных во второй главе моделей и методов для решения задачи идентификации управляемого процесса энерговыделения (ЭВ) в активной зоне ядерного реактора типа ВВЭР-1000 при совершении маневра мощности В этой задаче выделены три подзадачи
• идентификация процесса энерговыделения в фиксированном узле активной зоны,
• идентификация аксиального профиля энерговыделения тепловыделяющей сборки (TBC),
• идентификация пространственного поля энерговыделения в активной зоне
Приводится краткое описание проблемной области и исходных данных В качестве модели энерговыделения в фиксированном узле активной зоны предложено использовать нейросетевую NARX-иолсль Управляющим воздействием u(t) нейросети является положение органов регулирования системы управления и защиты (ОР СУЗ) Желаемым выходным процессом -соответствующий этому управлению процесс ЭВ в фиксированной точке активной зоны Вектор параметров у активной зоны предполагается фиксированным для всех рассматриваемых режимов управления
Для построения нейросетевой модели распределенного вдоль TBC процесса энерговыделения проведена редукция модели СРП во временной области Для аппроксимации профиля ЭВ в каждый момент времени t, t - О, Г, маневра мощности реактора выбран полином степени к
y(z, 0 = Pi (t)zk + рк_, (t)zk~l + + р, (t)z + р0 (0 , (5)
где z - масштабированная координата точки на TBC
Задача моделирования управляемого профиля ЭВ, таким образом, сведена к задаче моделирования коэффициентов аппроксимирующего полинома (5) Сформулировано предположение, что в динамике элементов вектора p(t) присутствует небольшое число главных компонентов, Д (/),
i = 0, к, к <к, образующих вектор p(t), инвариантных относительно рассматриваемых режимов управлений Рассмотрена схема перехода от
исходного пространства коэффициентов к пространству главных компонентов и обратно Для моделирования процессов р,(0, 1 = 0,к, использованы ИАКХ- не йр о сети На рис 4 изображена полученная нейроструктурная модель аксиального профиля ЭВ ТВС
Рис 4 Схема нейросетевой модели аксиального профиля ЭВ ТВС
При построении модели управляемого пространственного поля энерговыделения в активной зоне реактора ВВЭР-1000 также проведена редукция модели СРП во временной области Реализация модели в виде нейросетевой структуры приведена на рис 5 Для аппроксимации поля ЭВ в каждый момент времени t, / = 0,Г, маневра мощности реактора использован многослойный персептрон MLP-G, характеризующийся вектором синаптических коэффициентов p(t) Как и в предыдущей задаче, среди элементов этого вектора выделены главные независимые компоненты, для моделирования которых использованы А^/УТ-нейросети Многослойный
Рис 5 Схема нейросетевой модели пространственного поля энегровыделения в активной зоне реактора
персептрон MLP-ocj3, включённый в структуру, решает вспомогательную задачу масштабирования энерговыделений. В диссертации описана схема функционирования НСС и рассмотрен метод её обучения.
Для выполнения экспериментальных исследований предложенных нейроструктурных моделей разработана специализированная программная система. В диссертации приводится краткое описание архитектуры и функциональных возможностей системы.
В четвёртой главе приводятся результаты экспериментальных исследований нейросетевых моделей энерговыделения в активной зоне ядерного реактора типа ВВЭР-1000. Описываются эксперименты, выполненные с использованием пакета расширения MATLAB для идентификации линейных динамических систем (System Identification Toolbox), подтверждающие существенную нелинейность моделируемого объекта.
Приводятся результаты экспериментальных исследований нейросетевых NARX-моделей процесса ЭВ в фиксированном узле активной зоны. Исходные данные для построения моделей изображены на рис. 6.
из
£ 300
а) I
1 250
3601 340! 320: 300'
в) I 28°
Ш 260 240 220 200 180
С
Рис. 6. Процессы энерговыделения, наблюдаемые в узле с пространственным положением /=(1Л) (б, г), и соответствующие им процессы движения ОР СУЗ (а, в). Графики а и в соответствуют различным режимам управления. Положение ОР СУЗ указано в см, считая от низа активной зоны, единица измерения ЭВ - МВт, время указано в с
Для обучения использовался один обучающий пример (процесс 10 на рис. 6б и соответствующий ему управляющий процесс), остальные процессы использованы для тестирования. Каждый управляющий процесс представляет собой кусочно-линейную функцию с выходом на постоянный уровень.
Для оценки точности нейросетевых моделей введён ряд показателей, среди которых МЖ - среднеквадратическая ошибка, МАРЕ, МАХРЕ -средняя и максимальная относительные ошибки, МАХЕ - максимальная абсолютная ошибка, МЕРР, МАХРР - средняя и максимальная ошибки, отнесённые к размаху сигнала.
В результате исследований различных архитектур А^ЯХ-моделей установлено, что сеть с архитектурой т — 5, п = 5, К — 2, Л^ = 5, Ы2 = 1 (К — число слоёв, N1 - число нейронов в А>ом слое) обладает требуемыми точностными характеристиками (относительные показатели менее 5 %). Показатели точности нейросетевой модели на обучающей и тестовых реализациях приведены в таблице.
ШЕ МАРЕ МАХЕ МЕРР МАХРР
обуч. 5.71е+5 0.094% 2.62е+3 0.83% 4.13%
тест. 1.38е+6 0.15% 3.32е+3 1.36% 5.23%
Результаты воспроизведения сетью обучающих и тестовых процессов ЭВ приведены на рис. 7. Из рисунка видно, что желаемые и фактические выходы сети практически совпадают.
а) б)
Рис. 7. Результаты воспроизведения обученной АМА^-нейросетью обучающей и тестовых реализаций. Пунктирной линией показаны исходные реализации, сплошной - выходы модели. Архитектура сети: т = 5, п = 5, К = 2, Л', =5, N2 = 1 ■ Активационные характеристики нейронов первого слоя - сигмоиды, выходного нейрона - линейная.
Сделан ряд выводов о влиянии числа нейронов и числа задержек да и и в цепях управления и обратной связи Л^ЛУГ-нейросети на её динамические свойства и способности к обобщению в пространстве управляющих воздействий. Проведено исследование' зависимости точности и обобщающей способности сети от начальных значений синаптических коэффициентов при обучении градиентными методами. В диссертации обсуждаются особенности применения построенных нейросетевых моделей энерговыделения.
Исходные данные для построения нейросетевой модели аксиального профиля энерговыделения TBC и результаты его полиномиальной аппроксимации показаны на рис. 8. В качестве модели профиля использована нейросетевая структура, изображённая на рис. 4.
В результате исследований Л'Л.КА'-нейросетей, входящих в структуру, средствами разработанного программного обеспечения показано, что сети с архитектурными параметрами т = 3, п = 3, К= 2, jV, = 5, N2 = 1 воспроизводят
обучающие и тестовые реализации. факторных очков /?,(/)> ' = 0Д, с требуемой точностью (показатели МБРР < 5 %).
а) б)
Рис. 8. Процессы энерговыделения, наблюдаемые в различных узлах TBC и используемые при построении нейросетевой модели (а) и аксиальные профили энерговыделения TBC в различные моменты времени манёвра мощности реактора (б). Порядок аппроксимирующего полинома к = 4. Соответствующий режим управления приведён на рис. 6а
В диссертации исследована зависимость точности модели от порядка к аппроксимирующего полинома и числа к выделяемых главных компонентов. Показано, что главное подпространство практически
инвариантно к рассматриваемым режимам ступенчатого управления. На рис. 9 приведены результаты работы построенной модели.
а) б)
Рис. 9. Аксиальные профили энерговыделения TBC в различные моменты времени маневра мощности. Время указано в секундах, считая от начала манёвра. Сплошной линией показаны выходы нейросетевой модели, пунктирной - профили, аппроксимированные полиномом порядка к = 4. Рисунки а и б соответствуют различным режимам управления (см. рис. 6а, в)
Для построенной нейросетевой модели на протяжении всего времени манёвра мощности реактора значение показателей точности МАХРР < 7 % {МАХЕ < 3 %), что не уступает аналогичным показателям физической модели NOSTRA. Указанные значения говорят о способности модели к обобщению в ограниченном пространстве рассматриваемых режимов ступенчатого управления.
Для моделирования пространственного поля энерговыделения в активной зоне реактора использована нейросетевая структура, изображённая на рис. 5. В результате исследований средствами разработанной программной системы многослойных персептронов MLP-aß и MLP-G, входящих в НСС, найдены их архитектурные параметры, при которых обеспечиваются требуемые точностные характеристики на обучающей и тестовой выборках. Отмечена сложность аппроксимации поля ЭВ с помощью многослойной нейросети, связанная с его сильной неравномерностью и много-экстремальностью.
В результате исследований различных архитектур NARX-Moaemvi построена сеть с архитектурными параметрами т — 10, п = 5, К= 2, N\ = 10,
N2 ~ 1, которая воспроизводит реализации факторных очков Д (0, i = 0,k , с
точностью МЕРР <12% на обучающих реализациях и МЕРР <20% на тестовых. На рис. 10 показаны процессы знерговыделения в отдельных узлах активной зоны, полученные по результатам работы построенной НСС. В диссертации проводится анализ зависимости точности моделирования от архитектурных параметров отдельных модулей НСС.
а) б) в)
Рис. 10. Процессы энерговыделения в отдельных узлах активной зоны, построенные по результатам работы нейросетевой модели пространственного поля ЭВ (сплошная линия) и соответствующие исходные процессы ЭВ (пунктирная линия). На рис. а - обучающий процесс, на рис. б, в ~ тестовые.
Показатели точности построенной нейросетевой модели на обучающей и тестовых реализациях приведены в таблице.
MSE МАРЕ МАХЕ МЕРР М4ХРР
обуч. 6.47е+7 1.22% 1.78е+4 10.91% 28.06%
обуч. 6.78е+9 6.89% 1.79е+5 8.12% 23.28%
обуч. 8.81е+6 0.52% 1,28е+4 2.68% 16.85%
тест. 3.52е+9 4.43% 1,35е+5 8.92% 25.88%
тест. 8.88е+9 10.52% 1.71е+5 14.18% 28.73%
В диссертации приводится обсуждение причин возникновения погрешностей моделирования и предлагаются пути дальнейшего повышения точности По показателям точности построенная нейросетевая модель сравнима с математической моделью, реализованной в программе NOSTRA, при этом существенно превышая её в быстродействии. Однако в отличие от математических моделей, предполагающих численное решение уравнений математической физики, область применения построенных нейросетевых моделей ограничивается рассматриваемыми режимами кусочно-линейного управления.
В приложения вынесены вывод уравнений обучения нейросети нелинейной авторегрессии, описание применения предлагаемого нейроструктурного подхода для решения актуальной задачи в радиобиологии человека и животных, описание функциональных возможностей разработанной программной системы для экспериментальных исследований нейросетевых структур и акты об использовании результатов диссертационного исследования
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В заключении приведены основные результаты диссертации и сформулированы выводы
Итогом диссертационной работы являются следующие научные и практические результаты
1 Поставлена задача идентификации управляемого объекта с распределенными параметрами на основе результатов наблюдений типа "вход-выход" Введены и теоретически обоснованы два класса моделей для идентификации, предполагающие редукцию математической модели распределенной системы
2 Предложена нейросетевая реализация математических моделей указанных классов в виде нейросетевых структур - моделей нового типа, состоящих из взаимосвязанных нейросетевых модулей в общем случае различных архитектур
3 Предложены два подхода к обучению нейросетевых структур последовательное, включающее многошаговую процедуру обучения отдельных модулей, и совместное, предполагающее одновременную адаптацию всех параметров структуры Разработан алгоритм обучения нейросетевой структуры как целого, обобщающий метод обратного распространения ошибки во времени
4 Для моделирования сосредоточенной управляемой динамики использована управляемая нейросеть нелинейной авторегрессии (ТУЛТУГ-нейросеть) Предложена модификация математической модели Л'ЛЛА-нейросети, позволяющая сократить число настраиваемых параметров и повысить эффективность процедуры обучения
5 Предложен набор показателей для оценки точности нейроструктурных моделей управляемых распределенных объектов Сформулированы практические рекомендации по организации процесса обучения нейросетевых структур и их применению
6 Предложенные нейроструктурные модели и алгоритмы применены для решения прикладной задачи идентификации распределенных процессов энерговыделения в активной зоне ядерного реактора типа ВВЭР-1000 при совершении маневра мощности Построены модель управляемых процессов энерговыделения в фиксированном узле активной зоны, модель профиля ЭВ TBC и модель пространственного поля ЭВ в активной зоне реактора
7 Для проведения исследований нейроструктурных моделей управляемых распределенных систем разработана специализированная программная система
8 Средствами разработанной программной системы проведены серии компьютерных экспериментов, демонстрирующих точность построенных нейроструктурных моделей энерговыделения и подтверждающих их обобщающие способности в ограниченном пространстве типовых управляющих воздействий
Результаты проведенных теоретических и экспериментальных исследований подтверждают применимость разработанного методического и алгоритмического обеспечения для решения задач идентификации управляемых систем с распределенными параметрами, а новый предложенный тип нейроструктурных математических моделей может найти применение н в других проблемных областях
СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1 Мишулина О А, Трофимов А Г Нейросетевое моделирование распределенных процессов энерговыделения в активной зоне реакторной установки // Нейрокомпьютеры разработка и применение - 2007 -№9 -С 57-70
2 Two neural network models for nuclear engineering applications Two neural network models for nuclear engineering applications /OA Mishuhna, V S Khantonov, A G Trofimov, et al // Optical Memory & Neural Networks (Information Optics) -2005 - Vol 14,№1.-P 23-44
3 Нейросети в задаче траекторного управления динамическим объектом / О А Мишулина, А Г Трофимов, Б Е Федунов и др // Авиакосмическое приборостроение -2007 -№ 1 -С 31-37
4 Мишулина О А , Трофимов А Г Нейросетевой прогноз выживаемости клеток при гипертермическом воздействии // Новости искусственного интеллекта -2007
5 Пакет прикладных программ N-FONTO для построения нейросетевых моделей в ядерной энергетике / OA Мишулина, А Г Трофимов, В С Харитонов и др // Сборник научных трудов VII Всероссийской научно-технической конференции "Нейроинформатика-2005" - М МИФИ, 2005 - Т 2 -С 182-190
6 Костерев В В , Мишулина О А , Трофимов А Г Нейросетевая модель радиобиологического действия ионизирующих излучений в условиях гипертермии // Сборник научных трудов VIII Всероссийской научно-технической конференция "Нейроинформатика-2006" - М МИФИ, 2006 -Т 3 -С 188-196
7 Kosterev V V, Mishuhna О А, Trofimov A G Neural network model of cell survival under hyperthermia // IFMBE Proceedings WC 2006 "World Congress on Medical Physics and Biomedical Engineering" - 2006 -Vol 14 -P 3393-3396
8 Мишулина О A , Трофимов А Г, Щербинина M В Нейросетевые структуры в задачах моделирования физических переменных // Труды 62-ой Научной сессии РНТОРЭС им АС Попова -2007 - С 102-105
9 Мишулина О А, Трофимов А Г Нейросетевая структура для моделирования управляемых систем с распределенными параметрами // Сборник научных трудов X Всероссийской научно-технической конференции "Нейроинформатика-2008" - М МИФИ, 2008 - Т 2 -С 40-49
10 Разработка системы N-FONTO для решения задач ядерной теплоэнергетики / О А Мишулина, А Г Трофимов, М В Щербинина идр // Научная сессия МИФИ-2005 Сборник научных трудов - М МИФИ, 2005 -Т 2 - С 117-118
11 Нейросетевая модель прогноза энерговыделений в активной зоне реактора ВВЭР-1000 / О А Мишулина, А Г Трофимов, М В Щербинина и др // 14-й Международный научно-технический семинар "Современные технологии в задачах управления, автоматики и обработки информации" Сборник научных трудов - Самара СГАУ им Академика С П Королева, 2005 - С. 143
12 Трофимов А Г Синтез нейросетевой структуры для моделирования динамической системы с распределенными параметрами // 15-й Международный научно-технический семинар "Современные технологии в задачах управления, автоматики и обработки информации" Сборник научных трудов - М МИФИ, 2006 - С 166
13 Kosterev V V , Mishulma О A , Trofimov A G Cell survival data processing with artificial neural networks // 23-rd Annual Meeting of the European society for hyperthermic oncology Abstract Book -2006 -P 114-115
14 Трофимов А Г Разработка системы NSTRUCT для моделирования и обучения нейросетевых структур // Научная сессия МИФИ-2007 Сборник научных трудов -М МИФИ, 2007 - Т 2 - С 12-13
15 Моделирование нейтронного потока в активной зоне ВВЭР с помощью нейросетевых технологий / OA Мишулина, А Г Трофимов, Б Е Шумский и др // Научная сессия МИФИ-2007 Сборник научных трудов -М МИФИ, 2007 -Т 8 - С 160-162
16 Neural model of cells equisurvival lines under hyperthermia / V V Kosterev, OA Mishulma, AG Trofimov, etal // 24-rd Annual Meeting of the ESHO Abstract Book - 2007 - P 89-90
17 МишулинаОА, Трофимов А Г Нейросетевая структура с форсирующими звеньями // 16-й Международный научно-технический семинар "Современные технологии в задачах управления автоматики и обработки информации" Сборник научных трудов -2007 - С 144
18 Трофимов АГ, Скругин В И Разработка программной системы NeuroDynamica для нейросетевого моделирования динамических объектов // Научная сессия МИФИ-2008 Сборник научных трудов - М МИФИ, 2008 -Т 11 -С 109-110
19 Параллельная реализация алгоритмов обучения модульной нейросети и ее работы / В А Пересыпкин, А Г Трофимов, Е В Чепин идр // Научная сессия МИФИ-2008 Сборник научных трудов - М МИФИ, 2008 -Т 12 -С 121-122
20 Применение нейросетевой динамической модели аксиального профиля энерговыделения активной зоны ВВЭР-1000 для коррекции показаний ионизационных камер / О А Мишулина, А Г Трофимов, В С Харитонов и др // Научная сессия МИФИ-2008 Сборник научных трудов - М МИФИ, 2008 -Т 1 -С 113-115
Подписано в печать 28 04 2008 г Печать трафаретная
Заказ № 348 Тираж 100 экз
Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш , 36 (495) 975-78-56, (499) 788-78-56 www autoreferat ru
Оглавление автор диссертации — кандидата технических наук Трофимов, Александр Геннадьевич
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ.
ВВЕДЕНИЕ.
ГЛАВА 1. НЕЙРОСЕТЕВЫЕ МЕТОДЫ ПОСТРОЕНИЯ МОДЕЛЕЙ ДИНАМИЧЕСКИХ ОБЪЕКТОВ.
1.1. Методы идентификации динамических систем.
1.1.1. Классификация динамических систем.
1.1.2. Формулировка задачи построения модели динамического объекта.
1.1.3. Классификация и анализ подходов к идентификации динамических систем.
1.2. нейросетевые методы идентификации динамических систем с
• сосредоточенными параметрами.
1.2.1. Нейросетевые модели, реализующие классические методы идентификации.
1.2.2. Идентификация с использованием нейронных сетей прямого распространения.
1.2.3. Идентификация с использованием рекуррентных нейронных сетей.
1.3. Анализ подходов к идентификации систем с распределёнными параметрами.:.
1.3.1. Классические методы идентификации систем с распределёнными параметрами.
1.3.2. Нейросетевой подход к идентификации систем с распределёнными параметрами.
Выводы по главе 1.
ГЛАВА 2. ИДЕНТИФИКАЦИЯ УПРАВЛЯЕМЫХ СИСТЕМ С РАСПРЕДЕЛЁННЫМИ ПАРАМЕТРАМИ В КЛАССЕ НЕЙРОСЕТЕВЫХ СТРУКТУР.
2.1. Задача нейросетевой идентификации управляемого распределённого объекта.
2.1.1. Постановка задачи.'.
2.1.2. Классы моделей для идентификации.-тт.-.-.492.1.3. Нейросетевая реализация моделей распределённых систем.
2.2. Нейросетевая реализация нелинейной авторегрессионной модели.
2.2.1. Архитектура нейронной сети и алгоритм обучения.
2.2.2. Параметризация синоптических коэффициентов в цепи обратной связи.
2.2.3. Оптимизация параметров модели.
2.3. Нейросетевая модель распределённого объекта, основанная на редукции в пространственной области.
2.3.1. Математическая модель нейросетевой структуры.
2.3.2. Методы обучения нейросетевой структуры.
2.3.3. Особенности последовательной процедуры обучения.
2.3.4. Алгоритм вычисления градиента в параллельной схеме обучения.
2.4. Нейросетевая модель распределённого объекта, основанная на редукции во временной области.
2.4.1. Математическая модель нейросетевой структуры.
2.4.2. Методы обучения нейросетевой структуры.
2.4.3. Алгоритм вычисления градиента в параллельной схеме обучения.
2.5. Оценка точности нейросетевой модели.
2.5.1. Общие показатели точности нейросетевой модели динамического объекта
2.5.2. Использование показателей точности в критериях останова процедуры обучения нейросетевых моделей.
Выводы по главе 2.
ГЛАВА 3. НЕЙРОСЕТЕВАЯ ИДЕНТИФИКАЦИЯ ПРОЦЕССА ЭНЕРГОВЫДЕЛЕНИЯ В АКТИВНОЙ ЗОНЕ ЯДЕРНОГО РЕАКТОРА.
3.1. Задача построения нейросетевой модели энерговыделения в активной зоне ядерного реактора.
3.1.1. Описание предметной области.
3.1.2. Общее описание исходных данных для решения задач идентификации процессов энерговыделения в активной зоне ядерного реактора.
3.1.3. Нейросетевая модель энерговыделения в фиксированном узле активной зоны.
3.2. Нейросетевая идентификация управляемого аксиального профиля энерговыделения ТВ С.
3.2.1. Исходные данные для построения нейросетевой модели аксиального профиля энерговыделения.
3.2.2. Полиномиальная аппроксимация профиля энерговыделения в фиксированные моменты времени.
3.2.3. Выделение главных компонентов в управляемой динамике параметров модели профиля.
3.2.4. Синтез нейроструктурной модели профиля энерговыделения ТВС.
3.3. Нейросетевая идентификация управляемого пространственного поля энерговыделения в активной зоне.:.:.:.97"
3.3.1. Исходные данные для построения нейросетевой модели пространственного поля энерговыделения.
3.3.2. Синтез нейросетевой структуры для моделирования поля энерговыделения в фиксированные моменты времени.
3.3.3. Нейроструктурная модель управляемого поля энерговыделения в активной зоне.
3.4. Программная система для проведения экспериментальных исследований нейроструктурных моделей.
Выводы по главе 3.
ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ НЕЙРОСТРУК-ТУРНЫХ МОДЕЛЕЙ УПРАВЛЯЕМЫХ РАСПРЕДЕЛЕННЫХ ПРОЦЕССОВ ЭНЕРГОВЫДЕЛЕНИЯ В АКТИВНОЙ ЗОНЕ ЯДЕРНОГО РЕАКТОРА ТИПА ВВЭР-1000.
4.1. Экспериментальные исследования нейросетевой модели энерговыделения в фиксированном узле активной зоны.
4.1.1. Исследование возможности идентификации процесса энерговыделения в классе линейных моделей.
4.1.2. Зависимость способности нейросетевой NARX-модели к обобщению от архитектурных параметров многослойного ядра.
4.1.3. Результаты обучения нейросетевой NARX-модели из различных начальных конфигураций.
4.1.4. Влияние числа задержек в цепях управления и обратной связи NARX-модели на точность моделирования.
4.1.5. Выводы.
4.2. экспериментальные исследования нейросетевой модели управляемого аксиального профиля энерговыделения твс.
4.2.1. Визуальный анализ профилей энерговыделения в фиксированные моменты времени и динамики коэффициентов аппроксимирующего полинома.
4.2.2. Факторный анализ коэффициентов аппроксимирующего полинома.
4.2.3. Результаты компьютерного моделирования динамики главных компонентов параметров модели профиля с помощью NARX-нейросетей.
4.2.4. Точность восстановления фофиля энерговыделения по результатам работы нейросетевых NARX-мод'елей.
4.2.5. Выводы.
4.3. экспериментальные исследования нейросетевой модели управляемого пространственного поля энерговыделения в активной зоне.
4.3.1. Точность нейросетевой модели поля энерговыделения в фиксированные моменты времени.
4.3.2. Анализ динамики параметров нейросетевой модели поля энерговыделения в фиксированные моменты времени.:.::.
4.3.3. Точность и обобщающая способность нейроструктурной модели управляемого пространственного поля энерговыделения.
4.3.4. Выводы.
Выводы по главе 4.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Трофимов, Александр Геннадьевич
Актуальность темы. Распределённые динамические объекты встречаются в различных областях науки и техники: физике, экономике, медицине, геологии и пр. В отличие от систем с сосредоточенными параметрами, состояние которых в каждый момент времени характеризуется вектором конечной размерности, для распределённых систем состояние описывается функцией одной или нескольких переменных, обычно интерпретируемых как пространственные координаты. Проблема моделирования и управления такими объектами связана не только с их распределенностью и нелинейностью, но и с возможным отсутствием априорной информации о внутреннем устройстве моделируемой системы и закономерностях её функционирования. В этом случае практически единственным подходом к построению модели объекта остаётся использование экспериментальных данных о его функционировании.
Активное развитие классической теории идентификации, наблюдавшееся в 70-80-ых годах прошлого века, преимущественно было направлено на моделирование систем с сосредоточенными параметрами, в то время как распределённым системам уделялось существенно меньшее внимание. Основными причинами этого являлись сложность распределённой природы моделируемого объекта и трудности применения классических подходов.
В- последнее время наблюдается рост интереса к применению современных информационных технологий, в частности, нейросегевой технологии, к задачам моделирования распределённых динамических объектов. Связано это, по всей
1 видимости, с целым рядом факторов, среди которых можно отметить: разнообразие практических приложений; трудности применения стандартных методов идентификации вследствие нелинейности моделей, большого объёма данных, неточности- их измерений; высокая- вычислительная - сложность- классических методов моделирования распределённых систем.
Успех применения нейронных сетей в математическом моделировании в основном связан с задачами обработки статических данных, в то время как нейросетевому моделированию динамических объектов уделяется существенно меньшее внимание. Математические модели в классе, нейронных сетей обладают рядом замечательных свойств, связанных с их адаптивностью и способностью к генерализации данных, что говорит об их перспективности в рассматриваемой области.
Большинство методов идентификации распределённых объектов предполагают известным вид уравнения с частными производными, описывающего моделируемый объект, а задача идентификации сводится к подбору параметров этого уравнения, при которых удовлетворяются заданные граничные и начальные условия или обеспечивается наилучшее соответствие результатам наблюдений. В зависимости от типа этого уравнения, как правило, применяются различные методы решения. Нейросетевой подход позволяет единым способом решать задачи идентификации объектов, описываемых дифференциальными уравнениями различных типов.
Среди отечественных научных исследований, посвященных проблеме нейросетевого решения уравнений математической физики, особо можно выделить работы. Д.Л. Тархова, Л.Н.Васильева, В.И. Горбаченко. Многие работы в этой области являются узкоспециализированными и посвящены пейросетевому решению уравнений определённых типов либо предполагают ■ нейросетевую реализацию классических методов их численного решения.
В связи с этим создание псйросетевых моделей и методов идентификации систем с распределёнными параметрами в отсутствие информации о виде описывающих систему дифференциальных уравнений и конструирование соответствующих пейросетевых алгоритмов представляют актуальную и недостаточно изученную научную проблему.
К управляемым распределённым процессам относится процесс энерговыделепия в активной зоне ядерного реактора. Знание трехмерного поля эиерговыделения требуется для обеспечения безопасности эксплуатации реактора. Это связано с тем обстоятельством, что только на трехмерном поле энерговыделения можно определить критические теплофизические параметры, безопасности.
В настоящее время существует ряд программных моделей поля энерговыделения, используемых на атомных электростанциях (АЭС) и для проведения научных исследований. Эти модели имеют приемлемую погрешность -восстановления локального .энерговыделения в стационарном или медленно меняющемся состоянии реактора, в то время как в переходных режимах точность расчетов значительно ухудшается. Поскольку физические модели основаны на численном решении уравнений математической физики, повышение требований к точности неизбежно приводит к снижению их быстродействия. Кроме того, для физического расчёта необходима, адекватная информация о состоянии и параметрах активной зоны, которая не всегда известна с требуемой точностью.
В связи с этим актуальна проблема построения адекватной быстродействующей модели поля энерговыделения в активной зоне реактора, возможное использование которой в качестве советчика оператора позволит повысить эффективность эксплуатации ядерной энергетической установки
Объектом исследования диссертации являются управляемые системы с распределёнными параметрами, к которым относится активная зона ядерного реактора типа ВВЭР-1 ООО.
Предметом исследования являются методы идентификации управляемых систем с распределёнными параметрами на основе экспериментальных данных в классе нейросетевых моделей.
Цель и задачи исследования. Диссертация посвящена созданию нейросетевых моделей и методов идентификации управляемых систем с распределёнными параметрами и методических рекомендаций по их применению. Достижение поставленной цели предполагает решение следующих основных задач.
1. Формальное описание и теоретическое обоснование класса моделей, в рамках которого предполагается решать задачу идентификации управляемого распределённого объекта.
2. Интерпретация моделей в нёйросетевых терминах, позволяющая использовать для идентификации методы теории нейронных сетей, и синтез соответствующих нейросетевых моделей.
3. Разработка методов и алгоритмов настройки параметров нейросетевых моделей в соответствии с выбранным критерием оптимальности.
4. Формирование набора показателей для оценки точности обученных нейросетевых моделей управляемых распределённых объектов и предложений по их использованию.
5. Разработка специализированной программной системы-для проведения исследований нейросетевых моделей рассматриваемого типа.
6. Применение предложенных нейросетевых моделей и алгоритмов для решения прикладной задачи идентификации распределённых процессов энерговыделения в активной зоне ядерного реактора при совершении манёвра мощности.
7. Экспериментальные исследования построенных моделей энерговыделения средствами разработанного программного обеспечения и оценка их точности и обобщающей способности.
Методы исследования. Основой для создания нейросетевых моделей и алгоритмов и проведения экспериментальных исследований являются теория идентификации динамических систем, теория нейронных сетей, теория дифференциальных уравнений в частных производных и обыкновенных дифференциальных уравнений, численные методы решения дифференциальных уравнений, методы оптимизации и статистические методы анализа данных.
Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной.
1. Предложены и теоретически обоснованы два новых класса моделей управляемых объектов с распределёнными параметрами, в рамках которых возможна декомпозиция задачи идентификации на отдельные подзадачи.
2. Предложена нейроеетевая интерпретация моделей указанных классов в виде нейросетевых структур - совокупности связанных нейросетевых модулей различных архитектур. Применение нейроструктурных моделей является новым подходом в теории идентификации распределённых систем.
3. Разработаны два подхода к обучению нейросетевых структур рассматриваемых классов: последовательное и совместное обучение. Предложенный алгоритм совместного обучения обобщает классический метод обратного распространения ошибки во времени на случай нейросетевых структур и является новым в теории нейронных сетей.
4. Нейроструктурный подход применён для решения задач моделирования распределённых процессов энерговыделения в активной зоне ядерного реактора. Построенные нейроструктурные модели являются новыми и не применялись ранее в математическом моделировании физических процессов в реакторной установке.
5. Проведены серии компьютерных экспериментов, подтверждающие точность и обобщающую способность построенных нейроструктурных моделей процессов энерговыделения в активной зоне реактора.
Обоснованность и достоверность результатов обеспечиваются корректностью применения математического аппарата и сопоставлением результатов компьютерных экспериментов созданных нейроструктурных моделей с данными сертифицированной программы NOSTRA, реализующей численный расчёт соответствующих физических моделей.
Практическая значимость работы.
1. Нейроструктурные модели энерговыделения, обученные на реальных данных, полученных с помощью датчиков системы внугриреакторного контроля (СВРК) АЭС, могут быть использованы в качестве советчика оператора. Использование такой быстродействующей модели совместно с аппаратурой СВРК позволит повысить безопасность эксплуатации ядерной энергетической установки в манёвренном режиме.
2. Построенная динамическая модель управляемого аксиального профиля энерговыделения в активной зоне может быть использована для коррекции показаний датчиков аппаратуры контроля нейтронного потока, что позволит получить более точную информацию о состоянии активной зоны и, как следствие, повысить эффективность эксплуатации ядерной энергетической установки в манёвренном режиме.
3. Разработанное в диссертации методическое, алгоритмическое и программное обеспечение может -быть использовано в учебных курсах по современным методам математического моделирования и нейроинформатике, что позволит повысить уровень подготовки специалистов.
4. Предложенные модели и методы идентификации динамических систем в классе нейросетевых структур могут быть применены для решения прикладных задач в других проблемных областях. В работе описаны две подобные задачи: моделирование процессов гибели опухолевых клеток в живых тканях в условиях гипертермического воздействия и траекторное управление самолетом, который совершает оборонительный манёвр от атакующей его ракеты.
Реализация результатов работы. Математические модели, методы, алгоритмы и иаучно-практические рекомендации диссертации применены при решении задач моделирования физических процессов в активной зоне реактора ВВЭР-1000 и могут быть использованы при решении задач управления.
Полученные в диссертационной работе результаты используются в учебном процессе кафедр "Кибернетика" и "Теплофизика" МИФИ (Москва).
Созданное методическое и алгоритмическое обеспечение, а также практические рекомендации по обучению нейросетевых структур были применены при разработке системы распознавания символьной информации (ООО "ACT", Москва).
Использование результатов диссертационной работы и достигнутый при этом эффект подтверждены соответствующими актами.
Апробация работы. Основные положения диссертации докладывались на следующих всероссийских и международных семинарах и конференциях:
• Международная научно-техническая конференция "Интеллектуальные и многопроцессорные системы" (Геленджик, 2003).
• Всероссийская научно-техническая конференция "Нейроинформатика" (Москва, МИФИ, 2005, 2006, 2008).
• Всероссийская конференция "Нейросетевые алгоритмы решения задач ■ ~ математической физики" (Москва, НИИАА, 2007).
• Междисциплинарный научный семинар "Экобионика" (Москва, МГТУ им. Н.Э. Баумана, 2008).
• Annual Meeting of the European Society for Hyperthermic Oncology (Berlin 2006, Prague 2007).
• World Congress on Medical Physics and Biomedical Engineering (Seoul 2006).
• Научная сессия Российского научно-технического общества радиотехники, электроники и связи им. А.С. Попова (Москва, 2007).
• Научная сессия МИФИ (Москва, МИФИ, 2005, 2006, 2007, 2008).
• Международный научно-технический семинар "Современные технологии в задачах управления, автоматики и обработки информации" (Алушта, МАИ, 2005, 2006, 2007, 2008).
Результаты диссертации использованы в отчётах по проектам РФФИ (№ 05-08-01421) и МНТЦ (#2221).
Публикации результатов. Основные результаты диссертации опубликованы в 26 печатных научных работах, среди которых 2 статьи - в периодических научных изданиях, рекомендованных ВАК России,' 8 работ - в статьях и материалах конференций.
Основные положения, выносимые на защиту.
1. Новый тип нейросетевых математических моделей управляемых объектов с распределёнными параметрами - нейросетевые структуры - в рамках которых предлагается решать задачу идентификации.
2. Два подхода к обучению нейроструктурных моделей: последовательное, предполагающее обучение отдельных модулей структуры в определённой последовательности, и совместное, основанное на алгоритме обратного распространения ошибки во времени. Оба подхода допускают обобщение на более широкий класс нейросетевых структур.
3. Построенные в классе нейросетевых структур модели управляемых распределённых процессов энерговыделения в активной зоне ядерного реактора типа ВВЭР-1000: модель энерговыделения в фиксированном узле активной зоны, модель аксиального профиля энергбвыделения тепловыделяющей сборки, модель поля энерговыделения активной зоны.
4. Результаты компьютерных экспериментов построенных нейроструктурных моделей энерговыделения, демонстрирующих точность и обобщающие способности моделей в ограниченной области типовых управляющих воздействий, а также практические рекомендации по их обучению.
Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, заключения, библиографического списка и четырёх. приложений. Основная часть работы содержит 150 страниц машинописного текста, включая 14 таблиц, 58 рисунков и перечень использованной литературы из 129 наименований.
Заключение диссертация на тему "Синтез нейросетевых структур для моделирования управляемых объектов с распределенными параметрами"
Выводы по главе 4
Приведены результаты экспериментальных исследований нейросетевых моделей энерговыделения в активной зоне реактора ВВЭР-1000, предложенных в главе 3: модели ЭВ фиксированном узле активной зоны, модели аксиального профиля ЭВ ТВС и модели пространственного поля ЭВ. В результате предварительных исследований установлено, что процессы энерговыделения в фиксированных узлах активной зоны являются существенно нелинейными. Проведены исследования нейросетевых А^^Л'-моделей ЭВ в фиксированных узлах активной зоны, в результате которых определены зависимости точности и обобщающей способности сети от её архитектурных параметров^Установлено,-что-----обобщающие способности сети существенно зависят от начальной конфигурации еинаптичееких коэффициентов при использовании для обучения градиентных методов.
Приведены результаты экспериментальных исследований динамической нейросетевой модели аксиального профиля энерговыделения ТВС. Экспериментально подтверждено предположение, что в динамике коэффициентов полинома, аппроксимирующего профиль, присутствует небольшое число главных компонентов, инвариантных относительно рассматриваемых режимов кусочно-линейного управления.
В результате компьютерных экспериментов нейроструктурной модели пространственного поля ЭВ подобраны архитектурные параметры отдельных нейросетевых модулей, образующих структуру, при которых модель поля энерговыделения удовлетворяет требованиям по точности.
Показано, что построенные нейросетевые модели не уступают по точности существующим физическим моделям и обладают способностью к обобщению в ограниченном пространстве управляющих воздействий, определяемом рассматриваемыми кусочно-линейными режимами управления.
Результаты проведённых исследований нейроструктурных моделей подтверждают применимость разработанного методического и алгоритмического обеспечения для решения задач идентификации управляемых систем с распределёнными параметрами.
ЗАКЛЮЧЕНИЕ
В рамках диссертационной работы получены следующие научные и практические результаты.
На основе проведённого анализа существующих подходов к идентификации динамических систем с сосредоточенными и распределёнными параметрами предложено использовать нейросетевой подход. Описаны возможности нейросетевых моделей при решении задач идентификации динамических объектов, их преимущества и недостатки перед другими моделями.
Поставлена задача идентификации управляемого объекта с распределёнными параметрами на основе результатов наблюдений типа "вход-выход". Введены и теоретически обоснованы два класса моделей, в рамках которых решается задача идентификации. Оба класса моделей предполагают аппроксимацию распределённой системы системой с сосредоточенными параметрами.
Предложена нейросетевая реализация математических моделей указанных классов в виде нейросетевых структур - моделей нового типа, состоящих из взаимосвязанных нейросетевых модулей в общем случае различных архитектур.
Разработаны два метода обучения нейросетевых структур: последовательное, включающее многошаговую процедуру обучения отдельных модулей, и совместное, рассматривающее нейросетевую структуру как единое целое. Указаны особенности использования обоих методов. Алгоритм совместного обучения позволяет рассматривать метод обратного распространения ошибки во времени на более высоком уровне - распространение ошибки в нейросетевой структуре осуществляется не через отдельные нейроны, а через нейросетевые модули, в общем случае имеющие различные математические модели.
Для моделирования сосредоточенной управляемой динамики использована управляемая нейросеть- нелинейной-авторегрессии-(А'>1./?^г-нейросеть).Предложена модификация математической модели ЛгЛ.&¥-нейросети, позволяющая сократить число настраиваемых параметров и повысить эффективность процедуры обучения.
Предложен набор показателей для оценки точности нейроструктурных моделей управляемых распределённых объектов. Сформулированы практические рекомендации по организации процесса обучения нейросетевых структур и их применению.
Предложенные нейроструктурные модели и алгоритмы применены для решения прикладной задачи идентификации распределённых процессов энерговыделения в активной зоне ядерного реактора типа ВВЭР-1000 при совершении манёвра мощности. Построены модель управляемых процессов энерговыделения в фиксированном узле активной зоны, модель профиля ЭВ ТВС и модель пространственного поля ЭВ в активной зоне реактора.
Для проведения исследований нейроструктурных моделей управляемых распределённых объектов разработана специализированная программная система.
Средствами разработанной программной системы проведены серии компьютерных экспериментов, демонстрирующих точность построенных нейроструктурных моделей энерговыделения и подтверждающих их обобщающие способности в ограниченном пространстве типовых управляющих воздействий.
Результаты проведённых теоретических и экспериментальных исследований подтверждают применимость разработанного методического и алгоритмического обеспечения для решения задач идентификации управляемых систем с распределёнными параметрами, а новый предложенный тип нейроструктурных математических моделей может найти применение и в других проблемных областях.
Библиография Трофимов, Александр Геннадьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Нелинейные эффекты в хаотических и стохастических системах / B.C. Анищенко и др.. М.; Ижевск: Институт компьютерных исследований, 2003.
2. Малинецкий, Г.Г. Современные, проблемы нелинейной динамики / Г.Г. Малинецкий, А.Б. Потапов. М.: УРСС, 2000.
3. Перельман, И.И. Оперативная идентификация объектов управления / И.И. Перельман М.: Энергоиздат, 1982.
4. Заде, JI. Теория линейных систем. Метод пространства состояний / JI. Заде, Ч. Дезоер. -М.: Наука, 1970.
5. Современные методы* идентификации систем / Под ред. П. Эйкхоффа; пер. с англ. М.: Мир, 1983.
6. Эйкхофф, П. Основы идентификации систем управления / П. Эйкхофф. М.: Мир, 1975.
7. Методы классической и современной теории автоматического управления. Том 2: статистическая динамика и идентификация систем автоматического управления / Под ред. К.А. Пупкова и Н.Д. Егупова. М'.: Изд-во МГТУ им. Н.Э. Баумана, 2004.
8. Гроп, Д. Методы идентификации систем / Д. Гроп. М.: Мир, 1979.
9. Сейдж, Э. Идентификация систем управления / Э. Сейдж, Д. Мелса. М.: Наука, 1974.
10. Осовский, С. Нейронные сети для обработки информации / С. Осовский. -М.: Финансы и статистика, 2002.
11. Хайкин, С. Нейронные сети: полный курс / С. Хайкин. М.: Вильяме, 2006.
12. Galushkin, A.I. Neural networks theory / A.I. Galushkin. Springer, 2007.'
13. Sutton, R. Learning to predict by the methods of temporal differences / R. Sutton // Machine Learning. 1988. - № 3. - Pp. 9-44.
14. Narendra, K. Identification and control of dynamical systems using neural networks / K. Narendra, K. Parthasarathy // IEEE Transactions on Neural Networks. - 1990. - Vol. 1, № 1. - Pp. 4-27.
15. Kuroe, Y. Identification of nonlinear dynamical systems by recurrent high-order neural networks / Y. Kuroe, H. Ikeda, T. Mori // Proceedings of the IEEE International Conference on. Systems, Man and Cybernetics. 1997. - Vol. 1. -Pp. 70-75.
16. Chow, T. Application of modified sigma-pi-linked neural network to dynamical system identification / T. Chow, G. Fei, Y. Yam // Proceedings of the 3rd IEEE Conference on Control Applications. 1994. - Vol. 3. - Pp. 1729-1733.
17. Bailer-Jones, С. A Recurrent Neural Network for Modelling Dynamical Systems. Network / C. Bailer-Jones, D. MacKay // Computation in Neural Systems. -1998.-№ 9.-Pp. 531-547.
18. Wang, Y. Runge-Kutta neural network for identification of dunamical systems in high accuracy / Y. Wang, C. Lin // IEEE transactions on neural networks. — 1998. Vol. 9, № 2. - Pp. 294-307.
19. Geometry from a time series / N. Packard, J. Crutchfield, J. Farmer, R. Shaw // Physical Review Letters. 1980. - Vol. 45, № 9. - Pp. 712-716.
20. Takens, F. Detecting strange attractors in turbulence / F. Takens // Dynamical systems and turbulence. Lecture notes in mathematics // Eds. D.A. Rand, L.-S. Young.-Berlin: Springer-Verlag, 1981.-Vol. 898.-Pp. 366-381.
21. Mane, R. On the dimension of the compact invariant sets of certain nonlinear maps / R. Mane // Dynamical systems and turbulence. Lecture notes in mathematics // Eds. D.A. Rand,* L.-S. Young. Berlin: Springer-Verlag, 1981. — Vol. 898.-Pp. 230-242.
22. Delay Embeddings for Forced Systems II. Stochastic Forcing / J. Stark, D. S. Broomhead, M. E. Davies, J. Huke // Journal of Nonlinear Science. -2003. Vol. 13, № 6. - Pp. 519-577.
23. Leontaritis, I. J. Input-output parametric models for nonlinear systems: Part I -Deterministic nonlinear systems / I. J. Leontaritis, S.A. Billings // International Journal of Control. 1985. - Vol. 41. - Pp. 303-329.
24. Leontaritis, I.J. Input-output parametric models for nonlinear systems: Part II -Stochastic nonlinear systems / I. J. Leontaritis, S.A. Billings // International Journal of Control. 1985. - Vol. 41. - Pp. 329-344.
25. Льюнг, JI. Идентификация систем. Теория для пользователя / Л. Льюнг. М.: Гл. ред. физ.-мат. лит., 1991.
26. Todorovic, N. State of the art in nonlinear dynamically stem identification" using" artificial neural networks / N. Todorovic // Proceedings of 8th Seminar on Neural Network Applications in Electrical Engineering, NEUREL-2006. 2006. -Pp. 103-108.
27. Lang, K. A time-delay neural network architecture for isolated word recognition / K. Lang, A. Waibel, G. Hinton//Neural Networks. 1990. -№ 3. - Pp. 23-43.
28. Weigend, A. Times series prediction: Forecasting the future and understanding the past / A. Weigend, N. Gershenfield. MA: Addison-Wesley, 1994.
29. Sundararajan, Y. Analysis of minimal radial basis function network algorithm for real-time identification of nonlinear dynamic systems / Y. Sundararajan, P. Saratchandran // Control Th'eory Applications. 2000. - Vol. 147, №4. -Pp. 476-484.
30. Junge, Т. Off-line identification of nonlinear time-invariant systems using structurally adaptive radial basis function networks / T. Junge, H. Unbehauen // Proceedings of the 35th Conference on Decision and Control. 1996. -Pp. 943-948.
31. Zhang, Q. Wavelet Networks / Q. Zhang, A. Benveniste // IEEE transactions on neural networks. 1992. - Vol. 3. - Pp. 889-898.
32. Ling, S. Genetic algorithm-based variable translation wavelet neural network and its application / S. Ling, F. Leung // Proceedings of International Joint Conference on Neural Networks. 2005. - Pp. 1365-1370.
33. Lee, T. Wavelet-neural-network-based backstepping control for chaotic systems / T. Lee, C. Lin, C. Hsu // Proceedings of International Joint Conference on Neural Networks. 2005. - Pp. 384-389.
34. Dynamic wavelet neural network for nonlinear dynamic system identification / Y. Tan, X. Dang, F. Liang, C'. Su // Proceedings of the IEEE International Conference on Control Applications. 2000. - Pp. 214-219.
35. Patra, J. Nonlinear dynamic system identification using Chebyshev functional link artificial neural networks / J. Patra // IEEE Transactions on Systems. 2002. -Vol. 32, №4.-Pp. 505-511.
36. Mackenzie, M. Hermite neural network correlation ~ and- application / M.Mackenzie, A. Tieu // IEEE Transactions on' Signal Processing. 2003. -Vol. 51, № 12. - Pp. 3210-3219.
37. Barreto, G. Identification and control of dynamical systems using the self-organizing map / G. Barreto, A. Araujo // IEEE Transactions on Neural Networks.-2004.-Vol. 15, №5.-Pp. 1244-1259.
38. Temporal Sequence Processing using Recurrent SOM / T. Koskela, M. Varsta, J. Heikkonen, K. Kaski // Proceedings of the Second International Conference on Knowledge Based Engineering Systems KES'98. - 1998. - Vol. 1. -Pp. 290-296.
39. Varsta, M. Self-organizing maps in sequence processing : diss. . degree Doctor of Science in Technology / M. Varsta. 2002.
40. Williams, R. A learning algorithm for continually running fully recurrent neural networks / R. Williams, D. Zipser // Neural Computers. 1989. - Vol. 1, № 2. -Pp. 270-280.
41. Chan, L. Locally connected recurrent networks : technical report CS-TR-95-10, the Chinese University of Hong Kong, Computer Science Department / L. Chan, E. Young. 1995.
42. Siegelmann, H. Turing computability with neural nets / H. Siegelmann, E. Sontag
43. Applied Mathematics Letters. 1991. - Vol. 4, № 6. - Pp. 77-80.
44. Siegelmann, H. Computational power of neural networks / H. Siegelmann, E. Sontag // Journal of Computer System Sciences. 1995. - Vol. 50, № 1. — Pp. 132-150.
45. Siegelmann, H. Computational capabilities of recurrent NARX neural networks : technical report UMIACS-TR-95-12, CS-TR-3408 / H. Siegelmann., B. Home, C. Giles. 1995.
46. Rumelhart, R. Learning internal representation by error backpropagation / R. Rumelhart, G. Hinton, R. Williams // Parallel Distributed Processing: Explorations in Microstructure of Cognition. 1986. - Vol. 1. - Pp. 318-362.
47. Schmidhuber, J. A local learning algorithm for dynamic feedforward and recurrent networks : Report FKI-124-90 / J. Schmidhuber. 1990.
48. Elman, J. L. Finding structure in time / J.L. Elman // Cognitive Science. 1990. -Vol. 14.-Pp. 179-211.
49. Jordan, M. Generic constraints on underspecified target trajectories / M. Jordan // Proceedings of the International Joint Conference on Neural Networks. 1989. -Pp. 217-225.
50. Medsker, L. Recurrent neural networks: Design and applications /~L. MedskerT L. Jain. CRC Press, 2000.
51. Fernandez, B. Nonlinear dynamic system identification using artificial neural networks / B. Fernandez, A. Parlos, W. Tsai // Proceedings of the International Joint Conference on Neural Networks. 1990. - Pp. 133-141.
52. Puskorius, G. Neurocontrol of nonlinear dynamical systems with Kalman filter trained recurrent networks / G. Puskorius, L. Feldkamp // IEEE Transactions on Neural Networks. 1994. - Vol. 5, № 2. - Pp. 279-297.
53. Li, X. Dynamic system identification via recurrent multilayer perceptrons. Information Sciences / X. Li, W. Yu // Informatics and Computer Science: An International Journal. 2002. - Vol. 147, № 1. - Pp. 45-63.
54. Narendra, К. Gradient methods for the optimization of dynamical j systems containing neural networks / K. Narendra, K. Parthasarathy // IEEE Transactions on Neural Networks. 1991. - Vol. 2, № 2. - Pp. 252-262.
55. Kinouchi, M. Learning temporal sequences by complex neurons with local feedback / M. Kinouchi, M. Hagiwara // Proceedings of IEEE International Conference on Neural Networks. 1995. - Vol. 6. -Pp. 3165-3169.
56. Самарский, A.A. Теория разностных схем / A.A. Самарский. M.: Наука, 1989.
57. Parlos, A. Application of the recurrent multilayer perceptron in modeling complex process dynamics / A. Parlos, K. Chong, A. Atiya // IEEE Transactions on Neural Networks. 1993. - Vol. 5, № 2, Pp. 255-266.
58. Heister, F. An approach for the identification of nonlinear, dynamic processes with Kalman-filter-trained recurrent neural structures : report no. 193, University of Wurzburg, Institute of Computer Science / F. Heister, R. Muller. 1999.
59. Tutschku, K. Recurrent Multilayer Perceptrons for Identifcation and Control: The Road to Applications : report № 118, Institute of Computer Science, University of Wurzburg / K. Tutschku. 1995.
60. Chen, S. Non-linear system identification using neural networks / S.Chen, S. Billings, P.1 Grant // International Journal of Control. 1990. - Vol. 51, № 6. -Pp. 1191-1214. ' s< '
61. Home, B. An experimental comparison of recurrent neural networks / B. Home,
62. C. Giles // Advances in Neural Information Processing Systems // Eds.
63. D. Tesauro, D. Touretzky, T. been. MIT Press, 1995. - Pp. 697-704.
64. A delay damage model selection algorithm for NARX neural networks / T. Lin, L. Giles, B. Home, S. Kung // IEEE transactions on signal processing. Special issue on neural networks. 1997. - Vol. 45, № 11. - Pp. 2719-2730.
65. Billings, S. Recurrent radial basis function networks for ^"adaptive-noise" cancellation / S. Billings, C. Fung // Neural Networks. 1995. - Vol. 8, № 2. -Pp. 273-290.
66. Cheung, Y. A new recurrent radial basis function network / Y. Cheung // Proceedings of the 9th International Conference on Neural Information Processing (ICONIP). 2002. - Vol. 2. - Pp. 1032-1036.
67. Learning chaotic dynamics in recurrent RBF network / T. Miyoshi, II. Ichihashi, S. Okamoto, T. Hayakawa // Proceedings of the IEEE International Conference on Neural Networks. 1995.-Vol. l.-Pp. 588-593.
68. De Vries, B. The gamma model a new neural model for temporal processing / B. De Vries, J. Principe // Neural Networks. - 1992. - Vol. 5. - Pp. 565-576.
69. Motter, M. A gamma memory neural network for system identification / M. Motter, J. Principe // IEEE International Conference on Neural Networks '94. -1994.-Pp. 3232-3237.
70. Cholewo, T. Exact gradient calculation in gamma neural networks / T. Cholewo, J. Zurada, A. Cichocki // In Proceedings of International Symposium on Nonlinear Theory and its Applications. 1997. - Pp. 767-770.
71. The gamma MLP using ' multiple temporal resolutions for improved classification / S. Lawrence, A. Back, A. Tsoi, C. Giles // IEEE Workshop on Neural Networks for Signal Processing '97. - 1997. - Pp. 362-367.
72. Back, A. FIR and IIR synapses, new neural network architecture for time series modeling / A. Back, A. Tsoi // Neural Computing. 1991. - Vol.3. -Pp. 375-385.
73. Tsoi, A. Locally recurrent globally feedforward networks: A critical review of architectures / A. Tsoi, A. Back // IEEE Transactions on Neural Networks. 1994. -Vol. 5.-Pp. 229-239.
74. Frasconi, P. Local feedback multilayered networks / P. Frasconi, M. Gori, G. Soda//Neural Computing. 1992. - Vol. 4.-Pp. 120-130.
75. Bengio, Y. Learning the dynamic of speech with backpropagation for sequences / Y. Bengio, R. DeMori, M. Gori // Pattern Recognition Letters. 1992. -Vol. 13.-Pp. 375-385.
76. Mozer, M. A focused backpropagation algorithm for temporal pattern recognition / M. Mozer//Complex Systems. 1989.-Vol. 3.-Pp. 349-381.
77. Janczac, A. Identification on nonlinear systems using neural networks and polynomial models. A block-oriented approach / A. Janczac. Berlin; New York: Springer, 2005.
78. Haber, R. Nonlinear system identification input-output modeling approach. Volume 1: Nonlinear system parameter identification TR. Haber, L. KeviczkyT-New York: Springer, 1999.
79. Mandic, D. Recurrent neural networks for prediction. Learning algorithms, architectures and stability / D. Mandic, J. Chambers. New York: Wiley, 2001.
80. Balestrino, A. Approximation of Hammerstein/Wiener Dynamic Models / A. Balestrino, A. Caiti // IEEE International Joint Conference on Neural Networks IJCNN. 2000. - Vol. 1. - Pp. 70-74.
81. Chen, Y. Identification of chaotic systems using a self-constructing recurrent network / Y. Chen, J. Wang // Proceedings of the IEEE International Conference on Systems, Man and Cybernetics. -2005. Vol. 3. - Pp. 2150-2155.
82. Хакен, Г. Синергетика. Иерархии неустойчивости в самоорганизующихся системах и устройствах / Г. Хакен. М.: Мир, 1985.
83. Sinha, N. Modeling and Identification of Dynamic Systems / N. Sinha, B. Kuszta New York: VanNostrand Reinhold Co., 1983.
84. Ucianski, D. Optimal Measurement Methods for Distributed Parameter System Identification / D. Ucianski. Boca Raton: CRC Press, 200584. Приклонский, В:И. Численные методы / В .И. Приклонский. — М.: МГУ, 1999.
85. Власова, Е.А. Приближённые методы математической физики, /
86. Е.А. Власова; под ред. B.C. Зарубина, А.П. Крищенко. М.: Изд-воМГТУ им; Н.Э. Баумана; 2001.86: Зенкевич, О. Конечные элементы и аппроксимация / О. Зенкевич М.: Мир, 1986.
87. Chirikjian, G. A modal : approach to hyper-redundant manipulator, kinematics / G. Chirikjian- J. Burdick // IEEE Transactions on Robotics and Automaton. — 1994. Vol. 10, № 3. - Pp. 343-354.
88. Kugi, A. Tracking control of distributed-parameter systems: from? theory" to applications / A. Kugi- // Proceedings; of^ 6th International. Congress on Industrial, and Applied Mathematics. 2007. - Pp. 191-192.
89. Горбаченко, В.И. Нейрокомпьютеры в решении краевых задач теории поля. Книга 10-: учеб. пособие для вузов / В.И. Еорбаченко. — М.: Радиотехника, 2003: '
90. Нейроматематика. Книга 6. : учеб. пособие для вузов / под общ: ред: А.И: Галушкина. М.: ИПРЖР, 2002.
91. Васильев, А.Н. Новые подходы на основе RBF-сетей: к решению краевых задач для уравнения Лапласа на. плоскости / А.Н. Васильев, Д.А. Тархов // Нейрокомпьютеры: разработка и применение. -2004. -№ 7-8. С. 119-126.
92. Тархов, Д.А. Математическое моделирование физико-технических объектов на основе структурной и параметрической адаптации искусственных нейронных сетей : дис. . д-ра техн. наук : 05.13.18 / Тархов Дмитрий Альбертович. СПб, 2006.
93. Тархов, Д.А. Нейронные сети: модели и алгоритмы / Д.А. Тархов. М.: Радиотехника, 2005.
94. Two neural network models for nuclear engineering applications / O.A. Mishulina, V.S. Kharitonov, M.V. Scherbinina, A.G. Trofimov, A.A. Uskova // Optical Memory&Neural Networks. 2005. - Vol. 14, № 1. - Pp. 23-44.
95. Моделирование нейтронного потока в активной зоне ВВЭР с помощью нейросетевых технологий / О.А. Мишулина, А.А. Пинегин, А.Г. Трофимов, Б.Е. Шумский // Научная сессия МИФИ-2007. Сборник научных трудов. -М.: МИФИ, 2007. Т.8. - С. 160-162.
96. Трофимов, А.Г. Нейросетевое моделирование распределённых процессов энерговыделения в активной зоне реакторной установки / О.А. Мишулина,
97. A.Г. Трофимов // Нейрокомпьютеры: разработка и применение. 2007. -№ 9. - С. 57-70.
98. Коршунов, Ю.М. Математические основы кибернетики / Ю.М. Коршунов. -М.: Энергоатомиздат, 1987.
99. Jacobs, R.A. Increased Rates of Convergence Through Learning Rate Adaptation / R.A. Jacobs // Neural Networks.- 1988. Vol. 1. - Pp. 295-307.
100. Вапник, В. H. Восстановление зависимостей по эмпирическим данным /
101. B. Н. Вапник. М.: Наука, 1979.г
102. Климов, А. Н. Ядерная физика и ядерные реакторы / А.Н.Климов. М.: Энергоатомиздат, 1985.
103. Ядерные энергетические установки : учеб/ пособие для вузов / под общ. ред. акад. Н. А. Доллежаля. М.: Энергоатомиздат, 1983.
104. Шумский, Б. Е. Результаты и опыт аттестации программы NOSTRA / Б. Е. Шумский, А. А. Пинегин // Научная сессия МИФИ-2004. Сборник научных трудов. М.: МИФИ," 2004 - Т. 8. - С. 70-71.
105. Прикладная статистика. Классификация и. снижение размерности / С. А. Айвазян. М.: Финансы и статистика, 1989.
106. Трофимов А.Г. Разработка системы» NSTRUCT для моделирования и обучения нейросетевых структур / А.Г. Трофимов // Научная сессия МИФИ-2007. Сборник научных трудов. М.: МИФИ, 2007. - Т.2. - С. 12-13.'
107. Трофимов, А.Г. Разработка программной системы NeuroDynamica для нейросетевого моделирования динамических объектов / А.Г. Трофимов,
108. B.И. Скругин // Научная сессия МИФИ-2008. Сборник научных трудов. М.: МИФИ, 2008.-Т. 11.-С. 109-110.
109. Пакет прикладных программ N-FONTO для построения нейросетевых моделей в ядерной энергетике / А.Г. Трофимов и др. // Сборник научных трудов VII Всероссийской» научно-технической конференции "Нейроинформатика-2005". М.: МИФИ, 2005. - Т. 2. - С. 182-190.
110. Разработка системы N-FONTO для решения задач ядерной теплоэнергетики /
111. АЛЛ Трофимов и др. // Научная* сессия МИФИ-2005. Сборник научныхтрудов. М.: МИФИ, 2005. - Т. 2. - С. И7-118/ " ""
112. Трофимов А.Г. Нейросетевые структуры в задачах моделирования физических переменных / О.А. Мишулина, А.Г. Трофимов, М.В. Щербинина // Труды 62-ой- Научной сессии РНТОРЭС им. А.С. Попова. 2007.1. C.102-105.
113. Трофимов А.Г. Нейросетевой прогноз выживаемости клеток при гипертермическом воздействии / О.А. Мишулина, А.Г. Трофимов // Новости искусственного интеллекта. — 2007.
114. Trofimov A.G. Neural network model of cell survival under hyperthermia / V.V. Kosterev, O.A. Mishulina, A.G. Trofimov // IFMBE Proceedings WC 2006 "World Congress on Medical Physics and Biomedical Engineering". 2006. -Vol. 14.-Pp. 3393-3396.
115. Trofimov A.G. Cell survival data processing with artificial neural networks / V.V. Kosterev, O.A. Mishulina, A.G. Trofimov // 23-rd Annual Meeting of the European society for hyperthermic oncology. Abstract Book. 2006. - Pp. 114115.
116. Neural model of cells equisurvival lines under hyperthermia / V.V. Kosterev, E.A. Kramer-Ageev, O.A. Mishulina, A.G. Trofimov // 24-rd Annual Meeting of the ESHO. Abstract Book. 2007. - Pp. 89-90.
117. Мазохин, B.H. Современное состояние и перспективы применения электромагнитной гипертермии в медицинской практике / В.Н. Мазохин, Э.А. Гельвич // Биомедицинская радиоэлектроника. — 2000. — № 11. — С. 29-36.
118. Hyperthermia and Oncology. Volume 2: Biology of Thermal Potentiation of Radiotherapy / ed. by M. Urano, E. Douple. Zeist: VSP, 1989.
119. Ярмоненко, С. П. Радиобиология человека и животных : учеб. пособие / С. П. Ярмоненко, А. А. Вайнсон М.: Высшая школа, 2004.
120. Параллельная реализация алгоритмов обучения модульной нейросети и ее работы / А.Г. Трофимов и др. // Научная сессия МИФИ-2008: Сборник научных трудов. М.:МИФИ, 2008. - Т.12. - С.121-122.
121. Нейросети в задаче траекторного управления динамическим объектом / О.А. Мишулина, А.Г. Трофимов, Б.Е. Федунов, М.А. Демкин // Авиакосмическое приборостроение. 2007. - № 1. - С.31-37.
122. Дьяконов, В. MATLAB. Анализ, идентификация и моделирование систем. Специальный справочник / В. Дьяконов, В. Круглов СПб.: Питер, 2001.
-
Похожие работы
- Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
- Применение нейрокомпьютеров для представления и визуализации статических и динамических трехмерных данных
- Разработка комбинированного нейросетевого способа, моделей и средств для оперативного управления сложными техническими системами
- Разработка и исследование маршрута проектирования нейросетевого приложения с аппаратной поддержкой
- Нейросетевое моделирование в математической физике
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность