автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Численное моделирование задач гравиразведки, представимых интегральными уравнениями в свертках, на искусственных нейронных сетях
Автореферат диссертации по теме "Численное моделирование задач гравиразведки, представимых интегральными уравнениями в свертках, на искусственных нейронных сетях"
На правах рукописи
4850902
КУЧУМОВ Евгений Владимирович
ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ ЗАДАЧ ГРАВИРАЗВЕДКИ,
ПРЕДСТАВИМЫХ ИНТЕГРАЛЬНЫМИ УРАВНЕНИЯМИ В СВЕРТКАХ, НА ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЯХ
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Автореферат диссертации на соискание ученой степени кандидата технических наук
2 3 ИЮН 2011
ПЕНЗА 2011
4850902
Диссертационная работа выполнена на кафедре «Высшая и прикладная математика» в Государственном образовательном учреждении высшего профессионального образования «Пензенский государственный университет».
Научный руководитель - доктор физико-математических наук,
профессор Бойков Илья Владимирович.
Официальные оппоненты: доктор технических наук, профессор
Горбаченко Владимир Иванович;
доктор технических наук, профессор Малыгин Александр Юрьевич.
Ведущая организация - ФГУП «ПНИЭИ» (г. Пенза).
Защита диссертации состоится «*<£_» г., в 14 часов,
на заседании диссертационного совета Д 212.186.04 в Государственном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.
С диссертацией можно ознакомиться в библиотеке Государственного образовательного учреждения высшего профессионального образования «Пензенский государственный университет». Автореферат размещен на сайте www.pnzgu.ru
Автореферат разослан . МАЛ- 2011 г.
Ученый секретарь диссертационного совета доктор технических наук, профессор
^¿ВД, Смогунов В. В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Многие важные задачи физики, техники, экономики, социологии и т.д. представляют собой так называемые обратные задачи. Математически обратные задачи чаще всего выражаются с помощью интегральных или интегродифференциальных уравнений в свертках. Ярким примером является задача гравиразведки, математическая модель которой описывается нелинейными интегральными уравнениями в свертках первого рода.
Главная сложность в решении обратных задач, описываемых интегральными уравнениями в свертках первого рода, заключается в том, что они в подавляющем большинстве являются некорректными задачами, в отличие от прямых задач. Они характеризуются тем, что сколь угодно малые изменения исходных данных могут приводить к произвольно большим изменениям решений. Поэтому многие классические вычислительные методы неприменимы к этим задачам.
С другой стороны, теория искусственных нейронных сетей (ИНС), возникшая в середине прошлого столетия, изначально позиционировала себя как средство решения неформализуемых или трудноформализуемых задач, к которым относят задачи распознавания образов, классификации и кластеризации, оптимального управления и т.д. ИНС являются перспективными средствами решения вышеуказанных задач. Поэтому представляет интерес применение ИНС к решению интегральных уравнений в свертках.
В последнее время значительно возрос интерес к численным алгоритмам решения задач математической физики на ИНС. В общем случае алгоритмы численного моделирования обратных задач сводятся к задачам аппроксимации и итерационным методам решения операторных уравнений.
Тем не менее в настоящее время отсутствуют работы, посвященные решению интегральных уравнений первого (некорректная задача) и второго рода на ИНС. Практически отсутствуют методы и алгоритмы решения обратных задач на ИНС.
Перечисленные обстоятельства делают проблему решения обратных задач, и в частности интегральных уравнений первого рода в свертках, на ИНС актуальной. Решению этих вопросов посвящена данная диссертационная работа.
Цель работы состоит в приближенном решении интегральных уравнений в свертках на искусственных нейронных сетях и в применении полученных результатов к задачам гравиразведки.
Для достижения поставленной цели необходимо решить следующие задачи:
- разработать методы приближенного представления функций многих переменных на ИНС;
- разработать численные алгоритмы локализации минимума функции многих переменных (как периодической, так и непериодической) и программную реализацию данных алгоритмов на ИНС;
- построить формулы приближенного вычисления кратных интегралов, допускающих реализацию на ИНС;
- разработать численные алгоритмы решения интегральных уравнений на ИНС с использованием формул приближенного вычисления кратных интегралов и программную реализацию данных алгоритмов;
- построить итерационные формулы решения интегральных уравнений в свертках Фредгольма и Вольтерра;
- провести численное моделирование динамики колебаний чувствительного элемента струнного гравиметра;
- разработать комплексы программ, реализующие разработанные численные алгоритмы.
Методы исследования. В работе использованы методы функционального анализа, прикладного функционального анализа, теории аппроксимации, квадратурных формул, теории ИНС, теории линейных интегральных уравнений, интегральных преобразований и численных методов. Достоверность научных положений подтверждается соответствием теоретических результатов с результатами численного эксперимента на тестовых задачах.
Научная новизна работы состоит в следующем:
- предложены алгоритмы представления функций многих переменных на искусственных нейронных сетях;
- разработаны алгоритмы локализации минимума функции многих переменных на ИНС, которые применимы как на классе периодических функций, так и апериодических;
- предложены кубатурные формулы приближенного вычисления кратных интегралов на ИНС с использованием теории сведения функции многих переменных к функции одного переменного и преобразования Фурье;
- построены численные алгоритмы решения интегральных уравнений на ИНС с использованием специальных кубатурных формул вычисления кратных интегралов;
- предложены и обоснованы итерационные формулы решения интегральных уравнений в свертках Фредгольма и Вольтерра, эффективно реализуемые на искусственных нейронных сетях;
- разработаны алгоритмы численного решения обратных задач на ИНС с использованием адаптированных итерационных формул.
Теоретическая ценность заключается в следующем:
- предложены и обоснованы приближенные алгоритмы локализации минимума функции многих переменных на ИНС. Алгоритмы основаны на сведении последних к функциям одной переменной;
- предложены и обоснованы численные алгоритмы решения интегральных уравнений на ИНС, основанные на методе сведения многомерных интегралов к одномерным;
- предложены и обоснованы итерационные алгоритмы решения интегральных уравнений в свертках Фредгольма и Вольтерра на ИНС;
- предложены и обоснованы новые итерационные алгоритмы решений уравнений Вольтерра;
- разработаны численные алгоритмы исследования задач гравиразведки;
- исследована динамика колебаний струнного чувствительного элемента с переменным сечением.
Практическая значимость работы состоит в разработке пакета следующих программ:
- локализация минимума функции многих переменных;
- приближенное решение интегральных уравнений первого рода в свертках и, в частности, задач гравиразведки;
- моделирование динамики колебаний чувствительного элемента струнного гравиметра.
Основные положения, выносимые на защиту:
1. Алгоритмы минимизации функций многих переменных, основанные на их сведении к функциям одной переменной, даны оценки точности нахождения экстремальных значений и дана реализация алгоритмов на ИНС.
2. Итерационные методы решения интегральных уравнений первого рода в свертках, разработана методика реализации этих методов на ИНС.
3. Итерационные методы решения интегральных уравнений Вольтерра и Фредгольма в свертках, разработаны алгоритмы реализации итерационных формул на ИНС.
4. Алгоритмы решения задач гравиразведки на ИНС.
5. Численные алгоритмы решения интегральных уравнений на ИНС с использованием формул приближенного вычисления кратных интегралов.
6. Численный алгоритм моделирования динамики колебаний металлического струнного чувствительного элемента переменного сечения для струнного гравиметра.
Публикации. По материалам диссертации опубликовано 9 печатных работ, из них 5 - в изданиях, рекомендованных ВАК.
Апробация работы. Материалы диссертационной работы докладывались и обсуждались на следующих конференциях: Первой Всероссийской конференции «Нейросетевые алгоритмы решения задач математической физики» (Москва, 2007); III Международной научно-технической конференции «Аналитические и численные методы моделирования естественнонаучных и социальных проблем» (Пенза, 2008); VIII Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2008); XXVIII Всероссийской научно-практической конференции молодых ученых и специалистов «Датчики и системы - 2009» (Пенза, 2009); XXIX Всероссийской научно-практической конференции молодых ученых и специалистов «Датчики и системы - 2010» (Пенза, 2010).
Пакет прикладных программ «Приближенные методы решения уравнений динамики колебаний металлической струны» используется в производственной деятельности ОАО «НИИФИ» (акт о внедрении прилагается к диссертации).
Методы, разработанные в данной диссертации, использовались в НИР по проекту «Разработка теории функционирования волоконно-оптических лазерных интерферометрических систем на основе методов идентификации динамических систем с распределенными параметрами» (Рособразо-вание, Per. №2.1.2/937; мероприятие 2, раздел 2.1, подраздел 2.1.2, код ГРНТИ 59.03.05; 59.31.71; 59.45.37); срок выполнения - 2009-2010 гг.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы, приложений и изложена на 239 страницах.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении показана актуальность выбранной темы, обоснованы и сформулированы цели, задачи исследования, обозначены его научная новизна и практическая ценность, сформулированы основные положения, выносимые на защиту, а также приведены сведения о реализации и внедрении результатов, апробации работы и публикациях.
В первой главе диссертационной работы приведены обзоры численных методов решения интегральных уравнений в свертках и, в частности, задач гравиразведки, даны постановка задачи и описание предметной области исследований. Приведен краткий обзор общих результатов теории
аппроксимации. В частности, дан обзор аппроксимации функций многих переменных, работ по представлению функций многих переменных суперпозициями функций одной переменной и операцией сложения.
В первой главе представлены определения интегральных преобразований Фурье и Лапласа (одномерных и многомерных) и теоремы о свертках. Приводятся базовые понятия поиска экстремумов функции многих переменных с описанием конкретных алгоритмов поиска нулевого, первого и второго порядков. Проведен анализ итерационных методов решения операторных уравнений, интегральных уравнений в свертках (одномерных и многомерных) с точки зрения их применения в искусственных нейронных сетях. Приводятся определения классов функций, используемых в работе.
Приведены принципиальные схемы ИНС. Подробно описаны функциональные схемы радиальной базисной сети и нейронной сети в виде карты Кохонена.
Вторая глава посвящена представлению функций многих переменных на ИНС и методам локализации минимума функции многих переменных.
Основная концепция исследования - разработка простого в реализации и достаточно точного метода представления функции многих переменных в ИНС.
Разработаны методы локализации минимума функций многих переменных, основанные на сведении функций многих переменных к функциям одной переменной. Предложены алгоритмы приближенного нахождения экстремальных значений непрерывных и кусочно-непрерывных функций, заданных в ограниченных областях, получены оценки точности нахождения экстремумов в предположении, что a priori известно функциональное множество, к которому принадлежит исследуемая функция.
Разработан алгоритм нахождения экстремальных значений периодических функций многих переменных, основанный на аппроксимации последних с помощью гладких функций одной переменной, допускающий простую реализацию на нейронных сетях. К полученным в результате такой аппроксимации функциям одной переменной применяются известные алгоритмы поиска экстремальных значений.
Предложен следующий общий способ локализации наименьшего значения для функции двух переменных /(х},х2). Пусть функция f{p\t,p2t), где pi и рг (pi <pi) - простые числа, принимает наименьшее значение в точке /*, и это значение равно |v|0. Отсюда и из условия \f{x\,х2) — f(x[,x2)\^\x[-*i| + |jc2 -x2j следует, что минимальное значение функции f(x¡,х2) не может быть меньшим, чем =|v|0 ~л1р2 ~ Р\\/Pi ■ Выделим множество точек {/>1?а,/>2'а}» на которых < fip^t, p2t) < -Ho + nK + Pi|/P2- в n\P2~P\\/P2 окрестности точек {/Va,p2'a} нахо"
дится минимум j функции /(x^xj) ■ Обозначим эту окрестность точек {Р1(а'Р2(а] через Qj. Возьмем другую пару простых чисел q\ и д2 (<7i > Р\<42 > Рг)- Повторяя проведенные выше выкладки, получаем £22-окрестность [x^x^J- Очевидно, точка ^j*,^) лежит в пересечении окрестностей £2] и £22 > чт0 позволяет с большой степенью точности локализовать ее расположение. Продолжая этот процесс, месторасположение точки |х|*,х2 j локализуется с высокой степенью точности. В случае разрывных
функций алгоритмы модифицируются, но их оценки и структура сохраняют свой вид.
Данный результат обобщен на произвольное число переменных.
Разработаны и проанализированы четыре алгоритма нахождения минимума непериодических функций многих переменных.
•7
В первом алгоритме в области £2} =[0,1] переменные представлены в виде периодических функций
Xi(t) = Pit-[Pit], te [ОД], i = 1,2, pt ±ръР\ и N, (1)
здесь [у] означает целую часть аргумента у.
Сводим функцию f(x^x2) к одномерной функции /(f): /(^¡(гХ-^СО) = ДО • Ограничением данного метода является наличие разрывов первого рода у функции /(f). По этой причине к функции f(t) можно применять только методы нулевого порядка. При этом справедливы оценки, полученные для периодических функций.
Следующий алгоритм является обобщением предыдущего и заключается в зеркальном отображении отрезка прямой {xl(t),x2(t) =/) в точках,
лежащих на контуре Э£2 области £2, £2=[-1,1]2. Если таковой является точка (а,1), -1<я<1, то отображение осуществляется относительно прямой Xi =a. Фактически это означает построение в квадрате £2 ломаной
хх0) = (-1Г0 (pit +1) - (2 • n(t) +1)), n(t) =
p(f + l)
. *2 = t, (2)
гае te [-1,1],ре N.
Замена переменных переводит функцию /(х^,х2) из множества непрерывно дифференцируемых функций в множество функций, удовлетворяющих условию Липшица. Из-за разрывов производных /(О применимы только методы оптимизации нулевого порядка. Так как функция при-
надлежит классу Липшица, то применимы конечно-разностные методы оптимизации, например, метод Ньютона-Канторовича в конечно-разностной форме. Также сохраняются оценки точности аппроксимации экстремумов, приведенные выше.
Наряду с (2) используется для переменной д:; подстановка
хх (г) = 8ш(2я • р • г), х2 = /.
Для этой подстановки применяются методы оптимизации первого и второго порядков. В работе исследованы параллельные алгоритмы: хк(г) = 8т(2яр* + с^), х2 = £=1,2,...,М.
Четвертый алгоритм использует подстановку в форме спирали Архимеда. Замена переменных в этом случае
*1(0 -«»(оа-г), х2 = г• втСсо■ 0, о = 2п-р, (3)
где [0,1],ре N.
Такая подстановка избавляет от недостатков предыдущих методов -разрывов функции или ее производных. В этом случае используются как методы нулевого порядка, так и методы оптимизации второго порядка.
Основным недостатком данного метода является то, что область определения функции /(х1,х2) должна быть отображением окружности с помощью конформных или других гладких отображений. Поэтому при практическом использовании данного метода необходимо покрыть область £2 кругами, в каждом из которых применить развертку по спирали. В этом случае эффективно использование параллельных алгоритмов.
Предложенные алгоритмы реализованы на ИНС.
Разработан метод вычисления кратных интегралов, просто реализуемый на ИНС. Способ основан на использовании приближенного представления кратных интегралов в виде одномерного интеграла.
Пусть функция /(х1,х2,---,Х[) непрерывна в /-мерном кубе С/, определенном неравенством 0<*„<2я (V = 1,2,...,/), и имеет период, равный 2п по каждой переменной Ху. Через С{т\,...,т{) обозначим коэффициенты Фурье этой функции. Величины щ определены равенствами гйу = 1, если щ =0, ту = |я1,,|, если ШуФ 0: 2л 2п 2я
/■■•/л*!.....ХдУ1х1...с1хд=(2п)1-1 {/(-?!?.....д,1)Л-(2п)1 £ ..,£/),(4)
оо о Ч ,...,*/
где <71*<72^ — ^Ц ~ простые числа; X' означает суммирование по к^, У=1,2,...,/, таким, что (¿1,&2—>£;)?*(0,0>...,0) и + + кгдг+ ■•• +к^1 = 0.
В диссертационной работе реализован метод вычисления кратных интегралов на ИНС, основанный на формуле (4). Для этого используются нейронные сети Хопфилда. Рассмотрим задачу Коши:
% = (5)
си
5(0) = 0. (6)
Решение задачи (5), (6) имеет вид
X
о
Следовательно,
2п
5(271) = ¡/(в^^Ж. О
Таким образом, решение задачи Коши (5), (6) приводит к вычислению кратного интеграла.
Разработан и программно реализован метод приближенного решения интегральных уравнений на ИНС.
Представлен способ вычисления коэффициентов Фурье на нейронных сетях.
Пусть функция /(х1,Х2) представима рядом Фурье
/(хьх2) = с{ 0,0)+ £ с{к,1)ет^\ (7)
(*,г)*(о,о)
Умножим (7) на е~'(пХ1+тХ2). Имеем
/Й.*2)е",(лч+,В4) = + £ с^,0е'((А"л)дГ1+(г"т)Л2). (8)
(к,1*0,0)
Интегрируя это равенство, имеем 2л2п
\ 11(хх,х2)е~Кп*^тх'1)<1ххс1х2 = с(п,т)4п2 . (9)
о о
Возьмем два простых числа ^ {ч\ * Яг) и сделаем в равенстве (8) подстановку х\ = д^ результате получаем
к,1=-<*> (к,1М0,0)
Проинтегрируем равенство (10). Имеем
2 п о»
¡/(4М2г)еЧ("д1+""!2)'=2лф,т) + 2л £ (1])
0 (*.0=-~
где означает суммирование по (к,1) Ф (п,т) и таким, что
Из формулы (11) следует, что
. 2 П оо
Ф,т)=± ¡т^е-^^'Л- X ''и- (12) 271 о
Таким образом, погрешность вычисления коэффициентов Фурье по формуле
1 2п
с(п,ш)=-5- /Д^^'^1^2^+ *„„,(/> (13) 271 0
оценивается неравенством
I ' Ы • <14>
Получены оценки на различных классах функций. Вычисление коэффициентов Фурье описанным способом реализовано на ИНС. Для этого, используя формулу (13) для нахождения коэффициентов с(п,т), достаточно реализовать решение задачи Коши
си 271
х(0)=0,
и зафиксировать решение при г = 2л.
Из предложенных выше способов вычисления коэффициентов Фурье следует алгоритм реализации на искусственных нейронных сетях решения интегральных уравнений методом вырожденного ядра. Рассмотрим интегральное уравнение
2л
х(0 + Л ¡/1(Г,т)х(т)с/т = /(0, (15)
о
где
ДОе С[0,2л], А(м)е С[0,2л;0,2л]. 11
Пусть функция й(М)е С". Однако возможны и другие условия, налагаемые на функцию /г(?,т), в частности, условие /¡(¿,т)е Яр р, Р > 1/2.
Вычислив коэффициенты Фурье функции й(?,т), представим ее в приближенном виде:
ЛлетМ» t I
Уравнение (15) аппроксимируется следующим уравнением:
2л
(/,т)*(т)^ = /(г),
о
которое удобно представить в виде
n 2л n
х(г) + Х X еш | £ к{к,Ы1хх{х)с1х =/(/). (16)
*=-ЛГ о /=-ЛГ
Введем обозначение
2я
х(1)= |л:(т)Лт. О
Воспользовавшись этим обозначением, почленно умножая уравнение (16) на функции е'к1 к = -/V, N и интегрируя в пределах от 0 до 2 тс, приходим к системе уравнений
n
х(к) + Х2п £ ЛНиМО = /(*). * = (17)
Решение системы уравнений (17) методом последовательных приближений (при малых значениях X) и рядом других итерационных методов реализовано на ИНС. В частности, для решения системы уравнений (17) реализуется итерационной метод
1
хп+1 хп
А А
(А Ахп-А /), « = 0,1,...,
где А - матрица, описывающая левую часть системы уравнений (17).
В разделе 2.4 описан алгоритм нахождения минимума функции с помощью ИНС в случае двух переменных.
Для нахождения минимума функции /(х1,х2) используется способность нейронных сетей к классификации и кластеризации входных данных, в частности, векторов. Для этого нейронную сеть обучают определять элемент с минимальным значением из некоторого вектора значений. В таком представлении данная задача созвучна задаче распознавания образов.
В работе применяются классические схемы построения искусственных нейронных сетей, в первую очередь самоорганизующиеся нейронные сети и радиальные базисные сети с конкурирующим выходным слоем. В частности, используется одномерная карта Кохонена, программная эмуляция которой реализована в ППП NNT (Neural Network Toolbox) в среде системы MatLAB 6.5.
Третья глава посвящена итерационным алгоритмам решения операторных уравнений, а также итерационным алгоритмам решения интегральных уравнений в свертках Фредгольма и Вольтерра на ИНС.
Раздел 3.1 посвящен исследованию сходимости решений линейных и нелинейных операторных уравнений на нейронных сетях.
В разделе 3.1 рассматривается способ сведения решения операторного уравнения к дифференциальному уравнению специального вида. Указаны условия, при которых решения дифференциальных уравнений стремятся к точному решению исходного операторного уравнения.
Аналогичные утверждения доказаны для сходимости итерационных процессов решения нелинейных операторных уравнений.
Исследованы итерационные методы решения одномерных и многомерных интегральных уравнений Вольтерра. Получены критерии сходимости и оценки погрешности. Предлагаемые итерационные методы реализуются на ИНС.
Отдельный раздел посвящен реализации численных алгоритмов решения уравнений в свертках на ИНС.
В разделе 3.2 предлагается численный алгоритм решения интегрального уравнения в свертках на ИНС.
Для краткости изложение алгоритма приведем для одномерного интегрального уравнения в свертках:
оо
\h{x-x)z{t)dz = y{x). (18)
—оо
Полученные результаты естественным образом распространяются на многомерный случай.
Решение уравнения (18) проводится в несколько этапов: сначала вычисляются значения интеграла Фурье для ядра h{x) и свободного члена
у(х) в точках о/, к =0,1,...,TV, затем с помощью итерационного процесса в тех же точках спектральной области ищется решение уравнения (18).
Вычисления значений интеграла Фурье осуществляется с помощью специальным образом подобранной квадратурной формулы, которая наилучшим образом реализуется на ИНС. В основе численного интегрирования лежит интерполяция подынтегральной функции с помощью некоторых функций /(jrjvv,) (/= 0,l,...,m) или их суперпозиций, интегралы от кото-
рых известны a priori. Интерполяция осуществляется путем нахождения оптимальных значений параметров w¡ (¡ =0,l,...,m). В данной работе за базовую аппроксимирующую функцию берется кривая Гаусса (гауссиан):
f(x)=e~x\ (19)
Данная кривая соответствует функции активации радиальной базисной сети (radial basis network - RBN), являющейся двухслойной ИНС. Количество нейронов во входном слое Н¡ полагается равным количеству нейронов в выходном слое Н2 '■ Н\= Н2.
В основе построения квадратурной формулы лежит следующий интеграл:
00 Г
¡f[b-(x-w)]dx~, (20)
—оо
где w - вес нейрона первого слоя; b - вес смещения нейрона первого слоя.
я2-1
Таким образом, если функции у(х)~ ^Г w2¡ • f[b¡ -(^-^í,)] на интер-
¡=0
вале [xltx2], то
х2 *гНг-\
\y{x)dx= | £ w2i- f{br(x-w{i)}dx = (x2 -x¡) x¡ Í=0
где
h h2-i °°я2-1
i'=0 bi
,(21)
ЯдJ £ ^2rf[b¡-(x-Wu)}dx+ J £ W2rf[br(x-wu)]dx.(22)
«=0 ,2
1 Г -Е2
Если ввести обозначения Ф(х)\ е ^ с1Ъ, и
л/я 3
—оо
оо
1 г
-7= е ' гД; = 1-Ф(.х), то (22) можно переписать следующим образом: л/Л
Rb,(n) = <Jñ
'Нг
\
¿=0 Ь' /=0 Ь<
(23)
Функция Ф(х) связана с интегралом вероятности Лапласа, т.е. хорошо табулированной функцией, заменой переменной х. = х/\[2 и добавлением слагаемого 0,5.
В работе используется алгоритм определения параметров ¿>,- и по структуре схожий с гибридным алгоритмом.
По аналогии со случайным методом выбора коэффициентов формула (23) упрощается с помощью подстановки =Ьп, 1 = 0,...,Н2Здесь Ь является вектором смещения входного слоя, все элементы которого равны между собой. За начальное приближение для Ьп бралось следующее значение:
ЬпЖ,
^шах
где ¿/„^ - максимальное расстояние между выбранными центрами.
Процесс численного интегрирования для ИНС реализован следующим образом. Вначале идет процесс подготовки нейронной сети, который называется этапом грубой настройки. Единственная априорная информация, необходимая для этого этапа, - это число узловых точек п, которое даст нам число нейронов в каждом слое радиальной базисной сети Н2 ■ Предполагается, что необходимо вычислить интеграл от постоянной С=1 в единичном интервале:
1 1 \сйг= |л = 1.
о о
Таким образом, за координаты узловых точек можно взять
х:=—-—, I = 0,1,...,и-1, а значения ординат в узловых точках положить п -1
равными >(л:,) = 1, г' = 0,...,п-1. Произвольный интервал линейным преобразованием сводится к единичному.
Затем составляется система линейных алгебраических уравнений (СЛАУ) относительно м>2,-:
(■=0
Н£^е-ЬпНх^)1=у(х^ (24)
/=о
-Ьп2(хн ,_1-и'1,)2 ч
2, М>Ие 1 =У(*Нг-\)-- «=0
Решив СЛАУ (24), добьемся того, чтобы аппроксимирующая кривая проходила через узловые точки.
Для того чтобы получившаяся кривая как можно более гладко проходила через выбранные точки, применялся следующий алгоритм: пропорционально раздвигались или сдвигались гауссианы от середины интервала интегрирования с помощью еще одного коэффициента а, характеризующего степень «расталкивания-сближения» нейронов:
1__
г* .
= - / = 0,1.....Н2-1. (25)
На этапе грубой настройки коэффициент а полагался равным а = 0. Функционал для определения параметров а и Ьп имел следующий
вид:
н2-2
'я2-1 /
Ьп-
1 1=0 \
х]+х)+\
а)
.(26)
Условие наилучшего приближения определяется равенством
а,Ьп
Этап грубой настройки заканчивается подбором параметра Ьп. Данный этап не является обязательным для использования нейронной сети под каждую конкретную задачу, поэтому для данного числа нейронов грубую настройку можно выполнить один раз, а затем брать начальное приближение Ьп из памяти ЭВМ для следующего этапа.
В начале второго этапа - этапа тонкой настройки - после того, как решена система (24) с вектором свободных членов из значений подынтегральной функции в узлах, оценивается функционал (26). Если выполнено условие
ЧЧа,6л)£5, (27)
где 8 - некоторое заданное значение, то нужная аппроксимация найдена и можно использовать формулу (21) для нахождения приближенного значения интеграла. В случае невыполнения условия (27) осуществляется тонкая настройка сети с помощью параметра а. Замечено, что для большинства функций а изменяется в небольшом интервале [-1,1].
Если с помощью изменения параметра а не удается добиться выполнения условия (27), то применяются два варианта действий:
а) фиксируя наилучшее значение а*, варьировать коэффициент Ьп;
б) разбить исходный интервал интегрирования на меньшие интервалы и использовать нейронную сеть для каждой из них.
С применением данного метода реализована нейронная сеть, которая позволяет получить приближенные значения коэффициентов Фурье в точках О)*, к = 0,1,...,Л', для ядра и свободного члена уравнения (18) (рис. 1).
г(х) 0.5
0.4
\
\ 1 1 2 3
ч
\ 1
14.-. а. —
Рис. 1. Решение уравнения гравиразведки ь
I
£
Н + 1
2
2л '
н (л2 + (Я + I)2)
1 - точное решение; 2 - решение, полученное из аналитических значений с помощью аппроксимации обратного преобразования Фурье по методу трапеций; 3 - решение, полученное из приближенных значений, найденных с помощью ИНС
При решении интегрального уравнения типа свертки итерационным методом возникает потребность подобрать коэффициент регуляризации у так, чтобы выполнялось условие тах|1-уА(6)|<1, что гарантирует выполнение теоремы Банаха. В данном случае в работе используется способность ИНС типа карты Кохонена к классификации и кластеризации векторов, программная эмуляция которой входит в прикладной программный пакет системы Ма&АВ 6.5.
Описание алгоритма подбора параметра регуляризации приведено в конце раздела 3.2.
Интегральными уравнениями Вольтерра в свертках
г
(¡(г- т)*(т)</т =/(/), (28)
о
/
х(0+ ^({-х)х(^х = /(0 (29)
о
моделируются многие задачи физики и, в частности, задачи гравиразведки.
Интегральные уравнения Вольтерра широко применяются в сейсмологии.
Применяя к уравнениям (28), (29) прямое и обратное преобразование Лапласа или Фурье, формально можно получить решения соответствующих уравнений:
X(p) = F(p)/H(p), X(p) = F(p)/a + H(p)).
Однако из-за возможности обращения функций Н(р) или I + II(р) в нуль и расходимости интегралов обратного преобразования получение достаточно точных и устойчивых решений во многих случаях весьма проблематично.
Неустойчивость решения уравнения (28) также обусловлена тем, что задача его решения некорректна и решается с применением различных методов регуляризации.
Решение уравнения (29) является корректной задачей и, в целом, не требует регуляризованных алгоритмов. Однако это не снимает сложностей в случае возможности обращения функций Н(р) или (1 + Н(р)) в нуль, поэтому представляет интерес развитие других приближенных методов решения интегральных уравнений видов (28) и (29).
В разделе 3.3 предложены итерационные методы решения одномерных (28), (29) и многомерных интегральных уравнений Вольтерра и, кроме того, несколько алгоритмов, непосредственно предназначенных для реализации на ИНС.
В четвертой главе исследуются приближенные методы решения интегральных уравнений и краевых задач, которыми моделируются задачи ньютонова потенциала.
В разделе 4.1 исследуются следующие задачи: в односвязной области Т определена непрерывная функция ц(г,г), а в окрестности точки z = °° -аналитическая функция U(z), U(<*>) = 0, lim zU(z) = c0, Imc0 =0. Требуется найти такую ограниченную односвязную область D+, D+ с Т с жор-дановой границей, что U~(z,D+,n) = U(z), ze D~.
Здесь
V
Описанную задачу можно записать в виде следующего уравнения:
Ф+(0 = лф(0,г(0)-1/(г(0), |г| = 1, . (30)
где z(t), ф (t) - функции, аналитические при
MI(z(t),W)) = li(z,z)-
Вводя функцию ф (г) = г(г ') при |г| > 1, уравнение (30) преобразуется к следующему виду:
К <р ^ Ф+(0 - М (ф'(0,ф"(0) + и (<р" (о) = 0. (31)
В разделе 4.4 предложены и обоснованы алгоритмы численного решения краевых задач потенциала, представленных уравнениями вида (30),
(31).
В заключении подытожены основные результаты теоретических и практических исследований.
В приложении к диссертации приведены результаты численного моделирования на ИНС следующих прикладных задач:
- локализации минимума многих переменных;
- приближенного решения интегральных уравнений на нейронных сетях;
- применения ИНС типа карты Кохонена для поиска минимума периодической и непериодической функций двух переменных;
- решения задач гравиразведки на ИНС.
В приложении также приведены листинги программ, реализующих алгоритмы, предложенные в работе. Там же проведено исследование колебаний металлической струны переменного сечения при учете максимально возможных факторов, влияющих на динамику колебаний, вплоть до нели-нейностей. Включение этого приложения в диссертацию обусловлено тем, что струна является основным элементом струнного гравиметра. Выявление новых эффектов в динамике струны при влиянии многих внутренних и внешних факторов позволит проектировать более точные гравиметры и повышать точность измерений.
При исследовании математической модели струны были применены алгоритмы и итерационные методы, использованные в основной части диссертационной работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Предложены алгоритмы минимизации функций многих переменных, основанные на их сведении к функциям одной переменной, представлены оценки точности нахождения экстремальных значений и дана реализация алгоритмов на ИНС.
2. Предложены и обоснованы итерационные методы решения интегральных уравнений в свертках, разработана методика реализации этих методов на ИНС.
3. Предложены и обоснованы итерационные методы решения интегральных уравнений Вольтерра и Фредгольма в свертках, разработаны алгоритмы реализации итерационных формул на ИНС.
4. Предложены и апробированы алгоритмы решения внешних задач гравиразведки на ИНС.
5. Разработаны численные алгоритмы решения интегральных уравнений на ИНС с использованием формул приближенного вычисления кратных интегралов и составлена их программная реализация.
6. Проведен подробный анализ динамики колебаний металлического струнного чувствительного элемента переменного сечения для струнного гравиметра и представлены результаты численного моделирования указанной динамики.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в изданиях, рекомендованных ВАК РФ
1. Бойков, И. В. Представление функций многих переменных на нейронных сетях / И. В. Бойков, Е. В. Кучумов // Нейрокомпьютеры: разработка, применение. - 2007. - № 9. - С. 81-89.
2. Бойков, И. В. Об одном итерационном методе решения уравнений в свертках на нейронных сетях / И. В. Бойков, Е. В. Кучумов // Нейрокомпьютеры: разработка, применение. - 2007. - № 9. - С. 90-97.
3. Бойков, И. В. Методы локализации минимума функций многих переменных сведением их к функции одной переменной / И. В. Бойков, Е. В. Кучумов // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2008. - № 1(5). - С. 2-7.
4. Бойков, И. В. Об одном итерационном методе решения интегральных уравнений Вольтерра / И. В. Бойков, Е. В. Кучумов // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2009. -№ 2(10). - С. 25-38.
5. Кучумов, Е. В. Особенности динамики колебаний металлического струнного чувствительного элемента датчика / Е. В. Кучумов // Измерительная техника. - № 3. - 2011. - С. 7-11.
Публикации в других изданиях
6. Кучумов, Е. В. О возможности применения многомерной матричной алгебры к численному решению многомерных линейных интегральных уравнений Фредгольма/ Е. В.Кучумов // Проблемы информатики в образовании, управлении, экономике и технике : сб. ст. VIII Междунар. науч.-техн. конф. (19-20 ноября 2008 г.) - Пенза : Приволжский дом знаний. - С. 42-48.
7. Бойков, И. В. Итерационные методы решения операторных уравнений / И. В. Бойков, Е. В. Кучумов, В. А. Ланцова // Аналитические и численные методы моделирования естественнонаучных и социальных проблем : сб. ст. III Междунар. науч.-техн. конф. - Пенза: Приволжский дом знаний, 2008. - С. 91-97.
8. Кучумов, Е. В. Приближенные методы поиска минимума функций многих переменных с помощью сведения их к функциям одной переменной и использования искусственной нейронной сети (ИНС) / Е. В. Кучумов // Датчики и системы : сб. докл. XXVIII науч.-техн. конф. молодых специалистов (30-31 марта 2009 г.) / под ред. акад. Академии проблем качества РФ А. В. Блинова. - Пенза : ОАО «НИИФИ», 2009. - С. 79-87.
9. Бойков, И. В. Приближенное решение интегральных уравнений на нейронных сетях / И. В. Бойков, Е. В. Кучумов, Л. Д. Романова // Проблемы информатики в образовании, управлении, экономике и технике : сб. ст. IX Междунар. науч.-техн. конф. (28-29 октября 2009 г.) - Пенза : Приволжский дом знаний, 2009. - С. 123-127.
Научное издание
Кучумов Евгений Владимирович
Численное моделирование задач гравиразведки, представимых интегральными уравнениями в свертках, на искусственных нейронных сетях
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Подписано в печать 26.05.11. Формат б0х84'/16. Усл. печ. л. 1,16. Заказ № 001966. Тираж 100.
Издательство ПГУ. 440026, Пенза, Красная, 40. Тел./факс: (8412) 56-47-33; e-mail: iic@pnzgu.ru
Оглавление автор диссертации — кандидата технических наук Кучумов, Евгений Владимирович
Введение.
Глава 1 Постановка задачи, обзор и вспомогательные предложения
1.1 Постановка задачи и обзор.
1.1.1 Определение обратных задач гравиразведки.
1.1.2 Обзор уравнений в свёртках.,.
1.1.3 Некорректные задачи.
1.2 Теория аппроксимации.
1.2.1 Основные теоремы теории приближения функций.
1.2.2 Применение сигмоидальных функций и функций Гаусса к суперпозиции функций.
1.2.3 Задача интерполирования.
1.3 Преобразование Фурье и Лапласа.
1.4 Экстремумы функций многих переменных.
1.5 Итерационные методы Банаха и Обломской.
1.6 Итерационные методы решения уравнений в свёртках.
1.6.1 Обзор методов.
1.6.2 Итерационные методы решения уравнения (1.22).
1.6.3 Итерационные методы решения многомерных уравнений.
1.6.4 Метод регуляризации.
1.6.5 Численный метод.
1.6.6 Итерационные методы решения систем дискретных уравнений.
1.7 Классы функций.
1.8 Искусственные нейронные сети (ИНС).
Выводы по главе 1.
Глава 2 Представление функций многих переменных на ИНС.
2.1 Введение.
2.2 Метод локализации минимума функции многих переменных, основанный на сведении функции многих переменных к функциям одной переменной.
2.2.1 Периодические функции многих переменных.
2.2.2 Непериодические функции многих переменных.
2.2.3 Гармонические функции.
2.3 Об одном способе вычисления кратных интегралов на искусственных нейронных сетях.
2.4 Приближённое решение интегральных уравнений на ИНС.
2.5 Нахождение минимума функции двух переменных с помощью ИНС.:.
2.6 Решение прямых задач гравиразведки - картирование и т.д. на ИНС.
2.6.1 Постановка задачи.
2.6.2 Алгоритм решения с помощью ИНС.
Выводы по главе 2.
Глава 3 Итерационные методы решения операторных уравнений.
3.1 Решение операторных уравнений.
3.2 Решение интегрального уравнения в свёртках с помощью ИНС.
3.3 Итерационный метод решения интегральных уравнений Вольтерра.
3.3.1 Одномерные интегральные уравнения Вольтерра в свёртках
3.3.2 Многомерные интегральные уравнения Вольтерра в свёртках 142 Выводы по главе 3.
Глава 4 Приближённые методы решения обратных задач геофизики
4.1 Итерационно-проекционные методы решения обратных задач гравиразведки.
4.2 Решение обратных задач гравиразведки на искусственных нейронных сетях.
4.3 Моделирование задач сейсмической томографии уравнениями Вольтерра.
4.4 Приближённые методы решения обратных задач гравиметрии на искусственных нейронных сетях.
Выводы по главе 4.
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Кучумов, Евгений Владимирович
Актуальность темы
В численных методах принято делить классы различных задач на прямые и обратные задачи. Пусть дан некоторый оператор и, действующий на элемент х и результатом этого действия является некоторый элемент у. Тогда прямую задачу можно представить как определение элемента у по данному элементу х для конкретного оператора и, т.е. 1Гх = у. Обратные задачи будут представлять обратный процесс: нахождение элемента х по заданному элементу у для данного оператора и.
Многие важные задачи физики, техники, экономики, социологии и т.д. представляют собой именно обратные задачи. Математически обратные задачи чаще всего выражаются с помощью интегральных или интегро-дифференциальных уравнений. Однако, без решения прямых задач постановка обратных задач невозможна.
Большим источником прямых и обратных задач является геофизика, ярким примером которых являются задачи гравиразведки и сейсморазведки (в частности, сейсмическая томография), чьи математические модель описываются нелинейными интегральными уравнениями первого рода.
Разработка точных методов решения указанных задач актуальная в связи с практической необходимостью определения локальной и глобальной структуры земной коры (строительство крупных сооружений, добыча полезных ископаемых, эволюция геологических структур и т.п.), а так же всей Земли в целом (геотектонические и магматические процессы, планетология), что осложняется невозможностью прямого измерения внутренних физико-химических параметров или экспериментальной проверки в силу экстремальности условий.
Главная сложность в решении обратных задач заключается в том, что они в подавляющем большинстве являются некорректными задачами в отличие от прямых задач. Они характеризуются тем, что сколь угодно малые изменения исходных данных могут приводить к произвольно большим изменениям решений, что особенно критично в силу естественного наличия погрешностей у реальных данных.
С другой стороны, теория искусственных нейронных сетей (ИНС), возникшая в середине прошлого столетия, изначально позиционировала себя как средство решения неформализуемых или трудно формализуемых задач, к которым относят задачи распознавания образов, классификации и кластеризации, оптимального управления и т.д. ИНС зарекомендовали себя как перспективные средства решения вышеуказанных задач. Известно, что эти задачи, по сути, являются некорректными задачами и существенно перекликаются с обратными задачами.
В последнее время значительно возрос интерес к численным алгоритмам решения задач математической физики на ИНС1. В общем случае алгоритмы численного моделирования обратных задач сводятся к задачам аппроксимации и итерационным методам решения операторных (интегральных) уравнений.
Тем не менее, в настоящее время отсутствуют работы, посвященные решению интегральных уравнений первого (некорректная задача) и второго рода на ИНС. Практически отсутствуют методы и алгоритмы решения обратных задач на ИНС.
Перечисленные обстоятельства делают проблему решения прямых и в большей степени обратных задач на ИНС актуальной. В связи с этим, назрела необходимость применения ИНС в области решения обратных задач геофизики.
1 См. сборник трудов Первой Всероссийской конференции «Нейросетевые алгоритмы решения задач математической физики», г. Москва, 2007 г., атак же труды школы Горбаченко В.И.
Данная диссертация посвящена разработке методов решения прямых и обратных задач геофизики на ИНС.
Цель и задачи исследования. Цель работы состоит в приближённом решении обратных задач гравиразведки на искусственных нейронных сетях.
Для достижения поставленной цели в диссертации необходимо решить следующие задачи:
• разработать методы приближенного представления функций многих переменных на ИНС;
• разработать численные алгоритмы локализации минимума функции многих переменных (как периодических, так и непериодических) и их программную реализацию на ИНС;
• построить формулы приближенного вычисления кратных интегралов на ИНС;
• разработать численные алгоритмы решения интегральных уравнений на ИНС с использованием формул приближенного вычисления кратных интегралов и дать программную реализацию данного алгоритма;
• построить оптимальные итерационные формулы решения интегральных уравнений в свёртках типа Фредгольма и Вольтерра и разработать алгоритмы их реализации на ИНС;
• Разработать методы решения обратных задач гравиразведки, характеризуемых нелинейными интегральными уравнениями, на ИНС.
Методы исследования. В работе использованы методы теории ИНС, математического моделирования, функционального анализа, прикладного функционального анализа, теории аппроксимации, квадратурных формул, теории линейных интегральных уравнений, интегральных преобразований. Достоверность научных положений подтверждается соответствием теоретических результатов с результатами математического моделирования тестовых задач с использованием пакетов компьютерной математики, таких как МаЙаЬ и т.д.
Научная новизна работы состоит в следующем: построены алгоритмы численного решения обратных задач на ИНС; предложены алгоритмы представления функций многих переменных на ИНС; построены алгоритмы локализации минимума функции многих переменных на ИНС; предложены и обоснованы квадратурные формулы приближенного вычисления кратных интегралов на ИНС; построены численные алгоритмы решения интегральных уравнений на ИНС с использованием специальных квадратурных формул вычисления кратных интегралов; предложены и обоснованы итерационные методы решения интегральных уравнений в свёртках Фредгольма и Вольтерра. Теоретическая ценность заключается в следующем: предложены и обоснованы методы моделирования обратных задач гравиразведки на ИНС; предложены и обоснованы приближенные алгоритмы локализации минимума функции многих переменных на ИНС, основанные на сведении последних к функциям одной переменной; дано приложение этих алгоритмов к нахождению экстремумов потенциальных полей; предложены и обоснованы численные алгоритмы решения интегральных уравнений на ИНС, основанные на методе сведения многомерных интегралов к одномерным; предложены и обрснованы итерационные алгоритмы решения интегральных уравнений в свёртках Фредгольма и Вольтерра на ИНС. предложены и обоснованы новые итерационные схемы и алгоритмы решений уравнений Вольтерра. Практическая значимость.
Публикации. По материалам диссертации опубликовано 9 печатных работ, из них 6 - в изданиях, рекомендованных ВАК.
Апробация работы. Материалы диссертационной работы докладывались и обсуждались на следующих конференциях: Первой Всероссийской конференции «Нейросетевые алгоритмы решения задач математической физики» (Москва, 2007); Ш-ей Международной научно-технической конференции «Аналитические и численные методы моделирования естественнонаучных и социальных проблем» (Пенза, 2008); VIII-ой Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2008); XXVIII-ой Всероссийской научно-практической конференции молодых учёных и специалистов «Датчики и системы - 2009» (Пенза, 2009); IV Международная научно-практическая конференция молодых специалистов, аспирантов и студентов «Математическое и компьютерное моделирование естественнонаучных и социальных проблем» (Пенза, 2010), XXIX-ой Всероссийской научно-практической конференции молодых учёных и специалистов «Датчики и системы - 2010» (Пенза, 2010), ХХХ-ой Всероссийской научно-практической конференции молодых учёных и специалистов «Датчики и системы - 2011» (Пенза, 2011).
Пакет прикладных программ «Приближенные методы решения уравнений динамики колебаний металлической струны» используется в производственной деятельности ОАО «НИИФИ» (акт о внедрении прилагается к диссертации).
Методы, разработанные в данной диссертации, использовались в НИР по проекту «Разработка теории функционирования волоконно-оптических лазерных интерферометрических систем на основе методов идентификации динамических систем с распределёнными параметрами» (Рособразование, Per. №2.1.2/937; мероприятие 2, раздел 2.1, подраздел 2.1.2, код ГРНТИ 59.03.05; 59.31.71; 59.45.37); срок выполнения 2009-2010 гг.
Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и приложений и изложена на страницах.
Заключение диссертация на тему "Численное моделирование задач гравиразведки, представимых интегральными уравнениями в свертках, на искусственных нейронных сетях"
Заключение
В заключении обобщенны основные результаты теоретических и практических исследований.
-
Похожие работы
- Нейронные сети для обработки временных рядов
- Применение уравнений в свертках к решению обратных задач гравиметрии и идентификации динамических систем
- Математическое моделирование распознавания образа предмета с помощью нейронных сетей
- Моделирование и разработка программного обеспечения распознавания и классификации образов
- Математические модели и методы оптимизации функциональной надежности искусственных нейронных сетей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность