автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.15, диссертация на тему:Основы теории и методов структурной реализации моделирующих нейроподобных сетей для решения краевых задач теории поля
Оглавление автор диссертации — доктора технических наук Горбаченко, Владимир Иванович
ВВЕДЕНИЕ.
1. ИССЛЕДОВАНИЕ АНАЛОГОВЫХ КЛЕТОЧНЫХ НЕЙРОПОДОБНЫХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ В ЧАСТНЫХ ПРОИЗВОДНЫХ.
1.1. Вводные замечания.
1.2.0бзор классов краевых задач для дифференциальных уравнений в частных производных
1.3. Анализ свойств систем разностных уравнений.
1.4. Анализ методов решения дифференциальных уравнений в частных производных на аналоговых нейроподобных сетях.
1.4.1. Решение дифференциальных уравнений в частных производных на нейроподобной сети Хопфилда.
1.4.2. Решение дифференциальных уравнений в частных производных на клеточных нейронных сетях.
1.5. Исследование аналоговых клеточных нейроподобных сетей для решения дифференциальных уравнений в частных производных.
1.5.1. Исследование сетей с непрерывным представлением времени.
1.5.2.Исследование сетей с дискретным представлением времени.
1.6. Разработка методов уточнения решения, полученного на аналоговой нейроподобной сети.
1.7. Компьютерное моделирование работы вычислительной системы на основе нейроподобной моделирующей сети.
Введение 2001 год, диссертация по информатике, вычислительной технике и управлению, Горбаченко, Владимир Иванович
Решение краевых задач теории поля, описываемых дифференциальными уравнениями в частных производных, представляет собой чрезвычайно актуальную задачу, возникающую при исследовании многих научно-технических проблем, например, аэродинамики, рациональной разработки и эксплуатации нефтяных месторождений, гидрогеологии, тепло- и массопереноса, управлении объектами с распределенными параметрами и многих других. Краевые задачи теории поля отличаются большой вычислительной сложностью и как следствие этого чрезвычайно широким спектром методов и средств решения.
Для решения дифференциальных уравнений в частных производных аналитические методы [20, 74, 103, 386, 414, 434, 446] применимы только для ограниченного круга задач, поэтому, в основном, используются разнообразные численные методы. Среди численных методов наибольшее распространение получили методы конечных разностей [28, 53, 104, 265, 296, 387, 395, 396], конечных элементов [187,204,205,314,321,339,381,398,428] и граничных элементов [39, 263]. Наиболее проработанным и получившим наибольшее распространение является метод конечных разностей. В настоящей работе, там, где это не оговорено отдельно, в основном используется классический метод конечных разностей. Хотя большинство результатов несложно перенести и на другие методы.
Большинство численных методов сводит решение дифференциальных уравнений в частных производных к решению систем алгебраических уравнений (в общем виде нелинейных), которые характеризуются высоким порядком, как правило, плохой обусловленностью (т.е. высокой чувствительностью к погрешностям исходных данных и округлений) и разреженностью матрицы. Например, для решения многих современных прикладных задач аэродинамики и ядерной физики требуется не менее 1013 операций с плавающей точкой [277] (моделирование обтекания полной компоновки самолета на основе полных уравнений Навье-Стокса в течение 1 С полета требует 200 ч работы компьютера с быстродействием 1019 операций с плавающей точкой в секунду [438]). Решение задач в гидрогеологии и в разработке и эксплуатации нефтяных месторождений сводится к решению систем аппроксимирующих уравнений порядка более 104.105. Для нестационарных и нелинейных задач такие системы приходится решать сотни и тысячи раз. В системах управления объектами с распределенными параметрами дифференциальные уравнения в частных производных необходимо решать в реальном масштабе времени. Перечисленные обстоятельства требуют для решения аппроксимирующих систем высокой производительности компьютеров, применения вычислительных систем нетрадиционной архитектуры, ориентированных на решение определенного класса задач, и построения эффективных алгоритмов решения. То есть возникает комплекс задач, который принято называть проблемой отображения прикладной математики на архитектуру вычислительных систем [79, 260].
Решение проблемы состоит в распараллеливании вычислений и использовании векторных и параллельных компьютеров (см., например, [13, 22, 55, 56, 78, 83, 105, 106, 196, 229, 258, 261, 272, 319, 343, 353, 413, 415, 426, 429, 452, 457]). Известны параллельные проблемно-ориентированные системы для решения краевых задач теории поля [212, 294, 340, 352]. Большой интерес представляет использование многопроцессорных транспьютерных систем [35, 75, 192, 382, 427, 436, 437, 449, 557], в том числе, для решения задач теории поля [198]. Достоинствами мультитранспьютерных систем являются высокий показатель производительность/стоимость (например, система, состоящая из 100 транспьютеров IMS Т800, стоит в 20 - 30 раз дешевле, чем эквивалентный по производительности однопроцессорный компьютер [198]), высокая надежность, компактность, возможность настройки топологии процессорной решетки на конкретную решаемую задачу. В то же время при использовании мультитранспьютерных систем сохраняется большинство проблем построения и использования параллельных вычислительных систем.
Использование векторных компьютеров вызывает серьезные трудности, связанные не только с высокими сложностью и стоимостью таких компьютеров, но и с проблемами векторизации алгоритмов. Наличие в алгоритме смеси скалярных, векторных и матричных операций согласно "закону Уэра-Амдала" (WareAmdahl') [343] резко снижает эффективность распараллеливания.
С точки зрения эффективного отображения алгоритма решения системы алгебраических уравнений, аппроксимирующей дифференциальное уравнение в частных производных, на архитектуру вычислительной системы эффективным является применение "мелкозернистой" массивно-параллельной обработки (МРР - massively parallel processing), т.е. использование параллельно работающих процессоров, имеющих согласно классификации Флинна (М. J. Flynri) [426] архитектуру MIMD - multiple instruction, multiple data (в русской транскрипции: МКМД - множественный поток команд, множественный поток данных). В идеале один процессор должен соответствовать одной узловой точке конечно-разностной сетки, что для реальных задач трудно осуществить. Следует отметить, что по результатам списка 7Ър500 пятисот наиболее производительных суперкомпьютеров мира и 7Ър10, содержащего данные о десяти наиболее мощных суперкомпьютерных центрах России [271], среди современных суперкомпьютеров доминируют системы МРР-архитектуры. Так в 1998 г. первое место в Тор500 занимал Intel ASCI Red, содержащий 9152 процессора Pentium Pro/200 МГц и достигший на тестах Unpack parallel производительности 1.338 TFLOPS. В январе 1998 г. компьютер SGI ASCI Blue Mountain, содержащий 5040 микропроцессоров R10000 с тактовой частотой 200 МГц, достиг производительности 1.6 TFLOPS. Границу в 1 TFLOPS преодолели еще два суперкомпьютера - Cray T3E-I200, содержащий 1448 процессоров Alpha с тактовой частотой 600 МГц, и Intel ASCI Option Red в конфигурации, содержащей 7262 процессора Pentium Pro. Новейший суперкомпьютер ASCI White (от Accelerated Strategic Computing Initiative White Partnership) фирмы IBM [190] содержит 8192 процессора и обеспечивает пиковую производительность 12.3 TFLOPS ("стабильная" производительность 3 TFLOPS). Однако для массивно-параллельных компьютеров отношение "производительность/стоимость" уменьшается при увеличении числа процессоров и увеличении производительности процессора [99]. Это объясняется двумя причинами: увеличением потерь на обмены при увеличении числа процессоров и увеличением стоимости процессора при увеличении его производительности. Современные массивно-параллельные компьютеры представляют собой совокупность достаточно мощных, следовательно, достаточно дорогих процессоров, каждый из которых имеет достаточно большую собственную память. Для обмена данными между процессорами используются разнообразные коммуникационные сети. Причем всегда время доступа процессора к собственной памяти значительно меньше времени доступа к памяти других процессоров. Для эффективной реализации на массивно-параллельных компьютерах алгоритмы должны быть построены таким образом, чтобы алгоритм был максимально распараллелен, все процессоры были более или менее равномерно загружены и как можно редко обменивались данными с другими процессорами. Такие утверждения следуют из "закона Уэра-Амдала" [343]. В общем виде для того, чтобы за счет какого-либо фактора выполнение алгоритма было ускорено в q раз, необходимо, чтобы этим фактором была охвачена не менее чем
1-1) . Q)
-ая часть всех л операций алгоритма [77]. Например, в системе, содержащей 10 процессоров ускорить выполнение алгоритма в 103 раз можно, если 99.9 % операций алгоритма распараллелено и практически полностью исключены обмены между процессорами.
Таким образом, эффективное распараллеливание решения дифференциальных уравнений в частных производных возможно только на процессорных массивно-параллельных сетях, состоящих из большого числа (желательно равного числу точек аппроксимации) относительно несложных процессоров, обмен данными между которыми или сведен к минимуму или реализуется очень быстро.
Интересной реализацией массивно-параллельных сетей являются клеточные автоматы (CA - cellular automata) [293, 435, 450, 523, 550, 556]. Клеточные автоматы - это дискретные динамические системы, поведение которых полностью определяется в терминах локальных зависимостей. Клеточные автоматы состоят из простых клеток (ячеек), имеющих ограниченное число состояний. Проблема взаимодействия клеток предельно упрощается за счет использования только локального взаимодействия с соседними клетками.
Клеточный автомат в определенной степени является дискретным аналогом дифференциального уравнения в частных производных, недаром в [435] подчеркивается: "Клеточные автоматы в информатике являются аналогом физического понятия "поле". В [293, 523] доказано соответствие клеточно-автоматной модели дифференциальным уравнениям гидродинамики. Клеточные автоматы используют для моделирования весьма сложных физических полей [293, 435, 556]. Суть клеточно-автоматной модели [30] состоит в том, что пространство и время представляются в дискретной форме, а физические величины - в виде конечного числа состояний клеток автомата. Смена состояний во всех клетках происходит одновременно. Характеристики поля вычисляются путем суммирования числа единичных значений в окрестностях клетки. Например, плотность газа в точке равна числу клеток заданной окрестности, в которых переменная "масса" имеет единичное значение. При этом следует подчеркнуть, что клеточно-автоматная модель не является дискретной аппроксимацией дифференциального уравнения в частных производных, а является их альтернативой [550]. Клеточные автоматы позволяют получить визуальную картину физического поля, например, поля векторов скорости течения газа, концентрации частиц. Получение традиционно необходимых числовых характеристик поля на клеточных автоматах затруднено, возникают и другие трудности принципиального и технического характера [30]. Поэтому клеточные автоматы вряд ли могут заменить "обычные" компьютеры.
Все рассмотренные -выше вычислительные системы функционируют в дискретном пространстве и времени и реализуются средствами цифровой техники. В аналоговой технике известны чрезвычайно эффективные реализации массивно-параллельных процессорных сетей, в которых решены проблемы взаимодействия процессорных элементов, сами процессорные элементы предельно просты, а решение формируется неалгоритмическим путем, т. е. безо всякого программирования. Такими процессорными сетями являются сеточные модели, предложенные еще в 20-е годы советским математиком Гершгориным С. А. [101]. Сеточные модели основаны на аналогии между системой разностных уравнений и математическим описанием пассивной моделирующей сети. Теоретические основы построения и применения сеточных моделей заложены в работах отечественных ученых: Гутенмахера JI. И. [179- 182,392], Тетельбаума И. М. [430, 431], Волынского Б. А., Бухмана В. Е. [82], Коздобы Л. А. [243, 245, 246], Николаева Н. С., Козлова Э. С. [333], Мацевитого Ю. М. [301] и других (мы не рассматриваем огромное число приложений сеточных моделей в теплофизике, тур-биностроении, строительной механике, в проектировании и анализе разработки нефтяных месторождений, гидрогеологии, в моделировании физических полей кораблей и связанных с ними проблемах и во многих других областях). Среди работ зарубежных ученых выделяются работы Бойкена {Веикеп С. L.), предложившего резистивно-емкостные модели для решения нестационарных задач (ÄC-сеточные модели [486]), Либмана {Liebmann G.), разработавшего метод моделирования нестационарных задач (метод Либмана) и резистивные сеточные модели (Л-сеточные модели) [524, 525] и Карплюса (Karplus W. J.) [234].
В терминах современной теории параллельной обработки данных основным достоинством сеточных моделей является "мелкозернистая" массово-параллельная обработка, поскольку каждому узлу разностной сетки, как правило, соответствует простейший "процессорный элемент" - узел электрической сетки. Другим важным достоинством сеточных моделей является неалгоритмический характер работы. Это означает, что решение формируется не за счет программы работы процессора, а за счет топологии и величин связей между многими процессорами. Такой подход в современной теории нейронных сетей называется коннекционизмом [110]. Сеточные модели реализуют основные принципы коннекционизма: однородность системы, использование аналоговых связей, получение результата даже при выходе части процессорных элементов из строя (при выходе из строя отдельных процессорных элементов сетки происходит лишь снижение точности решения).
Основными недостатками сеточных моделей являются большая трудоемкость задания параметров сеточной области и съема решения, а зачастую также недостаточная точность сеток и сложность аппаратной реализации моделей. Для преодоления этих недостатков были созданы аналого-цифровые вычислительные комплексы (АЦВК), другое название - гибридные вычислительные системы (ГВС). Проблемам создания АЦВК типа "сетка-ЦВМ" посвящены работы Ни-цецкого Л. В., Овсюкова С. В., Спалвиня А. П., Родэ Э. Э. [334, 337, 342, 389, 419, 420], Николаева Н. С., Козлова Э. С., Максимова M. М., Сергеева Н. П., Мирошкина В. А. [21, 250, 332], Мацевитого Ю. М., Прокофьева В. Е., Цаканя-наО. С. [299, 303, 305], Павловского Р. А., Вишневского А. М. [16, 85, 367], а также многих зарубежных авторов [487, 489, 508, 517, 518, 531, 534, 535, 553, 554]. АЦВК типа "сетка-ЦВМ" содержат сеточную модель, все или часть параметров которой задается автоматически, а также производится автоматический съем результатов моделирования. Большинство АЦВК представляли собой комплексы, состоящие из автоматизированной сеточной модели и универсального компьютера. Хотя известно, что наиболее эффективны системы, в которых реализована полная интеграция аналоговой и цифровой частей и минимизировано время обмена между аналоговой и цифровой частями системы (общее поле памяти, распределенная система измерения и обработки решения). С помощью АЦВК были получены важные результаты во многих отраслях, например, в проектировании нефтяных месторождений, гидрогеологии, моделировании физических полей кораблей. Но АЦВК не получили широкого распространения из-за большой сложности и громоздкости. Уровень развития элементной базы 70 - 80 годов не позволял строить точные, надежные и в то же время достаточно компактные и недорогие системы такого класса.
Трудности построения аналоговых компьютеров и ограниченные возможности метода прямой аналогии породили подход, известный как квазианалогия, предложенный и развитый в работах Г. Е. Пухова и его учеников [238, 368 — 371]. В основе квазианалоговых моделей лежит не принцип подобия уравнений объекта и модели, а принцип эквивалентности в отношении результатов. В наиболее общем виде квазианалоговые модели в терминологии Г. Е. Пухова являются уравновешиваемыми, т. е. для обеспечения условий эквивалентности требуется проведение итерационных процедур настройки с использованием величин, получаемых на модели. Широкое распространение в сеточном моделировании получил квазианалоговый метод, известный как метод корректирующих токов (MKT). Сущность различных вариантов MKT состоит в итерационном задании в узловые процессоры определенным образом рассчитанных токов, компенсирующих разницу между расчетными и фактически заданными параметрами узловых процессоров. Использование итерационных алгоритмов для уточнения решения, полученного на сеточном интеграторе, предложено еще в [392]. Практическое применение этот метод получил только с появлением аналого-цифровых вычислительных комплексов. Основы MKT заложены в работах [334, 337, 342, 389], в работах [21, 134, 250, 303, 332, 404, 407, 419, 420, 487, 489, 508, 517, 518, 531, 534, 535, 553, 554] данный метод был обоснован и развит, в [128] разработан достаточно общий аддитивный итерационный алгоритм работы сеточный спецпроцессоров. Следует подчеркнуть, что MKT развивался относительно независимо от общей теории квазианалоговых методов Г. Е. Пухова. Применение MKT позволило компенсировать погрешности аналоговых элементов АЦВК, строить моделирующие сетки из неточных элементов и решать задачи, которые методом прямой аналогии принципиально не могут быть решены на сеточных моделях. Этим объясняется широкое распространение MKT: метод в той или иной форме применялся на всех известных аналого-цифровых комплексах "сетка-ЦВМ".
Следует подчеркнуть, что в своем развитии сеточные моделирующие структуры сблизились с нейронными сетями и во многом оказались функционально подобны нейронным сетям [388, 496, 529]. Сеточные модели и нейронные сети объединяют общие принципы коннекционизма и неалгоритмического характера решения, а квазианалоговые методы можно трактовать как своеобразные методы обучения без учителя. Наибольшее функциональное различие между сеточными моделями и нейронными сетями заключается в том, что процессорный элемент сеточной модели всегда является линейным элементом, а нейрон в большинстве приложений - нелинейным элементом, хотя известны многочисленные примеры применения линейного нейрона [30, 390, 441] и в нейронных сетях, используемых для решения задач вычислительного характера, применяются, как правило, линейные нейроны.
Сейчас наблюдается настоящий бум исследования и использования нейронных сетей и нейрокомпьютеров в различных областях (сошлемся лишь на наиболее известные работы, касающиеся фундаментальных подходов к использованию нейронных сетей, а также характеризующих исследования в России в области нейронных сетей [26, 27, 47, 59, 87, 90 - 92, 97, 99, 107, 108, 110, 177, 189, 193, 199, 213, 230, 233, 239, 262, 274, 291, 297, 298, 312, 322, 323, 390, 410, 416, 436, 443, 453, 456, 466, 469, 477, 499, 500, 513 -515]). Под нейрокомпьютером будем понимать вычислительную систему с архитектурой аппаратного и программного обеспечения, адекватной выполнению алгоритмов, представленных в нейросетевом логическом базисе [97, 99, 328]. Применение нейрокомпьютеров для решения вычислительных задач известно достаточно давно [230]. Однако традиционно нейрокомпьютеры используются для решения задач распознавания образов, связанных с необходимостью обучения на реальном экспериментальном материале. В настоящее время к этому классу задач добавляется новый класс задач, зачастую не требующих обучения, но хорошо представимых в нейросетевом логическом базисе - это задачи с ярко выраженным естественным параллелизмом: обработка сигналов, изображений, решение вычислительных задач [88, 91, 92, 99]. А. И. Галушкиным и его учениками сформировано научное направление "нейроматематика" [89, 97, 99, 328] - раздел вычислительной математики, связанный с решением задач с помощью алгоритмов, представимых в нейросетевом логическом базисе. Переход к нейросетевому логическому базису характерен для случаев увеличения размерности пространства решения или необходимости резкого уменьшения времени решения. Интересная точка зрения на использование нейронных сетей для решения формализованных задач представлена в [61, 62]. Согласно этой точке зрения искусственные нейронные сети создавались как технические модели человеческого мозга и в своем развитии повторяют развитие живого мозга. На первых этапах решались задачи восприятия, узнавания, различения - моделировалась подсознательная, интуитивная деятельность мозга, соответствующая уровню ребенка первых лет жизни. Следующим этапом моделирования деятельности мозга является переход к решению задач, которые задаются в формализованном виде. Это не противоречит нейросе-тевой парадигме обучения. Просто это - следующий этап развития искусственного "мозга", соответствующий обучению в школе и университете, где основой обучению точным наукам являются формализованные знания. "Это - путь введения в традиционно интуиционистские нейросетевые технологии формализованных математических методов" [61].
В этом направлении использования нейронных сетей важное место занимает применение нейронных сетей для решения дифференциальных уравнений в частных производных [92, 328]. Эффективность использования нейрокомпьютеров для решения дифференциальных уравнений в частных производных основывается на трех основополагающих принципах построения нейронных сетей:
1. "Мелкозернистая" массово-параллельная обработка.
2. Принципы коннекционизма, использующие для обработки информации связи между процессорными элементами, т.е. нейронами.
3. Неалгоритмическое получение решения, т.е. процесс решения есть переход (возможно пошаговый) от исходного состояния к устойчивому состоянию сети.
Рассмотрим последнее обстоятельство подробнее. Следуя [99], назовем логическим базисом задачи основной набор операций, реализуемых в процессе выполнения алгоритма. Для численных методов решения дифференциальных уравнений в частных производных таким базисом являются операции типа скалярного произведения: . Логическим базисом вычислительной системы являет/ ся основная группа операций, реализуемых операционным устройством. В случае "классических" компьютеров, в том числе, и суперкомпьютеров логический базис вычислительной системы никак не связан с логическим базисом решаемых задач и требует применения сложного программного обеспечения. В случае нейрокомпьютеров логический базис вычислительной системы совпадает с логическим базисом численных методов решения дифференциальных уравнений в частных производных, что может обеспечить неалгоритмический характер процесса решения и максимальную производительность. Можно сказать, что в нейрокомпьютерах на новой технологической базе реализуется принцип прямой аналогии, использовавшийся в аналоговой вычислительной технике [431].
Нейрокомпьютеры для решения дифференциальных уравнений в частных производных позволят достичь степени распараллеливания, не достижимой другими средствами. Следует также учесть, что по сравнению с известными суперкомпьютерами нейрокомпьютеры обеспечивают существенно лучшее соотношение "цена/производительность" [91, 92, 97, 99]. Это можно объяснить как согласованностью их логического базиса с логическим базисом задачи, так и согласованностью принципов построения нейронных сетей с принципами массово-параллельной обработки. Следует также отметить широкое возможности использования в нейрочипах и нейрокомпьютерах аналого-цифровой и аналоговой обработки - своеобразный "аналоговый ренессанс" [99, 287, 297], целью которого является резкое увеличение отношения "производительность/цена" при допустимой точности вычислений. Аналоговая схемотехника лучше отражает суть процессов, происходящих в нейронных сетях. Нейронная сеть в принципе является аналоговой, цифровая реализация представляет собой эмуляцию нейронной сети [99]. Аналоговая реализация, нейронных сетей требует значительно меньшего числа элементов, чем цифровая реализация. Основные проблемы внедрения аналоговых схем состоят в сложностях реализации промышленных технологий изготовления больших аналоговых микросхем.
Однако нейрокомпьютеры в целом и нейрокомпьютеры для решения краевых задач теории поля, в частности, находятся в стадии становления. Прежде всего, еще не решены в полном объеме задачи построения алгоритмов работы и архитектуры таких нейрокомпьютеров.
Как уже указывалось, решение разностных аналогов дифференциальных уравнений в частных производных сводится к решению систем линейных алгебраических уравнений. Известно достаточно много работ, посвященных решению систем линейных алгебраических уравнений на полносвязных нейронных сетях [18, 96, 412, 494, 495, 502, 503, 558-560]. Большинство известных алгоритмов решения на нейронных сетях систем линейных алгебраических уравнений строится согласно итерационному процессу X -» X - r|grad//(X), где X - вектор решения, Я(Х) - некоторый функционал ошибки, характеризующий точность решения, /7 - параметр (шаг). Нейронная сеть используется для вычисления grad//(X). Во всех известных алгоритмах используется функционал
Н{Х) = 1/2 (R,R), R - невязка решаемой системы. Известны нейросетевые реализации прямых методов решения систем алгебраических уравнений. Так в [560] используется ¿¿/-разложение и в результате обучения сети формируются треугольные матрицы разложения. Использование подобных сетей для решения систем уравнений, аппроксимирующих дифференциальные уравнения в частных производных, практически неприемлемо. Во-первых, для реальных порядков решаемых систем невозможно использовать полносвязную сеть. Во-вторых, использование функционала ошибки //(X) = 1/2 (R,R) эквивалентно применению трансформации (симметризации) Гаусса [54], которая резко ухудшает и без того очень плохую обусловленность решаемой системы, и как следствие, резко ухудшает динамические характеристики сети.
Чрезвычайно плодотворным представляется использование клеточных нейронных сетей (CNN - cellular neural network) для решения систем алгебраических уравнений, аппроксимирующих дифференциальные уравнения в частных производных. Клеточные нейронные сети, предложенные JI. Чуа (Chua L. О.) [488, 490, 492, 493], объединяют в себе черты клеточных автоматов (локальность взаимодействий) и нейронных сетей (коннекционистский характер вычислений). Формально можно рассматривать клеточную нейронную сеть и как сеть клеточных автоматов со специальными функциями клеток [29, 30] и как нейронную сеть, каждый нейрон которой имеет ограниченное число связей. В данной работе используется второй подход. Тогда CNN - это система простых процессоров (ячеек), расположенных на регулярной сетке и связанных между собой в одном или более слоях. Ячейкой в CNN является техническая модель нейрона.
Клеточные нейронные сети используются для таких традиционных для искусственных нейронных сетей приложений, как обработка изображений [490, 492,
497, 528], распознавание образов [29], ассоциативная память [365] и для решения многих других задач.
Структура клеточной нейронной сети адекватна многим задачам с естественным параллелизмом [98], легко устанавливаемое соответствие между разностным шаблоном и топологией сети делает привлекательным использование CNN для решения дифференциальных уравнений в частных производных. Уже в первой работе, посвященной CNN [490], подчеркнута общность между CNN и разностными аналогами дифференциальных уравнений в частных производных. В настоящее время известно достаточно много работ, посвященных использованию CNN для решения дифференциальных уравнений в частных производных [30,490, 493, 501, 504, 522, 527, 532, 533, 545, 546, 548].
В известных работах [490, 501, 527, 545, 546] используются аналоговые клеточные сети с непрерывным представлением времени, решающие системы обыкновенных дифференциальных уравнений, аппроксимирующие по методу прямых исходную краевую задачу. Наиболее перспективные аналоговые и цифровые сети, использующие дискретизацию пространства и времени, исследованы слабо. Использование дискретного времени позволяет упростить аппаратную реализацию сети и расширить спектр решаемых задач и применяемых методов. Недостаточно исследовано применение цифровых нейронных сетей для решения дифференциальных уравнений в частных производных. Рассмотренный в [424] вариант цифровой сети представляет собой нейросетевую реализацию одного из простейших итерационных алгоритмов - метода Якоби. Применительно к решению дифференциальных уравнений отсутствует теоретическое обоснование устойчивости формирования на сети решения уравнения
Выбор параметров клеточных сетей при решении дифференциальных уравнений в частных производных базируется на аналогии между математическим описанием сети и разностной аппроксимацией уравнения, однако, в опубликованных работах не применяется теория подобия, что затрудняет установление количественных соотношений (масштабов) между уравнением и параметрами сети.
Аналоговые нейронные сети обеспечивают высокую скорость получения решения, но относительно невысокую точность. Основную сложность представляет точное задание весов связи. Выход заключается в обучении сети, т. е. настройке параметров сети с учетом особенностей решаемой задачи и особенностей конкретного экземпляра сети. В [533] рассматривается алгоритм обучения, позволяющий по известным для некоторых моментов времени решениям уравнений, описывающих волновые процессы, обучить веса сети и получать решения для других моментов времени. Причем веса сети никак не были связаны с решаемым дифференциальным уравнением. Такой подход имеет очень ограниченное применение, его нельзя также рассматривать как решение обратной задачи, в которой по известному решению находятся характеристики среды [551].
Следует отметить, что многие теоретические положения, выработанные для сеточных моделей, в первую очередь, выбор параметров на основе теории подобия и квазианалоговые принципы работы, представляющие собой своеобразное обучение, могут быть плодотворно использованы в клеточных нейронных сетях.
К вычислениям на клеточных нейронных сетях близки клеточно-нейронные вычисления [29, 31, 483], которые основаны на алгоритме параллельных подстановок со специальными пороговыми функциями. Алгоритм параллельных подстановок [29, 295], в свою очередь, можно считать развитием идеи клеточных автоматов.
С решением дифференциальных уравнений в частных производных тесно связана проблема собственных значений [209, 253, 320, 354, 442, 444] для матриц аппроксимирующих уравнений, особенно, частичная проблема собственных значений, т. е. определение минимальных и максимальных собственных значений и соответствующих собственных векторов. В то же время с применением нейронных сетей эта проблема почти не решалась [526].
Приведенный анализ показывает современный уровень развития методов и средств решения дифференциальных уравнений в частных производных на ней-роподобных сетях. Однако существует ряд проблем, связанных с развитием теории и практической реализацией этих методов и средств, в частности:
- разработка теоретических основ решения дифференциальных уравнений в частных производных на клеточных аналоговых нейронных сетях, особенно на сетях с дискретным представлением времени;
- разработка и исследование методов обучения клеточных аналоговых нейронных сетей, позволяющих компенсировать аппаратные погрешности сетей;
- разработка теоретических основ решения дифференциальных уравнений в частных производных на цифровых синхронизируемых нейронных сетях с дискретным представлением времени;
- разработка и исследование методов решения на нейронных сетях проблемы собственных значений;
- разработка и исследование алгоритмов обучения и архитектуры нейроподоб-ных сетей для решения основных задач теории поля, в частности, задач, опит сываемых уравнениями эллиптического и параболического типов, нелинейных задач, внешних задач, задач теории пластин и оболочек;
- разработка архитектуры и реализации нейрокомпьютеров для решения дифференциальных уравнений в частных производных;
- разработка программного обеспечения нейрокомпьютеров для решения дифференциальных уравнений в частных производных.
Часть из указанных выше проблем явилась предметом настоящих исследований.
Актуальность проблемы. Эффективным средством решения краевых задач теории поля, описываемых дифференциальными уравнениями в частных производных, являются моделирующие нейроподобные сети, основанные на принципах массового параллелизма, коннекционизма и неалгоритмического характера работы. В настоящее время возможно построение эффективно функционирующих вычислительных систем для решения дифференциальных уравнений в частных производных на основе аналоговых моделирующих сетей с непрерывным и дискретным представлением времени и цифровых сетей с дискретным представлением времени.
Несмотря на довольно большое количество работ, посвященных рассматриваемой тематике, и проработку теоретических вопросов построения нейронных сетей общего вида для распознавания образов, обработки изображений и т. п., теоретические основы решения дифференциальных уравнений в частных производных на нейроподобных сетях разработаны недостаточно. Особенно перспективной для рассматриваемого направления представляется разработка теории сетей с ограниченной топологией - клеточных нейронных сетей.
Для аналоговых моделирующих сетей наиболее актуальны вопросы повышения точности, которые не могут быть решены только повышением точности аппаратуры сети. Для цифровых сетей практически отсутствуют теоретические обоснования решения-дифференциальных уравнений в частных производных. Так как моделирующие сети для решения дифференциальных уравнений в частных производных являются специализированными вычислительными системами, то необходима разработка теоретических основ решения на моделирующих сетях различных классов краевых задач теории поля и структуры вычислительных систем на основе таких сетей.
Разработка теории решения дифференциальных уравнений в частных производных на нейроподобных сетях послужит основой построения высокопроизводительных нейрокомпьютеров и является в настоящее время актуальной.
Цель работы. Целью диссертационной работы является разработка теоретических основ и методов структурной реализации аналоговых и цифровых моделирующих нейроподобных сетей для решения краевых задач теории поля.
Задачами исследования являются:
- математическое описание и теоретическое обоснование получения решения разностных аналогов дифференциальных уравнений в частных производных на аналоговых клеточных нейроподобных сетях с непрерывным и дискретным представлением времени;
- разработка и исследование методов обучения аналоговых моделирующих сетей, позволяющих компенсировать аппаратную погрешность сетей;
- разработка теоретических основ и структуры цифровых синхронизируемых нейроподобных сетей для решения дифференциальных уравнений в частных производных;
- разработка теоретических основ и структуры нейроподобных сетей для решения частичной проблемы собственных значений;
- разработка и исследование алгоритмов обучения и структуры моделирующих нейроподобных сетей для решения основных задач теории поля, в частности, задач, описываемых уравнениями эллиптического и параболического типов, нелинейных задач, внешних задач, задач теории пластин и оболочек.
Методы исследования. Для решения поставленных задач использовались методы теории дифференциальных уравнений в частных производных; линейной алгебры и теории матриц, теории итерационных алгоритмов, теории устойчивости динамических систем, теории нейронных сетей. В экспериментальных исследованиях применялось цифровое моделирование работы нейронных сетей.
Научная новизна работы состоит в следующем:
- разработан и исследован новый подход к построению аналоговых клеточных нейроподобных сетей для решения систем разностных уравнений, аппроксимирующих дифференциальные уравнения в частных производных, предаюженный подход в отличие от известных подходов исключает трансформацию Гаусса, что улучшает динамические свойства сети и снижает погрешность решения;
- разработаны и исследованы методы обучения аналоговых моделирующих сетей, использующие вектор смещения нейронов и позволяющие компенсировать погрешности аппаратуры сетей, доказаны сходимость и вычислительная устойчивость алгоритмов обучения;
- для описания работы синхронизируемых цифровых нейроподобных сетей впервые предложено использовать аппарат теории итерационных процессов, что позволило построить нейросетевые реализации эффективных итерационных процессов;
- разработаны структуры высокопроизводительных аналого-цифровых и цифровых нейрокомпьютеров для решения дифференциальных уравнений в частных производных;
- предложена и исследована структуры и градиентные алгоритмы работы сетей для решения частичной проблемы собственных значений;
- разработаны структура и ряд методов обучения однородных моделирующих нейроподобных сетей для решения внешних стационарных задач, в отличие от известных подходов предлагаемые методы исключают настройку синаптиче-ских весов сети;
- разработаны новые алгоритмы обучения моделирующих сетей для решения ряда задач теории пластин и оболочек, в частности, разработаны и исследованы методы решения на моделирующих сетях бигармонического уравнения изгиба пластин, задач термоупругости, задач колебания пластин;
Практическая ценность. Полученные в диссертации теоретические и практические результаты позволяют повысить точность работы моделирующих нейроподобных сетей и расширить классы решаемых задач, что подтверждается приведенными в диссертации примерами моделирования нейроподобных сетей и практическим использованием результатов диссертации.
Результаты диссертации являются теоретической основой разработки структуры, программно-математического обеспечения и технических средств нейрокомпьютеров для решения дифференциальных уравнений в частных производных.
Реализация и внедрение результатов. Исследования выполнялись на кафедре "Информационно-вычислительные системы" Пензенского государственного университета. Основные теоретические и практические результаты получены в ходе выполнения ряда научно-исследовательских работ, научным руководителем и исполнителем которых являлся автор. Работы выполнялись по хозяйственным договорам с Пензенским ФГУП "НПП "Рубин"" [219, 221] и с ЦНИИ имени академика А. Н. Крылова [4, 217, 218, 220, 318, 351, 362, 374, 375, 378]; в рамках ряда госбюджетных НИР, в том числе НИР "Исследование и разработка специализированных информационно-вычислительных систем (ИВС), работающих в реальном масштабе времени" [308] и "Исследование архитектуры и алгоритмов работы специализированных вычислительных систем (СВС) на базе параллельных и нейроподобных структур" [216], выполненных по плану министерства образования РФ; в рамках двух грантов министерства образования
РФ по фундаментальным исследованиям в области автоматики и телемеханики, вычислительной техники, информатики, кибернетики, метрологии и связи "Разработка методов моделирования распределенных объектов на нейроподобных сетях" [376] и "Разработка методов решения краевых задач математической физики на нейроподобных сетях" [377].
Результаты работы в виде теоретических исследований, алгоритмов, программ и результатов моделирования внедрены в ФГУП "НПП "Рубин"" при разработке аналого-цифрового вычислительного комплекса (АЦВК) "Сатурн-2" и спецпроцессора ЕС 2705. Результаты работы в виде теоретических исследований, алгоритмов, программных и технических средств внедрены в ЦНИИ им. А. Н. Крылова в АЦВК "Сириус".
Теоретические и практические результаты диссертационной работы использованы в учебном процессе Пензенского государственного университета при изучении студентами специальностей 220200, 170900 и 351400 дисциплин "Численные методы", "Вычислительная математика", "Линейная алгебра и численные методы".
Основные положения, выносимые на защиту;
- способ расчета параметров аналоговых клеточных нейроподобных сетей, основанный на использовании нового функционала ошибки;
- алгоритм обучения аналоговых моделирующих сетей с использованием вектора смещения;
- условия сходимости и устойчивости алгоритма обучения моделирующих сетей;
- нейросетевые реализации основных итерационных алгоритмов решения систем разностных уравнений;
- структуры и алгоритмы работы нейроподобных сетей для решения частичной проблемы собственных значений;
- структуры и методы обучения моделирующих сетей для решения внешних стационарных задач;
- методы решения на моделирующих сетях бигармонического уравнения изгиба пластин;
- методы решения на моделирующих сетях задач термоупругости пластин;
- методы решения на моделирующих сетях задач колебания пластин. Апробация работы. Основные результаты работы докладывались и обсуждались на международных, всесоюзных, республиканских, всероссийских и региональных научно-технических конференциях и семинарах: республиканских семинарах "Методы и средства решения краевых задач" (Рига, 1972, 1975, 1978), IV Всесоюзной конференции по аналоговой и аналого-цифровой вычислительной технике (Москва, 1973), областной научно-технической конференции "Вопросы проектирования и математического обеспечения информационно-вычислительных систем" (Пенза, 1973), областных научно-технических конференциях, посвященных дню радио и связиста (Новосибирск, 1975, 1976, 1978), III Всесоюзном совещании по технической диагностике (Минск, 1975), IV Всесоюзной конференции "Однородные вычислительные системы и среды" (Киев, 1975), Всесоюзной научно-технической конференции "Применение машинных методов для решения краевых задач" (Одесса, 1976), республиканском семинаре "Гибридные вычислительные машины и комплексы" (Киев, 1976), V Всесоюзной научно-технической конференции "Дальнейшее развитие аналоговой и аналого-цифровой вычислительной техники" (Москва, 1977), Всесоюзной научно-технической конференции "Автоматизация экспериментальных исследований" (Куйбышев, 1978), областной научно-технической конференции "Проектирование вычислительных устройств с помощью ЭВМ" (Пенза, 1978), Всесоюзном научно-техническом совещании "Проблемы создания и использования высокопроизводительных информационно-вычислительных машин" (Кишинев, 1979), областном семинаре "Математические методы в задачах управления" (Пенза, 1981), Всесоюзном семинаре "Специализированные процессоры параллельного действия для решения краевых задач" (Рига, 1981), Всесоюзной научно-технической конференции "Развитие и использование аналоговой и аналого-цифровой вычислительной техники" (Москва, 1981), областном семинаре "Проектирование и математическое обеспечение информационно-вычислительных систем" (Пенза, 1981), научно-техническом семинаре ВСНТО РЭС им. А. С. Попова "Эффективность машинных решений краевых задач" (Куйбышев, 1982), областном семинаре "Теория и практика построения информационно-вычислительных систем" (Пенза, 1982), научно-техническом семинаре ВСНТО РЭС им. А. С. Попова "Развитие машинных методов и средств решения краевых задач" (Донецк, 1983), научно-техническом семинаре ВСНТО РЭС им. А. С. Попова "Методы и средства решения краевых задач" (Казань, 1984), Всесоюзном совещании "Машинные методы решения краевых задач" (Рига, 1985), областном семинаре "Проектирование и эксплуатация информационно-вычислительных комплексов" (Пенза, 1986), зональной научно-технической конференции "Обработка информации в автоматизированных системах научных исследований" (Пенза, 1989), Всесоюзной конференции "Моделирование систем автоматизированного проектирование, автоматизированных систем научных исследований и гибких автоматизированных производств" (Тамбов, 1989), научно-техническом семинаре ВСНТО РЭС им. А. С. Попова "Практическая реализация машинных методов решения краевых задач" (Пенза, 1989), III региональном семинаре "Распределенная обработка информации" (Улан-Удэ, 1989), Всесоюзном научно-техническом семинаре "Математическое моделирование процессов и аппаратов" (Иваново, 1990), Всесоюзной научно-технической конференции "Перспективы развития и применения средств вычислительной техники для моделирования и автоматизированного исследования" (Москва, 1991), Международной научно-технической конференции "Методы и средства оценки и повышения надежности приборов, устройств и систем" (Пенза, 1992), Межгосударственной конференции "Методы и средства измерения механических параметров в системах контроля и управления" (Пенза, 1994), Международных научно-технических конференциях "Новые информационные технологии и системы" (Пенза, 1994, 1996, 1998, 2000), международной научно-технической конференции "Непрерывно-логические и нейронные сети и модели" (Ульяновск, 1995), Всероссийских семинарах "Нейроинформатика и ее приложения" Красноярск, 1995, 1996, 1997, 1998, 2000), Всероссийских научно-технических конференциях "Нейроинформа-тика-99", "Нейроинформатика-2000" и "Нейроинформатика-2001" (Москва,
19
1999, 2000, 2001), Всероссийских конференциях "Нейрокомпьютеры и их применение" (Москва, 1996, 1997, 1998, 1999, 2000, 2001), региональной научной конференции "Актуальные проблемы анализа и обеспечения надежности и качества приборов, устройств и систем" (Пенза, 1996), International symposium on nonlinear theory and its applications (NOLTA'96), (Katsurahama-so, Kochi, Japan, 1996), Всероссийской научно-технической конференции "Непрерывная и смежные логики в информатике, экономике и социологии" (Пенза, 1997), международной научно-технической конференции "Нечеткая логика, интеллектуальные системы и технологии" (Владимир, 1998), Третьем сибирском конгрессе по прикладной и индустриальной математике памяти С. А. Соболева (Новосибирск, 1998), международной конференции "Сучасш проблеми математики" (Чершвщ, Украина, 1998), международной конференции "Методы и средства преобразования и обработки аналоговой информации" (Ульяновск, 1999), международной конференции "Континуальные логико-алгебраические и нейросетевые методы в науке, технике и экономике" (Ульяновск, 2000).
Публикации. Основные положения диссертации опубликованы в 157 печатных работах, включая учебное пособие, 95 статей (из них две статьи опубликованы за рубежом: в США [507] и Японии [506]), 62 тезиса докладов, а также отражены в 23 зарегистрированных отчетах о НИР. Автор являлся редактором Пензенского регионального выпуска журнала "Нейрокомпьютеры: разработка, применение". - 2001. - № 3, в котором опубликованы статьи автора [157, 159, 176].
Структура и объем работы. Диссертация состоит из пяти глав, заключения, списка использованной литературы из 562 наименований и приложений, подтверждающих внедрение работы. Объем работы: 295 страниц основного машинописного текста, 69 рисунков и 10 таблиц.
Заключение диссертация на тему "Основы теории и методов структурной реализации моделирующих нейроподобных сетей для решения краевых задач теории поля"
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ К ГЛАВЕ 5
1. Для решения бигармонического уравнения на аналоговых нейроподобных сетях разработан и исследован вариант метода аддитивной коррекции - метод приближенной факторизации, основанный на представлении матрицы, описывающей нейроподобную сеть, в факторизованном виде. Применение метода аддитивной коррекции позволяет использовать простейший разностный шаблон и в то же время обеспечивает достаточно высокую точность решения за приемлемое число итераций. Проведенное компьютерное моделирование показало, что наиболее универсальным и эффективным является метод приближенной факторизации с дополнительным диагональным преобладанием в предконтурных узлах в четных итерациях.
2. Для решения бигармонического уравнения на цифровых нейроподобных сетях разработан и исследован пятицветный метод последовательной верхней релаксации. Разработанный метод может применяться для решения бигармонического уравнения . на вычислительных системах с массивно-параллельной архитектурой (МРР). На персональных компьютерах может быть использована последовательная реализация пятицветного метода.
3. Разработана и исследована цифровая реализация метода приближенной факторизации, основанная на факторизованном представлении матрицы сети. Особенностью разработанной реализации метода является замена двукратного решения систем разностных уравнений выполнением небольшого фиксированного числа-итераций. Компьютерное моделирование показало явное превосходство метода приближенной факторизации над другими методами. Разработанный метод может быть использован как на компьютерах с массивно-параллельной архитектурой, так и на персональных компьютерах.
4. Разработаны алгоритмы решения на нейроподобных сетях двумерных задач термоупругости. Основу алгоритмов составляет метод приближенной факторизации решения бигармонического уравнения. Эффективность разработанных алгоритмов исследована путем компьютерного моделирования с использованием специально разработанного комплекса программ ТЕРМАН имитации аналоговой нейроподобной сети для решения задач термоупругости.
5. Разработаны нейросетевые реализации степенного и градиентного методов решения частичной проблемы собственных значений. Разработаны и исследованы универсальные градиентные алгоритмы определения собственных векторов положительно определенных матриц, соответствующих максимальному и минимальному собственным числам. Алгоритмы могут быть реализованы на нейроподобных сетях с непрерывным и дискретным представлением времени. Разработанные алгоритмы могут быть также реализованы на компьютерах традиционной архитектуры, в частности, на персональных компьютерах.
6. На основе предложенных нейросетевых методов решения частичной проблемы собственных значений разработаны алгоритмы определения собственных частот колебаний пластин. Компьютерное моделирование нейроподобных сетей при реализации разработанных алгоритмов показало, что алгоритмы позволяют за небольшое число итераций определять собственные числа и частоты пластин при произвольных граничных условиях, а также определять собственные формы пластин.
7. Разработаны и исследованы нейросетевые алгоритмы решения задач вынужденных колебаний пластин. Если колебания происходят в результате внешнего синусоидального воздействия с постоянной амплитудой воздействия, то эффективным является решение задачи в амплитудной постановке. В общем виде предложен алгоритм решения задач вынужденных колебаний в нестационарной постановке. Разработанные алгоритмы основаны на методах аддитивной коррекции и приближенной факторизации.
ЗАКЛЮЧЕНИЕ
В диссертации разработаны теоретические основы и методы структурной реализации аналоговых и цифровых моделирующих нейроподобных сетей, включающие: новый подход к построению аналоговых и цифровых клеточных нейропбдобных сетей для решения дифференциальных уравнений в частных производных; алгоритмы обучения аналоговых клеточных нейроподобных сетей, позволяющие компенсировать погрешности сети и расширить класс решаемых задач; структуру аналого-цифровых и цифровых нейрокомпьютеров для решения краевых задач теории поля; методы решения на нейроподобных сетях основных классов краевых задач (внутренние стационарные и нестационарные задачи, нелинейные задачи, внешние стационарные задачи, бигармоническое уравнение и плоские задачи термоупругости, частичная проблема собственных значений и задачи свободных и вынужденных колебаний пластин).
Проведенные исследования позволили решить важную научную проблему разработки теоретических основ решения дифференциальных уравнений в частных производных на нейроподобных сетях.
В результате проведенных теоретических и экспериментальных исследований автором получены следующие результаты.
1. Разработан и теоретически обоснован новый подход к построению аналоговых клеточных нейроподобных сетей для решения дифференциальных уравнений в частных производных, учитывающий положительную определенность систем разностных уравнений, и в отличие от известных подходов исключающий трансформацию Гаусса, что улучшает динамические свойства сети и снижает погрешность решения.
2. Разработан и исследован алгоритм обучения аналоговых клеточных нейроподобных сетей, использующий вектор смещения. Разработаны алгоритмы аддитивной коррекции, позволяющие получать точность решения, ограниченную лишь разрядностью цифрового компьютера, в котором происходит формирование решения. Разработан новый аддитивный блочно-релаксационный метод, позволяющий решать большие задачи на моделирующих сетях ограниченных размеров. Впервые разработан алгоритм обучения нейроподобных сетей с непрерывным представлением времени. С использованием теории итерационных процессов получены условия сходимости процесса обучения сети и устойчивости процесса обучения к аппаратным погрешностям.
3. С целью сокращения числа итерационных циклов разработаны и исследованы нейросетевые реализации итерационных алгоритмов вариационного типа и новый подход, основанный на использовании специальной масштабирующей матрицы. Применение масштабирующей матрицы отличается простотой и большей скоростью сходимости, чем известные алгоритмы вариационного типа.
4. Разработана структура аналого-цифрового нейрокомпьютера для решения дифференциальных уравнений в частных производных. Структура основана на архитектуре гиперкуб и включает сеть асинхронно работающих цифровых процессоров, управляющих аналоговой нейроподобной сетью. Проведенные оценки показали, что предлагаемая структура позволяет примерно на порядок повысить коэффициент эффективности распараллеливания вычислительной системы.
5. Для решения систем разностных уравнений с симметричными положительно определенными матрицами разработана структура цифровой нейроподобной сети, исключающая трансформацию Гаусса. Разработанная сеть на несколько порядков уменьшает число итераций (тактов работы сети) по сравнению с известными сетями.
6. Впервые предложено рассматривать работу синхронной нейроподобной сети с дискретным представлением времени и линейной функцией активации как итерационный процесс. Доказано, что в этом случае условие асимптотической устойчивости сети совпадает с условием сходимости стационарного итерационного процесса с матрицей перехода, равной матрице связей сети.
7. На основе модульного анализа итерационных алгоритмов решения систем разностных уравнений предложено обобщенное описание итерационных алгоритмов, позволившее разработать структуры нейроподобных сетей, реализующих эффективные итерационные алгоритмы. Разработана и исследована нейросетевая реализация блочно-асинхронных итерационных алгоритмов, позволяющая эффективно реализовать итерационные алгоритмы при ограниченном числе нейронов сети. Показаны возможности применения нейропроцессора российской разработки ЫМ6403 для эмуляции нейроподобных сетей, реализующих итерационные алгоритмы решения систем разностных уравнений.
8. Для решения внешних краевых задач разработан алгоритм обучения сети, основанный на использовании вектора смещения. Разработанный алгоритм требует задания корректирующих воздействий только на границе области и во множестве приграничных узлов, использует однородную сеть без точного моделирования геометрии области и задания дополнительных проводимостей, моделирующих граничные условия. Получено условие сходимости процесса обучения и доказана устойчивость обучения к погрешностям сети.
9. Разработаны алгоритмы обучения сети, основанные на редукции внешних краевых задач к граничным интегральным уравнениям. Разработанные алгоритмы используют однородную сеть фиксированной структуры и требуют задания корректирующих воздействий только в узловые точки сеточной границы.
10. Разработаны алгоритмы моделирования потенциальных полей в составных средах на однородных моделирующих сетях фиксированной структуры. Алгоритмы основаны на пересчете условий на границе раздела сред в ближайшие узловые точки. Разработаны и исследованы алгоритмы моделирования полей тонких оболочек, помещенных во внешнее поле. Алгоритмы используют обучение однородной сети с применением вектора смещения сети. Получены условия, гарантирующие сходимость итерационного алгоритма формирования решения.
1 ¡.Разработана структура технических и программных средств специализированного вычислительного комплекса для решения внешних краевых задач. Структура позволяет реализовать комплекс при задании корректирующих воздействий в ограниченное число узловых точек, прилежащих к границе. Разработана гибкая иерархическая структура программного обеспечения, отдельные компоненты программного обеспечения интегрируются посредством базы данных. Основные концепции построения аппаратного и программного обеспечения успешно реализованы в системе для измерения, расчетов и управления сетками (СИРИУС).
12. Для решения бигармонического уравнения на нейроподобных сетях разработан и исследован вариант метода аддитивной коррекции - метод приближенной факторизации, основанный на представлении матрицы, описывающей нейроподобную сеть, в факторизованном виде. Применение метода аддитивной коррекции позволяет использовать простейший разностный шаблон и в то же время обеспечивает достаточно высокую точность решения за приемлемое число итераций. Для решения бигармонического уравнения на цифровых нейроподобных сетях разработан и исследован пятицветный метод последовательной верхней релаксации.
13. Разработаны алгоритмы решения на нейроподобных сетях двумерных задач термоупругости. Основу алгоритмов составляет метод приближенной факторизации решения бигармонического уравнения.
14. Разработаны нейросетевые реализации степенного и градиентного методов решения частичной проблемы собственных значений. Разработаны и исследованы новые универсальные градиентные алгоритмы определения собственных векторов положительно определенных матриц, соответствующих максимальному и минимальному собственным числам. Алгоритмы могут быть реализованы на нейроподобных сетях с непрерывным и дискретным представлением времени. Разработанные алгоритмы могут быть также реализованы на компьютерах традиционной архитектуры, в частности, на персональных компьютерах. На основе предложенных нейросетевых методов решения частичной проблемы собственных значений разработаны алгоритмы определения собственных частот колебаний
Библиография Горбаченко, Владимир Иванович, диссертация по теме Вычислительные машины и системы
1. Авдевич М. М. Применение консервативного метода граничных элементов для решения трехмерных задач электроразведки на постоянном токе /ММ Авдевич, А. М. Вишневский, А. Я. ЛаповокА. Я. 1. Физика земли. - 1998. - № 4. - С. 47 - 54.
2. Азиз X. Математическое моделирование пластовых систем/ X. Азиз, Э. Сеттари. М.: Недра, 1982. - 407 с.
3. Алгоритмическое использование сеточных ABM / Н. П. Сергеев, В. И. Горбаченко, В. А. Селютин, 3. И. Баусова II Решение краевых задач средствами математического моделирования. Киев: Ин-т математики АН УССР, 1979.-С. 9- 14.
4. Алгоритмическое повышение производительности сеточного спецпроцессора / В. И. Горбаченко, Г. М Блинова, С. Н. Катков, Э. С. Козлов
5. Вопросы радиоэлектроники. Серия ЭВТ. 1983. - Вып. 9. - С. 38 - 45.
6. Алгоритмы моделирования вибраций пластин при помощи проблемно-ориентированной вычислительной системы / В. И. Горбаченко, С. Н. Катков, А. Н. Семенов, Э. С. Козлов II Вопросы радиоэлектроники. Серия ЭВТ. 1988. - Вып. 10. - С. 47 - 52.
7. Алгоритмы работы АЦВК для решения внешних краевых задач /Я. 77. Сергеев, Р. А. Павловский, А. М. Вишневский, В. И. Горбаченко II Теория и практика построения информационно-вычислительных систем. Саратов: Изд-во Саратов, ун-та, 1982. - С. 18 - 20.и
-
Похожие работы
- Теоретические основы и разработка многофункциональных отказоустойчивых устройств на нейроподобных элементах
- Коммутационные системы нейроподобных структур и нейрокомпьютеров
- Метод, алгоритмы синтеза и структурно-функциональная организация отказоустойчивых нейросетевых логических устройств
- Методы математического моделирования нейтронно-физических процессов на проблемно-ориентированных вычислительных структурах
- Нейросетевой подход к интегрированному представлению и обработке информации в интеллектуальных системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность