Структурно-алгоритмическая адаптация числовых вычислений

Оленин, Анатолий Степанович

Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Структурно-алгоритмическая адаптация числовых вычислений

доктора физико-математических наук: Оленин, Анатолий Степанович
город: Москва
год: 1994
специальность ВАК РФ: 05.13.16

Автореферат по информатике, вычислительной технике и управлению на тему «Структурно-алгоритмическая адаптация числовых вычислений»

Автореферат диссертации по теме "Структурно-алгоритмическая адаптация числовых вычислений"

Р70 0 ^

- ЛОР ЮЗ';

рои СПИСКА Я АКАДЕМИИ НАУК ИНСТИТУТ Ш-ОКЛКМ КИБКШЬ"Г1/|КИ

На правах рукописи УЖ 681.324.001.51

ОЛЕНИН Анатолий Степанович

СТРУКТУРНО-АЛГОРИТМИЧЕСКАЯ АДАПТАЦИЯ ЧИСЛОВЫХ ВЫЧИСЛЕНИИ

Специальность 05.13.Г6 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

АВТОРЕФЕРАТ

диссертация на соискание ученой степени доктора 4мзико~математических наук

М О С й В А 1994

Работа выполнена в Вычислительном центре коллективного пользования Российской Академии наук.

Официальные оппоненты:

доктор физико-математических наук Б.Н.ЧЕТВЕРУШКИН доктор технических наук Ю.Г.ДАДЛЕВ

доктор технических наук С.Х.САХШ1

Ведущая организация: Вычислительный центр Российской Академии наук

Защита состоится "_"_ 1994г. в _ часов на

на заседании специализированного совета Д.003.78.0! ИГ1К РАН по адресу: 117312 Москва, ул. Вавилова, 37.

С диссертацией можно ознакомиться в библиотеке Института Автореферат разослан "_"___ 1994г.

Ученый секретарь Л

специализированного совета к.ф.-м.н. у^* /¿^М^М^БКЛЯЕВ

Общая характеристика работы

Актуальность тема. Создание вычислительных средств высокой оизводительности является в настоящее время одним из ределяющнх звеньев научно-технического прогресса. Большое имание при этом уделяется проблеме, связанной с разработкой раллельных архитектур. Сложность указанной проблемы заключается том, что ее решение требует комплексного подхода к вопросам хитектуры, организации вычислительного процесса и горитмического оснащения. Особенно это относится к сфере учно-прикладных задач физико-математического цикла и, в стности, к задачам математической физики, где дефицит стродействия современных вычислительна систем ощущается весьма тро. Вместе с тем именно в этой области наиболее ясен ищипиальный путь достижения высокой производительности. Часто м характер задач, их внутренняя структура указывают на зможность решения с помощью параллельных вычислительных средств, эгда же требуется коренной пересмотр алгоритмического зспечения с целью переложения его на системы параллельной работки, существенно согласуясь с их архитектурой. Поэтому следования, базирующиеся на комплексном подходе к решению эблемы адаптации вычислений и предлагающие обоснованные модели реализации, несомненно являются актуальными для современной числительной науки.

Цель работы. Исследование проблемы адаптации числовых гаслений; разработка скалярно-векторной модели организации числительных процессов и изучение ее приложений; анализ рективности распараллеливания ряда алгоритмов в условиях эльных физико-математических задач.

Научная новизна и практическая ценность. В плене общей зуктурно-алгоритмической постановки предложены и развиты элярно-векторная модель вычислений и параметрическая модель штации, которые открывают новое направление в проблеме фаботки эффективных вычислительных процессов.

Подученные оценки для ряда типичных физических числовых моделей показывают, что требуемый объем вычислений доступен при условии существенного распараллеливания. Изучены структура и некоторые приложения скалярно-векторной модели.

Рассмотрено множество алгоритмов для плотных матриц и показано, что они могут быть записаны в скалярно-векторной форме, где специфика метода заключена в скалярной части, а векторная часть практически универсальна. Наличие свойства совмещенности скаляров и векторов подчеркивает, что скалярно-векторная алгоритмика плотных матриц весьма полезна для производительного счета.

В том же аспекте проанализирован ряд алгоритмов в классе ленточных матриц. Предложены эффективные алгоритмы с общей структурой ленты, имеющие явно выраженный скалярно-векторный характер. Изучены их свойства по устойчивости, параллельности и объему вычислений. Один из таких алгоритмов, объединяющий в себе ряд положительных свойств, введен в неявную схему баротропной модели атмосферы.

Проведен численный анализ демпферного механизма стабилизации неустойчивости, связанного с диффузией производной по времени от искомой функции. Показано, что такой механизм ведет не только к прямому ускорению счета, но и значительно повышает возможности распараллеливания. В рамках общей постановки параметрической модели адаптации исследованы ее приложения к МВК "Эльбрус-2". Рассмотрен безобменный способ организации сеточных вычислений, удобный для оптической реализации.

Результаты, полученные в настоящей работе, представляют интерес как для создателей высокопроизводительных вычислительных систем, так и для разработчиков эффективных вычислительных процессов.

Апробация работы. Результаты работы докладывались на Всесоюзной школе "Многопроцессорные вычислительные системы с общим управлением" (Звенигород, 1981), на 7-м Всесоюзном семинаре по комплексам программ математической физики (Горький, 1981), на 4-й Сибирской школе по технологии разработки пакетов прикладных программ (Иркутск, 1982), на 8-м Всесоюзном семинаре по комплексам программ математической физики (Ташкент, 1983), на 2-й Всесоюзной

энференции "Современные проблемы численного анализа" (Тбилиси, 389), на Всесоюзной конференции по методам численного решения гогомерных нестационарных задач математической физики (Арзамас, 391), на Международной конференции "Теоретические проблемы 1бернетики" (Саратов, 1993), а также на заседаниях семинаров ютитута вычислительной математики РАН, Института проблем гбернетики РАН, Института точной механики и вычислительной ■■хники. Вычислительного центра коллективного пользования РАН. 1Инято участие в Международном конкурсе по параллельным ггоритмам "БирегСир-'Л", Мангейм, Германия.

Публикации. Опубликовано 25 работ; наиболее полно основные зультаты отражены в работах, приведенных в заключительной чести стоящего автореферата.

ОбЪем и структура работы. Диссертация состоит из введения, ти глав, заключения. Она содержит 258 страниц текста и список пфатуры из 102 наименований.

Содержание работы

Введение. Рассмотрены типичные классы числовых моделей, ¡щие многочисленные приложения в задачах физико-математического та: конечно-разностная модель, модель частиц и статистическая ;ель (метод Монте-Карло). Представлены оценки числа операций, изводительности, объема оперативной памяти этих моделей для ичной трехмерной нестационарной многокомпонентной задачи. Из ультатов оценок видно, что метод частиц примерно на порядок ее затратен, чем конечно-разностная модель, а метод Монте-Карло а два порядка. Хотя эти дашше носят весьма приближенный актер, тем не менее качественно они в основном отражают ш.ную ситуации.

Приведенные характеристики некоторых современных супер-ЭВМ жи к оценочным по объему оперативной памяти, но по 1зводителыюсти пока не достигают требуемых значений. Вместе с как следует из анализа моделей, их потенциальные возможности параллельности позволяют разливать на типичной задаче

производительность Ю12 оп/сек и вше.

Среди различных архитектур супер-ЭВМ заметно выделяются два направления реализации параллелизма: параллелизм в виде векторных операций с независимым выполнением скаляров и векторов (CRAY Y-MP, SX-3) и параллелизм на множестве процессоров с обменами между ними (СМ-2, NCUBE-2). Естественно, что эффективное функционирование такого рода систем невозможно без соответствующей поддержки на уровне алгоритмов и программ. Именно этот круг вопросов является предметом исследований настоящей работы.

Глава I. Структура скалярно-векторной модели вычислений. В основу описания скалярно-векторной модели положен тот факт, что в реальных числовых вычислениях, как правило, присутствуют скалярная и векторная компоненты. Причем, если имеется возможность обработки скаляров на векторном фоне, то их сдерживающее влияние на производительность счета оказывается минимальным. Таким образом, весьма сложная проблема ускорения скалярной компоненты может быть в ряде случаев заменена более простой ' задачей параллельного совмещения скаляров и векторов.

Приводится характерная форма скалярно-векторного процесса (СВ-процесса). Соответствующая' структура вычислителя представляется в виде взаимодействующих друг с другом скалярного и векторного процессоров. Сформулированы требования при которых СВ-процессы максимально эффективны. Особое внимание уделяется таким свойствам СВ-процессов. как загрузочная полнота и совмещенность скаляров с векторами. В загрузочно полных СВ-процессах отсутствуют (по определению) короткие векторы и обеспечивается кусочное постоянство длин векторов. Тем самым на алгоритмическом уровне снимаются главные причины падения производительности векторной обработки. Трудности сокращения доли скаляров для наращивания производительности счета компенсируются организацией их фонового прогона.

На основе разделения вычислений на скалярные, векторные и параллельные (по признаку векторности операндов и знаков операций), вводятся три вида функций параллельности: функция скалярности, функция векторности и функция параллельности. Эти функции определяют свойства алгоритмов с точки зрения параллелизма.

Показано, что функция параллельности, как наиболее

нереальная, может быть представлена в виде суперпозиции мирной и векторных функций, причем векторные функции берутся по Эственным знакам операций

Р(п) = S(n) + е V (п), q - знак операции, q 4

годя из этого разложения, произвольный вычислительный процесс '.падается на совокупность взаимодействующих СВ-процессов.

Для векторных процессов приведены соотношения, из которых, 1Я функцию векторпости, можно вычислить такие характеристики 'оритма, как его длину (общее число операций), реальную высоту зависимости от ресурса параллельности), ускорение (но сравнении последовательным счетом), среднюю векторность, степень птации.

Получены выражения, позволяющие с помощью заданных функции и урса параллельности сравнивать алгоритмы по скорости их олнения на параллельных средствах. Для этого нужно рассчитать и вставить соответствующие алгоритмам величины

LsW = L + E<p-V(n)> .

L - длина алгоритма, р - ресурс параллельности, V(n) -сция векторности (уига паралельности). Суммирование ведется по юти точек, где V(n) < р. При р = 1 процедура сравнения ¡ходит в обычную для последовательных алгоритмов, когда ютавляются просто их длины.

Показано, что производительность скалярно-векторных ¡слений с учетом совмещения скаляров и векторов может быть ана соотношением

W =

1 + 1Яу кз

-Г—If

1 + ЗУ ЗУ

ь - векторная производительность, 1 - отношение количеств зций, выполняемых в скалярном и векторном режимах, терпение скалярной и векторной производительностей. Коэффициент

к3 учитывает долю скаляров, несовмещенных с векторами. В случае kg = ü достигается полное совмещение, и общая производительность скалярно-векторного комплекса определяется в основном его векторной частью.

Глава 2. Скалярно-векторная алгоритмика плотных матриц. О позиций основных требований эффективности СВ-процессов (полноты загрузки и совмещенности скаляров с векторами) проанализирован ряд алгоритмов, оперирующих с плотными матрицами. Показано, что значительное множество методов типа исключения (методы -Гаусса, Жордана, отражений, вращений и др) может быть представлено в единообразной скалярно-векторной форме с помощью следующих выражений . '. 1

k _ (УаЛ 1) як _ ~к-1 _ к ~к-1

где tk- сглаживающий вектор.

Специфика того или иного метода оказывается сосредоточенной в скалярной части, и с помощью задания сглаживающего вектора можно переходить от одного метода к другому. При этом векторная компонента остается универсальной. Такой подход позволяет строить полные (в смысле загрузки) СВ-процессы, обеспечивающие совмещение скаляров и векторов.

Изучены возможности построения полных скялярно-векторных процессов в итерационных методах, особенно в тех случаях, когда неявность требует -вычислений с треугольными матрицами, менее эффективных с точки зрения загрузки (методы Гаусса-Зейделя, SOR, SSOtí). СВ-форма является естественной для блочных методов и группы алгоритмов сопряженных направлений.

Предложено описание модели вычислительного процесса, реализующего общую слсалярно-векторную схему обработки.

Глава 3. Векторизация ленточных систем. Ленточные системы, широко распространенные в задачах физико-математического моделирования, рассмотрены главным образом для общей структуры ленты. Разработаны легко векторизуемые варианты марш-алгоритма, прогоночный алгоритм с явным обращением

фомежуточных матриц (имеющих структуру матриц Фробениуса), фогоночно-маршевый алгоритм и другие. Исследованы условия их остойчивости и даны оценки вычислительных затрат. Для марш-алгоритма (ширина ленты матрицы 2ян-1)

т ш __

^т • 1 = 1

т т

г1>т Ь1кг1+к-1 +]С?-| а1кг1-к + 11

х.

i+m = <XvW + ri+tn • Х1 = .....V

сарактерны высокая эффективность по числу операций (порядка ш N У1Я переменных коэффициентов и порядка mN для постоянных коэффициентов), отсутствие заполнения ленты, низкий процент жэляров, но вместе с тем неустойчивость к ошибкам округления.

Напротив, прогоночшА алгоритм (m2N операций)

Qi+1 = + JmA> <Bi + W1 VM = Vi - Qi+1 (Fi + AiV

xi = Vl+1 + lQl+1 •Xi+1J * Xi-M = (Ii+1.....xi+m)T

остойчив, однако обладает менее регулярной структурой вычислительного процесса. Достоинства обоих алгоритмов )бЪединяются в оощей нрогоночно-маршевой схеме, которая использует эазоиение вектора неизвестных на группы. Маршевые процессы зассчитываются независимо для каждой группы и затем замыкаются с рмощью прогоночной схемы. Быстродействие, устойчивость, юраллельность прогоночно-маршевого алгоритма зависят от параметра избиения. Кроме того, 11МА свойствешш полнота СВ-процессов и жалярно-векторная.совмещенность.

На примере двумерной разностной задачи с пятидиагональной эазреженной матрицей показаны возможности организации )В-внчислений с фоновым взаимодействием скалярного и векторного

процессоров для схем БЬС®, ББОК и расщепления.

Глава 4. Демпферное моделирование баротропной атмосферы. Ряд результатов, полученных в предыдущих главах, был реализован в численной . модели баротропной атмосферы, используемой для геофизических исследований. Изучались сравнительные характеристики вычислений по явной и неявной схемам. Для решения матричной системы в неявной схеме использовался прогоночно-маршевый алгоритм. Настройка 11МА на максимальное быстродействие (при сохранении достаточного запаса устойчивости) осуществлялась с помощью демпферного варианта стабилизации.

Имеется ряд схем стабилизации неустойчивости, например, схемы на основе расщепления пространственного оператора, кинетически согласованные схемы и другие. В данном случае рассмотрен способ, связанный с "размазыванием" по пространственным координатам производной по времени от искомых функций. Этот подход, безотносительный к виду пространственного оператора, оказался весьма эффективным для ускорения как явных, так и неявных схем.

На базе баротропной модели был создан комплекс программ, основу которого составили четыре расчетные схемы: явная схема, схема Мацуно, неявная линейная схема и явная демпферная схема. Изучалась также сходимость итерационного процесса для полной нелинейной системы, где на кавдой итерации использовалась линейная неявность.

С целью анализа указанных схем был проведен дат вычислительных экспериментов. Как показали расчеты, существенное влиянии па скоростные характеристики схем оказывали нелинейность и нлраооличность системы. При высоких числах Не = 10Ь в случае явной схемы требовался примерно в 10 раз меньший шаг по времени, чем это следовало из точности аппроксимации. Введете демпфирования (в пределах допустимой точности) позволило снять ограничение на шаг по устойчивости, что соответственно повысило быстродействие схемы почти на порядок при незначительных дополнительных затратах.

Для того чтобы обеспечить режим максимального быстродействия для прогоночно-маршевого алгоритма, демпфер был введен также в неявную схему. И хотя реализация этой схемы на каждом шаге более затратна по объему вычислений, отсутствие

ограничения на устойчивость делает ее более эффективной по сравнений с обычной явной схемой.

При Ее = 103 начинают проявляться параболические свойства системы и явная схема становится еще более чувствительной к зеличине шага, требуя его заметного уменьшения. Тем не менее демпферная явная схема в этих условиях сохраняет свои скоростные сачества всего лишь за счет некоторого увеличения параметра демпфирования. В результате относительная эффективность демпферной :хемы оказывается значительно выше.

Картина качествешю меняется с дальнейшим ростом влияния язкости. Величина Не = Ш2 приводит к заметной трансформации рофиля функций и нарастанию градиентов вблизи полюсов. В этой итуации полное подавление неустойчивости требует уже недопустимо ысоких (с точки зрения точности) значений параметра эмпфирования. Уменьшение демпфера приходится компенсировать экращеяием шага, что ведет к росту времени счета. Однако несмотря ) низкую величину демпфера, схема остается все-таки в несколько )з эффективней обычной явной схемы.

Как показывают расчеты, неявная схема с одним и тем же добранным демпфером, сохраняет скоростные качества независимо от сел Рейнольдса. Это объясняется тем, что внутришаговая устойчивость определяется не свойствами разностной схемы, а ецификой алгоритма решения системы уравнений, огоночго-маршевый алгоритм в зависимости от степени разбиения известных на группы в одном предельном случае переходит в гричную прогонку (устойчивую, но с большим числом операций), а в /гом - в марш-алгоритм (неустойчивый, но со значительно меньшим земом вычислений). Демпфирование позволяет получить разбиение, гетащее высокую скорость и устойчивость. При этом по сравнению штричной прогонкой быстродействие возрастает на порядок.

Глава 5. Адаптационная структура вычислительных алгоритмов и тем.

Распараллеливание является одним из важнейших, но не нственным фактором адаптации алгоритмов и программ к лтектуре вычислительных систем. Реальная производительность целительной системы может быть описана выражением

= Ск^...^) и

Это выражение показывает, что потери производительности по отношению к ее пиковому значению IV обусловлены рядом причин, влияние которых описывается с помощью. подлежащих определению коэффициентов Общая схема релизации такого подхода трактуется как параметрическая модель адаптации и имеет вид

В соответствии с этой моделью процесс адаптации описывается следующей совокупностью действий:

выявление системных и пользовательских - параметров (факторов), от которых зависит реальная производительность системы;

- построение моделей влияния этих параметров на производительность системы;

- оценка потерь производительности по каждому из факторов на основе моделей влияния;

- проведение адаптационных мер на уровне алгоритмов и программ с целью снижения потерь.

Максимальное согласование системных и пользовательских параметров выполняется пользователем или аппаратными средствами.

В дайной работе проанализированы приложения параметрической модели к МВК "Эльбрус-2". Рассмотрены следующие факторы адаптации, которые существенно влияют на производительность МВК: параллельные процессы, 'Переисаользование С03У, параллельность на

'ронне комавд.

Адаптация по параллельным процессам. Здесь в качестве ■истемного и пользовательского параметров выступают соответственно исло процессоров Р и ускорение S. Согласующая функция ользователя состоит в том, чтобы найти такую конфигурацию аспараллеливания, при которой величина ускорения отличалась бы ак можно меньше от числа процессоров. Степень согласованности тих параметров определяется коэффициентом адаптации kp= S/P. Чем нше этот показатель, тем лучше адаптирован алгоритм (программа) к рхитектуре МВК по фактору многопроцессорности.

Показано, что в случае явной схемы достаточно высокий )э<1фициент адаптации 0,93) имеет конфигурация, связанная с

аспараллеливанием уравнения Пуассона для функции тока при эзбиении поверхности Земного шара на три (Р = 3) широтных Шсти.

В неявной схеме оказалось необходимым добавить в процесс (аптации уравнение динамики вихря. Причем, как «азали вычислительные эксперименты, включение в конфигурацию юпараллеливания только маршевой части ПМА приводило к достаточному согласованию (кр = 0,47). Значительно лучшие зультаты получались, если распараллеливание охватывало не только ршевый, но и прогоночный счет (кр = 0,9).

Адаптация по С03У. В задачах с преобладанием обработки ссивов существенное значение в МВК. имеют два вида 003У: буферная мять команд ВПК и буферная память массивов БПМ. Эффект реиспользования С0.ЧУ проявляется при следующих условиях:

- область локализации циклов программ не должна превышать змер ВПК;

- область локализации массивов не должна превышать размер БПМ;

- количество повторных обращений к локализованной информации должно быть меньше отношения пропускных способностей СОЗУ и

I _

Следовательно, в число системных параметров включаются юшение пропускных способностей К = №созу/№озу' РазмеР буферной ити команд мбпк, размер буферной памяти массивов мбпм-тветствующие пользовательские параметры: число повторений ализованной информации Кд, размер тела цикла и размер

массива Мм. Построение модели влияния переиспользования на производительность заключается в способе вычисления коэффициента адаптации, который учитывает перечисленные выше системные и пользовательские свойства и в данном случае может быть представлен с помощью выражения

(k.,-1 )kg + 1

= Ü '

где k1, k2 описывают реальные для программы локализацию и степень заполнения СОЗУ.

Анализ атмосферной задачи приводит к следующим результатам. Явная схема, содержащая множество коротких циклов с большим числом повторений, удовлетворяет условиям переиспользования по локализации на 100%, по заполнению ВПК - примерно на 90%, что соответствует коэффициенту адаптации ^ = 0,9. В неявной схеме степень локализации также высока, но заполнение в среднем по программе несколько ниже - 80% и коэффициент адаптации получается kII = 0,8.

Ситуация с переиспользованием массивов существенно иная. Практически все участвующие в атмосферной задаче массивы обладают достаточным числом повторений, но, как правило, слишком велики по размеру, чтобы поместиться в БПМ. Имеется возможность разбиения массивов на подмассивы необходимого размера, но затраты на щюграммировяние в таком случае могут значительно снизить эффект от переиспользования. Кроме того, в МВК существует механизм опережающей подкачки массивов в БПМ, что обеспечивает автоматическую адаптацию к этой памяти.

Адаптация на уровне команд. В программах, которые были разработаны для реализации указанных выше схем, доминирует регулярная обработка массивов. Это обстоятельство, находящееся по существу в распоряжении пользователя, вместе с механизмом опережающей подкачки создает благоприятные условия для эффективного заполнения конвейеров функциональных устройств с коэффициентом адаптации, весьма близким к единице. Параллельная загрузка отдельных ФУ в процессоре определяется динамикой выполнения программы и осуществляется тем полнее, чем больше в щюграмме независимых разноименных операций.

В этой же главе обсужден ряд вопросов, связанных с возможностью построения сеточных оптических вычислений. Типичные троекты ЭВМ для сеточных задач используют обменную модель зычислений на матрице связанных процессоров, где кавдому фоцессору соответствует узел (или груша узлов) сетки. При этом [а каждом шаге вычислений помимо непосредственного счета должна [роизводиться операция обмена данными между процессорами, фиктивность такой модели обеспечивается лишь в том случае, когда атраты времени на обмены малы по сравнению с процессорным ременвм. С точки зрения оптики более удобны безобменные сеточные одели. Например, явную разностную схему для двумерного уравнения иффузии можно использовать в следующей записи

< = + г<и",о + и+1,о + + ио,+1> + -1 роо •

(е вычисления производятся целиком над матрицей значений функций > внутренних узлах и матрицами, сдвинутыми в соответствии с |блоном (вниз, вверх, влево, вправо) для учета границ. Если вся ¡ласть помещается в сечении светового луча, то выделение обходимых подобластей и задание сложной геометрии можно уществлять путем маскирования. В этом случае оптический перенос формации в процессе обработки не требует взаимодействия узлов утри сечения луча. Трехмерные области представляются набором эскостных картинок, которые могут обрабатываться параллельно, зизводительность такой системы определяется разрешающей >собностью оптических носителей информации, возможностями юминащей среды по записи и считыванию картинок и ;тродействием матрицы исполнительных устройств.

Заключение

В настоящей работе основное внимание сосредоточено главным азом на исследовании следующих трех проблем.

I. Прямое ускорение скалярной компоненты, содержащейся в пьных вычислениях, связано с физическими ограничениями на эость распространения сигнала и представляет собой сложную

технологическую проблему. Обеспечение возможности фонового счета скаляров и векторов на уровне алгоритмов и процессов значительно ослабляет остроту этой проблемы. Представление и разработка вычислительных процессов в рамках скалярно-векторной модели, реализующей указанный подход, позволяет существенно повысить производительность обработки информации.

2. Качественное решение крупных научно-прикладных задач возможно только в условиях устойчивых вычислительных схем. Разработка конкретных механизмов стабилизации неустойчивости, не ведущих к чрезмерному увеличению числа операций и вместе с тем обладающих высокой степенью параллелизма, является весьма значительным средством повышения эффективности числовых вычислений в области физико-математического моделирования.

3. Реальная производительность вычислительных систем на широком спектре решаемых задач, как правило, заметно ниже пиковой производительности. Зто вызвано рядом факторов, определяющих структурное рассогласование программных и системных свойств. Разработка и реализация моделей адаптации алгоритмов к архитектурам вычислительных машин позволяет более полно использовать потенциал производительности параллельных систем и комплексов.

Основные итоги работы

I. На базе характерной многокомпонентной трехмерной задачи получены оценки затрат вычислений и объема оперативной памяти для типичных в математической физике числовых моделей с учетом особенностей их параллелизма.

'¿. Предложено структурное описание скалярно-векторной модели, важной для реальных вычислений; разработаны функциональные средства описания параллельных и векторных процессов; приведены соотношения для производительности скалярно-векторных вычислений.

3. Изложен ряд алгоритмов для плотных и ленточных матриц: построена общая структурная схема скалярно-векторной организации; предложена адекватная модель вычислений.

4. Разработан комплекс программ численного моделирования >аротропной модели атмосферы; доказана эффективность демпферной ¡табилизацш неустойчивости для явной и неявной схем; в неявном :лучае реализован один из разработанных ленточных алгоритмов с ¡арьируемыми быстродействием, устойчивостью и параллельностью.

5. Предложена параметрическая модель адаптации; дан анализ даптациошюй структуры МВК "Эльбрус-2"; апробирован ряд средств, мающихся в распоряжении пользователя, для построения эффективных ычислителышх процессов.

6. По ряду основных факторов проведена адаптация численной эдели баротропной атмосферы к МВК "Эльбрус-2"; на основе вшинных экспериментов получены результаты по эффективности эраметрической модели и степени адаптируемости баротропной задачи.

7. Предложен способ построения безобменных сеточных числительных схем, удобных для оптической реализации; дана фуктурно-алгоритмическая модель организации безобменных схем.

Основные результаты диссертации изложены в следующих бликациях:

1. Оленин A.C. О параллельной реализации прогонки. В сб.: мплексы программ математической физики. -Новосибирск: Ин-т ор. и прикл. механики СО АН СССР, 1982, с.130-135.

2. Оленин A.C. Параллельные вычисления в некоторых разностных дачах. -М.: 1983, 24с. (Препринт ИТМ и ВТ АН СССР Ю).

3. Оленин A.C. Векторные процессы в линейных алгебраических цачах с плотными матрицами. -М.: 1983 , 38с. (Препринт ИТМ и ВТ

СССР Ж7).

4. Оленин A.C. Многопроцессорная декомпозиция ленточных зтем. В сб.: Комплексы программ математической физики. >восибирск: Ин-т теор. и прикл. механики СО АН СССР, 1984, 52-87.

5. Оленин A.C. Организация скалярно-векторннх вычислений в •ебре ленточных и блочных матриц. -М: 1984,.44с. (Препринт ИТМ и АН СССР >68).

6. Оленин A.C. Скалярно-векторные процессы в ленточных темах. -М.: 1987, 29с. (Препринт ОВМ АН СССР Ш56).

7. Оленин А.С. Некоторые структурные и алгоритмические аспекты скалярно-векторной модели вычислений. В сб. СуперЭВМ. -М.: ОВМ АН СССР. 1989, с.77-95.

8. Оленин А.С. Прогоночно-маршевая реализация баротропной модели атмосферы, вопроси адаптации и архитектурного обеспечения. //Вычислительные машины с нетрадиционной архитектурой. -М: Наука, 1990, с.120-138.

9. Оленин А.С. Демпферное моделирование баротропной атмосферы. -М.: 1991, 24с. (Препринт ВЦКЛ АН СССР ШЗ).

10. Olenln A.S. Parallel and scalar-vector processes In barotropic atmosphere. //SuperCup-91. Mannheim, Germany, 1У91.

11. Оленин А.С. Адаптационная структура вычислительных алгоритмов и систем. //Вычислительные машины с нетрадиционной архитектурой. -М: Наука, 1994.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00