автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Разработка и исследование элементов и устройств цифровой обработки сигналов и метода их эффективного использования в комбинированных кластерах

кандидата технических наук
Аль-Ханани Морад Абдулла Ахмад
город
Таганрог
год
2011
специальность ВАК РФ
05.13.05
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование элементов и устройств цифровой обработки сигналов и метода их эффективного использования в комбинированных кластерах»

Автореферат диссертации по теме "Разработка и исследование элементов и устройств цифровой обработки сигналов и метода их эффективного использования в комбинированных кластерах"

На правах рукописи

484989Ь

АЛЬ-ХАНАНИ Морад Абдулла Ахмад

РАЗРАБОТКА И ИССЛЕДОВАНИЕ ЭЛЕМЕНТОВ И УСТРОЙСТВ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ И МЕТОДА ИХ ЭФФЕКТИВНОГО ИСПОЛЬЗОВАНИЯ В КОМБИНИРОВАННЫХ КЛАСТЕРАХ

Специальность:

05.13.05 -Элементы и устройства вычислительной техники и систем управления

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Таганрог-201! , 5 ■

4849896

Работа выполнена в Технологическом институте Южного федерального университета в г. Таганроге.

Научный руководитель:

доктор технических наук, профессор Гузик Вячеслав Филиппович

Официальные оппоненты:

доктор технических наук, профессор Турулин Игорь Ильич

кандидат технических наук, с.н.с. Боровков Игорь Константинович

Ведущая организация: Таганрогский филиал НИИ Системотехники

Защита диссертации состоится « » ч*©л.й_2011 г. в _ на заседании

диссертационного совета Д 212.208.21 Южного федерального университета по адресу: 347928, Ростовская область, г.Таганрог, пер. Некрасовский, 44, корпус Д, комната 406.

Просим Вас прислать отзыв, заверенный гербовой печатью учреждения, по адресу: 347928, Ростовская область, г. Таганрог, пер. Некрасовский, 44, Технологический институт Южного федерального университета в г. Таганроге. Ученому секретарю диссертационного совета Д 212.208.21 Чернову Николаю Ивановичу.

С диссертацией можно ознакомиться в Зональной научной библиотеке ЮФУ по адресу: 344000, г. Ростов-на-Дону, ул. Пушкинская 148.

Автореферат разослан «'¿~Ъ> Л „д. 2011 г.

Ученый секретарь диссертационного совета доктор технических наук, профессор

Чернов Н,И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Проблема эффективного решения задач цифровой обработки сигналов на современном уровне развития науки и техники является одной из важнейших. Ее решение сопряжено с синтезом новых эффективных средств решения на методологическом, алгоритмическом, программном и аппаратном уровнях.

В этой связи диссертационная работа посвящена разработке нового комбинированного устройства кластерного типа с многоуровневым параллелизмом обработки данных, а также новых элементов и устройств, применяющихся как вычислительные узлы комбинированного кластера для эффективной обработки цифровых сигналов.

Так как разрабатываемые элементы и устройства являются новыми на современном этапе развития вычислительной техники, то необходимым является также разработка метода и алгоритмов их эффективного использования для решения задач цифровой обработки сигналов.

Актуальность проблемы обуславливается

необходимостью увеличения производительности к процессе решения вычислительных задач любыми способами, в частности с помощью новых элементов и устройств, внедрением новой теоретической и алгоритмической базы, использованием новых методов повышения эффективности решения задач на гибридных схемах.

В диссертации рассматриваются теоретические и практические аспекты разработки нового комбинированного устройства кластерного типа и новых элементов и устройств, являющихся его вычислительными узлами, которые позволяют эффективно решать задачи цифровой обработки данных с помощью мног оуровневого параллелизма. Также проводится классификация способов обработки информации в распределенных вычислителях, синтезируется метод и алгоритмы применения разработанных элементов и устройств для решения задач цифровой обработки сигналов в рамках синтезированного в диссертационной работе высокопроизводительного комбинированного кластера.

Актуальность диссертации подтверждается использованием полученных результатов в хоздоговорных и госбюджетных научно исследовательских работах 1 кафедры вычислительной техники Технологического института Южного федерального университета в г. Таганроге (ТТИ ЮФУ), а также в учебном процессе, что сопровождается соответствующими актами о внедрении.

Объектами исследования в диссертационной работе являются: элементы и устройства для решения задач цифровой обработки сигналов, кластеры с многоуровневой структурой, архитектуры микропроцессоров, специфические аппаратные и программные средства иоддержки вычислительного процесса, методы математического моделирования, численные методы, а также высокопроизводительные алгоритмы и методы распределенных вычислений па базе разного рода параллельных и кластерных вычислителей с использованием существующих элементов и устройств.

Целью работы в теоретическом плане являются:

-разработка нового комбинированного устройства кластерного типа для решения

задач цифровой обработки сигналов; -разработка новых элементов комбинированного кластера на базе процессоров цифровой обработки сигналов (ЦОС) и программируемых логических интегральных схем (ПЛИС) для решения задач ЦОС; -разработка метода и алгоритмов эффективного использования новых элементов и устройств комбинированных кластеров с многоуровневой архитектурой для решения задач ЦОС на практике; Целью работы в практическом плане является:

-разработка элементов и устройств комбинированных кластеров для решения задач ЦОС;

-реализация алгоритмов, синтезированных в диссертационной работе, в виде программного комплекса для обеспечения работы нового комбинированного кластера;

-экспериментальная проверка, а также апробация и внедрение полученных теоретических и практических результатов на примере решения актуальных задач фильтрации изображений и обработки гидроакустических данных методами вейвлет-анализа; О с н о в н ы мн задачами работы являются: -проведение анализа существующих элементов и устройств, применимых для

решения задач ЦОС в составе вычислительных систем общего назначения; - разработка нового комбинированного устройства кластерного типа, при помощи

которого можно эффективно решать задачи цифровой обработки сигналов; -синтез элементов и устройств на базе процессоров ЦОС и ПЛИС, которые можно применять как вычислительные узлы разработанного комбинированного кластера для решения задач цифровой обработки сигналов; -описание способа представления сложных вычислительных задач в терминах теории графов для их корректного переноса на разработанный комбинированный кластер, а также обоснование и описание метода и алгоритмов эффективного использования новых элементов и устройств для решения распределенных задач цифровой обработки сигналов, а также провести экспериментальную проверку полученных результатов на практике. М с т о д ы выполнения исследований. Для теоретических исследований использовались методы цифровой обработки сигналов, методы проектирования элементов и устройств, теории графов и множеств, теории алгоритмов и численных методов, методы математического моделирования и объектно-ориентированного программирования, методы параллельных вычислений.

Кроме того, проводились экспериментальные исследования на модельных и реальных объектах и сигналах, а также апробация разработанных алгоритмов на ЭВМ. Н а у ч н а я но в и з и а :

-разработано новое вычислительное устройство кластерного типа (комбинированный кластер) для выполнения распределенных вычислений, являющееся эффективным для решения задач цифровой обработки сигналов и

отличающееся от существующих введением специализированных элементов, адаптированных для реализации алгоритмов ЦОС, а также многоуровневой параллельной организацией вычислительного процесса; -разработаны специализированные элементы и устройства, являющиеся эффективными для решения задач ЦОС в базисе комбинированного кластера и отличающиеся от существующих ориентацией именно на алгоритмы обработки сигналов на аппаратном и программном уровне, а также позволяющих выполнять межэлементные соединения, составляющие сети нижнего уровня в разработанном в рамках диссертационной работы многослойном комбинированном кластере. Практическая ценность и рекомендации но применению.

Результаты исследований, описанных в диссертации, находят применение для решения комплексных задач обработки сигналов, как на верхнем уровне комбинированных кластеров, так и на уровне проблемно-ориентированных элементов и устройств, образующих нижние слои.

Эффективность и качество работы разработанного комбинированного кластера цифровой обработки сигналов следует из:

-использования элементов и устройств с аппаратной поддержкой алгоритмов цифровой обработки сигналов;

- введения концептуально новых и эффективных методов и алгоритмов обработки данных на комбинированных кластерах;

-использования распределенных вычислителей с настраиваемой коммуникационной средой для параллельного выполнения участков загружаемых задач;

-многоуровневого распараллеливания решаемых задач сразу на нескольких слоях

комбинированного кластера; -эффективного использования возможностей адаптации структуры кластера к особенностям и размеру решаемой задачи, а также возможностей горизонтального и вертикального масштабирования и замены элементов в соответствии с требованиями. Основные положения, выносимые на защиту:

-новое комбинированное устройство кластерного типа (комбинированный

кластер), являющийся эффективным для решения сложных задач ЦОС; -элементы и устройства, адаптированные для решения задач ЦОС в составе

многослойного комбинированного кластера. Достоверность и обоснованность полученных результатов и положений, выносимых на защиту, подтверждается:

- применением апробированных алгоритмов для двух- и трехмерных задач ЦОС;

- разработкой и апробацией специализированного низкоуровневого программного обеспечения для решения сложных задач ЦОС;

-постановкой и проведением вычислительного эксперимента и проверкой полученных результатов на практике на примере решения задачи медианной фильтрации изображений и обработки гидроакустических сигналов методами иейвлет-анализа с применением предложенных специализированных элементов и устройств.

Полученные элементы и устройства, а также сопутствующие их эффективному применению на практике метод и алгоритмы являются универсальными и их целесообразно использовать при построении комплексов цифровой обработки сигналов, автоматизированных модулей целеуказания и сопровождения объектов, расчете параметров распространения гидроакустических волн, обработке поверхностей и сигналов разной физической природы.

Научные и практические результаты диссертации использовались при выполнении госбюджетной НИР «Разработка теории и принципов построения интеллектуальных высокопроизводительных реконфигурируемых многопроцессорных вычислительных систем на основе аппаратных мультипрограммных средств и специализированных трансляторов алгоритмов в аппаратные программы», выполняемой п ТТИ ЮФУ, а также в учебном процессе ТТИ ЮФУ - в лабораторном практикуме по курсу «Проблемно-ориентированные вычислительные системы», что подтверждено соответствующими актами. П у б л и к а ц и и .

Результаты, полученные в диссертации, нашли отражение в 8 печатных работах. Среди них 5 ст атей, 3 тезиса докладов. 3 статьи опубликованы в изданиях, входящих в список рекомендованных ПАК.

Апробация работы.

Результаты работы докладывались и обсуждались на различных конференциях:

1) VIII Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика радиоэлектроника и систем управление». Таганрог, 2006, ТРТУ;

2) IX Всероссийской научной конференция студентов и аспирантов «Техническая i кибернетика, радиоэлектроника и системы управления». - Таганрог, 2008;

3) Всероссийской научно-технической конференции с международным участием «Компьютерные технологии в науке, инженерии и управлении» «КомТех-2009». - Таганрог, 2009;

4) 55-й Всероссийской и научно-методической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ в 2009;

5) 56-й Научно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ. - Таганрог, 2009;

6) V ежегодной научной конференции студентов и аспирантов базовых кафедр Южного научного центра РАН Таганрог, 2009;

7) VII Всероссийской конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление». ТТИ ЮФУ -Таганрог, 2009;

8) 57-й Научно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ. - Таганрог, 2011.

Структура работ ы .

Материал основной части диссертационной работы изложен па 180 страницах машинописного текста. Диссертация состоит из введения, четырех разделов, списка литературы из 114 наименований на 10 листах, содержит б таблиц, 66 рисунков и 2 приложения на 21 листе. Общий объем диссертации, включая список используемых источников и приложения, составляет 212 страниц.

Краткое с о д е р ж а п и с р а б о т ы .

Первый раздел работы посвящен анализу существующих элементов и устройств цифровой обработки сигналов, обзору распределенных вычислительных архитектур, применимых для построения комбинированных кластеров, их классификации и носит постановочный характер. В разделе вводятся такие опорные понятия для решаемой задачи обработки данных с применением параллельных принципов, как многослойные кластеры и проблемно ориентированные ядра.

На основании проведенного анализа, делается вывод о целесообразности разработки новых элементов и устройств для построения комбинированных кластеров в целях реализации разных алгоритмов цифровой обработки сигналов сразу па нескольких уровнях вычислений в целях сокращения временных затрат. Большое внимание в разделе уделено вопросам классификации, оценке преимуществ и недостатков существующих решений поставленной проблемы с целью поиска новых путей для создания элементов и устройств, компенсирующих недостатки аналогов.

Раздел завершается сравнительной характеристикой всех рассмотренных решений и обоснованием необходимости создания новых элементов и устройств, а также метода их использования, построенного на возможности соединения классических кластеров на ПЭВМ с применением наборов элементов и устройств разного типа, позволяющих решать большинство специализированных задач сиг налов более быстро и эффективно, чем ПЭВМ и более дешево, чем супер-ЭВМ.

Второй раздел диссертационной работы посвящен разработке элементов и устройств, соответствующих поставленной задаче построения комбинированных кластеров цифровой обработки сигналов.

Приведены основные требования к элементам и устройствам, описаны их основные принципы работы, синтезированы процедуры п функции, а также разработаны конфигурации программного обеспечения комбинированных кластеров на базе процессоров цифровой обработки сигналов и приведены конфигурации элементов и устройств на основе программируемых логических интегральных схем, применимые для решения сложных задач обработки сигналов.

Далее в разделе синтезированы процедуры проектирования элементов и устройств комбинированных кластеров на базе процессоров ЦОС и программируемых логических интегральных схем.

Поэтапно представлен процесс синтеза устройств и проверки их работоспособности на компьютерных моделях и в составе реального кластера, включающий в себя следующие этапы:

1) анализ решаемой задачи и определение распараллеливаемых участков, а также блоков алгоритмов, нуждающихся в аппаратном ускорении на базе специализированных элементов и устройств;

2) разработку коммуникационных средств, осуществляющих объединение сетевых станций в кластер верхнего уровня;

3) обеспечение поддержки специального программного обеспечения, позволяющего создавать кластер - проблемно-ориентированные проекты;

4) разработка новых или реконфигурирование имеющихся элементов и устройств цифровой обработки сигналов для решения конкретных задач, в том числе в процессе работы;

5) синтез функционального базиса элементов и устройств и разработка процедур управления потоками данных на всех узлах комбинированного кластера;

6) создание динамической реконфигурируемой коммутационной структуры нижнего уровня для вычислительных элементов и устройств, включенных в рабочие станции верхнего уровня, для обеспечения многоуровневого параллелизма;

7) синтез процедур управления модулями связи коммутационной структуры нижнего слоя;

8) решение задач сбора, визуализации и последующего хранения результатов вычислений.

На рисунке 1 показана обобщенная структура разработанного комбинированного кластера с элементами ЦОС, построенного по указанным выше принципам,

Рисунок 1. Обобщенная структура многослойного кластера с несколькими проблемно-ориентированными ячейками В качестве особенностей разработанного комбинированного кластера указывается наличие многослойного параллелизма с точки зрения организации коммутационного поля и распределения вычислительных потоков, а также возможность горизонтального и вертикального масштабирования и изменения состава устройств ускорения, ориентированных на различные задачи.

Разработано несколько новых элементов и устройств на базе ПЛИС по предложенной в диссертационной работе процедуре.

Для данных элементов и устройств были синтезированы структурные и функциональные схемы, файлы конфигурационных проектов.

Функциональные схемы разработанных устройств представлены на рисунках 2 и

Сходно« 1илг».зп

Окилл «»»ил

Устройство управления

Тпжобыв ИУГ>71!ЬЫ

Г

з

Т

Рисунок 2. Функциональная схема потокового вычислителя в базисе ПЛИС на примере решения задач ЦОС методами вейвлст-аналича

Рисунок 3. Функциональная схема аппаратного ускорителя на примере решения задачи

ЦОС методами вейвлет-анализа

1.0

Для проведения эксперимента и решения практических задач данные узлы были сконфигурированы для реализации алгоритмов вейвлет-анализа.

В частности, был разработан потоковый вычислитель цифровой обработки сигналов, работающий в целочисленной области, позволяющий организовывать быстрые многопоточные вычисления, выполнять горизонтальное и вертикальное масштабирование, динамически модифицировать коммутационную схему и наращивать число вычислительных узлов.

Далее был разработан обособленный вычислитель (ускоритель) на базе ПЛИС, также предназначенный для решения задач цифровой обработки сигналов.

Особенностью данного элемента является возможность отдельного конструктивного исполнения в виде встраиваемого ускорителя в ПЭВМ верхнего слоя кластеров.

Данные ускорители предназначены для применения в качестве вычислительных узлов разработанного комбинированного кластера, так как являются эффективными для решения сложных вычислительных задач цифровой обработки сигналов.

Приводятся результаты экспериментов, проведенных с использованием синтезированных элементов и устройств.

Проведенные тесты показали ускорение вычислительного процесса в 348-672 раз при применении параллельного аппаратного решения в составе комбинированного кластера по сравнению с последовательным однопроцессорным вариантом.

Результаты были получены на примере реализации алгоритмов обработки гидроакустических данных методами вейвлет-анализа, но применимы и для других алгоритмов цифровой обработки сигналов.

Третий раздел диссертационной работы посвящен разработке алгоритмической базы для практической реализации предложенной совокупности аппаратных средств.

Синтезируются алгоритмы работы серверной части комбинированного кластера и его клиен тских частей.

В разделе диссертационной работы приводится разработанный совокупный алгоритм распределения вычислений на многослойном кластере, основанный на предложенной структуре распределенных вычислений.

Предлагается универсальная вычислительная структура и показан принцип обработки данных на многослойном кластере.

Определяется организация модулей программного обеспечения узлов многослойных гибридных кластеров.

В разделе приводится пример параллельной реализации алгоритмов цифровой обработки сигналов па базе неоднородных кластеров по предложенному методу. В частности, приведены схемы масш табируемых вейвлет-алгоритмов ЦОС.

Структурные схемы параллельных алгоритмов вейвлет-анализа, предназначенных для решения на базе многослойных гибридных кластеров, представлены на рисунке 4.

Генерация коэффициентов системы фильтрсш

Геи«гр«»иу1и лиатииносс) сюре» а

С" Базовая фо^ма фильгр.**^)

(^Генерация ц^)

/----- —11

( Генерация ) 4

уровне Ц.ц,

, ^¡И'Л"!»-]^

ЯАОС-.,»)

а

фЪ

рОАСЦ,,,)

С.гь......

сОО(1_,а.,)

.......-ЧрЛ"""

Л--.-,.

_.]_______

»ттИч)

Рисунок 4. Параллельная реализация алгоритмов вейвлет-анализа

Рассматриваются проблемы и задачи организации комбинированных кластеров, рассматриваются и сравниваются характеристики топологий сети передачи данных, пригодных для организации многослойных соединений в неоднородных кластерах.

В частности, определяются скоростные характеристики современных компьютерных сетей, которые целесообразно применять для организации коммутационного поля верхнего уровня многослойного кластера.

Показывается подход к иерархическому представлению задач на базе комбинированного кластера и проводится оценка временных параметров выполнения вычислительных алгоритмов на базе многослойных кластеров, а также выделяется определение эффективности этого процесса.

На рисунке 5 приведен пример распределения сложной задачи на узлы неоднородного гибридного кластера, представленные в виде аппаратных ускорителей.

Формализуется представление неоднородного кластера в виде графовых схем. Показывается подход к иерархическому представлению задач на базе кластеров и проводится оценка временных параметров выполнения вычислительных алгоритмов на базе многослойных кластеров, а также выделяется определение эффективности этого процесса.

В соответствии с предложенным подходом, в данном разделе диссертационной работы была показана процедура вертикального и горизонтального масштабирования алгоритмов при увеличении глубины обработки данных и наращении числа процессоров.

Граф-схемы алгоритмов также показаны и на примере алгоритмов вейвлет-анализа. Эти схемы далее используются в вычислительном эксперименте в указанной последовательности, то есть для сравнения однопроцессорного варианта, а также двухпроцессорной и четырехпроцессорной конфигураций.

Рисунок 5. Графовое представление распределенной задачи для комбинированного кластера Дается понятие основных характеристик эффективности работы кластера и проводится формализация процесса их вычислений.

Приводится описание применения комбинированного кластера для решения задач ЦОС в виде последовательности следующих этапов.

1. Определение особенностей вычислительной задачи цифровой обработки сигналов, которая должна быть решена на базе многослойного гибридного кластера.

2. Выделение участков алгоритма, которые не могут быть эффективно решены средствами стандартных ЭВМ в составе кластера с общепризнанной архитектурой.

3. Анализ имеющихся в наличии аппаратных ускорителей, которые можно использовать для эффективного решения выделенных ранее «проблемных» участков решаемой задачи на аппаратном уровне.

4. Определение состава N ~ \п.} проблемно-ориентированных ячеек (ПОЯ), которые будут использованы в конкретной конфигурации многослойного кластера.

5. Получение характеристик ПОЯ Тр{р(п),ц) и других параметров аппаратных ускорителей.

6. Составление структуры S = (N,L,p,c,m) аппаратно-программного комплекса согласно представленной методики в терминах теории графов для определения структуры связей /. = {/,} и системы взаимообмена данными в рамках многослойного кластера.

7. Определение параметров коммуникационной среды c(/J в рамках имеющейся структуры кластера для составления функции маршрутизации

m(t, с, р).

8. Определение ожидаемых параметров М./'Г) времени выполнения задачи для конфигурации 5.

9. Определение ожидаемого эффекта от параллельного решения поставленной задачи на гибридном кластере, выраженного в терминах коэффициента ускорения е(„„ и минимально возможного времени

выполнения т„

ч

10.Инициализация и запуск элементов и узлов комбинированного кластера и ожидание результатов выполнение распределенной задачи.

11.Определение реальных временных затрат и реальной эффективности параллельного решения ер1:тщ - 1"хт.т,И^тт ■ Четвертый раздел диссертационной работы посвящен экспериментальной проверке полученных теоретических результатов. Здесь приводится описание проведенного эксперимента, рассматриваются разработанные программы для серверной и клиентской частей комбинированного кластера.

В разделе приводятся результаты апробации разработанного комбинированного устройства кластерного типа на примере реализации алгоритмов фильтрации изображений больших размеров и алгоритмов цифровой обработки гидроакустичсскчх сигналов методами вейвлет-анализа.

Результаты испытаний представлены I! таблице 1. Таблица 1 - Показатели времени выполнения алгоритмов фильтрации

Характеристика

) 2 4 8

время загрузки изображения, с 5 6 6 7

время разбиения, с 11 12 8 8

время передачи файлов клиентам, с 0 2 2 2

время сборки, с 4 15 14 15

время фильтрации, с 1590 980 485 237

Ко;Iичество вычислителы Iых узлов

На графике, изображенном на рисунке 6, показан характер снижения времени обработки данных в зависимости от задействованных узлов.

затрэчемое время на фильтрацию

1900 1600 1ЙОО §1200 ^000 800 й-еоо « аоо Х, 200

¡»ЕЧЙСГР.П ПЫЧИ( ДЙГО!

Рисуиок 6. Зависимость времени обработки данных от количества задействованных компьютеров

Из проведенных экспериментов следует, что при увеличении числа компьютеров с 1 до 2 время обработки уменьшилось приблизительно на 40%, а с увеличением числа компьютеров кластера с 2 до 4 и с 4 до 8 время обработки уменьшалось приблизительно на 50% на каждом этапе.

Время решения данной задачи на одной ЭВМ без применения ускорителей по стандартному последовательному алгоритму, составило 1992 с. В сравнении с этим, на одной машине с ускорителем задача была решена за 1590 с. а на 8-ми машинах - за 237 с.

Результаты практической реализации алгоритмов ЦОС на базе ПЛИС показали ускорение вычислительного процесса до 6.72 раз по сравнению с программным однопроцессорным решением.

Результаты обработки изображений приведены на рисунке 7.

а) б)

Рисунок 7. Результаты обработки изображений на комбинированном кластере: а) - исходное изображение, б) - изображения после фильтрации

На рисунке 8 представлен результат обработки гидроакустических сигналов в виде карты донной поверхности с затонувшим объектом искусственного происхождения.

Как видно из приведенных рисунков и представленных выше результатов экспериментов, выбранная структура многослойного кластера обеспечивает не только качественное решение задач цифровой обработки сигналов, но и хорошие показатели временных затрат.

а) б)

Рисунок 8. Результаты обработки гидроакустических сигналов и изображений на комбинированном кластере: а) исходное изображение, б) - результирующие изображения

В заключении излагаются основные результаты диссертационной работы.

В приложениях приведены примеры программной реализации разработанных алгоритмов, а также акты об использовании результатов диссертационной работы.

Основные результаты диссертационной работы:

-проведен анализ современных элементов и устройств обработки сигналов и выполнена классификация мощных распределенных вычислителей с целью обоснования создания комбинированных кластеров для решения задач цифровой обработки сигналов;

-разработано комбинированное устройство кластерного типа с многоуровневым параллелизмом обработки данных;

-разработаны новые элементы и устройства для решения задач ЦОС в базисе комбинированных кластеров;

-разработаны аппаратные конфигурации элементов и устройств (ускорителей) для решения задач цифровой обработки сигналов;

-предложен метод и алгоритмы эффективного применения разработанных элементов и устройств комбинированных кластеров с многоуровневой архитектурой с применением встроенных аппаратных ускорителей;

-получены результаты экспериментального исследования, подтверждающие обоснованность и достоверность принятых решений, а также эффективность применения разработанных элементов и устройств для решения задач цифровой обработки сигналов.

Публикации в изданиях, относящихся к перечнюВАК.

1. Аль-Ханани М.А. Разработка метода решения задач распространения гидроакустических лучей на кластерных системах с ПОЯ. Известия ЮФУ. Технические науки. Тематический выпуск «Интеллектуальные САПР». Таганрог: изд-во ТТИ ЮФУ, 2010, №7(108). С. 179-180.

2. Гузик В.Ф., Золотовский В.Е., Аль-Ханани М.А. Система высокопроизводительного моделирование распространения гидроакустических волн. Известия ЮФУ. Технические науки, Тематический выпуск «Интеллектуальные САПР». Таганрог: изд-во ТТИ ЮФУ, № 4(81), 2008. С. 160-163.

3. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Разработка высокопроизводительной системы моделирования и решения задач цифровой обработки сигналов на базе многослойных неоднородных кластеров. Известия ЮФУ. Технические науки. Тематический выпуск «Компьютерные и информационные технологии в науке, инженерии и управлении». Таганрог: изд-во ТТИ ЮФУ, 2008, № 11(88). С. 182-188.

Прочие публикации..

1. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Распределенное моделирование многопроцессорных систем обработки сигналов на базе компьютерных сетей // Тезисы доклада VIII Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика радиоэлектроника и систем управление». Таганрог: изд-во ТРТУ, 2006, № 293. С. 124-125.

2. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Система динамического распределения вычислительных ресурсов локальных сетей в задаче цифровой вейвлет-обработки сигналов. Известия ТРТУ. Тематический выпуск «компьютерные информационные технологии в науке, инженерии и управлении». Таганрог: изд-во ТРТУ, 2007, № 3(75). С. 153-155.

3. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Реализация алгоритмов вейвлет-обработки сигналов с помощью параллельных вычислений. Известия ТРТУ. Таганрог: изд-во ТРТУ, 2006, № 9-1(64). С. 91.

4. Аль-Ханани М.А. Система автоматизированной настройки и реконфигурация ячеек многослойных кластеров на базе многопроцессорных систем типа АО!8Р21ХХХ. Тезисы доклада. V ежегодная научная конференция студентов и аспирантов базовых кафедр Южного научного центра РАН. Росгов-на-Дону: изд-во ЮНЦ РАН, 2009, С.84-85.

5. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Использование многослойных гибридных кластеров для решения задач моделирования // Тезисы доклада VII Всероссийской конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление». Таганрог: изд-во ТТИ ЮФУ, 2009, С. 77-80.

В работах, опубликованных в соавторстве, относящихся к перечню ВАК, лично автору принадлежат следующие результаты: в работе [2] предложена методика подсчета определяющих, параметров системы динамического распределения вычислительных ресурсов локальной сети; в [3] выполнена реализация параллельных программ вейвлет-анализа;

В работах, опубликованных в других изданиях в соавторстве, лично автору принадлежат следующие результаты: в работе [1] предложена структура компьютерной сети для целей моделирования системы цифровой обработки сигналов; в [2] выполнена реализация параллельных программ вейвлет-анализа; в [3] предложен метод обработки алгоритмов вейвлет-анализа методами параллельных вычислений и выполнена реализация параллельных программ; в [5] предложена методика использования многослойных кластеров для решения задач моделирования.

Типография ТТИ ЮФУ, ГСП 17 А, Таганрог, ул. Энгельса, 1. Заказ № .Тираж 100 экз.

Оглавление автор диссертации — кандидата технических наук Аль-Ханани Морад Абдулла Ахмад

ВВЕДЕНИЕ.

ГЛАВА 1 АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ ОБРАБОТКИ ДАННЫХ НА БАЗЕ КОМБИНИРОВАННЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЕЙ.

1.1 Постановка задачи разработки элементов и устройств для решения задач цифровой обработки сигналов на базе комбинированных кластеров.

1.2 Основные положения.

1.3 Анализ элементов и устройств, применимых для решения задач обработки сигналов в составе комбинированных кластеров.

1.3.1 Вычислительные решения типа NVidia Tesla.

1.3.2 Высокопроизводительные аппаратные кластеры на базе ЦОС процессоров.

1.3.3 Аппаратный акселератор на базе NeuroMatrix® NM6403.

1.3.4 Реконфигурируемые аппаратные ускорители на базе ПЛИС.

1.4 Анализ современных методов к построению распределенных вычислителей, применимых для организации комбинированных кластеров с применением элементов и устройств цифровой обработки сигналов.

1.4.1 Суперкомпьютеры (супер-ЭВМ).

1.4.2 Многопроцессорные вычислители.

1.4.3 Кластеры на базе локальных вычислительных сетей.

1.4.4 GRID -технология.

1.5 Классификация комбинированных кластеров ЦОС.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Аль-Ханани Морад Абдулла Ахмад

Проблема эффективного решения задач цифровой обработки сигналов на современном уровне развития науки и техники является одной из важнейших. Ее решение сопряжено с синтезом новых эффективных средств решения на методологическом, алгоритмическом, программном и аппаратном уровнях.

В этой связи, диссертационная работа посвящена разработке нового комбинированного устройства кластерного типа с многоуровневым параллелизмом обработки данных, а также новых элементов и устройств, применяющимися как вычислительные узлы комбинированного кластера, являющихся эффективными для обработки цифровых сигналов.

Так как разрабатываемые элементы и устройства являются новыми на современном этапе развития вычислительной техники, то необходимым является также разработка метода и алгоритмов их эффективного использования для решения задач цифровой обработки сигналов.

Актуальность проблемы обуславливается необходимостью увеличения производительности в процессе решения вычислительных задач любыми способами, в частности с помощью новых элементов и устройств, внедрением новой теоретической и алгоритмической базы, использованием новых методов повышения эффективности решения задач на гибридных схемах.

В диссертации рассматриваются теоретические и практические аспекты разработки нового комбинированного устройства кластерного типа и новых элементов и устройств, являющихся его вычислительными узлами, которые позволяют эффективно решать задачи цифровой обработки данных с помощью многоуровневого параллелизма. Также проводится классификация способов обработки информации в распределенных вычислителях, синтезируется метод и алгоритмы применения разработанных элементов и устройств для решения задач цифровой обработки сигналов в рамках синтезированного в диссертационной работе высокопроизводительного комбинированного кластера.

Актуальность диссертации подтверждается использованием полученных результатов в хоздоговорных и госбюджетных научно исследовательских работах кафедры Вычислительной техники Технологического института Южного федерального университета в г. Таганроге, а также в учебном процессе, что сопровождается соответствующими актами о внедрении.

Диссертация посвящена Разработке и эффективному использованию комбинированных кластеров, построенных на базе сигнальных спецпроцессоров и других элементах и устройствах для решения сложных вычислительных задач цифровой обработки сигналов.

Вычислительные задачи цифровой обработки сигналов зачастую содержат в себе отдельные подзадачи, которые медленно или неэффективно решаются на базе даже самых современных персональных ЭВМ общего назначения. Вследствие этого, решение части алгоритмов переносится на узкоспециализированные аппаратные схемы или отдельные элементы и устройства, выполненные в виде спецпроцессоров или других специализированных элементов и устройств, оптимизированных для решения конкретных алгоритмов цифровой обработки сигналов. Последние, как правило, имеют особое строение, архитектуру и, так называемую, «проблемно-ориентированную» структуру, обеспечивающую максимальную эффективность решения отдельных сложных комплексных вычислительных задач. В этом случае целесообразно применение гибридных схем, сочетающих в себе все лучшее характеристики параллельных методов обработки данных [1-2, 5-6]. Общая организация вычислительного процесса, механизмы управления, отображения данных и результатов вычислений, транспорт обрабатываемых значений переменных и параметров, - все это максимально эффективно выполняется на верхнем уровне - на уровне персональных ЭВМ в составе вычислительной сети [4, 5, 8]. Одновременно с этим, наиболее сложные участки алгоритма, требующие максимальной концентрации вычислительных ресурсов и имеющие максимальную трудоемкость, решаются на базе специализированных вычислительных элементов и устройств, как бы образующих второй «слой» комбинированного кластера [22].

При этом можно говорить уже не об однородных сетях и кластерах, а о совершенно новой организации процесса параллельных вычислений: вычислениях на базе элементов и устройств в составе многослойных комбинированных кластеров.

До последнего времени, одним из основных способов параллельной обработки данных было использование супер-ЭВМ для выполнения трудоемких вычислительных процессов в многих областях науки и техники, так как он дает прорыв и быстрый темп в развитии этих областей. Однако это решение не доступно каждому. Необходимо отметить, что при составлении программных средств под супер-ЭВМ (как средств управления, так и средств для решения прикладных задач), особое внимание следует уделять технике программирования, то есть построению логической архитектуры программы. Здесь подразумевается развитие и дополнение алгоритмов распараллеливания, повышающих эффективность их выполнения на многопроцессорных ЭВМ[4, 7, 8].

Кроме того, чрезвычайно важным является процесс разработки самих вычислительных элементов и устройств, а так же их оптимизация для решения определенных вычислительных задач в области цифровой обработки сигналов.

Способ решения трудоёмких вычислительных задач с использованием двух и более компьютеров, объединённых в сеть, называется распределенным. Те задачи, которые выполняет персональный компьютер годами, кластер может решить в течение нескольких дней.

Распределённые вычисления являются частным случаем параллельных вычислений, то есть одновременного решения различных частей одной вычислительной задачи несколькими процессорами одного или нескольких компьютеров. К этому случаю также можно отнести перенос решения части вычислительных задач на отдельные специализированные элементы и устройства, имеющие определенные структурные, архитектурные, аппаратные и программные особенности.

В диссертационной работе анализируются существующие элементы и устройства, которые можно применять для решения задач цифровой обработки сигналов, исследуются распределенные мощные вычислители, ориентированные на параллельную обработку данных, в состав которых можно включать проблемно-ориентированные элементы и устройства, а также предлагается новый способ обработки данных, основанный на слиянии принципов построения вычислительных комплексов «общего» и «специального» назначения в комбинированные кластеры с многоуровневой организацией вычислительного процесса для решения задач цифровой обработки сигналов на базе специализированных элементов и устройств.

Основная идея состоит в построении вычислители, позволяющие проводить параллельную обработку данных сразу на нескольких уровнях. Такая организация вычислительного процесса предполагает реализацию концепции «множественный поток команд и множественный поток данных», являющейся наиболее эффективной для обработки больших объемов данных в реальном времени.

Этот вариант организации аппаратных средств является наиболее подходящим, так как обеспечивает большую гибкость и более широкие возможности по сравнению с остальными, сохраняя баланс сложности (цены) и предоставляемых исследователю возможностей. Такая организация близка по идеологии к массово параллельным и кластерным вычислителям, в которых вычислительные узла объединены в некоторую коммуникативную сеть, определенной или изменяемой топологии с доступом к локальной памяти и коммуникационным элементам для связи с внешним миром. По такому принципу можно организовать вычислительную структуруна базе специализированных микропроцессоров, например на основе сигнальных процессоров или программируемых логических интегральных схем.

Соединив универсальные средства разработки, мониторинга, управления и проведения вычислений со специализированными аппаратными элементами типа сигнальных процессоров или иных вычислительных узлов, имеющих более узкую направленность, можно получить новый метод обработки данных, обладающий всеми достоинствами обоих подходов.

Так как аппаратный базис, в данном случае, представляется как совокупность вычислительных элементов и устройств разного плана, то, можно говорить о гетерогенных вычислителях, позволяющих распределить задачу, выбрав наиболее подходящий аппаратный и вычислительный базис, фактически, для каждой процедуры обработки данных.

В таком случае можно говорить о локальном и глобальном применении параллельного подхода к решению задач, как в межпроцессорном пространстве, так и внутри каждого отдельного микропроцессора, если это позволительно с точки зрения его типа и структуры.

Научная новизна:

- разработано новое вычислительное устройство кластерного типа (комбинированный кластер) для выполнения распределенных вычислений, являющееся эффективным для решения задач цифровой обработки сигналов и отличающееся от существующих введением специализированных элементов, адаптированных для реализации алгоритмов ЦОС, а также многоуровневой параллельной организацией вычислительного процесса;

- разработаны специализированные элементы и устройства, являющиеся эффективными для решения задач ЦОС в базисе комбинированного кластера и отличающиеся от существующих ориентацией именно на алгоритмы обработки сигналов на аппаратном и программном уровне, а также позволяющих выполнять межэлементные соединения, составляющие сети нижнего уровня в разработанном в рамках диссертационной работы многослойном комбинированном кластере;

- предложен метод и алгоритмы эффективного использования новых элементов и устройств для решения распределенных задач цифровой обработки сигналов в базисе разработанного комбинированного кластера, отличающиеся от существующих введением проблемно-ориентированных узлов в состав кластеров для эффективного решения вычислительных алгоритмов с многоуровневым распараллеливанием;

Основные положения, выносимые на защиту

На защиту выносится:

- новое комбинированное устройство кластерного типа (комбинированный кластер), являющийся эффективным для решения сложных задач цифровой обработки сигналов;

- элементы и устройства, адаптированные для решения задач ЦОС в составе многослойного комбинированного кластера;

- метод и алгоритмы эффективного использования разработанных элементов и устройств для решения задач цифровой обработки сигналов на комбинированных кластерах с многослойной архитектурой, а также результаты экспериментального исследования;

Основные результаты диссертационной работы.

- проведен анализ современных элементов и устройств обработки сигналов и выполнена классификация мощных распределенных вычислителей с целью обоснования создания комбинированных кластеров для решения задач цифровой обработки сигналов;

- разработано комбинированное устройство кластерного типа с многоуровневым параллелизмом обработки данных;

- разработаны новые элементы и устройства для решения задач ЦОС в базисе комбинированных кластеров;

- разработаны аппаратные конфигурации элементов и устройств (ускорителей) для решения задач цифровой обработки сигналов;

- предложен метод и алгоритмы эффективного применения разработанных элементов и устройств комбинированных кластеров с многоуровневой архитектурой с применением встроенных аппаратных ускорителей;

- получены результаты экспериментального исследования, подтверждающие обоснованность и достоверность принятых решений, а также эффективность применения разработанных элементов и устройств для решения задач цифровой обработки сигналов.

Объектами исследования в диссертационной работе являются: элементы и устройства для решения задач цифровой обработки сигналов, кластеры с многоуровневой структурой, архитектуры микропроцессоров, специфические аппаратные и программные средства поддержки вычислительного процесса, методы математического моделирования, численные методы, а также высокопроизводительные алгоритмы и методы распределенных вычислений на базе разного рода параллельных и кластерных вычислителей с использованием существующих элементов и устройств.

Целью работы в теоретическом плане являются:

- разработка нового комбинированного устройства кластерного типа для решения задач цифровой обработки сигналов;

- разработка новых элементов комбинированного кластера на базе процессоров цифровой обработки сигналов (ЦОС) и программируемых логических интегральных схем (ПЛИС) для решения задач ЦОС;

- разработка метода и алгоритмов эффективного использования новых элементов и устройств комбинированных кластеров с многоуровневой архитектурой для решения задач ЦОС на практике;

Целью работы в практическом плане является:

- разработка элементов и устройств комбинированных кластеров для решения задач ЦОС;

- реализация алгоритмов, синтезированных в диссертационной работе, в виде программного комплекса для обеспечения работы нового комбинированного кластера;

- экспериментальная проверка, а также апробация и внедрение полученных теоретических и практических результатов на примере решения актуальных задач фильтрации изображений и обработки гидроакустических данных методами вейвлет-анализа;

Основными задачами работы являются:

- проведение анализа существующих элементов и устройств, применимых для решения задач ЦОС в составе вычислительных систем общего назначения;

- разработка нового комбинированного устройства кластерного типа, при помощи которого можно эффективно решать задачи цифровой обработки сигналов;

- синтез элементов и устройств на базе процессоров ЦОС и ПЛИС, которые можно применять как вычислительные узлы разработанного комбинированного кластера для решения задач цифровой обработки сигналов;

- описание способа представления сложных вычислительных задач в терминах теории графов для их корректного переноса на разработанный комбинированный кластер, а также обоснование и описание метода и алгоритмов эффективного использования новых элементов и устройств для решения распределенных задач цифровой обработки сигналов, а также провести экспериментальную проверку полученных результатов на практике.

Методы выполнения исследований.

Для теоретических исследований использовались методы цифровой обработки сигналов, методы проектирования элементов и устройств, теории графов и множеств, теории алгоритмов и численных методов, методы математического моделирования и объектно-ориентированного программирования, методы параллельных вычислений.

Кроме того, проводились экспериментальные исследования на модельных и реальных объектах и сигналах, а также апробация разработанных алгоритмов на ЭВМ.

Практическая ценность и рекомендации по применению Результаты исследований, описанных в диссертации, находят применение для решения комплексных задач обработки сигналов как на верхнем уровне комбинированных кластеров, так и на уровне проблемно-ориентированных элементов и устройств, образующих нижние слои.

Эффективность и качество работы разработанного комбинированного кластера цифровой обработки сигналов следует из:

- использования элементов и устройств с аппаратной поддержкой алгоритмов цифровой обработки сигналов;

- введения концептуально новых и эффективных методов и алгоритмов обработки данных на комбинированных кластерах;

- использования распределенных вычислителей с настраиваемой коммуникационной средой для параллельного выполнения участков загружаемых задач;

- многоуровневого распараллеливания решаемых задач сразу на нескольких слоях комбинированного кластера;

- эффективного использования возможностей адаптации структуры кластера к особенностям и размеру решаемой задачи, а также возможностей горизонтального и вертикального масштабирования и замены элементов в соответствии с требованиями.

Достоверность и обоснованность разработанных метода и алгоритмов была проверена при решении следующих задач:

- разработка нового устройства в виде комбинированного кластера;

- разработка эффективного способа решения задач цифровой обработки сигналов на базе нового комбинированного устройства кластерного типа;

- обоснование метода и алгоритмов эффективного использования синтезированных элементов и устройств для решения практических задач;

- постановка вычислительного эксперимента и проверка полученных результатов на практике на примере решения задачи медианной фильтрации изображений и обработки гидроакустических сигналов методами вейвлет-анализа, требующими применения специализированных элементов и устройств.

Полученные элементы и устройства, а также сопутствующие их эффективному применению на практике метод и алгоритмы являются универсальными и их целесообразно использовать при построении комплексов цифровой обработки сигналов, автоматизированных модулей целеуказания и сопровождения объектов, расчете параметров распространения гидроакустических волн, обработке поверхностей и сигналов разной физической природы.

Научные и практические результаты исследования диссертационной работы использовались при постановке лабораторных работ и используются в учебном процессе в лабораторном практикуме по курсу «Проблемно-ориентированные вычислительные системы».

Апробация работы.

Результаты работы докладывались и обсуждались на Международных и Всероссийских конференциях, в том числе на:

1. VIII Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика радиоэлектроника и систем управление ». Таганрог, 2006 ТРТУ.

2. IX Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления». - Таганрог, 2008.

3. Всероссийской научно-технической конференции с международным участием «Компьютерные технологии в науке, инженерии и управлении» «КомТех-2009»- Таганрог, 2009.

4. 55-й Всероссийской и научно-методической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ в 2009.

5. 56-йНаучно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ. -Таганрог, 2009.

6. V ежегодной научной конференции студентов и аспирантов базовых кафедр Южного научного центра РАН Таганрог, 2009.

7. VII Всероссийской конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление». ТТИ ЮФУ- Таганрог 2009.

8. 57-й Научно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ. -Таганрог, 2011.

Публикации.

Результаты, полученные в диссертации, нашли отражение в 8 печатных работах, среди них 5 статей, 3 тезиса докладов. 3 статьи изданы в журналах, входящих в список, рекомендованных ВАК.

Структура работы.

Материал основной части диссертационной работы изложен на 180 страницах машинописного текста. Диссертация состоит из введения,4 разделов, списка литературы из 114 наименований на 10 листах, содержит 6 таблиц, 66 рисунков и 2 приложения на 21 листе.

Заключение диссертация на тему "Разработка и исследование элементов и устройств цифровой обработки сигналов и метода их эффективного использования в комбинированных кластерах"

4.4 Выводы

В данной главе представлены результаты практической проверки предложенного метода решения сложных вычислительных задач на комбинированных кластерах, а именно:

1. Выполнена постановка задачи экспериментального исследования и определены сложности, которые возникают при практической реализации предложенного метода.

2. Приведено описание технической реализации предложенного метода на базе комбинированных кластеров цифровой обработки сигналов.

3. Решены проблемы сетевого взаимодействия, уравновешивания состояния потоков информации, установлен порядок обмена сообщениями, реализован алгоритм управления процессорными модулями.

4. Решена задача медианной фильтрации на базе кластера ЦОС и получены результаты ускорения порядка (1.63(14%), 3.28(28%), 6.71(58%)).

5. Решена задача комплексной обработки двухмерных и трехмерных сигналов (поверхностей) методами вейвлет-анализа и получены результаты ускорения до 25% на четырехпроцессорной конфигурации.

ЗАКЛЮЧЕНИЕ

В диссертационной работе проведен анализ современных элементов и устройств, применимых для решения задач цифровой обработки сигналов, а также проанализированы современные вычислители и суперкомпьютеры, на базе которых можно разработать и реализовать комбинированный кластер, наилучшим образом подходящий для решения сложных задач благодаря включению в его состав специализированных элементов и устройств.

Рассмотрены существующие решения, выделены их основные достоинства и недостатки. На основании проведенного анализа предложена классификация кластеров с учетом необходимости внедрения проблемно-ориентированных элементов и устройств, а также адаптации аппаратно-программного базиса к проблематике решаемой задачи.

Также рассмотрены основные технологии передачи информации в распределенных системахи их базовые разновидности топологий. На основании этих данных обоснована необходимость в разработке подхода к организации вычислительного процесса именно на базе гибридных кластерных схем с использование мотдельных принципов, наследуемых из кластерных, многопроцессорных и грид-систем с совмещением аппаратных акселераторов, четко ориентированных на проблематику решаемой задачи.

Разработаны аппаратные конфигурации элементов и устройств комбинированного кластера для решения задач ЦОС на базе ПЛИС и процессоров цифровой обработки сигналов.

Далее была выделена проблема организации вычислительного процесса в таких комбинированных кластерах и сформировано формальное описание способа решения сложных вычислительных задач на их основе. Было сформировано описание такого комбинированного кластера на структурном уровне, показаны принципы горизонтального и вертикального масштабирования гибридных кластеров, дана формализация графового представления комбинированного кластера, и показаны принципы распределения вычислительных задач на отдельные узлы. Кроме того, были разработаны структурные схемы программного обеспечения и конфигурации аппаратуры для практического решения распределенных задач ЦОС.

После этого была проведена оценка временных параметров выполнения вычислительных алгоритмов на базе многослойных кластеров и разработано множество алгоритмов распределения вычислений на базе многослойных кластеров, а также определены структуры программного обеспечения для серверной и клиентских частей комбинированного кластера. Приведены их обобщенные алгоритмы работы.

Кроме того, был приведен пример параллельной реализации алгоритмов цифровой обработки сигналов, выполненной в соответствии с предложенным подходом.

В заключении диссертационной работы было выполнено экспериментальное исследование предложенного метода решения сложных вычислительных задач на базе гибридных кластеров, заключающееся в выполнении алгоритмов фильтрации изображений большой размерности на распределенной вычислительной структуре, а также в реализации комплексного алгоритма вейвлет-анализа двумерных и трехмерных сигналов (поверхностей).

Для практического решения поставленных задач был разработан комплекс программного обеспечения, позволивший использовать ячейку неоднородного кластера из восьми ЭВМ и встроенных ускорителей цифровой обработки сигналов типа А1)Р160С)РС1.

Результаты экспериментов показали эффективность предложенного подхода и возможность его использования на практике.

Библиография Аль-Ханани Морад Абдулла Ахмад, диссертация по теме Элементы и устройства вычислительной техники и систем управления

1. Аль-Ханани М.А. Разработка метода решение задач распространения гидроакустических лучей на кластерных системах с ПОЯ. Известия ЮФУ. Технические науки, Тематический выпуск « Интеллектуальные САПР », Таганрог: Изд-во ТТИЮФУ, 2010, №7(108), С. 179-18.

2. Айфичер Э., Джервис Б. Цифровая обработка сигналов: практический подход. 2004.

3. Андрей Карпов Статьи на сайте компания ООО «СиПроВер», http://www.viva64.com.

4. Астафьева Н.М. Вейвлет анализ. Основы теории и применения. Успехи физических наук, т. 166, вып. 11, ноябрь 1996 г.

5. Афанасьев К.Е. и др.Многопроцессорные вычислительные системы и параллельное программирование.Кемерово: Кузбассвузиздат, 2003.

6. Беспалов. Д.А. Параллельная реализация алгоритмов вейвлет-анализа на многопроцессорных кластерах. Изв. вузов Сев.-Кавк. Регион Техн. Науки», №2, 2007 г. С. 13 16 .

7. Богачев К.Ю.Основы параллельного программирования М.: БИНОМ. Лаборатория знаний, 2003.

8. Богданов А. В. Курсы лекций и методические материалы, совместной российско-белорусской программы «СКИФ» http://www.csa.ru/skif/.

9. Бурдик В. С. Анализ гидроакустических систем. Ленинград: Судостроение. — 1988.

10. П.Васильева Л.Г., Жилейкин Я.М., Осипик Ю.И. Преобразования Фурье и вейвлет-преобразование. Их свойства и применение // Вычислительные методы и программирование. 2002. 3, №2. С. 79-82.

11. Васюков В.Н. Цифровая обработка сигналов и сигнальные процессоры в системах подвижной радиосвязи: Учебник, 2003.

12. Воеводин В.В., Воеводин Вл.В. «Параллельные вычисления», СПб :БХВ-Петербург, 2004-608с.

13. Воеводин В.В. Статьи и методические материалы лаборатории Параллельных информационных технологий НИВЦ МГУ http://www.parallel.ru/

14. Воеводин В.В., Капитонова А.П. Методы описания иклассификации архитектур вычислительных систем.М. :МГУ. 1994.-79с.

15. Воеводин В.В .Математические основы параллельных вычислений.М.: МГУ, 1991.

16. Воеводин В.В.Модели и методы в параллельных процессах.М.: Наука, 1986.

17. Воеводин Вл.В. Курс лекций «Параллельная обработка данных».

18. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. СПб.: Изд-во ВУС, 1999 208 с.2020.Гадзиковский В.И. Теоретические основы цифровой обработки сигналов. 2004.

19. Гергель В.П. Курсы лекций и методические материалы на сайте интернет университет www.intuit.ru/department/calculate/paralltp/О/.

20. Гергель В.П., Стронгин Р.Г. Основы параллельных вычислений для многопроцессорных вычислительных систем. Учебное пособие. Нижний Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2000. 176 с.

21. Гергель В.П., Стронгин Р.Г.Основы параллельных вычислений для многопроцессорных вычислительных систем.Н. Новгород: Изд-во ННГУ, 2001.

22. Головашкин Д.Л.Методы параллельных вычислений. Ч. 1.Самара: Самар. гос. аэрокосм, ун-т, 2002.

23. Гонсалес Р., Вудс Р. Цифровая обработки изображений. М.: Техносфера, 2005. 1072 с.

24. Грегори Р. Основы многопоточного, параллельного и распределенного . программирования. Диалектика. 2003. 512 с.

25. Гузик В. Ф., Беспалов Д.А., Аль-Ханани М.А. Реализация алгоритмов вейвлет-обработки сигналов с помощью параллельных вычислений. Известия ТРТУ. Таганрог: Изд-во ТРТУ, 2006 г. № 9-1(64). С. 91.

26. Гузик В.Ф. Проектирование проблемно-ориентированных вычислительных систем. Изд-во ТТИ ЮФУ, 2009.- 463с.

27. Гузик В.Ф., Беспалов. Д.А. Естественный параллелизм быстрых алгоритмов вейвлет-преобразования. Известия ТРТУ. Тематический выпуск. Компьютерные информационные технологии в науке, инженерии и управлении. Таганрог: Изд-во ТРТУ, №3, 2007 г. С. 155 - 158.

28. Гузик В.Ф., Середа A.A., Поленов М.Ю., Павленко В.Г. Оценка производительности отказоустойчивой системы с матричнопотоковой архитектурой // Труды Международной НТК "Диагностика, информатика и метрология 94м. СПб, 1994. С. 183-184.

29. Дацюк В.Н. и др.Методическое пособие по курсу «Многопроцессорные системы и параллельное программирование».Ростов-на-Дону: РГУ, 2000.

30. Деменев А.Г.Параллельные вычислительные системы: основы программирования и компьютерного моделирования.Пермь: ПГПУ, 2001.

31. Дорошенко А.Е.Математические модели и методы организаций высокопроизводительных вычислений.Киев: Наукова думка, 2000.

32. Кельтон В., Jloy А. Имитационное моделирование. Классика CS. -СПб.: Питер, Киев: BHV, 2004. 847 с.

33. Кнут Д. Искусство программирования. Вильяме. 2005. 720 с.

34. Кнут Д. Искусство программирования. Том 3. Сортировка и поиск. Вильяме, 2000. 832 с.

35. Кобелев В.Ю., Ласточкин A.B. Выбор оптимальных вейвлетов для обработки сигналов и изображений // Труды II международной конференции «Цифровая обработка сигналов и ее применения» М.: 1999 Т. II.- С. 514-518.

36. Комолкин A.B., Немнюгин С.А.Программирование для высокопроизводительных ЭВМ.СПб.: Изд-во НИИ химии СПбГУ, 1998.

37. Копысов С.П., Сагдеева Ю.А. Двумерное вейвлет-преобразование Хаара и его применение к многомасштабному анализу// Ижевск: ИПМ Уро РАН, 2004, Деп. В в ВИНИТИ, №769-В2004.

38. Корнеев В.В.Параллельное программирование в MPI.M. Ижевск: Институт компьютерных исследований, 2003.

39. Корнеев В.В.Параллельные вычислительные системы.М.: Нолидж, 1999.

40. Кузьминский М. Статья на сайте Открытые системы, #07-08/2003 http://www.osp.ru/os/2003/07-08/012.htm/.

41. Куприянов М.С. , Матюшкин Б.Д., Иванова В.Е., Матвиенко Н.И., Усов Д. Ю. Техническое обеспечение цифровой обработки сигналов. 2000.

42. Куприянов М.С., Матюшкин Б.Д. Цифровая обработка сигналов: Процессоры, алгоритмы, средства проектирования Изд. 2-е, перераб., доп.

43. Лайонс Р. Цифровая обработка сигналов. 2006.

44. Левкович-Маслюк Л., Переберин А. Введение в вейвлет-анализ. ГрафиКон'98, Москва, сентябрь 1998.

45. Макконелл Дж. Основы современных алгоритмов. 2-е дополненное издание. М.: Техносфера, 2004. 368с.

46. Марков Н.Г. Мирошниченко Е.А., Сарайкин A.B. Моделирование параллельного программного обеспечения с использованием PS-сетей. //Программирование. 1995, N 5. С.24-32.

47. Методы компьютерной обработки изображений // Под ред. Сойфера А. В. 2-е изд., испр. М.: ФИЗМАТЛИТ, 2003. - 784 с.

48. Немнюгин С.А., Стесик О.Л. Параллельное программирование для многопроцессорных вычислительных систем // СПб.: Петербург, 2002. -400с.

49. Новиков JI.B. Основы вейвлет-анализа сигналов. — С.-Пб.: ИАиП РАН, 1999.64.0ппенгейм А., Шафер Р. Цифровая обработка сигналов. 2006.

50. Осипов JI.A. Обработка сигналов на цифровых процессорах: Линейно-аппроксимирующий метод: Справочное пособие. 2001.

51. Прэтт У. Цифровая обработка изображений в 2-х книгах. М.: Радио и связь, 1987.

52. Рави Сети Л. Басс. Архитектура программного обеспечения на практике. 2-е изд. Питер. 2006, 576 с.

53. Сергиенко А. Б. Цифровая обработка сигналов. СПб.: Питер, 2003 г.

54. Смелянский Р.Л. Методы и средства анализа производительности вычислительных систем с традиционной архитектурой. М.: Изд-во МГУ, 1989. 24с.

55. Солонина А., Улахович Д., Яковлев Л. Алгоритмы и процессоры цифровой обработки сигналов. Учебное пособие. 2002.

56. Солонина А.И., Улахович Д.А., Арбузов С.М., Соловьева Е.Б., Гук И.И. Основы цифровой обработки сигналов: курс лекций. СПб.:БХВ-Петербург, 2003.

57. Старченко A.B., Есаулов А.О.Параллельные вычисления на многопроцессорных вычислительных системах.Томск: ТГУ, 2002.

58. Стивенсон Н. Распределенные системы. Принципы и парадигмы. Диалектика. 2003, 880 с.

59. Таненбаум Э., Стеен. В. Распределенные системы. Принципы и парадигмы , СПб.: Питер, 2003. — 877.

60. Фурман Я.А., Кревецкий A.B., Передреев А.К. и др. Введение в контурный анализ. Приложения к обработке изображений и сигналов. 2003.

61. Фурсов В.А. и др.Введение в программирование для параллельных ЭВМ и кластеров.Самара: СНЦ РАН, СГАУ, 2000.

62. Харатишвилли Н.Г., Чхеидзе И.М., Ронсен Д., Инджия Ф.И. Пирамидальное кодирование изображений. М.: Радио и связь, 1996. — 192 с.

63. Хьюз Т. Параллельное и распределенное программирование и использованием С++. М, СПб, Киев: 2004.

64. Цивилёв A.M., Дорохин С.А., Смехов Д.Г. Цифровая обработка сигналов. Москва: Инструментальные системы, 2002-36с.

65. Чуи К. Введение в вейвлеты. М.: МИР, 2001.

66. Чумакова Е.В. Статья Электронного научного журнала «исследовано в россии» http://zhurnal.gpi.ru/articles/2009/070.pdf.

67. Шалыто A.A. Автоматное проектирование программ. Алгоритмизация и программирование задач логического управления. Журнал "Известия академии наук. Теория и системы управления" Номер 6. Ноябрь-Декабрь 2000. С. 63-81.

68. Шахтарин Б.И. Обнаружение сигналов. 2006.

69. Шпаковский Г.И., Серикова Н.В.Программирование для многопроцессорных систем в стандарте MPI: Пособие.Мн.: БГУ, 2002.

70. Юкио Сато. Обработка сигналов. Первое знакомство. М.: Додэка.

71. Якобовский М.В.Распределенные системы и сети.М.: МГТУ «Станкин», 2000.

72. Яншин В.В., Калинин Г.А. Обработка изображений на языке Си для IBM РСЖ Алгоритмы и программы. М.: Мир, 1994.

73. Ярославский Л.П. Введение в цифровую обработку изображений. М: -Советское радио, 1979 г.

74. ADSP 2106х SHARC User's manual. Analog Devices Inc., 1996.

75. Advanced Computer Architectures: A Design Space Approach, D. Sima, T. Fountain and P. Kacsuk, Addison-Wesley, 1997.

76. Akl S.G.Parallel Sorting Algorithms.Orlando, FL: Academic Press, 1985

77. Amdahl G.Validity of the single processor approach to achieving large scale computing capabilities.AFIPS Conference Proceedings, 1967. Vol. 30. P. 483 485, Washington, D.C.: Thompson Books.

78. Andrews G.R.Foundations of Multithreading, Parallel and Distributed Programming.Addison-Wesley, 2000.

79. Barker M.Cluster Computing Whitepaper.

80. Bertsekas D.P., Tsitsiklis J.N.Parallel and Distributed Computation. Numerical Methods.Prentice Hall, Englewood Cliffs, New Jersey, 1989.

81. Buyya R.High Performance Cluster Computing. Volume 1: Architectures and Systems. Volume 2: Programming and Applications.Prentice Hall PTR, Prentice-Hall Inc., 1999.

82. Charles E. Leiserson Fat-trees: universal networks for hardware-efficient supercomputing, IEEE Transactions on Computers, Vol. 34 , no. 10, Oct. 1985, p. 892—901.

83. Dally W.J., Towles B.P.Principles and Practices of Interconnection'' ' Networks.Morgan Kaufmann, 2003.

84. Daubechies I. Ten Lectures on Wavelets. SIAM, 1992.

85. Gilbert J., Zmijewski E.A parallel graph partitioning algorithm for a message-passing multiprocessor.WInternational Journal of Parallel Programming. 1987. P. 498 513.

86. Grama A.Y., Gupta A. and Kumar V, IEEE Trans, on Information Theory, Vol. 38, No. 2, March 1992.

87. Group W., Lusk E., Thakur R.Using MPI-2: Advanced Features of the Message Passing Interface (Scientific and Engineering Computation).MIT Press, 1999.

88. Hockney R.W., Jesshope C.R.Parallel Computers 2. Architecture, Programming and Algorithms.Adam Hilger, Bristol and Philadelphia, 1988.

89. Holschneider M., Kronland-Martinet R., Morlet J. and Tchamitchian P. Wavelets, time-frequency Methods and Phase Space, chapter A Real

90. Time Algorithm for Signal Analysis with the Help of the Wavelet Transform, pages 289 297. Springer-Verlag, Berlin, 1989.

91. Kurdi H., Al-Raweshidy H., Maozhen L. Статьи на интернет-портала по грид-технологиям http://www.gridclub.ru/.106. ' Mallat S. G. A Wavelet Tour of Signal Processing, 1998.

92. Malat S., Hwang W. L. Singularity detection and processing with wavelets. IEEE Trans. Info. Theory, 38(2):617-643, March 1992.

93. Meyer, Y. Combes J. M., Grossman A., Tchamitchian P. Orthonormal Wavelets, Wavelets, time-frequency methods and phase-space. SpringerVerlag, 1989, pp. 21-37.

94. NVIDIA CUDA Compute Unified Device Architecture. Programming Guide. Version 1.1. 11/29/2007. 143 p.

95. Rosenfeld A., Troy E. B. Visual Texture Analysis, Proceedings UMR-Mervin J. Kellt Communications Conference, University of Missouri-Rolla, Missouri, October 1970, Section 10-1.

96. Stacy L, William J., Rama N Учебники и курсы на сайте петродворцового телекоммуникационного центра «УСИТ», http://www.ptc.spbu.ru.

97. Sterling T.Beowulf Cluster Computing with Windows.Cambridge, MA: The MIT Press, 2001.

98. Wilkinson В., Allen M.Parallel programming.Prentice Hall, 1999.

99. Xu Z., Hwang K. Scalable Parallel Computing Technology, Architecture, Programming Boston: McGraw-Hill, 1998.