автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.15, диссертация на тему:Проектирование высокопроизводительных систем цифровой обработки сигналов
Автореферат диссертации по теме "Проектирование высокопроизводительных систем цифровой обработки сигналов"
МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)
МАИ
[
На правах рукописи
БАРАНОВ Лев Дмитриевич
ПРОЕКТИРОВАНИЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ СИСТЕМ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ Специальность 05.13.15 - «Вычислительные машины и системы»
Автореферат
Диссертации на соискание ученой степени кандидата технических наук
Москва Издательство МАИ 2005
Работа выполнена на кафедре «Вычислительные машины, системы и сети» факультета систем управления, информатики и электроэнергетики летательных аппаратов Московского авиационного института (государственного технического университета) МАИ.
Научный руководитель:
Официальные оппоненты:
заслуженный деятель науки РФ, доктор технических наук, профессор О.М. Брехов.
Зав. каф. 309 «Теоретическая электротехника» Московского авиационного института (государственного технического университета) МАИ, д.т.н., проф. Булеков Владимир Павлович,
к.т.н., Штейнберг Виталий Иосифович, генеральный директор ФГУП НИИ «Аргон».
Ведущая организация:
ОАО «Научно-исследовательский центр электронной вычислительной техники» (НИЦЭВТ), г. Москва.
Защита состоится « 37» ь/ССиР 2005 г. в // час.
мин на
заседании диссертационного совета Д 212.125.01 при Московском авиационном институте (государственном техническом университете) по адресу: 125993, г.Москва, А-80, ГСП-3, Волоколамское шоссе, д.4.
Отзыв на автореферат в одном экземпляре, заверенный печатью, просим высылать по адресу: 125993, г.Москва, А-80, ГСП-3, Волоколамское шоссе, д.4, Ученый Совет, ученому секретарю диссертационного совета Д 212.125.01.
Автореферат разослан «_»_2005 г.
Ученый секретарь диссертационного совета, кандидат технических наук, доцент
Общая характеристика работы
Актуальность проблемы
Проектирование процессоров и вычислительных систем обработки сигнальной информации уже многие годы является актуальной задачей. Традиционное применение радиолокации связано с решением задач для наблюдения и сопровождения движущихся объектов находящихся в воздухе, на море, на суше и в космосе с платформ расположенных также в воздухе, на море, на суше и в космосе.
Многие радиолокационные методы и устройства, разработанные первоначально для военных нужд, нашли свое применение в мирных областях техники как, например, наземная и спутниковая связь в СВЧ-диапазоне, навигационные системы, системы радиоэлектронного подавления, радиоастрономия, СВЧ-спектроскопия, медицина, метеорология. Вычислительные средства реального времени в радиолокационных комплексах 70-х годов определили развитие вычислительных систем сверхвысокой производительности.
В это время разработаны и внедрены вычислительные системы, находившиеся на уровне мировых проектов того времени.
Широко известные суперЭВМ отечественных разработок:
- серия "Эльбрус-1", "Эльбрус-2" - разработка ИТМ и ВТ им. С.А.Лебедева;
- серия ЕС 1060, ЕС 1062 - разработка НИЦЭВТ;
- серия MIO, М13 - разработка НИИ ВК им. М.А.Карцева.
Эти разработки опирались на отечественную элементную базу.
Особое место в этом ряду занимает машины MIO, М13, спроектированные для решения задач с естественным параллелизмом данных.
Требование максимальной производительности на элементной базе того времени заставило искать новые технические решения в организации вычислительного процесса и привело к созданию параллельных вычислительных машин, определивших направление вычислительной техники.
Разработка цифровых методов селекции движущихся целей (СДЦ) привело к революции в методах обработки радиолокационных сигналов. Цифровая обработка открыла возможность практического воплощения результатов теории радиолокации, которая ранее, когда доступны были одни лишь аналоговые методы, имела ограниченное применение.
Развитие радиолокации и переход на цифровую обработку задачи селекции движущихся объектов резко повысило требования к производительности систем цифровой обработки сигналов (ЦОС). Возросли требования к системам ЦОС также в связи с расширением условий их эксплуатации, например, в системах морского примене " ования и др.
Проектирование систем ЦОС сталкивается с возросшим информационным потоком от различного типа абонентов реального времени. Переход к многомерной обработке сигналов существенно усложняет задачу.
Многомерная обработка сигнала требует организации и слежения за дополнительными информационными потоками, которые условно разбиваются на кадры и выборки. Организация приема информации, относящейся к одному кадру, определяется количеством каналов АЦП в системе, число которых для гидроакустических систем достигает 5000. Обработка включает два этапа - первичную обработку и пространственную обработку. Таким образом, для решения задач первичной обработки сигналов в режиме многомерной обработки требуется организация высокоскоростного приема и далее высокопроизводительной обработки информации.
Прием кадров, его фрагментов, разбиение выборки на кадры, кадров на фрагменты выполняются путем мультиплексирования информационного входного потока данных, определяемого конкретной задачей.
Актуальность задачи определяется возрастающей потребностью в высокопроизводительных системах ЦОС для различных областей применения:
радиолокации;
- гидроакустических систем;
- мобильных систем телекоммуникаций и других высокотехнологичных направлений науки и техники.
Достижения в области микроэлектроники определили два направления проектирования систем ЦОС:
конструирование специального оборудования СБИС для задач ЦОС на основе средств проектирования ПЛИС (программируемых логических интегральных схем) с использованием различных систем автоматизированного проектирования;
- проектирование высокопроизводительных систем на базе процессоров DSP с кластерной шиной обмена или многопроцессорной архитектуры с многоканальными шинами обмена между процессорами и памятью.
Выбор архитектуры вычислительных средств для задач ЦОС прежде всего диктуется динамическими параметрами сигналов. Современные микропроцессорные технологии допускают широкий выбор методов и средств их решения. Реализация ЦОС на универсальных процессорах в основном предпочтительна для эмуляции ЦОС и при работе не в реальном масштабе времени Стандартные процессоры как правило имеют аппаратный умножитель многоразрядных операндов. В то же время точность представления данных ЦОС ограничивается 8-16-тью разрядами и избыточность ресурсов
процессора в плане высокоскоростного выполнения арифметических многоразрядных операций оказывается невостребованной.
Появление особой разновидности микропроцессоров - цифровых сигнальных процессоров (08Р)-является качественным скачком, который способствовал дальнейшему развитию и совершенствованию методов цифровой обработки. Это было обусловлено, прежде всего, тем, что в DSP на одном кристалле совмещается высокопроизводительная цифровая обработка на основе аппаратно реализованного умножителя-накопителя с обеспечением разнообразных интерфейсов. Самое главное, DSP предоставляет возможность реализовать гибкое изменение алгоритмов с учетом меняющихся требований за счет их программируемое™ при сравнительно небольшой цене микросхем DSP.
Для моделирования и построения ЦОС более предпочтительными оказываются специализированные процессоры цифровой обработки сигналов.
Путем наращивания числа процессоров в системе можно реализовать достаточно сложную и быстродействующую систему цифровой обработки. Возможности программируемых логических интегральных схем ПЛИС для построения ЦОС практически не ограничены. ПЛИС на одном кристалле позволяют построить достаточно большое число умножителей, работающих одновременно на достаточно высокой частоте (до 200 МГц) Большое количество внешних выводов ПЛИС, развитая структура быстродействующих межсоединений, повышенная скорость обмена между кристаллами, в совокупности, позволяют построить на основе ПЛИС законченный достаточно регулярный фрагмент ЦОС, а затем, осуществляя каскадирование ПЛИС простым соединением указанных для аппаратного каскадирования выводов, создавать ЦОС произвольной конфигурации и сложности
Цель исследований диссертационной работы.
Цель исследований диссертационной работы заключается в разработке вычислительных процессов многомерной пространственной обработки сигналов и построении на его основе высокопроизводительных вычислительных систем.
Исследования проводились по следующим направлениям
1. Анализ архитектур высокопроизводительных вычислительных средств реального времени для решения задач ЦОС на основе:
- универсальных суперЭВМ;
- специализированных процессоров DSP;
- специализированных заказных средств проектирования на базе программируемой логики ПЛИС.
2. Исследование методов эффективного распараллеливания многопроцессорных систем для обслуживания специализированных абонентов реального времени с учетом накопленного опыта отечественных разработок.
3. Исследование методов многомерной цифровой обработки сигналов специализированных цифровых устройств СДЦ для ЛЧМ-сигнала РЛС кругового обзора, работающих в условиях сильных отражений от различных неподвижных предметов на основе алгоритма первичной обработки для ЛЧМ-сигнала. Определение состава и производительности узкоспециализированных процессоров.
4. Исследование информационных потоков многомерной обработки гидроакустических сигналов для выработки методов их цифровой реализации с учетом специфики потоков команд, потоков данных и адресных механизмов, что определило организацию высокопараллельного вычислительного процесса для ГАК, имеющего до 5000 источников информации.
На основе алгоритмов первичной обработки проведено определение плотности информационных потоков, их маршрутизация, оценены быстродействия методов их обработки, динамического редактирования, про-странсвенно-временной-частотной фильтрации.
В работе отражены вопросы проектирования, связанные с организацией системы ввода/вывода для абонентов реального времени.
В системе первичной обработки сигналов возникает задача наращивания объектов ОЗУ, как в процессоре ввода/вывода, гак и в процессоре обработки. Используются оценки переполнения ОЗУ в предположении, что ОЗУ доступны всем абонентам, когда возникает вероятность переполнения.
Приводятся методы, определяющие зависимость быстродействия центрального процессора от интенсивности запросов абонентов.
Методы исследования.
Решение перечисленных задач основывается на использовании общей теории радиолокации, на методах цифровой обработки сигналов, на методах оценки производительности параллельных вычислительных структур реального времени и теории массового обслуживания для оценок влияния подключения абонентов реального времени на производительность центрального процессора.
На защиту выносятся следующие положения:
1. Высокопроизводительный метод цифровой реализации алгоритма многомерной цифровой обработки сигналов специализированных цифровых устройств селекции движущихся целей (СДЦ), определивший архитектуру
цифровых устройств селекции. В состав специализированного процессора СДЦ входят следующие узкоспециализированные процессоры: процессор цифровой обработки сигналов (ПЦОС);
- процессор обработки пачечных сигналов (ПОПС);
- процессор обнаружения движущихся целей (ПОДЦ);
- процессор формирования кода порога (ПФКП).
2. Архитектура вычислительной системы и способ организации параллельного вычислительного процесса многомерной обработки гидроакустических сигналов с производительностью 20-10^ оп/с.
Научная новизна работы.
Научная новизна работы заключается в разработке методик проектирования малогабаритных вычислительных систем ЦОС производительностью 20-10^ оп/с. для реализации задач пространственно-временной обработки сигналов.
Оценены основные информационные потоки источников сигналов и временные критерии их первичной обработки.
Выделены типовые вычислительные процессы цифровой реализации задач временной и пространственной фильтрации сигналов и определены требуемые производительности вычислительных средств для их решения.
Определены методы распараллеливания основных алгоритмов (многопроцессорность, конвееризация, фрагментирование).
Предложена специализированная многопроцессорная синхронная архитектура вычислительной системы, классифицированная с учетом потоков команд, потоков данных и адресных механизмов считывания данных.
Разработана технология реализации вычислительных систем ЦОС.
Работа проведена для двух вычислительных систем первичной обработки малогабаритной РЛС кругового обзора и гидроакустического комплекса.
Для РЛС кругового обзора разработана функциональная схема специализированного устройства селекции движущих целей (СДЦ) и определен состав его базовых модулей. Разработан метод быстрой цифровой реализации квазисогласованной фильтрации ЛЧМ комплексных сигналов для каждого периода повторения РЛС.
Создана процедура азимутальных фрагментов из 10 элементарных азимутальных направлений при круговом обзоре пространства. Введение процедуры азимутальных фрагментов уменьшает общее количество азимутальных направлений, подлежащих обработке, и сохраняет возможность точного измерения азимута.
Для устройства селекции движущихся целей на основе алгоритма подавления помех и выделения движущихся целей разработан быстрый цифровой метод его реализации путем комбинации КИХ - фильтра 3-го порядка и процессора ДПФ, обеспечивающего фильтрацию доплеровских частот.
Для обнаружения движущихся целей разработан метод цифровой реализации на основе многоканального обнаружителя, выполняющего для каждого азимутального фрагмента и строба дальности в каждом доплеров-ском канале независимое обнаружение сигнала.
Для формирования порога обнаружения сигналов в устройстве селекции движущихся целей на основе алгоритма формирования усредненного значения помех в каждом элементе дальности для азимутальных фрагментов создан метод цифровой реализации с помощью цифрового фильтра нижних частот и рекурсивного цифрового фильтра.
Разработана вычислительная система первичной обработки для гидроакустического комплекса, приемная антенна которого содержит 5000 гидрофонов-приемников информации. Предложена и технически реализована архитектура универсальной реконфигурируемой системы цифровой обработки многомерных сигналов на основе потоковой многоканальной конвейерной обработки информации и разработаны методы цифровой реализации алгоритма многомерной обработки сигналов для абонентов ГАК.
Разработаны технические решения проектирования процессоров цифровой обработки сигналов на основе современных программируемых логических ПЛИС фирм Altera.
Результаты работы, выносимые на защиту
Вычислительная система селекции движущихся целей (СДЦ), состав ее базовых модулей и обеспечение требуемой производительности узкоспециализированных процессоров:
процессора цифровой обработки сигналов (ПЦОС) с быстродействием 2,6' 109 оп/с;
процессора обработки пачечных сигналов (ПОПС) с быстродействием 20-106 оп/с;
процессора обнаружения движущихся целей (ПОДЦ) с быстродействием 45'106 оп/с;
процессора формирования кода порога (ПФКП);
- процедура фрагментирования азимутальных направлений СДЦ
Способ организации вычислительного процесса многопроцессорной высокопроизводительной синхронной системы обработки гидроакустических сигналов ГАК, с учетом специфики потоков команд, потоков данных и
адресных механизмов считывания данных для многомерной обработки сигналов, обеспечивающих высокопроизводительную обработку многоканальных потоков сигнальной информации.
Классификация и сравнительный анализ основных направлений аппаратной реализации высокопроизводительных устройств цифровой обработки сигналов.
Техническая реализация построения процессоров цифровой обработки сигналов на основе ПЛИС.
Основные результаты работы.
Основным результатом диссертационной работы является построение вычислительных процессов цифровой реализации алгоритмов первичной обработки сигналов и проектирование на основе этих решений высокопроизводительных вычислительных систем различного применения.
Предложена и реализована система цифровой обработки селекции движущихся целей для PJIC кругового обзора, состоящая из нескольких узкоспециализированных процессорных модулей.
Для ГАК, имеющего до 5000 источников информации, предложена и аппаратно реализована организация вычислительного процесса, в которой помимо распараллеливания на 48 каналов, включены средства адресации информационных и управляющих потоков Такой процессор первичной обработки имеет производительность до 20" 109 оп/с для формирования пространственных характеристик сигналов и выполняет временную фильтрацию на основе алгоритма БПФ с производительностью 5109 оп/с.
Реализована параллельная синхронная многопроцессорная вычислительная архитектура для проектирования малогабаритных систем ЦОС производительностью 20' 109 оп/с.
При проектировании современных гидроакустических комплексов и цифровых устройств селекции движущихся целей использованы как ПЛИС технологии, так и процессоры DSP разработки фирм TI и AD.
Для выполнения этих задач были проведены исследования и получены следующие результаты:
- проанализированы архитектурные особенности синхронной многопроцессорной вычислительной системы, ориентированной на естественный параллелизм данных;
- предложена и реализована функциональная схема устройства селекции движущихся целей для РЛС кругового обзора;
- предложен и реализован сверхпараллельный способ организации вычислительного процесса для систем ГАК.
Результаты работы используются при проектировании современных высокопроизводительных систем ЦОС различного назначения в разработках ОАО НИИВК им. М.А. Карцева.
Практическая ценность результатов.
Разработанные при участии автора узлы устройства управления в составе суперЭВМ нашли применение в изделиях MIO, 13М6-02 и созданных на их основе комплексах (63И6, 68И6 и др.).
Разработки специализированных процессоров проведены по темам: ОКР "Магнолия-ЦВК" -разработки и создания специализированных вычислительных процессоров СДЦ;
в изделии J1-01 для стендового и опытного образца ЦБК обра-боткигидроакустической информации;
- ОКР "МАТЭКС" при создании специальных СБИС и модулей обработки сигналов;
ОКР "Образ" при создании специализированного вычислительного комплекса для обработки информации ультразвукового диагностического аппарата.
Апробация работы. Основные результаты работы докладывались автором на VI Международном форуме "Высокие технологии XXI века" (Москва, 2005г.), на VI Международной конференции "Кибернетика и высокие технологии XXI века" (Воронеж, 2005г.).
Публикации. По результатам работы опубликовано 12 печатных работ.
Структура и объем работы. Диссертационная работа содержит 122 страницы и состоит из введения, четырех глав, заключения и списка литературы.
Содержание работы.
Во введении обосновывается актуальность проблемы, показывается ее новизна, формулируются цели и практическая значимость работы, а также реализация результатов работы.
В первой главе приведены основные сведения о вычислительных средствах цифровой обработки сигналов - суперЭВМ, процессорах ЦОС (DSP) и заказных СБИС.
В мировой практике разрабатываются и используются суперЭВМ нескольких принципов построения, которые можно разделить на две группы К первой группе относятся суперЭВМ с массовым параллелизмом обработки информации, имеющие очень большое число (1000-И 0000) относительно
простых вычислительных узлов на микропроцессорах широкого применения и распределенную по узлам память. Ко второй - относятся многопроцессорные универсальные суперЭВМ, содержащие относительно небольшое число (порядка 32) процессоров предельной (на данном уровне развития техники) производительности, а также распределенную по процессорам и общую оперативную память. Широко разрабатываются вычислительные системы высокой производительности в виде сетей ЭВМ с быстродействующими каналами связи.
Установленные в вычислительных центрах суперЭВМ первой группы (фирм NEC, IBM, Hewlett-Packard, Intel и др.) имеют пиковую производительность до 4 ! х 1012 операций в секунду с плавающей запятой (41 тераф-лоп), а второй группы (фирм NEC, Fujtsu и др.) - до 1,3х1012 оп./с. В России суперЭВМ первой группы - МВС-1000 (на основе микропроцессоров Alpha) создает НИИ "Квант", второй группы - МВК "Эльбрус-ЗМ" разрабатывает ЗАО "МЦСТ".
СуперЭВМ с массовым параллелизмом обработки информации, для которых применяются обозначения MPP(Massively Parallel Processing) или MMP(Multichassis Multilink Point-to-Point Protocol), получили свое развитие в США по правительственной долгосрочной программе ASCI ("application spécifié integrated circuits" - стратегическая суперкомпьютерная инициатива), целью которой является создание суперЭВМ для моделирования ядерных взрывов Такие ЭВМ эффективны, прежде всего, при решении задач математической физики с хорошо распараллеливаемыми алгоритмами вычислений. Важное значение в этих случаях имеет высокая точность вычислений, требующая использовать 64-разрядные числа с плавающей запятой Реальная производительность ЭВМ архитектуры МРР при этом может достигать до 40% от пикового показателя.
Массивно-параллельные системы (МРР) состоят из однородных вычислительных узлов, включающих один или несколько центральных процессоров (обычно RISC-архитектуры), локальную память, причем прямой доступ к памяти других узлов невозможен, коммуникационный процессор или сетевой адаптер и другие устройства ввода/вывода Общее число процессоров в реальных системах достигает несколько тысяч. Несмотря на трудности в организации полной загрузки всех процессоров и дорогостоящее программное обеспечение архитектура получила широкое распространение. Примерами могут служить системы SGI/CRAY ТЗЕ, Hitachi SP8000, IBM RS/6000 SP2, серия Connection Machine (СМ) разработки фирмы Thinking Machines Corp. (TM) и др.
Вторая группа суперЭВМ, ориентированная на универсальную организацию вычислительного процесса, обеспечивает широкую применяемость систем, позволяет эффективно использовать программное обеспече-
ние, что в конечном счете уменьшает стоимость разработки. К эюй группе относится класс симметричных мультипроцессорных систем (SMP), архитектура которых состоит из нескольких однородных процессоров и массива общей памяти, обычно из нескольких независимых блоков. Все процессоры имеют доступ к любой точке памяти с одинаковой скоростью. Процессоры подключены к памяти либо с помощью общей шины, либо с помощью crossbar -коммутатора (HP 9000). Примерами таких систем являются SMP-сервера и рабочие станции на базе процессоров Intel (IBM, HP, Compaq, Dell, ALR, Unisys и др.). Наличие общей памяти сильно упрощает взаимодействие процессоров между собой, однако накладывает ограничения на их число, не более 30 в реальных системах. Это системы широкого применения.
К этой группе следует отнести суперЭВМ серии M (MIO, М13), разработки НИИ ВК в 70 - 90 годы, которые, созданные для первичной обработки сигналов РЛС, находили применение при автоматизированной обработке снимков пузырьковых камер, для расчета низкотемпературной плазмы, гидроакустических и других актуальных задач 70 - 80 годов.
При одинаковых объемах аппаратуры и стоимости суперЭВМ, построенная на одноплатных кластерах из сигнальных микропроцессоров, будет иметь во много раз большую пиковую производительность, чем суперЭВМ на вычислительных модулях из универсальных микропроцессоров.
Однако суперЭВМ на сигнальных микропроцессорах будут эффективными на меньшем числе классов решаемых задач, т.е. будут менее универсальными по применению, чем суперЭВМ на универсальных МП. Это связано с тем, что они не позволяют хорошо решать задачи, требующие повышенной точности вычислений и большого числа условных (логических) переходов по результатам вычислений.
Наиболее распространенная современная технология проектирования систем ЦОС с использованием стандартных вычислительных серий DSP'
- Texas Instruments: TMS320C6711, TMS320C6416, TMS320C6201;
- Analog Devices: ADSP2062, TSIOls, TS201s;
ГУП НЦП "Элвис": Мультикор (MC-12xx, MC24xx).
При оценке производительности следует различать пиковую и реальную производительность процессоров. Пиковая производительность вычисляется исходя из общего количества вычислительных узлов, которые могут работать параллельно, и тактовой частоты процессора. Реальная производительность определяется множеством факторов, зависящих от реализации тех или иных алгоритмов ЦОС, таких как полоса пропускания системы ввода-вывода, размер внутренней памяти, число регистров и др.
В реальных задачах производительность системы в большой степени зависит от механизмов доставки данных к вычислительным узлам. Так,
при реализации различных алгоритмов на производительность могут оказывать негативное влияние, например, в несколько раз снизить производительность системы, следующие факторы:
размер внутренней памяти; количество сверхоперативных регистров;
- количество каналов ПДП;
- перекрытие операций ввода-вывода по каналам ПДП и операций I процессора;
полоса пропускания внешней шины данных.
Одним из факторов, повлиявших на развитие систем ЦОС, явилась необходимость решения задачи первичной обработки радиолокационной информации. Под первичной обработкой понимается этап от восприятия кодов аппаратуры антенны - до идентификации траектории движущегося объекта.
Рассмотрим основные базовые алгоритмы пространственно-частотно-временной обработки сигналов В наиболее простом случае алгоритм пространственно-частотно-временной (ГГЧВ) обработки сигналов определяется выражением
У = ТХа, (1.3)
где У, X - матрицы выходных и входных данных; Т - матрица весовых коэффициентов обработки сигналов в частотно-временной области (фильтрация сигналов); а - матрица весовых коэффициентов обработки сигналов в пространственной области (формирование пространственных диаграмм направленности).
Реализацию обработки сигналов в соответствии с (1.3) можно осуществить различными способами. Первый способ - пространственная частотно-временная обработка, когда сначала реализуется пространственная обработка сигналов У, = Ха, а затем - частотно-временная У = Т У[. Второй способ обработки - вначале реализуется частотно-временная обработка сигналов У2 - ТХ, а затем пространственная У = У2а. В зависимости от размерности матриц Т и а оба способа реализуются различным числом операций и объемом промежуточных данных.
В ряде случаев матрицы Т и а можно представить в виде произведения более простых матриц. При этом для вычисления (1.3) можно использо-* вать ряд «быстрых» алгоритмов, например, быстрое преобразование Фурье
(БПФ) Следует отметить, что при фиксированных данных системы (ограниченный набор опорных сигналов, простая конфигурация пространственных приемников, ограниченный спектр задач) структура вычислительной системы для алгоритма (1.3) может быть достаточно простой, и используются все
известные методы повышения производительности и пропускной способности: матричный, векторный и конвейерный способы реализации аппаратуры; «быстрые» алгоритмы, учитывающие структурные свойства сигналов и пространственных приемников; распределенную структуру памяти и процессоров.
В радиолокационных комплексах, разрабатываемых в НИИВК в 80-ые годы, при первичной обработке сначала выполнялась пространственная обработка, а затем частотно-временная. При этом пространственная обработка выполнялась в два этапа. Первый этап выполнялся аналоговыми средствами в приемной позиции РЛС, а завершающий этап пространственной обработки выполнялся цифровым способом в процессоре ввода-вывода Последующая частотно-временная обработка для сформированных пространственных каналов выполнялась в процессоре первичной обработки и универсальной суперЭВМ М-10 для классификации объектов и формирования траекторий.
Средняя производительность системы при 8-ми кратном распараллеливании составляла 5.1 млн. оп/с.
В создаваемом в настоящее время цифровом вычислительном комплексе для обработки гидроакустической информации (ГАК) первичная обработка включает следующие этапы:
частотно-временная обработка для приемной аппаратуры изделия, включающей до 5000 источников информации, при этом аналоговым способом в приемной аппаратуре изделия выполняется мультиплексирование входных каналов;
- пространственная двумерная обработка для псевдоаппертур приемной позиции ГАК.
Оба этапа выполняются для одного сеанса работы приемной аппаратуры изделия, дальнейшие вычисления корреляций и траекторий производятся в универсальном процессорном модуле.
Реализация перечисленных алгоритмов требует создания специализированных систем и устройств обработки сигналов, чему посвящена данная работа.
Вторая глава посвящена вопросам проектирования современных малогабаритных высокопроизводительных вычислительных систем первичной обработки сигналов.
СДЦ для РЛС кругового обзора предназначено для контроля за движением объектов на земле и море и выполнено на основе новейших цифровых технологий.
Устройство ориентировано на применение в РЛС кругового обзора, имеющую следующие основные характеристики:
средняя частота повторения импульсов (То) 500 Гц, что обеспечивает однозначное измерение дальности в диапазоне до 250 км;
обзор по азимуту осуществляется в диапазоне 0 - 360°; - ширина луча 1° по уровню половинной мощности; один полный обзор осуществляется за 10 сек.; точность измерения дальности 150 м, точность измерения по
азимуту 1°;
исходные данные поступают от блока передачи данных в виде 10-разрядных комплексных чисел.
Информация от сигнала в одном азимутальном направлении посту-( пает в течение 2 мс, полный обзор станции составляет 10 с. Один азимуталь-
ный фрагмент содержит 10 азимутальных направлений.
На рис. 2.1 приведена структурная схема алгоритма селекции движущихся целей (СДЦ).
Алгоритм цифровой обработки сигналов выполняет квазисогласованную фильтрацию ЛЧМ сигналов в каждом периоде повторения РЛС и описывается в общем виде выражением
y(n) = £ h(m)x(n-m), '
m-1
где: x(n- т) - отсчеты исходного комплексного сигнала; у(п) - комплексные отсчеты выходного сигнала;
h(m) отсчеты комплексной импульсной характеристики квазисогласованного фильтра (256 значений);
п = 1...2575 - длина исходной последовательности, подлежащей обработке;
ш = 1. .256 - длина импульсной характеристики фильтра. Количество операций (К) для выполнения квазисогласованной фильтрации согласно выражению (*) составляет: Kl =(Кумн + Ксл) m n , где: Куми - количество арифметических операций для выполнения ум-I ножения двух комплексных чисел (Кумн - 6);
Ксл - количество арифметических операций для выполнения сложений двух комплексных чисел (К =2). > При этом имеем К, =(6+2) • 256 ■ 2575 = 5273600.
Производительность равна Е = К,/Т.
Рис 2 1 Структурная схема алгоритма СДЦ
Время Т для выполнения цифровой фильтрации по одному азимутальному направлению ~ 2 мс.
Для выполнения указанного количества операций за 2 мс устройство цифровой фильтрации иметь производительность Е = 2,6 109 оп/с
Для уменьшения объема входного ОЗУ и упрощения последующей обработки в устройстве используется процедура формирования азимутальных фрагментов, содержащих по 10 элементарных азимутальных направлений, возникающих при круговом обзоре пространства. Это позволяет уменьшить общее количество азимутальных направлений, подлежащих дальнейшей обработке с 5000 до 500, сохранив при этом возможность измерения азимута с точностью порядка 1°. Объем каждой страницы входного ОЗУ составляет при этом 2575x10 комплексных чисел в ПЦОС
После приема и фильтрации информации по 10 азимутальным направлениям в ОЗУ формируется отфильтрованный азимутальный фрагмент
у(п) -результат работы процессора ПЦОС (см. рис. 2.2).
Рисунок 2.2. Структурная схема специализированного цифрового устройства С ДЦ
В дальнейшем реализуется алгоритм подавления помех. Для всех далъност-ных каналов для каждого из 10 элементов отфильтрованного азимутального фрагмента выполняется КИХ-фильтрация 3-го порядка, с коэффициентами -1/2, 1, -1/2 , что эквивалентно применению схемы двукратного череспериод-ного вычитания, и далее фильтрация доплеровских частот с помощью 8-точечного ДПФ
Алгоритм фильтрации описывается следующими выражениями-
з .
У|(к)=ХЬ(т,)х(к-т,),
где х(к - т,) - отсчеты комплексного сигнала азимутального фрагмента;
Ь(3)= - 1/2, 1, -1/2; - отсчеты импульсной характеристики КИХ-
фильтра 3-го порядка;
Ш| = 3 - длина импульсной характеристики КИХ-фильтра;
у, (к) - выходные комплексные отсчеты азимутального фрагмента; к - 10 длина последовательности азимутального фрагмента для одного дальностного канала.
Массив у' (к) передается для выполнения ДПФ.
Фильтрация доплеровских частот выполняется с помощью 8-точечного ДПФ для азимутального фрагмента, этим завершается работа процессора ПОПС.
В рассматриваемом устройстве выполняется только первый этап обнаружения, его результаты передаются на универсальную ЭВМ типа РС, входящую в вычислительный комплекс РЛС, где и завершается второй этап обнаружения.
Для выполнения первого этапа обнаружения выходные сигналы каждого из 8-ми каналов, полученные после выполнения операции ДПФ переводятся из комплексной формы в действительную путем вычисления модуля комплексного числа в соответствии с общим выражением:
ад = л/ус2(п) +ук2(п),
где Ус (п) и Ук (п) - соответственно синфазная и квадратурная составляющие п-го комплексного числа на выходе процессора ДПФ. Полученный сигнал подается на многоканальный обнаружитель, который выполняет для каждого азимутального фрагмента и строба дальности в каждом доплеровском канале независимое обнаружение сигнала.
Устройство обнаружения осуществляет сравнение модуля Z(n) и сформированных 8-ми модулей комплексных чисел со значением ип - кодом
порога, и в случае превышения порога г(п) > и„, значение г(п), оформленное в виде формуляра, содержащего номер азимутального фрагмента и номер дальностного канала, передается в универсальную ЭВМ для дальнейшей обработки При этом может оказаться, что превышение над порогом может возникнуть в нескольких доплеровских каналах Тогда выдается формуляр максимального из значений превышающих порог. При равенстве амплитуд превысивших код порога в нескольких доплеровских каналах дальности, передается значение доплеровского канала с минимальным номером.
Для огибающей помех, имеющих релеевскую плотность вероятностей, как в нашем случае, порог обнаружения и„, вероятность ложной тревоги а и среднее значение помех Ъ связаны соотношением
Видно, что порог обнаружения можно получить, умножая измеренное среднее значение помех на некоторую константу в (а), однозначно связанную с заданной вероятностью ложной тревоги.
Следует отметить, что в РЛС кругового обзора имеют место:
различные уровни помех в различных азимутальных направлениях и на различных дальностях, которые определяются местными условиями, в которых работает РЛС;
большой объем исходной информации, достигающей 56 Мбайт памяти или более 10 млн. чисел за один обзор.
Для того чтобы решить в таких условиях задачу поддержания заданных вероятностей ложных тревог 10"2 - 10"3, необходимо использовать некоторый опорный фон помех для каждого азимутального фрагмента и каждого строба дальности во всем секторе обзора. Такой опорный фон формируется в процессоре формирования кода порога (ПФКП) с помощью алгоритмов формирования постоянной составляющей помех и карты помех, и хранится в соответствующем ЗУ. Объем этого ЗУ равен 1,4 10б комплексных чисел, а само ЗУ представляет собой матрицу 544 х 2575 чисел
Для формирования постоянной составляющей помех в каждом п-м элементе дальности каждого к-го азимутального фрагмента используется цифровой фильтр нижних частот, вычисляющий
Для формирования карты радиолокационных помех в каждом элементе «дальность - азимут» используется рекурсивный цифровой фильтр, в котором реализуется рекуррентное соотношение
г„ =£ке[¥п(к-1)]-
/ - количество срезов в данном азимутальном фрагменте. Здесь индекс 3 относится к номеру обзора в процессе составления карты помех, который должен проводится при вводе РЛС в эксплуатацию на месте ее дислокации; Ц - опорный уровень помех, соответствующий ]-му обзору, д - константа, определяющая время формирования карты (в количестве обзоров), необходимое для получения достоверных результатов
В процессе обнаружения для каждого азимутального фрагмента считывается код порога, соответствующий каждому элементу дальности. 4
Поскольку, после выполнения фильтрации в процессоре пачечных сигналов выделяется информация в 8-ми доплеровских каналах, то по коду порога, поступившего с карты помех, формируется восемь индивидуальных кодов порога и„ путем умножения на 8 соответствующих констант из ПЗУ процессора обнаружения.
ПЗУ констант представляет собой таблицу значений для каждого из 8-ми доплеровских каналов для формирования индивидуального кода порога. Процедура повторяется для всех "дальностных каналов" текущего азимутального фрагмента. Уровень порога динамически формируется для элемента фрагмента.
В процессе обнаружения для каждого элемента «дальность - азимут» из ЗУ карты помех вызывается соответствующий ему опорный уровень помех. В каждом доплеровском канале этот опорный уровень умножается на свои константы, которые заранее вычисляются и хранятся в ПЗУ процессора обнаружения.
С полученными порогами обнаружения сравниваются сигналы соответствующих доплеровских каналов, и результаты обнаружения записываются в выходное БЗУ, которое также имеет структуру двух страниц, работающих поочередно Максимальный объём каждой страницы составляет 16К чисел, имеющих следующий состав:
16 двоичных разрядов - код амплитуды; 12 двоичных разрядов - код номера строба дальности; 10 двоичных разрядов - код номера азимутального фрагмента. С помощью адаптера обмена, входящего в состав контроллера, эти данные передаются на универсальную ЭВМ, где выполняются второй этап обнаружения и вся последующая обработка информации. *
В соответствии с общим алгоритмом работы определена структурная схема устройства. В его состав входят следующие узкоспециализированные процессоры: I процессор цифровой обработки сигналов (ПЦОС); процессор обработки пачечных сигналов (ПОПС); процессор обнаружения движущихся целей (ПОДЦ); процессор формирования кода порога (ПФКП);
контроллер или процессор управления и обмена.
Рассмотрим особенности каждого из перечисленных процессоров.
ПЦОС должен выполнить большое количество однородных операций умножения и сложения комплексных чисел. Так, при прямой реализации свертки (*) в реальном масштабе времени, его производительность в перерасчете на действительные числа должна составлять 2,6Т09 оп/с. Существенно (примерно на порядок) можно уменьшить требования к производительности ПЦОС, если вычислять выражения (*) методом быстрой свертки с использованием алгоритма БПФ. Практическая граница, где прямая и быстрая свертки примерно эквивалентны по сложности реализации, до недавнего времени соответствовала N = 16 -г 32, где N - длина импульсного отклика цифрового фильтра И(т).
С появлением функционально законченных СБИС КИХ-фильтров типа А100 фирмы 1птоБ, эта граница поднялась до N = 64 - 128. Использование современных с высоким уровнем интеграции ПЛИС с учетом специфики работы КИХ-фильтров при цифровой обработке радиолокационных сигналов позволило поднять эту границу еще выше и довести до N = 256, что реализовано в данном устройстве.
Введение процессора ПОПС связано с тем, что доплеровские частоты могут быть выявлены только по ряду импульсов, полученных в разных периодах повторения РЛС. При использовании кругового обзора это проявляется в пачечном характере отраженного от каждого объекта сигнала, который должен быть выделен в ПОПС и обнаружен в ПОДЦ. Основными элементами ПОПС являются КИХ-фильтр 3-го порядка и 8-точечный процессор ДПФ (БПФ), которые должны согласно расчетам обладать суммарной производительностью порядка 20-106 оп/с.
ПОДЦ включает в себя как типовые элементы цифровой обработки сигналов (цифровой фильтр нижних частот, рекурсивный цифровой фильтр 1-го порядка, запоминающие устройства), так и специализированные узлы выделения огибающей комплексного сигнала, многоканальный процессор обнаружения. Требования к производительности ПОДЦ составляют ~ 45 106оп/с В процессоре наряду с арифметическими операциями выполняются и логические.
Контроллер выполняет в основном последовательность логических операций, связанных с управлением работой всех перечисленных процессоров, как единой системы обработки сигналов в реальном масштабе времени На него возложен также контроль за работоспособностью всего специализированного устройства СДЦ.
Гидроакустический комплекс (ГАК) пассивной локации представляет собой систему состоящую из приемной комфорной антенны, АЦП с частотными фильтрами и вычислительного цифрового устройства
тотными фильтрами и вычислительного цифрового устройства первичной обработки информации. При проектировании системы ЦОС для гидроакустических задач учитывались особенности системы сбора информации Приемная антенна содержит 5000 гидрофонов. Субантенна -это фрагмент антенны, на который поступает информация от предполагаемой цели в заданном углу обзора пространства.
Приемная антенна содержит 5000 гидрофонов-приемников информации. (
Информация, принимаемая от 5000 источников, образует кадр. За один сеанс, равный 1сек., принимается 16К кадров.
Общее количество характеристик направленности (пространственных лучей), которые требуется сформировать согласно ТЗ при обработке '
частотных каналов, равно 5,2 • Ю^.
Данные от низкочастотных источников, поступающие по 5000 входным каналам, путем мультиплексирования объединяются в четыре скоростных канала с рабочей частотой 25Мгц в процессоре ввода-вывода
Поток поступающей информации (ПВИ) для подсистемы из четырех подабонентов равен:
ПВИ = п • ф • {=4 ■ 2 • 25 106 = 200 Мб/с ,
где:
п - количество приемных подабонентов канала (п = 4);
ф - формат передаваемых данных (ф = 2 байта);
f- частота синхронизации информации ^ = 25 МГц).
Процесс первичной обработки гидроакустической информации можно разделить на два этапа. Первый этап частотная обработка, второй -частотно пространственная фильтрация.
Структурная схема алгоритма приведена на рис. 2.5.
Основу частотной обработки составляет операция БПФ. Один информационный временной срез от 5000 приемников представляет собой кадр в 5000 отсчетов. За сеанс работы равный 1сек , соответствующий одной выборке, принимается 16К кадров, то есть массив 16-ти разрядных отсчетов объемом 16Кх5000. Над этим массивом выполняется БПФ размерностью 16К точек. По результату операции БПФ выполняется фильтрация частот, ^
что сокращает объем информации, поступающей на дальнейшую обработку более чем на 50%. В полученном массиве по каждой частоте формируется частотный срез в виде отдельного банка комплекснозначащих чисел.
1
Частотные срезы представлены в виде виртуальных массивов значений со,, Фактическое расположение 5000 каналов, которым соответствуют о),,,представляет собой двумерную конструкцию комфорной антенны в изделии.
Вход ^—»•
23
Прием информации от АЦП £=25 Мгц ГАК
Форм>фование выборки 5000 х16К
Частотгая фильтрация БПФ на 16К точек для 5000 каналов
— 4-
Формирование
частотного среза выборки.
Пространственная
обработка. Формирование
диаграмм направленности
Выход
Рис.2.5. Структурная схема алгоритма ГАК
Поэтому пространственная фильтрация выполняется над двумерными массивами частотных срезов. Пространственная обработка выполняется над отдельными фрагментами частотных срезов, называемых субантенной. Субантенна - двумерный массив приемников виртуальной информации (каналов), создаваемых при проектировании изделия для каждого частотного среза и для определенного углового направления с учетом общего сектора обзора.
Базовой операцией пространственной обработки гидроакустической информации является формирование двумерных характеристик направленности для субантенн согласно выражению:
где:
Впга - спектральные составляющие, принадлежащие ¡-ому частотному срезу (В „„, е с^);
Wm, Wn - заданные коэффициенты фазирования;
М - количество строк в субантенне;
т - индекс номера строки в субантенне; 4
N - количество приемников информации в строке субантенны;
п - индекс номера приемника информации в строке субантенны.
Общее количество характеристик направленности субантенн (про- ,
странственных лучей), которые требуется сформировать за время одной выборки, равно 5,2.106.
Коэффициенты фазирования вычисляются предварительно при формировании технического задания на акустическую систему.
Требуемая производительность (Ппр) вычислительной системы в пиковом случае для пространственной обработки информации, поступающей за 1с от приемной позиции изделия, оценивается следующим образом :
Ппр = К- № М-я,
где:
К- общее количество характеристик направленности (пространственных лучей), которые требуется сформировать при сигнальной обработке частотных каналов (К = 5,2 • 106);
N - количество приемных каналов в горизонтальном направлении (строка) субантенны (Ы = 25);
М - количество приемных каналов в вертикальном направлении (количество строк) субантенны (М = 20);
Я - количество арифметико-логических операций при выполнении базовой операции сумм произведений комплекснозначных отсчетов (я = 8).
Ппр = 5,2106 • 25 ■ 20 • 8 = 20-109 оп/с.
Частотная фильтрация БПФ производительностью:
П = 16К/2 1оеЛ6К • 10 • 5 ■ 103 = 5 • 109 оп/с.
чв °2 I
Вычислительный процесс пространственной обработки гидроакустической информации ориентирован на архитектуру с параллельной обработкой данных типа "одиночная команда - множественные данные", с высоким коэффициэнтом распараллеливания, в данном случае выбран равным 48. I
Базовый модуль построен с условием, что для 16 соседних частотных срезов алгоритм пространственной обработки одинаков. В модуле реализуется 16 конвейерных арифметических устройств, выполняющих операции суммы произведений комплекснозначащих чисел.
Результаты пространственной обработки формируются последовательно для всех частотных срезов. Для этого предусмотрена буферная память для каждом арифметическом устройстве. Для совмещения обработки и загрузки память должна быть двухпортовой.
На выходе формируется значение характеристики направленности для субантенн всех частотных срезов.
Структурная схема информационных потоков и вычислительного процесса при формировании пространственного спектра сигналов приведена на рисунке 2.7.
МФУ - модуль функционального управления (управление, редактирование, буферная память).
ОК - одиночный поток команд (программная последовательность
команд).
А,(1) - последовательность адресов данных для выбора информации из массива после частотной обработки входной информации (первое измерение).
А,(2) - последовательность адресов данных для выбора информации из массива, полученного в результате обработки в первом измерении.
Рис 2 7 Структурна* схема вычислительного процесса двумерной обработки гидроакустических сигналов
После редактирования, заключающегося в синхронизации, идентификации и преобразовании в комплексное представление, информационный поток поступает на обработку.
Пиковая производительность вычислительной системы должна достигать ~20-109оп/с.
Рассматривается пространственная обработка в двух измерениях на трех синхронных линейках функциональных многоарифметических модулей ФАМк ФАМ(к+]), ФАМ(к+2) Базовой операцией ФАМ является «умножение с накоплением» (MAC) над группой комплекснозначимых отсчетов входных приемных каналов.
Все поле из 48-ми процессоров (3x16) работает по одной управляющей команде ОК.
Для обеспечения высокоскоростной маршрутизации потока данных блок МФУ формирует систему адресов A,(1V2) и Ajk(lV2), Aj (k+1)(lV2), Aj <k+2)(lV2) выборки информации из промежуточной памяти для хранения двухчастотных срезов входной многоканальной информации. Объем 16Кх32бит (ОПМФУ) предназначен для одного информационного канала В каждом ФАМк - ФАМкт2 обеспечивается обработка 16-ти каналов и общий объем памяти в трех линейках равен 16x3x16Кх32бит.
В первом измерении происходит весовое суммирование для каждого из 48-ми каналов исходной цифровой функциональной последовательности данных МПД размерностью (3x16) и одиночного потока внешних данных (ОПД), содержащего пространственные коэффициенты фазирования для к, к+1, к+2 направлений, соответственно. ФАМ построен с тем условием, что для 16-ти соседних частотных срезов алгоритм обработки одинаков. ОПД поступает на массив (3x16) с размножением по линейкам ФАМ.
Результат обработки первого измерения направляется в сверхоперативную регистровую память линеек ФАМк - ФАМк+2.
Во втором измерении исходной цифровой функциональной последовательностью данных является массив, вычисленный в первом измерении.
МПДвиеш - множественный поток внешних данных, МПДквнут - множественный поток внутренних данных, ОПДквнсш - одиночный поюк внешних данных.
A, (1V2) - массив адресов для считывания данных из буферов функциональных арифметических модулей. Эта адресная шина используется в первом измерении для считывания информации из ОПМФУ, а во втором измерении из сверхоперативной регистровой памяти.
Aj k(l) , Aj (k+1)(l) , Aj (k+2)(l) - три адреса выборки коэффициентов фазирования для первого измерения из массивов содержащихся в ФАМк, ФАМ(к+1), ФАМ (к1.2); после считывания коэффициентов фазирования выпол-
няется операция размножения для 16 арифметических узлов, входящих в состав многоарифметического модуля.
А, k(2) , Aj (к+|)(2) , Aj (к+2)(2) - три адреса выборки коэффициентов фазирования для второго измерения из массивов содержащихся в ФАМк, ФАМ(к+1), ФАМ (к+2); после считывания коэффициентов фазирования выполняется операция размножения для 16 арифметических узлов, входящих в состав многоарифметического модуля.
Результаты, поступающие на выход ФАМЬ ФАМ (к+|), ФАМ !V2) представляют собой сформированный пакет данных двумерной пространственной фильтрации для 48-ми частотных срезов (по 16 для каждой ФАМ), сформированный при преобразовании исходных частотных спектров в последовательность отсчетов после выполнения двумерной фильтрации. Реализованная структура отражает концептуальный принцип обработки информации в направлении увеличения параллельности выполнения операций и улучшения организации вычислений синхронных потоков.
В результате анализа алгоритмов обработки, разработан метод цифровой реализации задач пространственной фильтрации сигналов и предложена многопроцессорная синхронная архитектура вычислительной системы, классифицированная не только с учетом потоков команд, потоков данных, но и адресных механизмов считывания данных.
При создании высокопроизводительных модулей обработки сигналов создан механизм адресации больших многомерных массивов для нескольких вложенных циклов.
Требуемая производительность обеспечивается параметрами конвейерной вычислительной системы обработки гидроакустических сигналов, и равна Е = / • m • п • /, где:
/ - тактовая частота работы системы 50 Мгц;
m - глубина конвейера многофункционального арифметического узла (ш=8);
п - количество арифметических узлов в каждом функциональном модуле (п=16);
/ - количество многофункциональных арифметических модулей (/
=3)
Высокий ранг параллелизма задачи позволяет выбрать параметры п=16,1=3.
В третьей главе приводится техническая реализация некоторых устройств разработанных вычислительных систем.
Разработанная универсальная реконфигурируемая система цифровой обработки многомерных сигналов процессора для ГАК представлена на рисунках 3.5, 3 6. Система построена на базе процессора TMS 320С64Х.
Характерности процессора TMS 320С64Х: рабочая частота 700 Мгц, производительность до 1,5 Гфлоп/с. Производительность всей системы ~ 20 • 109 оп/с.
Система работает под управлением ПЭВМ - PENTIUM, подключенной к процессорному модулю ввода/вывода через стандартную шину PCI.
Максимальный поток поступающей информации с абонентов (АРВ) оценивается -200 Мбайт с/с.
I - уровень обработки выполняет временную фильтрацию кадров (БПФ) с производительностью ~ 3,5 • 109 оп/сек.
TI - уровень выполняет пространственную фильтрацию для абонентов и обеспечивает суммарную производительность ~ 20- 109 оп/с.
Процессорный модуль ввода/вывода (ПМВВ) данных абонентов реального времени (АРВ), предназначен для приема и буферизации данных АРВ с последующей пересылкой их в память каналов обработки комплексной информации. Необходимость буферизации входных данных вытекает из двух обстоятельств:
источник данных и приемник синхронизируются независимыми генераторами синхрочастот, т. е. существует необходимость согласования по опорным частотам;
различная структура входных АРВ и в канале обработки (КО) комплексной информации.
Решение вопроса согласования опорных частот достигается за счет того, что прием входных данных в буфер ПМВВ синхронизируется тактовой частотой источника, а вывод данных из входного буфера для пересылки в КО - внутренней частотой.
Различие структур данных абонентов и каналов обработки комплексной информации заключается в следующем:
данные абонентов реального времени представляют собой временные отсчеты форматом 1, в одном сеансе передачи от абонента передается один временной отсчет;
- канал обработки комплексной информации оперирует комплексным отсчетом форматом 2, который формируется из двух последовательных временных отсчетов абонента.
Следовательно, для формирования одного комплексного отсчета во входном буфере ПМВВ перед пересылкой в память КО необходимо накопить два временных отсчета абонента.
Кроме того, поток данных от абонентов АРВ, поступающий на вход ПМВВ, содержит временные отсчеты различных элементарных источников данных (ИД), определяющихся особенностью абонента. Для обработки данных необходимо в памяти КО расположить данные каждого ИД в виде целостного массива. Следовательно, наряду с задачами согласования опорных
частот и преобразования входных данных в комплексные ПМВВ решает задачу по упорядочению в памяти КО.
Архитектура процессора TMS 320С64Х включает два параллельных канала HPI и EMIF с прямым доступом к внутренней памяти. Канал HPI -имеет 16 разрядное слово обмена и производительность 34 Мбайт/с обменов внутри процессора, и производительность 24,2 Мбайт/с обменов с динамической памятью Контроллер транзитных связей (КТС) - формирует отдельные массивы для выполнения временной фильтрации БПФ.
Система предназначена для многомерной обработки сигналов путем формирования пространственно-частотного спектра сигналов и корреляционной обработки.
Далее приводятся схемы разработанных специализированных вычислительных устройств базовых модулей ( БПФ, матричное устройство и др.) на основе технологии ПЛИС фирмы Altera.
В четвертой главе решаются вопросы проектирования связанные со спецификой абонентов реального времени:
- особенности универсальной системы средств ввода-вывода для параллельных вычислительных систем;
- выбор архитектуры системы ввода-вывода и распределение функций между ее составными частями;
- обоснование выбора объема ОЗУ для буферизации абонентов;
- влияние организации связи внешних абонентских устройств с САБС на быстродействие ЦП.
В системах первичной обработки сигнала возникает задача наращивания объемов ОЗУ, как в процессорах ввода/вывода, так и в процессорах обработки.
Показано, что:
- для обеспечения высокой производительности необходима универсальная система абонентского сопряжения;
- для работы с переменным качественным составом абонентов разного типа необходимы программируемые устройства сопряжения;
- для работы с переменным количественным составом - модульная структура САБС.
Основными функциями сопрягающего процессора являются:
- отработка интерфейса абонента, взаимодействие с верхним уровнем абонентского сопряжения;
- декодирование макрокоманд центрального процессора и формирование словососгояния;
БС/5
Б/5[1б] <=>
PCI
пмвв
APB(I-IY)
О-уровень
AI [16]
i, г|АО[32]
АС/О
APB(I) J уровень Временная фильтрация (БПФ)
АРВ(1)
ао [32]
АС/5
а/5[32;
,,, д,
UQ/7 ]Асд
Б/б [16] I
Б С/6 AIV [16]
АРВ(П,И1)
ПФ/б
1,П уровень
I
Б/7[1б]|
БС/7
АРВ(ГУ) ПФ/7
Ц1 уровень
С=уПФ/1 JBCTI Ьс/2 ^ 2] * *
БС/3
шр Б/5 [¡б]
ПМВВ - процессорный модуль ввода-вывода
АРВ - абоненты реального времени.
PCI - канал обмена с управляющей ЭВМ
АС/1-5, БС/1-5 - сигналы управления маршрутизацией
А - линия транзитных передач до пространственной
обработки! Б - линия передач результатов фильтрации
Рисунок 3 5 Структурная схема 3-х уровневой системы обработки на DSP
Выходы ПМВВ
Временная фильтрация БПФ Производительность 3,5*10®оп/с
АО [32]
АС О
КТС - контроллер транзитных связей HPI - Host-Post loter&ce
TMS - Texas Instruments, модель C64x(8800MIPS.l, 1Г,гц) EMIF - External Memory Interface
А - информационный массив после временной трансляции информационные связи -управляющие связи.
Рисунок 3 6 Структурная схема типового модуля
- управление внешним обменом;
- обработка данных на проходе.
Для уменьшения потерь информации рекомендуется использовать метод оперативного изменения ОЗУ с изменением указаний в управляющем слове.
Приведена оценка влияния частоты обращений абонентских устройств на быстродействие центрального процессора и указан оптимальный режим работы ЦП по результатам моделирования
Основные результаты работы.
Основным результатом диссертационной работы является определение методики проектирования систем ЦОС, которая включает построение вычислительных процессов цифровой реализации алгоритмов первичной обработки сигналов и проектирование на основе этих решений высокопроизводительных вычислительных систем многомерной обработки сигналов.
Предложена и реализована система цифровой обработки селекции движущихся целей для РЛС кругового обзора, состоящая из нескольких узкоспециализированных процессорных модулей
Для ГАК, имеющего до 5000 источников информации, предложена и аппаратно реализована организация вычислительного процесса, в которой помимо распараллеливания на 48 каналов, включены средства адресации информационных и управляющих потоков. Такой процессор первичной обработки имеет производительность до 20 1 09 ол/с для формирования пространственных характеристик сигналов и выполняет временную фильтрацию на основе алгоритма БПФ с производительностью 5' 109 он/с
При проектировании современных гидроакустических комплексов и цифровых устройств селекции движущихся целей использованы как ПЛИС технологии, так и процессоры DSP разработки фирм TI и AD.
Для выполнения этих задач были проведены исследования и получены следующие результаты:
проанализированы архитектурные особенности синхронной многопроцессорной вычислительной системы, ориентированной на естественный параллелизм данных;
предложен и реализован сверхпараллельный способ организации вычислительного процесса для систем ГАК;
предложена и реализована функциональная схема устройства селекции движущихся целей для РЛС кругового обзора;
Результаты работы используются при проектировании современных высокопроизводительных систем ЦОС различного назначения в разработках ОАО НИИВК им МА Карцева
Публикации. По теме диссертации опубликовано 12 печатных работ.
1. Баранов Л.Д. и др. Устройство управления ЭВМ MIO. //Вопросы радиоэлектроники. - М., 1980. - Серия ЭВТ, вып.9. - С. 15-30.
2. Баранов Л.Д. и др. Вариант включения процессора серии TMS для решения задач ЦОС. //Вопросы радиоэлектроники. - М., 2001. -Серия ЭВТ, вып. 1.
3. Баранов Л.Д. Некоторые особенности архитектуры процессоров цифровой обработки сигналов. //Вопросы радиоэлектроники. - М., 2002. - Серия ЭВТ, вып. 1.
4. Бахтиаров Г.Д., Баранов Л.Д., Златников В.М. Специализированное цифровое устройство селекции движущихся целей. //Вопросы радиоэлектроники. -М., 2003. - Серия ЭВТ, вып.2.
5. Баранов Л.Д. Высокопроизводительная система цифровой обработки сигналов. //Вопросы радиоэлектроники. - М., 2002. - Серия ЭВТ, вып. 1.
6. Баранов Л.Д., Латышов A.A. Развитие средств ввода-вывода ЭВМ семейства «М». //Вопросы радиоэлектроники. - М., 2003. - Серия ЭВТ, вып.2.
7. Баранов Л.Д., Бахтиаров Г.Д., Златников В.М. Цифровая обработка радиолокационных сигналов и DDC технологии. //Радио промышленность. - М., 2004.
8. Антонов-Антипов Ю.Н., Баранов Л.Д., Златников В.М. Унифицированное цифровое квадратурное преобразование сигналов ФМ-2 с реализацией на ПЛИС. //Вопросы радиоэлектроники. - М., 2004. -Серия ЭВТ, вып.1.
9. Баранов Л.Д., Златников В.М., Кучернюк И.Н. Специализированный процессор диспетчеризации информационных потоков высокопроизводительной системы цифровой обработки сигналов. //Вопросы радиоэлектроники. - М., 2004. - Серия ЭВТ, вып. 1.
10. Баранов Л.Д, Калинин М.И. Цифровой понижающий преобразователь-устройство цифровой обработки сигналов в системах связи. //Вопросы радиоэлектроники. - М., 2005. - Серия ЭВТ, вып. 1.
11. Баранов Л.Д. Вопросы проектирования высокопроизводительных систем первичной обработки сигналов. VI Международный форум "Высокие технологии XXI века",- М., 2005.
12. Баранов Л.Д. Новые технологии проектирования высокопроизводительных систем ЦОС. VI Международная конференция "Кибернетика и высокие технологии XXI века",- Воронеж, 2005
'ос. национальна, виклмотека i
C-HrnMw Í " - -
Подписано в печать 27.04.2005. Бум офсетная Формат 60x84 1/16 Печать офсетная Усл. печ. л. 2,09. Уч -изд. л. 2,25. Тираж 100 экз Зак. 3060/5084. С. 333.
Отпечатано в типографии Издательства МАИ «МАИ», Волоколамское ш , д 4, Москва, А-80. ГСП-3 125993
к
к
»
t
» ~ 8 5 3 S
РНБ Русский фонд
2006-4 7880
Оглавление автор диссертации — кандидата технических наук Баранов, Лев Дмитриевич
Введение.
Глава 1. Выбор архитектуры вычислительных средств с предельными характеристиками для задач ЦОС.
1.1. Современные суперЭВМ и процессоры ЦОС.
1.2. Вопросы системной интеграции.
1.3. Архитектура центрального процессора универсальной суперЭВМ с синхронным управлением многопроцессорным АЛУ.
1.4. Алгоритмы первичной обработки сигналов и методы их решения.
Выводы.
Глава 2. Проектирование малогабаритных высокопроизводительных систем ЦОС.
2.1. Выбор архитектуры и состава специализированного цифрового устройства селекции движущихся целей.
2.2. Проектирование высокопроизводительных специализированных цифровых устройств селекции движущихся целей.
2.3. Организация вычислительного процесса пространственной обработки сигнала ГАК.
2.4. Постановка и решение вопросов параллельного программирования и предварительной отладки программ.
Выводы.
Глава 3. Техническая реализация модулей высокопроизводительной системы обработки сигналов
3.1. Высокопроизводительная система первичной обработки для гидроакустических комплексов по технологии DSP.
3.2. Разработка модуля быстрого преобразования Фурье для систем с высокой производительностью.
3.3. Проектирование типового высокопроизводительного матричного устройства.
3.4. Особенности команд устройства управления параллельной архитектуры суперЭВМ Ml0.
3.5 Оценка производительности специализированных вычислительных устройств (СДЦ) и вычислительной системы ГАК.
Выводы.
Глава 4. Сопряжение вычислительных средств первичной обработки сигналов с приемной аппаратурой изделий.
4.1. Системы ввода-вывода для параллельных вычислительных комплексов.
4.2. Выбор архитектуры системы ввода-вывода и распределение
• функций между ее составными частями.
4.3. Обоснование выбора объема ОЗУ для буферизации информации абонентов и влияние организации связи внешних абонентских устройств с САБС на быстродействие ЦП. Ill
Выводы.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Баранов, Лев Дмитриевич
Проектирование процессоров и вычислительных систем обработки сигнальной информации уже многие годы является актуальной задачей. Традиционное применение радиолокации связано с решением задач для наблюдения и сопровождения движущихся объектов находящихся в воздухе, на море, на суше и в космосе с платформ расположенных также в воздухе, на море, на суше и в космосе.
Многие радиолокационные методы и устройства, разработанные первоначально для военных нужд, нашли свое применение в мирных областях техники как, например, наземная и спутниковая связь в СВЧ-диапазоне, навигационные системы, системы радиоэлектронного подавления, радиоастрономия, СВЧ-спектроскопия, медицина, метеорология. Вычислительные средства реального времени в радиолокационных комплексах 70-х годов определили развитие вычислительных систем сверхвысокой производительности.
В это время разработаны и внедрены вычислительные системы, находившиеся на уровне мировых проектов того времени.
Широко известные суперЭВМ отечественных разработок:
- серия "Эльбрус-1", "Эльбрус-2" - разработка ИТМ и ВТ им. С.А. Лебедева;
- серия ЕС 1060, ЕС 1062 - разработка НИЦЭВТ;
- серия Ml0, Ml3 - разработка НИИ ВК им. М.А. Карцева.
Эти разработки опирались на отечественную элементную базу.
Особое место в этом ряду занимает машины М10, М13, спроектированные для решения задач с естественным параллелизмом данных.
Требование максимальной производительности на элементной базе того времени заставило искать новые технические решения в организации вычислительного процесса и привело к созданию параллельных вычислительных машин, определивших направление вычислительной техники.
Разработка цифровых методов селекции движущихся целей (СДЦ) привело к революции в методах обработки радиолокационных сигналов. Цифровая обработка открыла возможность практического воплощения результатов теории радиолокации, которая ранее, когда доступны были одни лишь аналоговые методы, имела ограниченное применение.
Развитие радиолокации и переход на цифровую обработку задачи селекции движущихся объектов резко повысило требования к производительности систем цифровой обработки сигналов (ЦОС). Возросли требования к системам ЦОС также в связи с расширением условий их эксплуатации, например, в системах морского применения, аэростатного базирования и др.
Проектирование систем ЦОС сталкивается с возросшим информационным потоком от различного типа абонентов реального времени. Переход к многомерной обработке сигналов существенно усложняет задачу.
Многомерная обработка сигнала требует организации и слежения за дополнительными информационными потоками, которые условно разбиваются на кадры и выборки. Организация приема информации, относящейся к одному кадру, определяется количеством каналов в системе. Обработка включает два этапа - первичн>тооб4^аботку и пространственную обработку. < При ограниченном количестве каналов икформациякадра-разбивается на от-""' дельные фрагменты. При приеме каждого фрагмента необходимо выполнить большой объем специализированных операций с высоким быстродействием (формирование аналитического сигнала, создание дальномерных каналов, динамическая реконструкция сигналов и периодов следования для борьбы со «слепыми скоростями», интерполяция данных, формирование фазового фронта).
Для решения задач первичной обработки сигналов в режиме многомерной обработки требуется организация высокоскоростного приема и далее высокопроизводительной обработки информации.
Прием кадров, его фрагментов, разбиение выборки на кадры, кадров на фрагменты выполняются путем мультиплексирования информационного входного потока данных, определяемого конкретной задачей.
Актуальность задачи определяется возрастающей потребностью в высокопроизводительных системах ЦОС для различных областей применения:
- радиолокации;
- гидроакустических систем;
- мобильных систем телекоммуникаций и других высокотехнологичных направлений науки и техники.
Достижения в области микроэлектроники определили два направления проектирования систем ЦОС:
- конструирование специального оборудования СБИС для задач ЦОС на основе средств проектирования ПЛИС ( программируемых логических интегральных схем) с использованием различных систем автоматизированного проектирования;
- проектирование высокопроизводительных систем на базе процессоров DSP с кластерной шиной обмена или организацией многопроцессорной архитектуры с многоканальными шинами обмена между процессорами DSP и памятью.
Выбор архитектуры вычислительных средств для задач ЦОС прежде всего диктуется динамическими параметрами сигналов. Современные микропроцессорные технологии допускают широкий выбор методов и средств их решения. Реализация ЦОС на универсальных процессорах в основном предпочтительна для эмуляции ЦОС и при работе не в реальном масштабе времени. Стандартные процессоры как правило имеют аппаратный умножитель многоразрядных операндов. В то же время точность представления данных ЦОС ограничивается 8-16-тыо разрядами и избыточность ресурсов процессора в плане высокоскоростного выполнения арифметических многоразрядных операций оказывается невостребованной.
Появление особой разновидности микропроцессоров - цифровых сигнальных процессоров (08Р)-является качественным скачком, который способствовал дальнейшему развитию и совершенствованию методов цифровой обработки. В DSP на одном кристалле удалось совместить собственно высокопроизводительную цифровую обработку на основе аппаратно реализованного умножителя-накопителя с возможностью обеспечения разнообразных интерфейсов и, самое главное, реализовать гибкое изменение алгоритмов с учетом меняющихся требований за счет их программируемое™ при сравнительно небольшой цене микросхем DSP.
Для моделирования и построения ЦОС более предпочтительными оказываются специализированные процессоры цифровой обработки сигналов.
Путем наращивания числа процессоров в системе можно реализовать достаточно сложную и быстродействующую систему цифровой обработки. Возможности программируемых логических интегральных схем ПЛИС для построения ЦОС практически не ограничены. ПЛИС на одном кристалле позволяют построить достаточно большое число умножителей, работающих одновременно на достаточно высокой частоте (до 200 МГц). Большое количество внешних выводов ПЛИС, развитая структура быстродействующих межсоединений, повышенная скорость обмена между кристаллами, в совокупности, позволяют построить на основе ПЛИС законченный достаточно регулярный фрагмент ЦОС, а затем, осуществляя каскадирование ПЛИС простым соединением указанных для аппаратного каскадирования выводов, создавать ЦОС произвольной конфигурации и сложности.
Цель исследований диссертационной работы заключается в разработке вычислительных процессов многомерной пространственной обработки сигналов и построении на его основе высокопроизводительных вычислительных систем.
Исследования проводились по следующим направлениям.
1. Анализ архитектур высокопроизводительных вычислительных средств реального времени для решения задач ЦОС на основе:
- универсальных суперЭВМ;
- специализированных процессоров DSP;
- специализированных заказных средств проектирования на базе программируемой логики ПЛИС.
2. Исследование методов эффективного распараллеливания многопроцессорных систем для обслуживания специализированных абонентов реального времени с учетом накопленного опыта отечественных разработок.
3. Исследование методов многомерной цифровой обработки сигналов специализированных цифровых устройств СДЦ для ЛЧМ-сигнала РЛС кругового обзора, работающих в условиях сильных отражений от различных неподвижных предметов на основе алгоритма первичной обработки для ЛЧМ-сигнала. Определение состава и производительности узкоспециализированных процессоров.
4. Исследование информационных потоков многомерной обработки гидроакустических сигналов для выработки методов их цифровой реализации с учетом специфики потоков команд, потоков данных и адресных механизмов, что определило организацию высокопараллельного вычислительного процесса для ГАК, имеющего до 5000 источников информации.
На основе алгоритмов первичной обработки проведено определение плотности информационных потоков, их маршрутизация, оценены быстродействия методов их обработки, динамического редактирования, пространс-венно-временной-частотной фильтрации.
В работе отражены вопросы проектирования, связанные с организацией системы ввода/вывода для абонентов реального времени.
В системе первичной обработки сигналов возникает задача наращивания объектов ОЗУ, как в процессоре ввода/вывода, так и в процессоре обработки. Исполь'зуются оценки переполнения ОЗУ в предположении, что ОЗУ доступны всем абонентам, когда возникает вероятность переполнения.
Приводятся методы, определяющие зависимость быстродействия центрального процессора от интенсивности запросов абонентов.
Научная новизна работы заключается в разработке методик проектирования малогабаритных вычислительных систем ЦОС производительностью 20* 109 оп/с. для реализации задач пространственно-временной обработки сигналов.
Оценены основные информационные потоки источников сигналов и временные критерии их первичной обработки.
Выделены типовые вычислительные процессы цифровой реализации задач временной и пространственной фильтрации сигналов и определены требуемые производительности вычислительных средств для их решения.
Определены методы распараллеливания основных алгоритмов (многопроцессорность, конвееризация, фрагментирование).
Предложена специализированная многопроцессорная синхронная архитектура вычислительной системы, классифицированная с учетом потоков команд, потоков данных и адресных механизмов считывания данных.
Разработана технология реализации вычислительных систем ЦОС.
Работа проведена для двух вычислительных систем первичной обработки малогабаритной PJIC кругового обзора и гидроакустического комплекса.
Для PJIC кругового обзора разработана функциональная схема специализированного устройства селекции движущих целей (СДЦ) и определен состав его базовых модулей. Разработан метод быстрой цифровой реализации квазисогласованной фильтрации JI4M комплексных сигналов для каждого периода повторения PJ1C.
Создана процедура азимутальных фрагментов из 10 элементарных азимутальных направлений при круговом обзоре пространства. Введение процедуры азимутальных фрагментов уменьшает общее количество азимутальных направлений, подлежащих обработке, и сохраняет возможность точного измерения азимута.
Для устройства селекции движущихся целей на основе алгоритма подавления помех и выделения движущихся целей разработан быстрый цифровой метод его-реализации путем комбинации КИХ - фильтра 3-го порядка и процессора ДПФ, обеспечивающего фильтрацию доплеровских частот.
Для обнаружения движущихся целей разработан метод цифровой реализации на основе многоканального обнаружителя, выполняющего для каждого азимутального фрагмента и строба дальности в каждом доплеровском канале независимое обнаружение сигнала.
Для формирования порога обнаружения сигналов в устройстве селекции движущихся целей на основе алгоритма формирования усредненного значения помех в каждом элементе дальности для азимутальных фрагментов создан метод цифровой реализации с помощью цифрового фильтра нижних частот и рекурсивного цифрового фильтра.
Разработана вычислительная система первичной обработки для гидроакустического комплекса, приемная антенна которого содержит 5000 гидрофонов-приемников информации. Предложена и технически реализована архитектура универсальной реконфигурируемой системы цифровой обработки многомерных сигналов на основе потоковой многоканальной конвейерной обработки информации и разработаны методы цифровой реализации алгоритма многомерной обработки сигналов для абонентов ГАК.
Разработаны технические решения проектирования процессоров цифровой обработки сигналов на основе современных программируемых логических ПЛИС фирм Altera.
Результаты работы, выносимые на защиту:
Вычислительная система селекции движущихся целей (СДЦ), состав ее базовых модулей и обеспечение требуемой производительности узкоспециализированных процессоров:
- процессора цифровой обработки сигналов (ПЦОС) с быстродействием 2,64 О9 оп/с;
- процессора обработки пачечных сигналов (ПОПС) с быстродействием 20-106 оп/с;
- процессора обнаружения движущихся целей (ПОДЦ) с быстродействием 45' 106 оп/с;
- процессора формирования кода порога (ПФКП);
- процедура фрагментирования азимутальных направлений СДЦ.
Способ организации вычислительного процесса многопроцессорной высокопроизводительной синхронной системы обработки гидроакустических сигналов ГАК, с учетом специфики потоков команд, потоков данных и адресных механизмов считывания данных для многомерной обработки сигналов, обеспечивающих высокопроизводительную обработку многоканальных .потоков сигнальной информации.
Классификация и сравнительный анализ основных направлений аппаратной реализации высокопроизводительных устройств цифровой обработки сигналов.
Техническая реализация построения процессоров цифровой обработки сигналов на основе ПЛИС.
Основные результаты работы.
Основным результатом диссертационной работы является построение вычислительных процессов цифровой реализации алгоритмов первичной обработки сигналов и проектирование на основе этих решений высокопроизводительных вычислительных систем различного применения.
Предложена и реализована система цифровой обработки селекции движущихся целей для РЛС кругового обзора, состоящая из нескольких узкоспециализированных процессорных модулей.
Для ГАК, имеющего до 5000 источников информации, предложена и аппаратно реализована организация вычислительного процесса, в которой помимо распараллеливания на 48 каналов, включены средства адресации информационных и управляющих потоков. Такой процессор первичной обработки имеет производительность до 20Т0 оп/с для формирования пространственных характеристик сигналов и выполняет временную фильтрацию на основе алгоритма БПФ с производительностью 5" 109 оп/с.
Реализована параллельная синхронная многопроцессорная вычислительная архитектура для проектирования малогабаритных систем ЦОС производительностью 20" 109 оп/с.
При проектировании современных гидроакустических комплексов и цифровых устройств селекции движущихся целей использованы как ПЛИС технологии, так и процессоры DSP разработки фирм TI и AD.
Для выполнения этих задач были проведены исследования и получены следующие результаты:
- проанализированы архитектурные особенности синхронной многопроцессорной вычислительной системы, ориентированной на естественный параллелизм данных;
- предложена и реализована функциональная схема устройства селекции движущихся целей для РЛС кругового обзора;
- предложен и реализован сверхпараллельный способ организации вычислительного процесса для систем ГАК.
Результаты работы используются при проектировании современных высокопроизводительных систем ЦОС различного назначения в разработках ОАО НИИВК им. М.А. Карцева.
По теме диссертации опубликовано 12 печатных работ.
Практическая ценность результатов.
Разработанные при участии автора узлы устройства управления в составе суперЭВМ нашли применение в изделиях М10, 13М6-02 и созданных на их основе комплексах (63И6, 68И6 и др.).
Разработки специализированных процессоров проведены по темам:
- ОКР "Магнолия-ЦВК" - разработки и создания специализированных вычислительных процессоров СДЦ;
- в изделии Л-01 для стендового и опытного образца ЦВК обработки-гидроакустической информации;
- ОКР "МАТЭКС" при создании специальных СБИС и модулей обработки сигналов;
- ОКР "Образ" при создании специализированного вычислительного комплекса для обработки информации ультразвукового диагностического аппарата.
Внедрение результатов работы отражено в актах.
Заключение диссертация на тему "Проектирование высокопроизводительных систем цифровой обработки сигналов"
Результаты работы используются при проектировании современных £ высокопроизводительных систем ЦОС различного назначения в разработках
ОАО НИИВК им. М.А. Карцева.
Заключение.
Основным результатом диссертационной работы является определение методики проектирования систем ЦОС, которая включает построение вычислительных процессов цифровой реализации алгоритмов первичной обработки сигналов и проектирование на основе этих решений высокопроизводительных вычислительных систем многомерной обработки сигналов.
Разработана вычислительная система цифровой обработки СДЦ для РЛС кругового обзора, состоящая из узкоспециализированных процессорных модулей общей производительностью 2.6Т09 оп/с .
Для ГАК, имеющего до 5000 источников информации, предложена и реализована организация вычислительного процесса, в которой помимо распараллеливания на 48 каналов, включены средства адресации информационных и управляющих потоков. Такой процессор первичной обработки имеет производительность до 20Т09 оп/с для формирования пространственных характеристик сигналов и выполняет временную фильтрацию на основе алгоритма БПФ с производительностью 5 * 109 оп/с.
При проектировании современных гидроакустических комплексов и цифровых устройств селекции движущихся целей использованы как ПЛИС технологии, так и процессоры DSP разработки фирм TI и AD.
Для выполнения этих задач были проведены исследования и получены следующие результаты:
- проанализированы архитектурные особенности синхронной многопроцессорной вычислительной системы, ориентированной на естественный параллелизм данных;
- предло.жен и реализован сверхпараллельный способ организации вычислительного процесса для систем ГАК;
- предложена и реализована функциональная схема устройства селекции движущихся целей для РЛС кругового обзора.
Библиография Баранов, Лев Дмитриевич, диссертация по теме Вычислительные машины и системы
1. Гливенко Е.В. Параллельный процессор первичной обработки информации. - М.: Радио и связь, 1992.
2. Дорохин С.А. Высокопроизводительные процессоры цифровой обработки сигналов 2000 года. //Цифровая обработка сигналов. -1999. -№1.
3. Баранов Л.Д. и др. Вариант включения процессора серии TMS для решения задач ЦОС. //Вопросы радиоэлектроники. М., 2001. - Серия ЭВТ, вып. 1.
4. Баранов Л.Д. Некоторые особенности архитектуры процессоров цифровой обработки сигналов. //Вопросы радиоэлектроники. М., 2002. - Серия ЭВТ, вып. 1.
5. Карцев М.А., Баранов Л.Д., Миллер Л.Я. и др. Вычислительный комплекс 63Мб: техническое описание. /НИИВК, 1977. Фг1.701.003 ТО.
6. Златников В.М., Петрова Г.Н. Вариант организации машины реляционной базы данных на вычислительной системе ПАРС. //Вопросы радиоэлектроники. М., 1994. - Серия ЭВТ, вып.4.
7. Баранов Л.Д., Миллер Л.Я. и др. Изделие 13М6-02: техническое описа-¥ ние.-Том 1./НИИВК, 1984.-Фг1.700.004-02 ТО.
8. Баранов Л.Д. и др. Устройство управления ЭВМ Ml0.//Вопросы радиоэлектроники, -М., 1980.-Серия ЭВТ, вып.9, -С. 15-30.
9. Карцев М.А. Архитектура цифровых вычислительных машин. М.: Наука, 1978.
10. Брик В.А., Карцев М.А. Вычислительные системы и синхронная арифметика. -М.: Радио и связь, 1981.
11. Э. Иодан. Структурное проектирование и конструирование программ. Перевод с, английского. М.: Мир, 1979.
12. Бакулев П.А., Степин В.М. Методы и устройства селекции движущихся целей. -М.: Радио и связь, 1986.
13. Бахтиаров Г.Д., Баранов Л.Д., Златников В.М. Специализированное цифровое устройство селекции движущихся целей. //Вопросы радиоэлектроники. М., 2003. - Серия ЭВТ, вып.2.
14. Рабинер Л., Гоулд Б. Теория применение цифровой обработки сигналов. Перевод с английского под редакцией Ю.Н. Александрова. М.: Мир, 1978.
15. Баранов Л.Д. Высокопроизводительная система цифровой обработки сигналов. //Вопросы радиоэлектроники. М.,2002. - Серия ЭВТ, вып.1.
16. THE TMS 320С6201/С6701 Peripherals Reference Guide (SPPU 190).
17. Дорохин С.А. К вопросу отладки многопроцессорных систем цифровой обработки сигналов (ЦОС). //Вопросы радиоэлектроники. -М., 2003. -Серия ЭВТ, вып.2.
18. Баранов Л.Д., Латышов А.А. Развитие средств ввода-вывода ЭВМ семейства «М». //Вопросы радиоэлектроники. М., 2003. - Серия ЭВТ, вып.2.
19. Бочин Б.И., Ильицкая Л.С., Латышов А.А., Мельник Ю.Н. и др. Устройство для управления каналами ввода-вывода. 1086422 СССР, МКИ 606 F3/04. -1984.
20. Венцель Е.С. Теория вероятностей. М.: Наука, 1964.
21. Овчаров Л.А. Прикладные задачи теории массового обслуживания. М.: Машиностроение, 1969.
22. Мухтарулин B.C. Основные направления создания устройств цифровой обработки сигналов. //Вопросы радиоэлектроники. М.,2000. - Серия ЭВТ, вып. 1.
23. Семёнов Ю.В., "FT8U245AM в интерфейсе USB", http://www.kulakov.ru/usb.htm.
24. ADSP-TS201 TigerSHARC Processor Hardware Reference, Revision 0.2, Link Ports.
25. Virtex-II Platform FPGAs: Advance Product Specification, 2002.
26. FT8U245AM Preliminary Information Rev 0.9.
27. Баранов Л.Д., Бахтиаров Г.Д., Златников B.M. Цифровая обработка радиолокационных сигналов и DDC технологии. //Радио промышленность. -М., 2004.
28. Антонов-Антипов Ю.Н., Баранов Л.Д., Златников В.М. Унифицированное цифровое квадратурное преобразование сигналов ФМ-2 с реализацией на ПЛИС. //Вопросы радиоэлектроники. М.,2004. - Серия ЭВТ, вып.1.
29. Баранов Л.Д., Златников В.М., Кучернюк И.Н. Специализированный процессор диспетчеризации информационных потоков высокопроизводительной системы цифровой обработки сигналов. //Вопросы радиоэлектроники. М., 2004. - Серия ЭВТ, выпЛ.
30. DIGITAL SIGNAL PROCESSING. DATABOOK 1990г. CHAPTER 13, IMAGE PROCESSING WITH THE IMS A100.
31. Баранов Л.Д, Калинин М.И. Цифровой понижающий преобразователь-устройство цифровой обработки сигналов в системах связи. //Вопросы радиоэлектроники. М., 2005. - Серия ЭВТ, вып. 1.
32. Баранов Л.Д. Вопросы проектирования высокопроизводительных систем первичной обработки сигналов. VI Международный форум "Высокие технологии XXI века".- М., 2005.
33. Баранов Л.Д. Новые технологии проектирования высокопроизводительных систем ЦОС. VI Международная конференция "Кибернетика и высокие технологии XXI века".- Воронеж, 2005.
-
Похожие работы
- Синтез вычислительных ядер цифровой согласованной фильтрации радиолокационных сигналов на современной элементной базе
- Математическое и программное обеспечение систем автоматизации проектирования цифровых систем обработки сигналов
- Разработка и исследование быстрых цифровых алгоритмов обнаружения и демодуляции узкополосных сигналов
- Микроэлектронные системы цифровой регистрации широкополосных сигналов
- Цифровые системы слежения и обработки поляризованного сигнала
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность