Эффективные вычисления в архитектуре CUDA в приложениях информационной безопасности

Желтов, Сергей Александрович

Методы и системы защиты информации, информационная безопасность

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.19, диссертация на тему:Эффективные вычисления в архитектуре CUDA в приложениях информационной безопасности

кандидата технических наук: Желтов, Сергей Александрович
город: Москва
год: 2015
специальность ВАК РФ: 05.13.19

Автореферат по информатике, вычислительной технике и управлению на тему «Эффективные вычисления в архитектуре CUDA в приложениях информационной безопасности»

Автореферат диссертации по теме "Эффективные вычисления в архитектуре CUDA в приложениях информационной безопасности"

На правах рукописи

Желтов Сергей Александрович

ЭФФЕКТИВНЫЕ ВЫЧИСЛЕНИЯ В АРХИТЕКТУРЕ С1ГОА В ПРИЛОЖЕНИЯХ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ

Специальность 05.13.19 - Методы и системы защиты информации, информационная безопасность 05.13.17 - Теоретические основы информатики

Автореферат диссертации на соискание ученой степени кандидата технических наук

2 5 ПАР т

Москва 2015

005561074

Работа выполнена на кафедре комплексной защиты информации федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Российский государственный гуманитарный университет» (РГГУ).

Научный руководитель:

доктор технических наук Баранович Андрей Евгеньевич

Официальные оппоненты:

Рожков Михаил Иванович доктор технических наук,

кафедра компьютерной безопасности МИЭМ НИУ Высшей школы экономики

Шепитько Григорий Евдокимович доктор технических наук профессор, кафедра защиты информации Московского финансово-юридического университета

Ведущая организация:

Московский государственный университет имени М.В.Ломоносова

Защита состоится « 23 » апреля 2015 года в 14:00 часов на заседании диссертационного совета Д 212.198.13, созданного на базе РГГУ, по адресу: 125993, ГСП-3, Москва, Миусская площадь, д. 6, ауд._.

С диссертацией можно ознакомиться в библиотеке Российского государственного гуманитарного университета по адресу: 125993, ГСП-3, Москва, Миусская площадь, д. 6 и на официальном сайте организации по адресу http://dissovet.rggu.ru/.

Автореферат разослан « ^ » 2015 года.

Ученый секретарь диссертационного совета кандидат технических наук

абелинский Александр Анатольевич

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Современный этап развития информационно-коммуникационных технологий характеризуется существенным повышением производительности вычислительных систем, одним из основных факторов увеличения вычислительной мощности является задействование графических процессоров. Массовым образцом, наиболее эффективно используемых на практике графических процессоров (GPU - graphics processing unit) для организации общих вычислений, является видеоускорители компании nVidia с архитектурой CUDA (Compute Unified Device Architecture).

В настоящее время платформа параллельных вычислений CUDA широко используется в медицине (системы трехмерного ультразвукового сканирования), различных мультимедийных приложениях, требующих быстрой конвертации графических изображений, научных исследованиях: в сфере молекулярной динамики, гидродинамике и других областях, требующих больших вычислительных мощностей.

Использование технических решений nVidia существенно увеличило производительность, как суперкомпьютеров, так и персональных компьютеров, укомплектованных графическими платами с архитектурой CUDA.

Вместе с тем относительно низкие стоимость и удельное энергопотребление в сочетании с высокой производительностью графических процессоров с поддержкой CUDA значительно обострили проблему оценки технических возможностей потенциального нарушителя информационной безопасности (ИБ) автоматизированных систем (АС) и создали серьезные предпосылки для формирования новых угроз ИБ АС, средства защиты которых базируются на вполне определенных трудноразрешимых вычислительных задачах. Возможности применения распределенных параллельных вычислений при решении задач защиты информации исследовались ранее в работах Бабенко Л. К., Сидорова И. Д. и др. При этом, как правило, подразумевалось использование многопроцессорных систем, т. е. объединенных коммуникационными каналами вычислительных узлов на базе процессоров стандартной архитектуры. Некоторым особняком стоят работы Барановича А. Е., посвященные

организации параллельных вычислений в распределенной потоковой (функционально конвейерной) системе активной защиты информационной инфраструктуры.

Отсутствие задержек на передачу данных между вычислительными узлами и синхронизацию результатов при использовании графических процессоров с архитектурой С1ГОА принципиально меняют условия применения параллельных вычислений при решении задач защиты информации.

В обычных условиях при создании полноценной системы защиты информации в коммерческих АС, решается задача разработки политики безопасности. Как правило, основное внимание при этом уделяется формальным моделям разграничения доступа, безопасности операционных систем и методам криптографической защиты информации.

Основные результаты в этом направлении изложены в работах В. Галатен-ко, В. Герасименко, А. Грушо, П. Зегжда, К. Лендвер, М. Ранум, А. Баранович и др. С другой стороны многие вопросы, касающиеся оценки технических возможностей потенциального нарушителя ИБ АС, практически не рассматриваются. В частности, применение существующих методик оценки возможностей нарушителя не учитывает фактор, потенциального увеличения вычислительной мощности доступных ему технических средств за счет использования ресурсов графических ускорителей С1ЛЭА. Последнее приводит к неадекватному отображению реальных условий функционирования объекта зашиты, с точки зрения возможных противоправных действий в его отношении. При этом могут неверно оцениваться и действительные риски реализации новых угроз безопасности АИС (автоматизированная информационная система).

Риски реализации новых угроз безопасности, связанные с вышеперечисленными обстоятельствами, можно оценить по средствам:

• теоретической оценки вычислительной сложности алгоритмов, адаптированных к выбранной вычислительной архитектуре;

• проведения вычислительных экспериментов, позволяющих прагматически охарактеризовать ресурсы, необходимые и достаточные для преодоления подсистемы защиты конкретной АИС.

Оба способа взаимно дополняют друг друга и позволяют уточнить и детализировать риски безопасности, что, в свою очередь, дает возможность обеспечить безопасное функционирование АИС в условиях интенсивного развития информационных технологий.

Последнее обстоятельство предопределяет необходимость создания механизмов оперативной оценки технических возможностей потенциального нарушителя безопасности АИС при появлении новых средств вычислений.

В основу указанных механизмов должны бьггь положены новые подходы к оценке эффективности реализации параллельных алгоритмов и методика практической апробации новых вычислительных технологий в отношении их влияния на уровень технических возможностей потенциального нарушителя и, как следствие, на уровень защищенности АИС.

С точки зрения проблемы утечки конфиденциальной информации из защищенной АИС, ограниченного объема (с небольшим числом конечных пользователей), можно предложить задействовать GPGPU (General-purpose graphics processing units) CUDA в качестве альтернативного оборудования для развертывания систем DLP (Data Loss Prevention) и DPI (Deep Packet Inspection), которые анализируют содержимое сетевых пакетов, используя лингвистический анализ. В этом случае для поддержания функций защиты надо постоянно решать задачу тематической текстовой классификации (работы Пескишевой Т.А. и Котельникова Е.В.).

Выше перечисленные обстоятельства обосновывают актуальность диссертационной работы.

Целью диссертации является оценка возможности реализации вполне определенных угроз безопасности АС при использовании нарушителем гетерогенных систем с графической платформой CUD А.

Объектом исследования является архитектура CUDA с реализованной технологией общих вычислений в отношении возможности ее использования для решения ряда задач, сложность решения которых определяет уровень защищенности АС.

Предмет исследования - угрозы информационной безопасности, возникающие (формирующиеся) в отношении АС, при задействовании средств параллельных вычислений GPGPU с архитектурой CUDA для преодоления механизмов их защиты.

Для достижения поставленной цели в диссертационном исследовании решены следующие задачи:

• исследовать особенности организации параллельных вычислений при использовании различных вычислительных средств;

• проанализировать удельные показателей производительности, энергопотребления и стоимости графических и универсальных процессоров;

• оценить эффективность организации параллельных вычислений в гетерогенных вычислительных системах с архитектурой CUDA;

• адаптировать к архитектуре CUDA и программно реализовать алгоритмы метода Ш. Лемана решения задачи факторизации целых чисел и р-метода Полларда решения задачи дискретного логарифмирования в конечном поле;

• разработать методики оценки параллельных алгоритмов и программ, реализуемых в архитектуре CUDA, и общей экспериментальной апробации возможностей перспективных вычислительных систем на основе проведенного компьютерного моделирования решения задач адаптированными алгоритмами, полученных оценок эффективности и анализа удельных показателей гетерогенных систем на базе GPU вычислителей в отношении угроз и рисков ИБ;

• сформулировать рекомендации к системам обеспечения ИБ АС.

Методы исследований. В работе использовались методы системного анализа и теории чисел, алгебраических систем и конечных полей, теория сложности дискретных алгоритмов, теория параллельных вычислений, теоретические основы ИБ и математического моделирования.

Реализация результатов работы. Основные результаты диссертации.

1. Разработаны и программно реализованы параллельные алгоритмы метода Ш.

Лемана решения задачи факторизации целых чисел и р-метод Дж. Полларда

решения задачи дискретного логарифмирования в конечном поле, адаптированные к архитектуре CUDA.

2. Предложена методика оценки операционной сложности параллельных алгоритмов, реализованных в гетерогенных архитектурах с вычислителями CPU и GPGPU CUDA.

3. Получена сравнительная оценка технологии CUDA с точки зрения эффективности параллельных вычислений и получаемого при этом ускорения времени решения задач.

4. Проанализированы основные удельные показатели эффективности, характеризующие технологические решения CUDA: энергоэффективность, экономическая эффективность и удельное энергопотребление. Использованные показатели позволяют сравнивать вычислительные устройства CUDA с традиционными технологиями последовательных вычислений.

5. Сформулирована методика практической апробации вычислительных систем в отношении рисков реализации угроз ИБ при их использовании.

6. Выработаны рекомендации и сформулированы требования по уточнению уровня защищенности компонентов систем ИБ, основанных на сложности решения задач факторизации и дискретного логарифмирования в конечном поле при использовании гетерогенных вычислительных систем на базе графических процессоров.

Результаты работы использованы в исследованиях НИИ информационных технологий г. Тверь. Внедрены в учебный процесс и используются в разработанном на кафедре компьютерной безопасности и математических методов управления (КБиММУ) Тверского государственного университета (ТвГУ) курсе «Теоретико-числовые методы в криптографии».

Программные решения, предложенные в работе, защищены двумя авторскими свидетельствами об официальной государственной регистрации программы для ЭВМ № 2012612996: «Параллельный метод Шермана Лемана для архитектуры CUDA» (зарегистрировано в Реестре программ для ЭВМ 27.03.2012 г.) и №

2012615259: «Параллельный р-метод Полларда для архитектуры С1ЮА» (зарегистрировано в Реестре программ для ЭВМ 9.06.2012 г.).

Научная новизна работы характеризуется отсутствием:

- законченных результатов по исследованию эффективности использования аппаратных ресурсов с архитектурой СЦГОА при решении вычислительных задач, сложность решения которых обуславливает уровень защищенности АС;

- адаптированных алгоритмов и практических рекомендаций по оценке и совершенствованию систем защиты АС (по открытым источникам).

Разработанный подход к оценке асимптотической сложности параллельных алгоритмов и предложенные методики развивают ряд положений теории сложности дискретных алгоритмов и методов моделирования систем защиты АС.

Практическая значимость работы состоит в том, что разработанная совокупность методик позволяет проводить обоснованный выбор рациональных вариантов механизмов защиты АС и обеспечить требуемый уровень ее защищенности с учетом существующих сценариев развития технического прогресса.

Достоверность и обоснованность полученных результатов обеспечивается применением корректных исходных данных, апробированного аппарата исследований, проверкой непротиворечивости и адекватности промежуточных и окончательных положений и выводов и подтверждается экспериментальными данными, полученными в ходе исследования при разработке программных реализаций алгоритмов.

Апробация работы. Основные положения диссертации в период 2010 -2013 г.г. апробированы на II - IV международных конгрессах по интеллектуальным системам и информационным технологиям А18-1Т'2011, А13-1Т'2012, А18-1Т'2013 (секция «Информационная безопасность»), международной научно-практической конференции «РусКрипто'2012» (секция «Перспективные исследования в области кибербезопасности»), IV Международной научной конференции «Фундаментальные проблемы системной безопасности и устойчивости» (секция «Безопасность сложных технических систем»), расширенных заседаниях кафедр комплексной защиты информации, общей информатики и фундаментальной и прикладной математики ИИНТБ РГТУ, объединенных методологических семинарах Центра системного ана-

лиза и моделирования мышления ИИНТБ РГГУ, заседаниях кафедры КБиММУ ТвГУ, научно-технических семинарах математического факультета ТвГУ (20102013 гг.)

Публикации. По результатам исследований опубликовано 9 печатных работ, из которых 4 - опубликованы в изданиях из числа рекомендованных ВАК для опубликования результатов диссертационных исследований.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, перечня сокращений и использованных источников, а также пяти приложений. Работа представлена на 145 страницах машинописного текста, включает 15 таблиц, 21 рисунок, библиографию из 131 наименования. Основные положения, выносимые на защиту:

• оценки эффективности использования GPGPU при решении задач факторизации и дискретного логарифмирования и рекомендации по совершенствованию критериев защищенности АС;

• параллельные алгоритмы метода Ш. Лемана решения задачи факторизации целых чисел и р-метода Дж. Полларда решения задачи дискретного логарифмирования в конечном поле, адаптированные к архитектуре CUD А, и их программные реализации;

• методика оценки операционной сложности параллельных алгоритмов, реализуемых на гетерогенных архитектурах с вычислителями типа CPU и GPGPU с технологией CUD А;

• методика практической апробации вычислительных систем в отношении рисков реализации угроз ИБ при их использовании.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована актуальность темы, сформулированы цель, предмет и объект исследования, отражены научная новизна результатов и их практическая значимость, приведены положения, выносимые на защиту, представлена структура диссертации и ее содержание по разделам.

В первой главе - «Постановка задачи исследования» - приводится общая характеристика предметной области исследования. Рассматривается ряд новых уг-

роз ИБ и анализируются риски их реализации. Отмечается, что наряду с основными известными угрозами ИБ существенный рост общедоступных нарушителю вычислительных мощностей представляет угрозу ИБ, в частности, в отношении снижения уровня защищенности ряда асимметричных систем защиты, практическая стойкость которых базируется на сложности решения некоторых трудноразрешимых вычислительных задач. Выделены основные факторы, влияющие на увеличение производительности вычислительных систем в целом:

• рост производительности выделенных вычислительных устройств;

• организация массовых вычислений в совокупности устройств, в том числе, и мобильных;

• использование эффективных моделей вычислений на существующих классах архитектур.

В рамках классической модели вычислений А. Тьюринга - Дж. Неймана основным направлением снижения временных затрат является распределение требуемого объема информационно-вычислительной работы по совокупности параллельно работающих вычислителей. В первую очередь рост производительности вычислительных систем нарушителя порождает угрозы ИБ для парольных систем защиты. Их стойкость обусловлена невозможностью эффективной реализации метода грубой силы и недостаточностью вычислительных средств у потенциального нарушителя. Использование параллельных вычислений на базе графических процессоров может существенно повысить эффективность атак методом тотального перебора.

По данным Internet World Stats число пользователей сети Интернет в 2011 году превысило 2-Ю9, что с учетом иных классов вычислительных устройств дает общее представление о реальном количестве потенциально доступных вычислительных устройств массового пользования. Одной из основных составляющих прироста мощности вычислительных систем в настоящее время можно считать использование эффективных моделей вычислений на существующих классах параллельных архитектур гетерогенных систем на базе графических процессоров. Существенную часть (до 60%) рынка общедоступных графических карт занимает компания

nVidia, вычислители которой реализованы по технологии, основанной на архитектуре CUDA.

Эти обстоятельства определяют особую актуальность вопросов обеспечения безопасности АС, основными элементами которой являются построение модели потенциального нарушителя и необходимость наличия адекватных механизмов оценки технических возможностей, доступных противнику в настоящий момент. Такие механизмы должны реализовать новое качество - своевременное определение угроз для конкретной информационной системы, выявление потенциальных нарушителей, прогнозирование их возможностей, намерений, тактики действий и уточнение одной из важнейших характеристик модели нарушителя — уровня его технической подготовленности (оснащенности). Определение вычислительных возможностей потенциального нарушителя позволяет оценить уровень практической реализации угроз.

Вторая глава — «Параллельные вычисления в архитектуре CUDA» — посвящена обзору известных архитектур параллельных вычислительных систем и способов организации параллельных вычислений. Излагаются результаты краткого обзора наиболее известных реализаций российских и зарубежных параллельных вычислительных систем.

Рассмотрены различные варианты реализации технологии GPGPU (использования графического процессора для выполнения расчетов в приложениях общих вычислений) и особенности их применения для организации параллельных вычислений. На сегодняшний день технология GPGPU CUDA является фаворитом в данной области. Другие технологии, в том числе и ATI Stream, пока не имеют такой развитой аппаратно-программной базы, как у nVidia. Постоянный технический прогресс в развитии графических чипов общего назначения, а также стремительное развитие nVidia CUDA SDK позволяют считать компанию nVidia лидером в области высокопроизводительных вычислений с использованием GPGPU.

Обоснован выбор технологических платформ на базе ускорителей с архитектурой CUDA. Приводится описание особенностей конфигурации параметров ее программного ядра и видов графической памяти. В основе CUDA API лежит язык

Си. Организация аппаратной многопоточности позволяет более полно задействовать ресурсы графического процессора.

В главе сформулированы требования к архитектурным принципам вычислительной среды параллельных вычислений и свойствам алгоритма, характеризующим его способность к распараллеливанию. Рассмотрены общепринятые критерии интегральной эффективности организации параллельных вычислений: ускорение

параллельной реализации относительно последовательной а = — и эффектив-

Tf,

ность Е = — = , где 7j - время решения некоторой вычислительной задачи с по-к кТк

мощью последовательной программы, выполняемой на одном процессоре (CPU), Тк - время решения с помощью «параллельной» программы, выполняемой на к процессорах.

В третьей главе - «Алгоритмы решения задач факторизации и дискретного логарифмирования» — на основе анализа различных методов и алгоритмов для адаптации к параллельным вычислениям в архитектуре CUDA выбраны метод Ш. Немана и р-метода Дж. Полларда. Описываются основные идеи, используемые в методах, обосновывается корректность и сходимость алгоритмов и приводится их формальное описание.

Для получения теоретических оценок сложности параллельных алгоритмов, выполняемых на вычислительной системе с графическими процессорами, разработана методика оценки операционной сложности параллельных алгоритмов, реализованных в гетерогенных архитектурах с вычислителями CPU и GPGPU CUDA [9].

Методика 1.

1. Полагаем время выполнения элементарных команд и арифметических операций на центральном и графическом (GPGPU CUDA) процессорах одинаковым.

2. Полагаем сложность операций присваивания, ввода и вывода порядка O(const) * O(l).

3. Сложность операции передачи данных из оперативной памяти в память GPU вычислителя считаем равной 0(const) ~ O(l). Обратная операция имеет оценку такого же порядка.

4. Оценка одной параллельной нити, как и последовательных фрагментов алгоритма, производится согласно правилам анализа программ (алгоритмов)1.

5. Если количество параллельных нитей достаточно, то выполняем пункт 6. Иначе

+ 1,

s - количество нитей, h — размерность распараллеливаемой задачи, Ti - оценка ;-ой нити.

6. Число операций алгоритма, выполняемых параллельно на ¿-экземплярах нитей GPU-вычислителя, оценим как операционную сложность одной нити с максимальным временем выполнения, т. е. 0(тах(7^)), где 7] - оценка /-ой нити.

Предложенная методика позволяет:

- определить возможность практической применимости параллельного алгоритма;

- оценить требуемые вычислительные мощности (количество параллельных графических процессоров) для решения конкретной задачи;

- провести сравнительный анализ сложности нескольких параллельных алгоритмов, адаптированных к гетерогенным архитектурам на базе GPU-ускорителей.

С использованием данной методики получены теоретические оценки сложности параллельных алгоритмов, реализующих методы Ш. Лемана и р-метода Дж. Пол-ларда, в предположении, что количество доступных вычислительных элементов GPU (нитей) не менее чем необходимо для данной размерности задачи. Это означа-

оценка данного параллельного фрагмента составит 0(/тах(7^)), где / =

1 Ахо А., Хопкрофт Дж., Ульман Дж. Структуры данных и алгоритмы.: Пер. с англ.: Уч. пос. — М.: Издательский дом "Вильяме", 2000.

ет, что на графическом процессоре можно задать такую конфигурацию программного ядра, при которой значение /=/, т. е. s<h.

Утверждение 1. Параллельный алгоритм Ш. Немана, адаптированный к архитектуре CUDA, выполняемый на гетерогенной системе с достаточным количеством GPU-вычислителей, имеет асимптотическую оценку o{ifn Ig2 иj, где t = fig«],

п — факторизуемое число А

Утверждение 2. Параллельный алгоритм р-метода Полларда с псевдослучайной функцией заданной соотношением

&с(, если 0 < xt < ^ р,

2 1 х, ,если ~P<Xi <-р,

ах,,если —р<х1 < р.

где а,Ъ е Fp, р — простое число, а — образующий элемент мультипликативной группы поля F , х е Z, и адаптированный к архитектуре CUDA, выполняемый на гетерогенной системе с достаточным количеством GPU-вычислителей, имеет асимптотическую оценку O^fp log2 р^ М

Четвертая глава - «Компьютерное моделирование методов Лемана и р-метода Полларда» - посвящена экспериментальному обоснованию полученных результатов, оценке эффективности параллельных вычислений на GPU с архитектурой CUDA, сравнительному анализу удельных показателей эффективности графических и центральных процессоров.

Представлены сравнительные оценки времени работы параллельной и последовательной реализаций исследуемых алгоритмов. Результаты экспериментов по оценке временных затрат на решение задач факторизации целых чисел и дискретного логарифмирования в конечном поле при использовании последовательного и параллельного алгоритмов в различных условиях их постановки проиллюстрированы соответствующими графиками.

В силу особенностей организации параллельных вычислений в архитектуре CUDA для оценки ускорения решения задачи на гетерогенной системе с графическими процессорами использовано отношение времени работы параллельного алгоритма к вычислительной мощности (производительности) модели GPU устройства.

Динамика ускорения процесса решения задачи методом Ш. Лемана при использовании параллельных вычислений отражена на графике, приведенном на рис. 1.

- . - -34

би т

—• а--36

би т

- Х- - 38

би

142,08

385,9 ГФлопс

1088,6

Рис. 1. Зависимость ускорения процесса решения задачи методом Ш. Лемана от производительности GPU для различных значений размерности факторизуемого числа

Интегральная эффективность параллельных вычислений определена как отношение ускорения процесса вычислений (решения задачи) к количеству вычислительных ядер (CUDA cores)

где к - количество ядер GPU устройства.

Зависимость эффективности параллельных вычислений от мощности GPU-устройств представлена на рис. 2.

Как видно из представленных графиков, зависимость параметров ускорения и эффективности практически не зависят от размерности задачи.

Рис.2. Зависимость эффективности параллельных вычислений от мощности GPU

Динамика ускорения процесса решения задачи дискретного логарифмирования при использовании параллельных вычислений представлена на рис. 3.

400,00

350,00

300,00

| 250,00 ф

о 200,00 и

150,00 100,00 50,00 0,00

Г- —

396

1088,6

ГФлопс

Рис.3. Зависимость ускорения процесса решения задачи дискретного логарифмирования р-методом Полларда от производительности GPU для различных значений размерности модуля р

Помимо выше рассмотренных параметров эффективности, важнейшими характеристиками вычислительных систем для конечного потребителя (потенциального нарушителя ИБ) являются их стоимость и энергопотребление оборудования. Достаточно часто именно эти параметры определяют степень успеха продаж определенного технического решения на рынке, что, в свою очередь, влияет на массовое распространение технологических платформ данного типа. В работе проанализиро-

ваны основные показатели стоимости и энергопотребления при увеличении производительности за счет использования графических процессоров. Возможность повышения вычислительной мощности средств преодоления защиты при малых удельных материальных затратах влечет расширение круга потенциальных нарушителей ИБ.

Графические процессоры имеют низкую стоимость одного гигафлопса среди рассматриваемых вычислительных устройств, что сходится с оценками (для вычислителей компании nVidia), приведенными в открытой печати. С этой точки зрения высокопроизводительные решения на основе CUDA являются наиболее привлекательными.

Параметром, отражающим взаимосвязь производительности устройства и его потребляемой мощности, является удельная энергоэффективность. Последняя определяется как отношение производительности (вычислительной мощности) устройства к его энергопотреблению. Стоит отметить очень высокую удельную производительность вычислителей с архитектурой CUDA (рис. 4) при малом удельном энергопотреблении. Высокое удельное энергопотребление характерно именно для

центральных процессоров (см. рис. 5)

Intel Intel GT 240 GTX Tesla Tesla

Core 2 Core

Core 2 Core 560 K20 K20X

Duo ¡5-2400 E7500

Рис.4. Удельная производительность центральных и графических процессоров

Core 2 Core 240 560 K20 K20X Duo ¡5-E7500 2400

Рис.5. Удельное энергопотребление центральных и графических процессоров

Другим важным сравнительным показателем различных вычислительных устройств является их удельная экономическая эффективность, определяется как отношение вычислительной мощности к стоимости оборудования. Из рис.6 следует, что удельная экономическая эффективность наиболее высока не у специализированных решений компании nVidia, ay малобюджетных графических карт.

0.25 т'

™ Intel Intel GT240GTX560 Tesla Tesla

* Core 2 Core 15- K20 K20X

" Duo 2400

E7500

Рис.6. Экономическая эффективность

Сравнительный анализ использованных показателей показывает, что для повышения индивидуальной вычислительной мощности существенно выгоднее использовать графические процессоры с технологией CUDA, как наиболее эффективные с точки зрения удельной производительности и удельного энергопотребления при относительно невысокой стоимости. По параметрам производительности и энергопотребления (при одинаковых материальных затратах на оборудование для

систем с графическими и центральными процессорами) системы с архитектурой CUD А более чем в 10 раз превышают вычислительные способности центральных процессоров.

В завершении главы IV представлена методика «практической апробации вычислительных систем в отношении рисков реализации угроз ИБ при их использовании».

Методика 2.

1. Исследовать программно-аппаратные особенности архитектуры апробируемой вычислительной системы.

2. Исходя из особенностей организации вычислений, проанализировать известные алгоритмы решения вполне определенной задачи на предмет адаптации к используемой архитектуре.

3. Выбрать алгоритм и адаптировать его к рассматриваемой гетерогенной системе.

4. Выполнить теоретическую оценку операционной сложности разработанного (адаптированного) алгоритма, на основании которой сформулировать гипотезу об эффективности возможной реализации.

5. Программно реализовать адаптированный алгоритм.

6. Провести компьютерное моделирование решения задачи.

7. Оценить эффективность использования вычислений на гетерогенной системе с выбранной архитектурой в предложенном алгоритме и реализующей его программе.

8. Проанализировать удельные показатели производительности (вычислительной мощности), энергопотребления используемых вычислителей и их экономической эффективности.

9. По результатам п.п. 1-8 сформулировать рекомендации и требования к системам защиты в интересах повышения уровня защищенности компонентов, опирающихся на сложность решения исследуемых задач.

Вследствие того, что стандартные библиотеки программ CUDA на настоящий момент не содержат средств для реализации операций с большими числами, в

главе IV предложен один из способов представления «длинных» чисел и реализации арифметических операций над ними на вычислительных устройствах гетерогенной архитектуры типа GPGPU CUDA. С учетом особенностей архитектуры CUDA в качестве основной структуры представления длинных чисел выбран массив.

ВЫВОДЫ

В диссертационной работе в соответствии с поставленной целью исследований разработаны методики оценки операционной сложности параллельных алгоритмов, реализованных в гетерогенных архитектурах с вычислителями CPU и GPGPU CUDA, и практической апробации вычислительных систем в отношении рисков реализации угроз ИБ при их использовании, приведены обоснованные оценки эффективности использования параллельных вычислений в гетерогенных системах с архитектурой CUDA.

В ходе проведенных исследований получены новые теоретические и практические результаты, на основании которых можно сделать следующие выводы.

1. Использование параллельных вычислений на базе технических решений CUDA позволяет существенно снизить временные затраты на преодоление систем защиты. Архитектура CUDA относится к классу SIMT - Single Instruction Multiple Thread, который можно считать подклассом SIMD (Single Instruction stream Multiple Data stream) общепринятой классификации, поэтому наиболее целесообразно использовать данную архитектуру для реализации методов и алгоритмов с массовым параллелизмом данных.

2. Массовое распространение, низкая стоимость и удельное энергопотребление в сочетании с высокой удельной производительностью графических процессоров с поддержкой CUDA делает их одним из самых доступных средств для увеличения технических (вычислительных) возможностей потенциального нарушителя ИБ АС.

3. Обоснованную и достоверную оценку вычислительной стойкости систем защиты можно получить лишь совместно, используя аппарат теории сложности дискретных алгоритмов и аппарат компьютерного моделирования вычислительных

процессов, реализующих методы (алгоритмы), эквивалентные по сложности вскрытию систем защиты АС. Оценку стойкости средств защиты необходимо проводить для каждого нового класса вычислительных устройств, новых архитектур и моделей вычислений.

4. Результаты компьютерного моделирования решения задач факторизации и дискретного логарифмирования на модифицированных параллельных алгоритмах показали следующее:

- организация эффективных параллельных вычислений в архитектуре CUDA позволяет снизить фактические временные затраты на два - три порядка относительно времени решения последовательными алгоритмами;

- с учетом удельных показателей графических плат nVidia, при соответствующей адаптации алгоритмов к архитектуре CUDA на GPGPU можно эффективно решать и иные задачи аналогичного характера (высокой степени параллелизма). Одной из таких задач является задача анализа сетевых пакетов и классификации их содержимого по категориям, назначению и уровню доступа.

5. Полученные оценки свидетельствуют, что с учетом общего количества вычислительных средств при использовании локальных предметно-ориентированных компонентов вычислительных систем, в частности, специализированных решений nVidia (Quadro и Tesla), и «заоблочных» вычислений в скором времени-можно прогнозировать до 108 управляемых «облаком» вычислителей с производительностью более 1 ГГц (до 108 регистровых операций на отдельном терминале). Соответственно, общее снижение практической операционной стойкости систем защиты составит (с учетом задействования гетерогенных вычислителей) от 1016 до 1019раз на консорциум [1]. Таким образом, в ближайшее время следует ожидать существенного возрастания уровня угроз для коммерческих АС и угроз кибербезопасности в отношении систем защиты информации, что позволяет сформулировать общие рекомендации следующего плана:

- в интересах преодоления существующих систем защиты возможно и целесообразно задействовать ресурсы GPU в гетерогенных GRID-системах;

- в интересах повышения уровня защищенности систем ИБ необходимо учитывать возрастающие угрозы со стороны массового задействования гетерогенных вычислителей на базе GPU, что, в свою очередь, требует организации непрерывного мониторинга за рынком перспективных GPU и соответствующей теоретико-экспериментальной апробации новых образцов вычислителей по предложенным методикам;

- для реализации систем DPI и DLP с механизмами семантического анализа, целесообразно задействовать аппарат параллельных вычислений на графических платах с архитектурой CUDA с использованием соответствующих адаптированных алгоритмов.

Статьи, опубликованные в журналах из списка ВАК

1. Баранович А.Е., Желтов С.А. Гетерогенные архитектуры массовых вычислений и новые угрозы кибербезопасности // Системы высокой доступности. — 2012. - № 2. — т.8. - с. 16-22.

2. Желтов С.А. Адаптация метода Шермана Лемана решения задачи факторизации к вычислительной архитектуре CUDA / Вестник РГТУ №14/12, серия «Информатика. Защита информации. Математика». Научный журнал. М.: РГТУ, 2012.-с. 84-92.

3. Желтов С.А. Адаптация р-метода Полларда решения задачи дискретного логарифмирования к вычислительной архитектуре CUDA / Вестник РГГУ, серия «Информатика. Защита информации. Математика». Научный журнал. М.: РГГУ, 2013.-с. 139-146.

4. Желтов С.А. Реализация арифметических операций с «длинными» числами на устройствах GPGPU. - Вопросы защиты информации №3: науч. практ. журнал - Москва, 2012. — с. 2-4.

Другие публикации

5. Баранович А.Е., Желтов С.А. Организация параллельных вычислений в задачах факторизации на базе архитектуры CUDA // Тр. III Междунар. конгресса по интеллект, системам и информ. технол. // XI Междунар. научн.-техн. конф.

«Интеллектуальные системы» (А18'11). - М.: Физматлит, 2011. - Т. 1. - с. 481485.

6. Желтое С.А. Особенности адаптации вычислительных алгоритмов к архитектуре С1ЮА. - Математические методы управления: Сб. науч. тр. - Тверь: Твер. гос. ун-т, 2011. - с. 33-36.

7. Желтов С.А. Некоторые оценки эффективности параллельных вычислений в архитектуре С1ГОА при решении задачи факторизации целых чисел // Тр. IV Междунар. конгресса по интеллект, системам и информ. технол. // XII Меж-дунар. научи.-техн. конф. «Интеллектуальные системы» (А18'12). - М.: Физматлит, 2012.-Т. 2.-с. 191-196.

8. Желтов С.А. Алгоритмы факторизации целых чисел. - Методические указания к лабораторным занятиям на ЭВМ для студентов математического факультета. Тверь: Твер. гос. ун-т, 2012.

9. Желтов С.А. Методика получения оценки сложности параллельных алгоритмов реализуемых в гетерогенных вычислительных системах // Тр. IV Междунар. конгресса по интеллект, системам и информ. технол. / XIII Междунар. научн.-техн. конф. "Интеллектуальные системы" (А15'13). М., Физматлит,2013.-Т. 1.-е. 208-211.

Подписано в печать 17.02.2015 г. Тираж 100 экз. Заказ № ООО «Альба Плюс» г. Тверь, ул. Двор Пролетарки, дом 102

Похожие работы

Информатика, вычислительная техника и управление
05.13.00