автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Развитие методов построения грид-сред и систем облачных вычислений для задач физики высоких энергий

кандидата физико-математических наук
Кутовский, Николай Александрович
город
Дубна
год
2014
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Развитие методов построения грид-сред и систем облачных вычислений для задач физики высоких энергий»

Автореферат диссертации по теме "Развитие методов построения грид-сред и систем облачных вычислений для задач физики высоких энергий"

На правах рукописи

КУТОВСКИЙ Николай Александрович

РАЗВИТИЕ МЕТОДОВ ПОСТРОЕНИЯ ГРИД-СРЕД И СИСТЕМ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ ДЛЯ ЗАДАЧ ФИЗИКИ ВЫСОКИХ ЭНЕРГИЙ

Специальность: 05.13.11 —математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

/

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

005550198

Дубна 2014

005550198

Работа выполнена в Лаборатории информационных технологий Объединенного института ядерных исследований.

Научный руководитель

доктор технических наук Кореньков Владимир Васильевич

Научный консультант

кандидат физико-математических наук Зрелов Пётр Валентинович

Официальные оппоненты:

Ильин Вячеслав Анатольевич,

доктор физико-математических наук, доцент, НБИКС-Цектр НИЦ «Курчатовский институт», начальник отдела

Посыпкин Михаил Анатольевич, кандидат физико-математических наук, доцент, Институт проблем передачи информации РАН, ведущий научный сотрудник

Ведущая организация: Институт системного программирования РАН

Защита диссертации состоится «ВО» {¿¿йЛ 2014 года в га часов на заседании диссертационного совета Д 720.001.04 в Лаборатории информационных технологий Объединенного института ядерных исследований, г. Дубна Московской области.

С диссертацией можно ознакомиться в библиотеке ОИЯИ. Автореферат разослан «23» Г/пАРу/а9 2014года.

Ученый секретарь диссертационного совета, доктор физико-математических наук, профессор

Иванченко Иосиф Моисеевич

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Создание, сопровождение и развитие инфраструктур для хранения, обработки и анализа данных экспериментов в области физики высоких энергий (ФВЭ) включает решение большого круга задач, связанных с применением в данной области современных информационных технологий (ИТ).

В настоящее время широкое распространение получили грид-технологии и технологии облачных вычислений (облачные технологии). Каждая из них имеет свою специфику, преимущества и область применения.

Так грид активно применяется для проведения масштабных научных исследований. Он позволяет объединять в единую глобальную инфраструктуру разрозненные ресурсы организаций и совместно их использовать большому количеству пользователей. Например, без применения новых подходов к хранению данных, их обработке и анализу, которые заложены в концепции грид, решение задач экспериментов в области ФВЭ на Большом адронном коллайдере (БАК) в Европейской организации ядерных исследований (ЦЕРН) было бы невозможным, учитывая объёмы поступающих от детекторов данных (десятки петабайт в год), а также необходимость в их дальнейшей обработке и анализе тысячами учёных из распределённых по всему миру центров.

Грид-технологии успешно используются в области биомедицины и фармацевтики. В качестве примеров можно упомянуть такие проекты как MammoGrid и MammoGrid+, WISDOM и WISDOM-II, neuGRID и др. Активное применение и развитие грид-инструментария в области здравоохранения способствовало созданию международной ассоциации — HealthGrid Association.

Облачные технологии обеспечивают сетевой доступ к вычислительным, программным и информационным ресурсам (сетям передачи данных, серверам, устройствам хранения, сервисам и приложениям), конфигурируемым в соответствии с оперативными запросами. Они позволяют значительно сократить расходы на ИТ-инфраструктуру, удовлетворять динамически меняющиеся потребности в ресурсах и т. д.

Для широкого спектра задач в области ФВЭ является актуальным сокращение времени их выполнения, а также повышение эффективности использования ресурсов. Одним из решений представляется синтез облачных и грид-технологий. Так, повышение эффективности использования компьютерных ресурсов достигается при размещении грид-сервисов на виртуальных машинах в облачной среде (далее в тексте такие системы будут называться облачными грид-системами), а уменьшение времени выполнения — за счёт

решения задач на отдельных специализированных комплексах.

Помимо этого, повышение эффективности использования ресурсов позволяет сократить их количество, необходимое для освоения облачных и грид-технологий, тем самым снижая порог вхождения в эти области.

Таким образом, представляется актуальным разработка методов создания многофункциональных гетерогенных комплексов для решения широкого класса задач в области ФВЭ, позволяющих сократить время решения этих задач и повысить эффективность использования ресурсов.

Цели и задачи исследования

Целью диссертационной работы является развитие методов построения многофункциональных гетерогенных комплексов с использованием облачных и грид-технологий для решения широкого класса задач в области ФВЭ, позволяющих сократить время их решения и повысить эффективность использования ресурсов; проверка данных методов путём реализации подобного комплекса и использования его для решения конкретных задач; разработка методов адаптации приложений для грид-сред.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Провести анализ задач в области ФВЭ, связанных с хранением, передачей, обработкой и анализом данных, и вариантов синтеза облачных и грид-технологий для сокращения времени решения этих задач и повышения эффективности использования ресурсов.

2. Развить методы создания комплексов с использованием облачных и грид-технологий для решения исследовательских задач в области ФВЭ с учётом их специфики и рационального использования ресурсов.

3. С помощью развитых методов построить облачную грид-систему и применить её для решения конкретных исследовательских задач ФВЭ.

4. Разработать методы адаптации определённого класса приложений для грид-сред на базе EMI1 и РГС2 и провести их тестирование.

Методы исследования

В диссертационном исследовании применены современные подходы к организации

1 EMI (European Middleware Initiative) - программная платформа для высокопроизводительных распределённых вычислений (URL: http://eu-emi.eu), выступающая базой для построения европейской грид-инфраструктуры и в рамках которой сейчас происходит развитие европейского промежуточного программного обеспечения (ППО) грид.

2 РГС (российская грид-сеть для высокопроизводительных вычислений, http://www.voskhod.ru/index.php?id=9&item=251 - это территориально-распределенная телекоммуникационная автоматизированная система общегосударственного уровня для обеспечения доступа к ресурсам российских суперкомпьютерных центров при организации распределенных высокопроизводительных вычислений.

распределенной обработки информации, в частности, технологии облачных вычислений, грид-технологии и технологии виртуализации.

Научная новизна диссертационной работы

1. Развиты методы построения масштабируемых многофункциональных гетерогенных комплексов (облачных грид-систем), которые позволяют сократить время решения широкого круга задач, связанных с хранением, передачей, обработкой и анализом данных экспериментов БАК, и повысить эффективность использования компьютерных ресурсов.

2. Выполнен анализ и сформулированы основные требован™ для системы мониторинга ресурсов уровня Tier-3. Программная реализация такой системы увеличила эффективность использования ресурсов, позволив ускорить проведение анализа данных и получение физических результатов эксперимента ATLAS.

3. Разработаны методы адаптации определённого класса приложений для использования их в грид-средах на базе EMI и РГС.

Защищаемые положения

1. Развитые в данной работе методы создания облачных грид-систем для решения исследовательских задач ФВЭ.

2. Облачная грид-система ЛИТ ОИЯИ, реализованная с использованием предложенных методов.

3. Методы адаптации определённого класса приложений для грид-сред на базе EMI и РГС

4. Ряд адаптированных в эти среды прикладных пакетов для научных исследований в различных областях.

Теоретическая значимость работы определяется развитыми в ней подходами и методами построения многофункциональных гетерогенных комплексов с использованием облачных и грид-технологий для решения широкого класса исследовательских задач в области ФВЭ, а также методами адаптации определённого класса прикладных пакетов для использования их в грид-средах на базе EMI и РГС.

Практическая значимость состоит в том, что развитые в данной работе методы обеспечивают возможность тиражирования подобных комплексов, что позволило построить аналогичные инфраструктуры в институтах стран-участниц ОИЯИ: Центре суперкомпьютерных вычислений Национального технического университета Украины «Киевский политехнический институт», Физико-техническом институте низких температур им. Б.И. Веркина (Украина), Институте теоретической физики им. H.H. Боголюбова

(Украина), Институте физики Национальной академии наук Азербайджана.

Комплекс ЛИТ ОИЯИ был использован для решения следующих задач:

- создание средств мониторинга сайтов уровня Tier-3 грид-инфраструктуры эксперимента ATLAS;

- разработка методов адаптации приложений для EMI и РГС, а также перенос ряда прикладных пакетов в упомянутые грид-среды;

- написание подсистемы хранения данных для Российской грид-сети;

- разработка функциональных тестов для ряда грид-сервисов;

- обучение облачным и грид-технологиям, в том числе проведение на регулярной основе занятий в образовательных учреждениях.

Использование созданного комплекса для ряда задач подтверждено соответствующими документами. Апробация работы

Основные положения и результаты работы докладывались и обсуждались на следующих российских и международных научных мероприятиях:

- The International Conference «Distributed Computing and Grid-technologies in Science and Education» 2008, 2010, 2012 (Dubna, Russia);

- The International Conference on Computing in High Energy and Nuclear Physics 2012 (New York City, USA);

- научные конференции молодых учёных и специалистов ОИЯИ 2008, 2010, 2011, 2012, 2013 (Дубна, Россия);

- программно-консультативные комитеты ОИЯИ 2010, 2012, 2013.

Цикл работ «Грид-среда ОИЯИ - элемент Российской и глобальной грид-инфраструктуры», включающий в себя исследования, вошедшие в диссертационную работу, был удостоен Первой премии ОИЯИ за 2013 год. Также эти исследования были поддержаны грантами для молодых учёных и специалистов ОИЯИ в 2010, 2011, 2012, 2013 и 2014 годах, в 2008 г. - стипендией им. H.H. Говоруна, в 2012 году удостоены премии конкурса молодёжных работ на конференции молодых учёных и специалистов ОИЯИ. Публикации

По результатам диссертации опубликовано 29 работ, в том числе 4 [1-4] — в рецензируемых изданиях3.

3 Перечень российских рецензируемых научных журналов, в которых должны быть опубликованы

основные научные результаты диссертаций на соискание ученых степеней доктора и кандидата

наук: http://vaked.gov.ru/87

Структура и объем работы

Диссертация состоит из введения, трёх глав, заключения с основными результатами диссертации, приложений и списка литературы. Общий объем диссертации составляет 125 страниц, включая 14 рисунков и 7 таблиц. Список литературы состоит из 101 наименования на 11 страницах.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обосновывается актуальность выбранной автором темы исследования, определена цель и поставлены задачи, сформулированы научная новизна и защищаемые положения. Отражена теоретическая и практическая значимость диссертационной работы, а также изложены сведения об их апробации.

В первой главе определены основные направления и задачи, связанные с освоением, использованием и развитием облачных и грид-технологий в ФВЭ, приводятся возможные варианты сочетания этих технологий, для каждого из вариантов обозначаются области применения. Выполнен анализ существующего мирового опыта в решении данных задач, указаны причины неэффективности, а в некоторых случаях и невозможности использования производственных грид-систем4 для их решения, сформулированы требования к построению специализированных комплексов для освоения и развития облачных и грид-технологий.

При использовании облачных и грид-технологий в ФВЭ выделяются следующие основные задачи:

1) освоение, связанное с обучением различных категорий специалистов (пользователей, системных администраторов, разработчиков);

2) проведение различных исследовательских работ, включая поиск наиболее подходящей технологии, их комбинаций и (или) типа ресурсов для решения конкретной задачи;

3) развитие, включающее разработку нового функционала и сервисов, а также адаптацию уже существующего программного обеспечения (ПО) или создание нового для работы в той или иной среде;

4) использование, подразумевающее создание и эксплуатацию инфраструктуры.

Для краткости далее в тексте задачи 1-3 из списка выше будут называться

«исследовательскими». Аналогично будут называться и комплексы, на которых они

решаются, в отличие от производственных грид-систем.

Хотя преимущественные области применения облачных и грид-технологий разнятся,

4 Под производственной грид-системой понимается система, которая используется для хранения, обработки и анализа реальных данных (например, инфраструктура \VLCG в случае экспериментов на БАК).

для ряда перечисленных выше задач совместное использование обоих подходов позволяет повысить эффективность использования компьютерных ресурсов и скорость решения этих задач.

Выделены несколько вариантов синтеза облачных и грид-технологий (см. рис. 1):

1) облачные ресурсы используются в дополнение к грид-ресурсам (например, во время пиковых нагрузок для обеспечения необходимого качества обслуживания);

2) все грид-сервисы, включая элементы хранения данных и вычислительные элементы, размещаются на виртуальных машинах в облачной среде;

3) все грид-сервисы размещаются на виртуальных машинах в облачной среде и дефицит ресурсов удовлетворяется за счёт облака (т. е. комбинация двух предыдущих

вариантов).

Рисунок 1. Схемы возможных вариантов синтеза облачных и грид-технологий

Соответствие задач вариантам совместного использования облачных и грид-технологий представлено в таблице 1 (знак «+» в ячейке таблицы указывает на возможность получения преимуществ от применения обоих технологий, а знак «-» — на отсутствие такой возможности либо её наличие, но не во всех случаях).

Таблица 1. Соответствие задач возможным вариантам синтеза облачных и грид-технологий

Задача \ Вариант 1 2 3

(1) обучение - + +

(2) исследования - + +

(3) развитие - + +

(4) использование + - -

Первый вариант не повышает эффективность использования компьютерных ресурсов, а позволяет только покрыть их дефицит. Он избыточен для исследовательских задач в силу их низкой ресурсоёмкости. Виртуализация может приводить к существенным накладным расходам, поэтому размещение высоконагруженных грид-сервисов на виртуальных машинах (варианты 2 и 3) может быть непригодно для задачи (4). Таким образом, повышение эффективности использования компьютерных ресурсов возможно при размещении грид-сервисов в облачных средах, что наилучшим образом подходит для исследовательских задач,

требующих существенных мощностей для их одновременного решения.

Если эффективное решение этих задач в области облачных технологий больших трудностей не вызывает, то в случае грид есть некоторые особенности, изложенные ниже.

Для решения исследовательских задач сертификаты необходимо выдавать в отдельных удостоверяющих центрах, т. к. цели использования таких сертификатов могут не соответствовать политике их выдачи существующими удостоверяющими центрами (УЦ). Помимо этого, в некоторых случаях является критичным время выдачи сертификатов (например, для интенсивных краткосрочных обучающих курсов продолжительностью в несколько дней), тогда как процесс получения сертификата в существующих УЦ может занимать от нескольких дней до недели (а порой и дольше).

В правилах использования ресурсов производственных грид-систем, к которым имеет доступ та или иная виртуальная организация (ВО), чётко обозначено целевое использование этих самых ресурсов для решения конкретных задач данной виртуальной организацией. Из этого вытекает необходимость в создании одной или несколько отдельных ВО для исследовательских целей.

Эффективное освоение и развитие грид-технологий предполагает как можно более оперативное выполнение счётных задач на рабочих узлах. Отдельная очередь в ресурсных центрах (РЦ) производственных грид-систем с выделенными рабочими узлами для задач исследовательской ВО будет снижать эффективность использования самих этих ресурсов, т. к. нагрузка на них от счётных исследовательских задач невысока, а запуск самих задач нерегулярен.

Необходимое время действия сертификатов пользователей или машин, также как и продолжительность членства пользователей в ВО в случае исследовательских задач, может варьироваться от нескольких дней до месяцев или даже лет, что является нетипичным для ВО и УЦ производственных грид-систем и вполне может служить ещё одним аргументом в пользу установки отдельных УЦ и сервиса управления виртуальными организациями с одной или несколькими специализированными ВО.

Кроме того, в организации может существовать потребность в решении исследовательских задач в нескольких грид-средах одновременно или даже в установке нового промежуточного программного обеспечения (ППО), тогда как производственные грид-системы функционируют на одном, реже — на нескольких ППО, среди которых необходимых организации может и не быть, а установка нового ППО на ресурсах производственных РЦ неприемлема.

На данный момент не существует каких-либо комплексов, позволяющих

одновременно выполнять все перечисленные выше задачи на разных типах ресурсов и сред. Они решаются на отдельных инфраструктурах в рамках каждого из проектов самостоятельно.

Так, например, для обучения пользователей работе в грид-среде на базе ППО gLite5 в рамках проектов EGEE использовался комплекс GILDA. Он позволял проводить обучение только для одной категории специалистов — пользователей и только на одном ППО — INFN Grid (хотя и полностью совместимого с gLite). После завершения проектов EGEE, EGEE-II и EGEE-III в проекте EGI подход к решению задачи обучения перестал быть централизованным и каждый из партнёров-участников должен решать её самостоятельно.

Портал WS-PGRADE хотя и позволяет решать задачу обучения пользователей и разработчиков, адаптировать и создавать приложения для достаточно широкого набора типов распределённых вычислительных комплексов, а также выполнять разработку, однако он непригоден для обучения системных администраторов и разработки для отсутствующих в этом комплексе грид-сред или распределённых систем хранения данных.

В рамках национальных и межнациональных проектов в области грид (например, OSG) обучение представлено школами (как правило, это одно-двух недельное мероприятие, включающее как лекции, так и практические занятия по работе в той или иной грид-среде), семинарами и онлайн курсами для самостоятельного освоения материала.

Из всего изложенного выше можно заключить, что для повышения эффективности использования ресурсов и скорости решения задач в области ФВЭ с применением облачных и грид-технологий необходимы отдельные специализированные комплексы, которые должны удовлетворять следующим требованиям.

1) Возможность выполнения работ на различных типах ресурсов: суперкомпьютерах, кластерах, гетерогенных средах на базе персональных компьютеров, облачных средах, системах распределённого хранения данных.

2) Возможность одновременного решения исследовательских задач на различных программных платформах с возможностью расширения их набора.

3) Рациональное использование компьютерных ресурсов.

4) Возможность задавать срок доступа к ресурсам комплекса.

5) Набор сервисов каждой из грид-сред должен обеспечивать достаточную функциональность для решения задач инфраструктуры и не являться избыточным.

6) Комплекс должен быть автономным, т. е. независимым от каких-либо сервисов

5 В силу ограничений на максимальный объём автореферата диссертации привести пояснение в нём всех используемых терминов и аббревиатур не представляется возможным. Их пояснение дано в диссертации в разделе «Словарь терминов».

производственных грид-систем (например, от сервисов управления виртуальными организациями, сервисов по учёту потребленных ресурсов и т. д.). Такая автономность позволит задействовать подобные комплексы для максимально широкого круга задач за счёт отсутствия необходимости соблюдения многих формальных процедур, которые обязательны в случае производственных грид-систем и которые для указанных целей являются необоснованно избыточными и могут только уменьшить эффективность использования таких комплексов, а также сузить спектр решаемых на них задач.

7) Объём усилий для создания и поддержания работоспособности комплекса должен быть соразмерен выполняемым на нём задачам и требуемой функциональности, а также обеспечивать необходимое и достаточное качество обслуживания. В завершении первой главы приводятся следующие выводы. В результате проведённого анализа выделено несколько возможных вариантов синтеза облачных и грид-технологий. Размещение грид-сервисов на виртуальных машинах в облачной среде позволяет повысить эффективность использования компьютерных ресурсов.

Во второй главе развиты методы создания таких специализированных комплексов с учётом определённых в первой главе требований, а также приводится описание облачной грид-среды, реализованной в ЛИТ ОИЯИ.

Эти методы заключаются в следующем:

1) построение локальной облачной платформы с поддержкой виртуального разделения ресурсов на уровне операционный системы (последующие шаги 2-4 выполняются на виртуальных машинах облачной платформы);

2) создание локального УЦ для выдачи сертификатов пользователей и машин;

3) инсталяция сервиса управления виртуальными организациями с одной или несколькими отдельными ВО;

4) установка сервисов грид-полигонов на базе используемых ППО.

При необходимости одновременного наличия грид-сред, функционирующих на базе разных ППО, повысить эффективность использования компьютерных ресурсов можно также за счёт совместного использования некоторых сервисов различными средами. Например, сертификаты машин и пользователей для разных полигонов могут выдаваться в одном и том же удостоверяющем центре; перенастраивая среду окружения на интерфейсе пользователя, каждый пользователь может работать с соответствующим набором команд для нужной ему среды, т. е. использовать всего лишь одну машину для пользователей всех установленных ППО; сервис управления виртуальными организациями может быть задействован для авторизации пользователей в тех системах, службы которых поддерживают работу с ним.

В соответствии с развитыми методами в ЛИТ ОИЯИ была создана облачная грид-система для исследовательских задач. В качестве программных платформ грид-сред используются различные ППО.

Схематично структура комплекса представлена на рис. 2.

ПО облачной платформы

Рисунок 2. Схема структуры комплекса для исследовательских задач в области облачных и грид-технологий

Выбор ПО для построения локальной облачной платформы осуществлялся в соответствии со следующими критериями:

1) поддержка необходимого типа виртуализации или наличие относительно простой возможности его интеграции;

2) совместимость с операционной системой (ОС) Linux и возможность запуска виртуальных машин с этой ОС, т. к. сервисы наиболее распространённых ППО грид работают под ней;

3) наличие понятной и доступной документации;

4) требуемая функциональность и качество программного продукта;

5) лицензия, допускающая модификацию и бесплатное использование;

6) поддержка со стороны разработчиков при необходимости модификации ПО.

Выбор ПО для виртуализации осуществлялся в соответствии со следующими критериями:

1) виртуализация на уровне операционной системы (т. к. эффективность использования

физических серверов зависит в том числе и от накладных расходов на виртуализацию, а из существующих на данный момент реализаций наиболее производительной, т. е. с минимальной нагрузкой на сервер, считается именно такая);

2) совместимость с ОС Linux;

3) возможность балансировки нагрузки на сервер посредством «живой» (т. е. без ощутимых для пользователей перерывов в работе) миграции виртуальных машин между серверами;

4) наличие консольных средств управления виртуальными машинами;

5) понятная и подробная документация;

6) необходимая функциональность и качество программного продукта;

7) лицензия, разрешающая бесплатное использование.

В результате проведённого анализа для виртуального разделения ресурсов был выбран программный продукт OpenVZ, а для создания облачных платформ — OpenNebula. Хотя ПО OpenNebula изначально не имело поддержки OpenVZ, автором данной диссертации была разработана первая версия драйвера для упомянутой реализации виртуального разделения ресурсов и доработана совместно с коллегами из ЛИТ ОИЯИ для более поздних версий OpenNebula.

На рис. 3 представлена общая схема облачной грид-системы ЛИТ ОИЯИ для исследовательских задач. Область с цифрой «1» и надписью «EMI» обозначает полигон на базе одноимённого ППО и включает в себя фигуры с закруглёнными углами, символизирующие грид-сайты, входящие в состав этого полигона и размещённые в институтах стран-участниц ОИЯИ. Область с цифрой «2» и надписью «облако» ЛИТ ОИЯИ содержит изображения полигонов на базе разных ППО, размещённые в облачной среде ЛИТ ОИЯИ. Ниже приводится описание основных её составляющих.

Полигон на базе ППО EMI. Одним из наиболее востребованных и интенсивно используемых является полигон на базе ППО EMI [7, 9, 12].

Данный полигон изначально состоял из двух грид-сайтов, размещённых только на ресурсах ЛИТ ОИЯИ. В дальнейшем в него были интегрированы грид-сайты организаций стран-участниц ОИЯИ. Состав участников этого сегмента комплекса носит динамический характер: добавляются новые грид-сайты, а часть интегрированных ранее прекращают своё участие (по различным причинам).

Схема на рис. 4 отражает положение дел на момент написания диссертации. Наряду с грид-сайтом ОИЯИ (на рисунке он обозначен как RU-JINR) присутствуют также грид-сайты Института физики высоких энергий (г. Протвино, Московская область, Россия) — SU-

Рисунок 3. Общая схема облачной грид-системы ЛИТ ОИЯИ Protvino-IHEP, Института теоретической физики им. H.H. Боголюбова (г. Киев, Украина) — UA-BITPEDU, Национального технического университета Украины «Киевский политехнический институт» (г. Киев, Украина) — UA-KPI-HPCC, Евразийского

MPIWN, SE

W№ SE

СЕ vwa VOMS IßpBDIl

V ui аивочу

Iis

UA-BITPEDU

Kil Г?:'-! lfc

1e В Dil WMS+IB

WNs SE \

pi SU-Protvino-IHEP

VOMS top BOII

4J

rs ,i I

UA-KPI-HPCC

¡¡I lü^ ^

■A »MBCI1 VAIS.L

UA-ILTPE

SE WMS * LB mp 80

J öflö

RU-JINR

г J p«l f J cr?u

Рисунок 4. Схема распределённого полигона на базе ППО EMI 14

национального университета им. Л.Н. Гумелёва (г. Астана, Казахстан) — кг-ЕМи, Физико-технического института низких температур им. Б.И. Веркина Национальной академии наук Украины (г. Харьков, Украина) — иА-ИТРЕ, Института физики Национальной академии наук Азербайджана (г. Баку, Азербайджан) —Аг-1Р.

Различия между производственными и исследовательскими грид-системами на базе этого ППО представлены в таблице 2.

Таблица 2. Различия между производственными и исследовательскими грид-системами

Сервис Производственная Исслед. грид- Пояснение значений для

грид-система система исследовательской грид-системы

УЦ иерархия одноранговые локальные одноранговые УЦ

VOBOX присутствует отсутствует обучение пользователей самими ВО

GOCDB присутствует отсутствует малое количество грид-сайтов

APEL присутствует отсутствует равный статус всех организаций-участников, бесплатное пользование ресурсами, простые нересурсоёмкие

задачи

SAM, GridView, GStat присутствует отсутствует упрощённый мониторинг на основе данных из информационной системы

Рабочие узлы много мало кол-во одновременно выполняемых счётных задач невелико, быстрые нересурсоёмкие задачи

FTS присутствует отсутствует небольшой объём передаваемых данных, отсутствие необходимости в передаче файлов с высокой надёжностью

SE большого объёма малого объёма малый объем хранимых данных

МуРгоху присутствует отсутствует короткое время выполнения задач

ROC присутствует отсутствует выполнение функций 1 человеком

На грид-сайтах данного полигона представлены как обычные кластеры, так и кластеры с поддержкой счёта параллельных задач (для имитации суперкомпьютеров).

Пашгон T3MON. В связи с использованием локальных ресурсов организаций для ускорения проведения анализа данных и получения окончательных физических результатов эксперимента ATLAS появилась задача мониторирования этих ресурсов (так называемых ресурсов уровня Tier-З), решение которой стало целью проекта «T3MON».

В архитектуре разработанной системы мониторинга условно можно выделить две компоненты: средства локального мониторинга, устанавливаемые на каждый сайт Tier-З, и глобального мониторинга.

В качестве основы для построения системы локального мониторинга выбран программный продукт Ganglia. Для разработки модулей к этой системе на грид-комплексе был создан полигон, состоящий из кластеров на базе наиболее используемых на сайтах уровня Tier-3 эксперимента ATLAS средств управления локальными вычислительными ресурсами (PROOF, PBS, Condor, OGE) и хранения данных (XRootD, Lustre).

Полигон РГС. Для выполнения обязательств ЛИТ ОИЯИ в рамках участия в проекте создания Российской грид-сети (РГС) для высокопроизводительных вычислений на исследовательском комплексе были установлены следующие компоненты:

1) веб-интерфейс пользователя для разработки проблемно-ориентированных интерфейсов (ПОИ) в виде расширений к нему;

2) элементы хранения данных на базе GridFTP;

3) виртуальная машина для разработки подсистемы хранения данных (ПХД) РГС. Полигон для вычислений на базе персональных компьютеров. Одним из видов

распределённых вычислительных ресурсов являются системы, в которых в качестве счётных узлов используются персональные компьютеры (такие среды ещё называют «DesktopGrid»), Подобный тип ресурсов используется в большом количестве проектов для решения достаточно широкого круга задач.

Для апробации самой технологии, а также последующей адаптации в эту среду востребованных приложений на исследовательском комплексе был создан отдельный полигон. Из существующего ПО, позволяющего создавать подобные платформы, был выбран продукт BOINC, как один из наиболее стабильных и распространённых. Программная компонента 3G-moct, разработка института МТА SZTAKI, позволила интегрировать данный полигон с полигоном на базе EMI, что дало возможность использовать одни и те же средства для запуска задач в обеих средах. Этот сегмент включает в себя следующие составляющие:

1) BOINC-сервер с 3G-moctom;

2) виртуальная машина с предустановленным BOINC-клиентом;

3) вычислительный элемент CREAM с программной компонентой «EDGI executor». Веб-портал. Для предоставления актуальной информации об исследовательском

комплексе (новости, текущее состояние, проводимые работы, завершённые и выполняемые задачи) на одной из виртуальных машин был развёрнут веб-портал со следующим URL: http://gridedu.jinr.ru. Он содержит описание распределённого полигона на базе EMI и показывает на карте местонахождение организаций с грид-сайтами, входящими в его состав. На данном портале размещены инструкции по интеграции грид-сайтов организаций в общую среду на базе данного ППО, руководства для системных администраторов по установке

сервисов EMI на виртуальные машины OpenVZ и по созданию вычислительных элементов на базе ППО EMI с поддержкой счёта параллельных задач. Помимо этого, размещена информация об ответственных за функционирование комплекса.

В конце второй главы по результатам изложенной в ней информации делаются следующие выводы. Разработаны методы создания специализированных комплексов с учётом сформулированных в первой главе требований. Эти методы позволяют повысить эффективность использования компьютерных ресурсов и сократить время решения исследовательских задач за счёт размещения грид-сервисов на виртуальных машинах в облачной среде и применения виртуализации на уровне операционной системы. На этой методологической основе в ЛИТ ОИЯИ был создан исследовательский комплекс.

В третьей главе приводится опыт применения созданного комплекса для решения конкретных научно-исследовательских задач, а также изложены методы адаптации приложений определённого типа для грид-сред на базе EMI и РГС.

Полигон на базе ППО EMI был использован для следующих задач:

1) разработка методов адаптации приложений для EMI, а также перенос с помощью этих методов в грид-среду ряда прикладных пакетов (Blender, DL_POLY, Molpro, Elmer, MEEP, FDS);

2) проверка функционирования различных типов вычислительных элементов, сконфигурированных при помощи утилиты YAIM, а также сертификация патчей для них;

3) создание набора функциональных тестов для интерфейса программирования приложений на языке Perl для сервиса LFC;

4) обучение пользователей из ОИЯИ и институтов стран-участниц работе в среде EMI;

5) обучение системных администраторов из ОИЯИ и институтов стран-участниц установке, настройке и проверке работоспособности грид-сайтов на базе ППО EMI;

6) проведение практических занятий по работе в данной грид-среде для студентов Учебно-научного центра ОИЯИ и университета «Дубна».

На базе полигона T3MON были выполнены работы по созданию модулей-дополнений для Lustre, PBS, XRootD и PROOF [2]. Последние два установлены на кластерах в Лаборатории ядерных проблем (ЛЯП) ОИЯИ, а также в таких организациях, как Brookhaven National Laboratory (BNL), Duke и Deutsches Elektronen-Synchrotron (DESY). В процессе разработки находятся модули для Condor и OGE.

Помимо выполнения на этом полигоне работ в рамках проекта «T3MON», он также был задействован для адаптации системы управления загрузкой эксперимента ATLAS —

PanDA — для работы с суперкомпьютерами.

На полигоне РГС для ряда прикладных пакетов (DL_POLY, Elmer, FDS, GEANT4-DNA, ZondGeoStat) были разработаны ПОИ с целью облегчения использования этих приложений в данной грид-среде, т. е. для выполнения таких операций, как формирование и запуск счётных заданий, контроль хода их выполнения и получение результатов вычислений. ПОИ призваны скрыть от пользователя детали и сложности работы самой грид-среды. Непосредственный счёт на вычислительных ресурсах выполняется с использованием того или иного конкретного прикладного пакета, который должен быть установлен на рабочих узлах грид-сайтов [3, 8].

Также была разработана подсистема хранения данных РГС на базе сервиса GridFTP с возможностью каталогизации исходных данных и результатов расчетов, обеспечивающая аутентификацию и авторизацию пользователей с использованием цифровых сертификатов.

На полигоне DesktopGrid успешно прошёл запуск тестовых приложений, в том числе и с использованием интерфейса пользователя EMI. Проработаны различные аспекты построения этой среды на основе ресурсов организаций стран-участниц ОИЯИ и её применения.

Кроме того, полигоны EMI и РГС были использованы для разработки обобщённых методов адаптации прикладных пакетов для этих сред [3, 8, 10]. Данные методы позволяют осуществить перенос приложений, удовлетворяющие следующим требованиям:

1) совместимость с ОС Linux,

2) возможность вызова в режиме командной строки,

3) отсутствие интерактивности,

4) указание параметров запуска и входных данных через аргументы в командной строке и (или) в отдельном файле.

Для адаптации конкретного пакета необходимо выполнить следующие шаги:

1) проверить приложение на соответствие приведённым выше требованиям;

2) создать скрипт (файл-сценарий), осуществляющий запуск приложения с нужными параметрами, а также при необходимости выполняющий набор операций до и после вызова прикладного пакета;

3) разработать файл описания задания на соответствующем языке конкретной грид-среды;

4) разместить приложение на рабочих узлах кластера одного из грид-сайтов;

5) внести соответствующие данные об установленном пакете в информационную систему грид-сайта.

В конце третьей главы делаются следующие выводы. Созданный с использованием предложенных методов специализированный комплекс позволяет решать широкий спектр исследовательских задач в области ФВЭ, а разработанные методы адаптации приложений дают возможность переносить прикладные пакеты определённого класса в грид-среды на базе EMI и РГС.

В заключении приводятся основные результаты диссертационной работы:

1. На основе проведённого анализа задач в области ФВЭ, связанных с хранением, обработкой и анализом данных, и вариантов синтеза облачных и грид-технологий развиты методы создания специализированных комплексов, позволяющие сократить время решения исследовательских задач и повысить эффективность использования компьютерных ресурсов за счёт размещения грид-сервисов на виртуальных машинах в облачной среде и применения виртуализации на уровне операционной системы.

2. С использованием развитых в данной работе методов в ЛИТ ОИЯИ создана облачная грид-система, которая применяется для решения широкого круга исследовательских и прикладных задач в области ФВЭ. С использованием этих же методов в ряде организаций из стран-участниц ОИЯИ были построены аналогичные комплексы, со временем ставшие основой национальных грид-инфраструктур.

3. Разработана система мониторинга ресурсов уровня Tier-3, которая повысила эффективность использования ресурсов, позволив ускорить проведение анализа данных и получение физических результатов эксперимента ATLAS.

4. Разработаны методы адаптации определённого класса приложений для грид-сред на базе EMI и РГС, а также проведено их тестирование путём переноса ряда приложений в EMI (Blender, DL_POLY, Molpro, Elmer, MEEP, FDS) и РГС (DL_POLY, Elmer, FDS, GEANT4-DNA, ZondGeoStat).

Публикации по теме диссертации

1. H.A. Кутовский Облачные автономные грид-инфраструктуры для учебно-исследовательских и тестовых целей // Информатизация образования и науки. ISSN: 20737572. 2013. № 4 (20). С. 15-29.

2. S. Belov et al VM-based infrastructure for simulating different cluster and storage solutions used on ATLAS Tier-3 sites // Journal of Physics: Conference Series. 2012. Vol. 396. Part 4. 5 pp. doi:10.1088/1742-6596/396/4/042036.

3. Кореньков B.B., Кутовский H.A., Семенов Р.Н. Опыт адаптации прикладных программных пакетов для работы в грид-средах // Компьютерные исследования и моделирование. ISSN: 2076-7633. 2012. Т. 4. № 2. С. 339-344.

4. Н.А. Кутовский, В.В. Кореньков Инфраструктура обучения grid-технологиям // Открытые системы. СУБД. ISSN: 1028-7493. 2009. № 10. С. 48-51.

5. S.D. Belov et al Grid in JINR and participation in the WLCG project // The 5th International Conference «Distributed Computing and Grid-technologies in Science and Education (Dubna, 16-21 July 3, 2012): proceedings. Dubna, 2012. P. 23-29.

6. S.D. Belov et al Monitoring, accounting and registration services for Russian grid network // The 5th International Conference «Distributed Computing and Grid-technologies in Science and Education» (Dubna, 16-21 July 3, 2012): proceedings. Dubna, 2012. P. 30-33.

7. Kutovskiy N.A. Distributed training and testing grid infrastructure evolution // The 5th International Conference «Distributed Computing and Grid-technologies in Science and Education» (Dubna, 16-21 July 3, 2012): proceedings. Dubna, 2012. P. 180-185.

8. Kutovskiy N.A., Lensky I.I., Semenov R.N. Problem-oriented web-interfaces for Russian grid network // The 5th International Conference «Distributed Computing and Grid-technologies in Science and Education» (Dubna, 16-21 July 3, 2012): proceedings. Dubna, 2012. P. 186-188.

9. V.V. Korenkov, N.A. Kutovskiy Distributed training and testing grid infrastructure // The 4th International Conference «Distributed Computing and Grid-technologies in Science and Education» (Dubna, June 28 - July 3, 2010): proceedings. Dubna, 2010. P. 148-152.

10. E.B. Dushanov, Kh. T. Kholmurodov, N. Kutovskiy Some experience in running molecular dynamics simulation application in grid // The 4th International conference «Distributed Computing and Grid-technologies in Science and Education» (Dubna, June 28 - July 3, 2010): proceedings. Dubna, 2010, P. 90-92.

11. S.D. Belov et al Joint Institute for Nuclear Research in the WLCG and EGEE Projects // The 3rd International Conference «Distributed Computing and Grid-Technologies in Science and Education» (Dubna, 30 June - 4 July 2008): proceedings. Dubna, 2008. P. 137-142.

12. Belov S.D., Korenkov V.V., Kutovskiy N.A. Educational Grid infrastructure at JINR // The 3rd International Conference «Distributed Computing and Grid-Technologies in Science and Education» (Dubna, 30 June - 4 July, 2008): proceedings. Dubna, 2008. P. 341-342.

13. V. Korenkov, N. Kutovskiy, I. Tkachev Experience of grid infrastructure installation, user and administrator training in Grid // The 2nd International Conference «Distributed Computing and Grid-Technologies in Science and Education» (Dubna, 26 June - 30 June, 2006): proceedings. Dubna, 2006. P. 96-98.

Получено 11 марта 2014 г.

Отпечатано методом прямого репродуцирования с оригинала, предоставленного автором.

Подписано в печать 12.03.2014. Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 1,4. Уч.-изд. л. 1,6. Тираж 100 экз. Заказ № 58205.

Издательский отдел Объединенного института ядерных исследований 141980, г. Дубна, Московская обл., ул. Жолио-Кюри, 6. E-mail: publish@jinr.ru www.jinr.ru/publish/

Текст работы Кутовский, Николай Александрович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Объединенный институт ядерных исследований Лаборатория информационных технологий

04201 45931 4

На правах рукописи

Кутовский Николай Александрович

РАЗВИТИЕ МЕТОДОВ ПОСТРОЕНИЯ ГРИД-СРЕД И СИСТЕМ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ ДЛЯ ЗАДАЧ ФИЗИКИ ВЫСОКИХ ЭНЕРГИЙ

05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель: д.т.н. Кореньков В.В. Научный консультант: к.ф.-м.н. Зрелов П.В.

Дубна - 2014

Оглавление

Введение...........................................................................................................................4

Глава 1. Решение исследовательских задач в ФВЭ, связанных с применением облачных и грид-технологий........................................................................................10

1.1. Основные задачи в ФВЭ, связанные с применением ИТ для хранения, передачи, обработки и анализа данных...................................................................10

1.2. Варианты синтеза облачных и грид-технологий.............................................10

1.3. Мировой опыт решения исследовательских задач в ФВЭ, связанных с применением облачных и грид-технологий............................................................14

1.4. Требования к комплексам для исследовательских целей...............................29

Глава 2. Методы построения облачных грид-систем и реализация такой системы в ЛИТ ОИЯИ.....................................................................................................................31

2.1. Методы построения облачных грид-систем.....................................................31

2.2. Описание реализации облачной грид-системы в ЛИТ ОИЯИ.......................32

2.2.1. Полигон на базе ППО ЕМ1.........................................................................35

2.2.2. Полигон ТЗМОЫ..........................................................................................42

2.2.3. Полигон РГС................................................................................................43

2.2.4. Полигон БезкШрСпс!...................................................................................44

2.2.5. Веб-портал комплекса.................................................................................46

Глава 3. Использование облачной грид-системы ЛИТ ОИЯИ..................................48

3.1. Полигон ЕМ1.......................................................................................................48

3.1.1. Обучение пользователей.............................................................................48

3.1.2. Обучение системных администраторов....................................................51

3.1.3. Обучение разработчиков.............................................................................53

3.1.4. Выполнение обязательств по проекту \VLCG...........................................53

3.1.5. Адаптация приложений...............................................................................54

3.2. Полигон ТЗМОМ.................................................................................................54

3.3. Полигон РГС.......................................................................................................55

J

3.4. Методы адаптации определённого класса приложений для грид-сред на базе

EMI и РГС...................................................................................................................57

3.4.1. Методы адаптации приложений для грид-среды на базе ППО EMI.......60

3.4.2. Методы адаптации приложений для грид-среды на базе ППО РГС.......66

Заключение.....................................................................................................................77

Список терминов...........................................................................................................78

Список литературы........................................................................................................88

Список иллюстративного материала...........................................................................99

Приложение А. Программный код модуля расширения ВИГ РГС для ППП FDS 101 Приложение Б. Программный код модуля расширения ВИГ РГС для ППП ZondGeoStat..................................................................................................................112

Введение

Актуальность темы. Создание, сопровождение и развитие инфраструктур для хранения, обработки и анализа данных экспериментов в области физики высоких энергий (ФВЭ) включает решение большого круга задач, связанных с применением в данной области современных информационных технологий (ИТ).

В настоящее время широкое распространение получили грид-технологии и технологии облачных вычислений (облачные технологии). Каждая из них имеет свою специфику, преимущества и область применения.

«Грид (Grid) — согласованная, открытая и стандартизованная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение ресурсов в рамках виртуальной организации» [1]. Другими словами, «грид — географически распределенная инфраструктура, объединяющая множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения. Грид предполагает коллективный разделяемый режим доступа к ресурсам и к связанным с ними услугам в рамках глобально распределенных виртуальных организаций, состоящих из предприятий и отдельных специалистов, совместно использующих общие ресурсы. В каждой виртуальной организации имеется своя собственная политика поведения ее участников, которые должны соблюдать установленные правила. Виртуальная организация может образовываться динамически и иметь ограниченное время существования» [2].

Грид активно применяется для проведения масштабных научных исследований. Он позволяет объединять в единую глобальную инфраструктуру разрозненные ресурсы организаций и совместно их использовать большому количеству пользователей. Например, без применения новых подходов к хранению данных, их обработке и анализу, которые заложены в концепции грид, решение задач экспериментов в области ФВЭ на Большом адронном коллайдере

(БАК) в Европейской организации ядерных исследований (ЦЕРН) было бы невозможным, учитывая объёмы поступающих от детекторов данных (десятки петабайт в год [3]), а также необходимость в их дальнейшей обработке и анализе тысячами учёных из распределённых по всему миру центров.

Грид-технологии успешно используются в области биомедицины и фармацевтики. В качестве примеров можно упомянуть такие проекты как MammoGrid и MammoGrid+ [4], имеющих своей целю качественное улучшение диагностики рака груди у женщин; WISDOM и WISDOM-II [5] — исследование посадочных леганд в поиске лекарства от малярии; neuGRID [6] — создание набора медицинских грид-сервисов для изучения дегенеративных болезней мозга. Активное применение и развитие грид-инструментария в области здравохранения способствовало созданию международной ассоциации — HealthGrid Association [7]. Неполный список завершившихся и реализуемых проектов по внедрению и использованию грид-технологий в этой области приведён в [8, с. 40].

Кроме того, в Европе был реализован проект «Business experiments in GRID» (BEinGRID) [9] по изучению возможности трансфера грид-технологий из науки в коммерческую сферу, в результате реализации которого в 25 пилотных бизнес-проектах эти технологии были успешно внедрены.

Облачные технологии обеспечивают сетевой доступ к вычислительным, программным и информационным ресурсам (сетям передачи данных, серверам, устройствам хранения, сервисам и приложениям), конфигурируемым в соответствии с оперативными запросами. Они позволяют значительно сократить расходы на ИТ-инфраструктуру, удовлетворять динамически меняющиеся потребности в ресурсах и т. д.

Важную роль и перспективность обоих подходов в области распределённых вычислений и хранению данных подтверждают объёмы финансирования в размере 600 миллионов евро, выделенные Европейской комиссией для реализации 7-й рамочной программы в период с 2007 по 2013 гг. по исследованиям и технологическому развитию [10, с. 1].

Для широкого спектра задач в области ФВЭ является актуальным сокращение времени их выполнения, а также повышение эффективности использования ресурсов. Одним из решений представляется синтез облачных и грид-технологий. Так, повышение эффективности использования компьютерных ресурсов достигается при размещении грид-сервисов на виртуальных машинах в облачной среде (далее в тексте такие системы будут называться облачными грид-системами), а уменьшение времени выполнения — за счёт решения задач на отдельных специализированных комплексах.

Помимо этого, повышение эффективности использования ресурсов позволяет сократить их количество, необходимое для освоения облачных и грид-технологий, тем самым снижая порог вхождения в эти области.

Таким образом, представляется актуальным разработка методов создания многофункциональных гетерогенных комплексов для решения широкого класса задач в области ФВЭ, позволяющих сократить время решения этих задач и повысить эффективность использования ресурсов.

Целью диссертационной работы является развитие методов построения многофункциональных гетерогенных комплексов с использованием облачных и грид-технологий для решения широкого класса задач в области ФВЭ, позволяющих сократить время их решения и повысить эффективность использования ресурсов; проверка данных методов путём реализации подобного комплекса и использования его для решения конкретных задач; разработка методов адаптации приложений для грид-сред.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Провести анализ задач в области ФВЭ, связанных с хранением, обработкой и анализом данных, и вариантов синтеза облачных и грид-технологий для сокращения времени решения этих задач и повышения эффективности использования ресурсов.

2. Развить методы создания комплексов с использованием облачных и грид-

технологий для решения исследовательских задач в области ФВЭ с учётом их специфики и рационального использования компьютерных ресурсов.

3. С помощью развитых в данной работе методов построить облачную грид-систему и применить её для решения конкретных исследовательских задач ФВЭ.

4. Разработать методы адаптации определённого класса приложений для грид-сред на базе EMI и РГС и провести их тестирование.

Методы исследования. В диссертационном исследовании применены современные подходы к организации распределенной обработки информации, в частности, технологии облачных вычислений, грид-технологии и технологии виртуализации.

Научная новизна данной диссертационной работы заключается в следующем:

1. Развиты методы построения масштабируемых многофункциональных гетерогенных комплексов (облачных грид-систем), которые позволяют сократить время решения широкого круга задач, связанных с хранением, передачей, обработкой и анализом данных экспериментов БАК, и повысить эффективность использования компьютерных ресурсов.

2. Выполнен анализ и сформулированы основные требования для системы мониторинга ресурсов уровня Tier-3. Программная реализация такой системы увеличила эффективность использования ресурсов, позволив ускорить проведение анализа данных и получение физических результатов эксперимента ATLAS.

3. Разработаны методы адаптации определённого класса приложений для использования их в грид-средах на базе EMI и РГС.

Защищаемые положения.

1. Развитые в данной работе методы создания облачных грид-систем для решения исследовательских задач ФВЭ.

2. Облачная грид-система ЛИТ ОИЯИ, реализованная с использованием

предложенных методов.

3. Методы адаптации определённого класса приложений для грид-сред на базе EMI и РГС

4. Ряд адаптированных в эти среды прикладных пакетов для научных исследований в различных областях.

Теоретическая значимость работы определяется развитыми в ней подходами и методами построения многофункциональных гетерогенных комплексов с использованием облачных и грид-технологий для решения широкого класса исследовательских задач в области ФВЭ, а также методами адаптации определённого класса прикладных пакетов для использования их в грид-средах на базе EMI и РГС.

Практическая значимость состоит в том, что развитые в данной работе методы обеспечивают возможность тиражирования подобных комплексов, что позволило построить аналогичные инфраструктуры в институтах стран-участниц ОИЯИ: Центре суперкомпьютерных вычислений Национального технического университета Украины «Киевский политехнический институт», Физико-техническом институте низких температур им. Б.И. Веркина (Украина), Институте теоретической физики им. H.H. Боголюбова (Украина), Институте физики Национальной академии наук Азербайджана.

Комплекс ЛИТ ОИЯИ был использован для решения следующих задач:

- создание средств мониторинга сайтов уровня Tier-3 грид-инфраструктуры эксперимента ATLAS;

- разработка методов адаптации приложений для EMI и РГС, а также перенос ряда прикладных пакетов в упомянутые грид-среды;

- написание подсистемы хранения данных для Российской грид-сети;

- разработка функциональных тестов для ряда грид-сервисов;

- обучение облачным и грид-технологиям, в том числе проведение на регулярной основе занятий в образовательных учреждениях.

Использование созданного комплекса для ряда задач подтверждено соответствующими документами.

Апробация работы. Основные положения и результаты работы докладывались и обсуждались на следующих российских и международных научных мероприятиях:

- The International Conference «Distributed Computing and Grid-technologies in

Science and Education» 2008, 2010, 2012 (Dubna, Russia);

- The International Conference on Computing in High Energy and Nuclear Physics

2012 (New York City, USA);

- научные конференции молодых учёных и специалистов ОИЯИ 2008, 2010,

2011, 2012, 2013 (Дубна, Россия);

- программно-консультативные комитеты ОИЯИ 2010, 2012, 2013.

Цикл работ «Грид-среда ОИЯИ - элемент Российской и глобальной грид-инфраструктуры», включающий в себя исследования, вошедшие в диссертационную работу, был удостоен Первой премии ОИЯИ за 2013 год. Также эти исследования были поддержаны грантами для молодых учёных и специалистов ОИЯИ в 2010, 2011, 2012, 2013 и 2014 годах, в 2008 г. - стипендией им. H.H. Говоруна, в 2012 году удостоены премии конкурса молодёжных работ на конференции молодых учёных и специалистов ОИЯИ.

Публикации. По результатам диссертации опубликовано 29 работ, в том числе 4 [11,12,13,14] — в рецензируемых изданиях1.

Структура и объём работы.

Диссертация состоит из введения, трёх глав, заключения с основными результатами диссертации, приложений и списка литературы. Общий объем диссертации составляет 125 страниц, включая 14 рисунков и 7 таблиц. Список литературы состоит из 101 наименования на 11 страницах.

1 Перечень российских рецензируемых научных журналов, в которых должны бьггь опубликованы основные научные результаты диссертаций на соискание ученых степеней доктора и кандидата наук: http://vak.ed.gov.ru/87

Глава 1. Решение исследовательских задач в ФВЭ, связанных с применением облачных и грид-технологий

1.1. Основные задачи в ФВЭ, связанные с применением ИТ для хранения,

передачи, обработки и анализа данных

Для хранения, передачи, обработки и анализа данных в ФВЭ применяются современные ИТ - облачные и грид-технологии. При их использовании выделяются следующие основные задачи:

1) освоение, связанное с обучением различных категорий специалистов (пользователей, системных администраторов, разработчиков);

2) проведение различных исследовательских работ, включая поиск наиболее подходящей технологии, их комбинаций и (или) типа ресурсов для решения конкретной задачи;

3) развитие, включающее разработку нового функционала и сервисов, а также адаптацию уже существующего программного обеспечения (ПО) или создание нового для работы в той или иной среде;

4) использование, подразумевающее создание и эксплуатацию инфраструктуры.

Для краткости далее в тексте задачи 1-3 из списка выше будут называться «исследовательскими». Аналогично будут называться и комплексы, на которых они решаются, в отличие от производственных грид-систем2.

1.2. Варианты синтеза облачных и грид-технологий

Хотя преимущественные области применения облачных и грид-технологий разнятся, для ряда перечисленных выше задач совместное использование обоих подходов позволяет повысить эффективность использования компьютерных ресурсов и скорость решения этих задач.

2 Под производственной грид-системой понимается система, которая используется для

хранения, обработки и анализа реальных данных (например, инфраструктура \VLCG в случае

экспериментов на БАК).

Можно выделить несколько вариантов синтеза облачных и грид-технологий (см. рис. 1):

1) облачные ресурсы используются в дополнение к грид-ресурсам (например, во время пиковых нагрузок для обеспечения необходимого качества обслуживания);

2) все грид-сервисы, включая элементы хранения данных и вычислительные элементы, размещаются на виртуальных машинах в облачной среде;

3) все грид-сервисы размещаются на виртуальных машинах в облачной среде и дефицит ресурсов удовлетворяется за счёт облака (т. е. комбинация двух

Соответствие задач вариантам совместного использования облачных и грид-технологий представлено в таблице 1 (знак «+» в ячейке таблицы указывает на возможность получения преимуществ от применения обоих технологий, а знак «-» — на отсутствие такой возможности либо её наличие, но не во всех случаях).

Таблица 1. Соответствие задач возможным вариантам синтеза облачных и грид-

технологий

Задача \ Вариант 1 2 3

(1) обучение - + +

(2) исследования - + +

(3) �