автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Создание информационно-вычислительной среды и решение некоторых задач моделирования и обработки данных для физических экспериментов
Оглавление автор диссертации — кандидата физико-математических наук Тихоненко, Елена Александровна
Введение
1. Создание в ОИЯИ информационно-вычислительной среды для физических экспериментов на ускорителе LHC
1.1. Постановка задачи создания информационно- вычислительной среды для эксперимента CMS в ОИЯИ.
1.2. Создание информационно-вычислительной среды для эксперимента CMS в ОИЯИ для стадии строительства установки
1.3. Дальнейшие перспективы организациии информационно- вычислительной среды для физических экспериментов на LHC в ОИЯИ.
2. Исследование возможностей ЭВМ СКЦ ОИЯИ для повышения эффективности решения физических задач и оказание методической помощи пользователям 37 2.1. Создание генератора случайных чисел на основе двумерного клеточного автомата и векторная программная реализация его алгоритма на ЭВМ Сопуех
2.1.1. Алгоритмы и программная реализация генератора и статистических тестов
2.1.2. Метод вложенных гистограмм для проверки многомерных случайных последовательностей
2.1.3. Результаты и выводы.
2.2. Исследование возможностей параллельной реализации на ЭВМ SPP-2000 задачи минимизации функционала при обработке данных с мюонных торцевых камер эксперимента CMS
2.2.1. Проблема восстановления координат заряженных частиц в мюонных торцевых камерах CMS.
2.2.2. Программная реализация и сравнительные результаты
2.3. Оказание методической помощи пользователям СКЦ ОИЯИ
3. Робастный подход для получения оптимальных оценок параметров мюонных треков в катодно-стриповых камерах эксперимента CMS
3.1. Постановка задачи.
3.2. Математическая модель и особенности реализации робаст-ного подхода.
3.3. Модель Монте-Карло и полученные результаты.
Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Тихоненко, Елена Александровна
Участие в современых физических экспериментах предполагает активное использование средств вычислительной техники и применение различных математических методов в физических исследованиях.
Сотрудники Объединенного института ядерных исследованиях (ОИЯИ) участвуют во многих крупных международных физических экспериментах. Это требует организации компьютинга1 для данных экспериментов в ОИЯИ для того, чтобы специалисты института имели возможность полноценно сотрудничать со своими коллаборациями, находясь длительное время в ОИЯИ. Требования к компьютингу крупных экспериментов очень разнятся в силу узкой специализации программного обеспечения для исследований в рамках этих экспериментов, необходимости поддержки этого программного обеспечения в среде соответствующих операционных систем, а также вследствие различия потребностей в вычислительных, дисковых, архивных и сетевых ресурсах, что определяется спецификой решаемых на конкретных экспериментах задач.
В настоящее время в CERN (Швейцария) создается крупнейший в мире ускорительный комплекс частиц Большой Адронный Коллайдер (LHC -Large Hadron Collider) [3]. ОИЯИ на протяжении нескольких последних лет активно участвует в трех проектах на LHC: ALICE, ATLAS и CMS. В этих работах принимает участие более 400 сотрудников ОИЯИ, которые занимаются проектированием и изготовлением детекторов, участвуют в развод "компьютингом" в данном контексте понимается применение программных средств и средств вычислительной техники для целей физических исследований. работке физических исследований и программного обеспечения для этих установок.
На данном этапе - строительства ускорителя и физических установок на нем - многие из перечисленных выше работ, в которых участвуют сотрудники ОИЯИ, требуют использования средств вычислительной техники. Далее, на действующей фазе ускорителя и установок задача организации процесса обработки и анализа данных становится особенно актуальной, поскольку реализация этой задачи является наиболее крупным информационно-вычислительным проектом в мире на ближайшие годы: необходимо будет обеспечить многоуровневую обработку данных огромного объема (Петабайты данных ежегодно) с прозрачным и быстрым доступом к этим данным из разных стран мира. Учитывая большой вклад специалистов ОИЯИ в проектах на LHC на стадии строительства ускорителя и установок, немаловажно создать основу для будущего их участия в работах на LHC после его запуска.
Вычислительно-информационная инфраструктура ОИЯИ в большой степени ориентирована на платформу UNIX [1]. Это хорошо согласуется с общими тенденциями организации компьютинга для физических экспериментов во всем мире. Однако использование множества операционных систем UNIX-платформы (ConvexOS, HP-UX, SPP-UX, Solaris, Linux) накладывает свои требования: необходимо создать унифицированный пользовательский интерфейс к специализированному программному обеспечению для физических экспериментов и выполнять определенную адаптацию этого программного обеспечения. Многообразие архитектур компьютеров, входящих в состав суперкомпьютерного центра ОИЯИ (СКЦ ОИЯИ), приводит к необходимости исследования, каким образом оптимизировать выполнение тех или иных задач, решаемых в рамках физических экспериментов.
Настоящая диссертация посвящена проблеме создания в ОИЯИ информационно-вычислительной среды для физических экспериментов в контексте создания необходимого программного окружения и использования комплексов программ, вопросам исследования созданной проблемно-ориентированной среды, в том числе, вопросам повышения эффективности использования ЭВМ ОИЯИ для решения физических задач, вопросам создания инструментария проблемно-ориентированной среды и реализации в этой среде некоторых математических методов для физических исследований как программных приложений для конкретных практических областей.
Изложены принципы и практическая реализация создания информационно - вычислительной среды для крупного физического эксперимента CMS [2] в ОИЯИ на стадии строительства установки как основы для участия ОИЯИ в создании регионального информационно-вычислительного центра для LHC в России.
Создаваемая для целей физических экспериментов информационно - вычислительная среда на ЦВК ОИЯИ требует изучения ее свойств. В процессе изучения использования векторно-параллельной ЭВМ Convex-220 и параллельного суперкомпьютера SPP-2000 для целей физических исследований автором были решены некоторые задачи, имеющие важное практическое применение, в частности, реализован новый генератор случайных многомерных векторов на базе двумерного бинарного клеточного автомата и исследовано использование SPP-2000 для решения задач минимизации функционала при обработке данных для эксперимента CMS. В процессе создания данных программ были исследованы возможности реализации соответствующих алгоритмов с учетом специфики архитектуры Convex-220 и SPP-2000. Данные работы оказались методически полезны для пользователей указанных ЭВМ, поскольку были выполнены на начальном этапе эксплуатации как Convex-220, так и SPP-2000. Более того, программная реализация генератора может рассматриваться как часть промежуточного слоя специализированного программного обеспечения.
Дальнейший интерес к применению математических методов для решения физических задач привел к использованию робастных методов для реконструкции трек-сегментов в мюонных торцевых камерах эксперимента CMS и, в конечном итоге, к созданию программного приложения для использования в практических целях при моделировании, а также при обработке экспериментальных данных с прототипа мюонной торцевой камеры.
Рассмотрим последовательно круг проблем, касающихся работ, включенных в диссертацию.
Начнем с освещения вопроса создания в ОИЯИ информационно-вычислительной среды для международного эксперимента CMS. Как уже было упомянуто выше, ОИЯИ является активным участников трех крупных экспериментов, планирующихся на LHC: ALICE, ATLAS и CMS. Ускоритель LHC предполагается ввести в эксплуатацию после 2005 года. В настоящее время происходит процесс проектирования и строительства физических установок, ведутся работы по моделированию установок и физических процессов в них.
Для определения стратегии организации компьютинга эксперимента CMS в 1996 году в CERN был принят проект по компьютингу CMS [4]. Этот проект разрабатывался в контексте координации работ всех специалистов, работающих в различных научных центрах и с учетом стремительно меняющейся ситуации в компьютерной сфере. В разработке данного проекта участвовали специалисты из всех организаций, участвующих в эксперименте CMS, в том числе и сотрудники ОИЯИ, включая автора данной диссертации. Правильно выбранная стратегия компьютинга позволила успешно решать задачи проектирования установки CMS и создала основу для ее успешной эксплуатации в дальнейшем.
Разработанные в [4] предложения по компьютингу CMS касаются как стадии конструирования установки, так и периода ее эксплуатации. Компьютерные требования на этих двух этапах существенно разнятся.
К основным задачам на этапе конструирования относятся, прежде всего, моделирование физических процессов и установки, включая генерацию событий, трекинг частиц, моделирование радиационного фона и электронных шумов, моделирование тригеров различного уровня, реконструкцию и анализ событий, а также визуализацию событий и процессов. Перечисленные задачи были решены в общей программе моделирования CMSIM [5] , написанной на языке Fortran, и на данном этапе решаются в новом объектно-ориентированном пакете ORCA [6], написанном на языке С++. Соответственно, во всех научных организациях, участвующих в работах по моделированию, необходимо наличие работающих актуальных версий CMSIM и ORCA и соответствующего унифицированного программного окружения. Немаловажной задачей является также обеспечение необходимого информационного сервиса в организациях-членах коллаборации CMS средствами WWW.
Для реализации задачи надлежащей организации компьютинга необходимо создание унифициованной программной среды. С середины 90-х годов коллаборацией CMS была признана базовой платформа UNIX: вначале это была операционная система SunOS, затем коммерческая система Solaris (на платформе Sun-станций). В последние годы прослеживается тенденция активного использования операционной системы Linux Red Hat - в связи с ориентацией на массовое создание PC-ферм в CERN и организациях-участницах эксперимента [7].
В качестве языка программирования предпочтение отдано языку С++ в связи с полным переходом на объектно-ориентированную платформу. При этом следует отметить, что предполагается полный отказ от использования языка FORTRAN. Произошел также переход от CMZ-технологии сборки библиотек [8] к технологии CVS [9]. Для сборки крупных пакетов программ в коллаборации CMS используется новое программное средство SCRAM [10].
Переход на объектно-ориентированную платформу в создании приложений для физики высоких энергий (ФВЭ) объясняется все возрастающим усложнением задач создания этих приложений, а именно объектно-ориентированный подход дает возможность разложить сложную проблему на составные части, причем каждая составляющая становится самостоятельным объектом, содержащим свои коды и данные, которые к этому объекту относятся. Разбиение сложной задачи на группы более простых увеличивает надежность программного обеспечения, создает основу для гибкого и четкого процесса управления разработкой кода, открывает новые возможности к повторному использованию кода. Принципиальным с точки зрения создания программы становится необходимость разработки прежде всего структуры данных, а только затем - способов работы с этими данными. Сама концепция объектов очень естественна для организации логического процесса анализа физических данных. Кроме того, как справедливо отмечает создатель С++ Б.Страуструп [11], наиболее сильной стороной этого языка является возможность активного его использования в программах, предназначенных для широкого диапазона прикладных областей. В этом смысле можно считать типичным приложение, которое включает в себя доступ к глобальной и локальной сетям, численные расчеты, графику, интерактивное взаимодействие с пользователем и обращение к базам данных. Ранее такие области считались раздельными и реализация математического обеспечения производилась группами специалистов различного профиля и с использованием разных языков программирования. Создание подобных приложений как раз особенно актуально для современных крупных экспериментов ФВЭ.
Что касается требований к компьютингу на стадии эксплуатации физических установок на LHC, в том числе и для установки CMS, то они являются совершенно беспрецедентными по свому масштабу, поскольку будут получены колоссальные объемы физических данных порядка петабайтов и возникнет необходимость организации доступа к данным и последующей их обработки и анализа в географически удаленных научных организациях.
В течение нескольких последних лет в CERN была выработана модель компьютинга в эру LHC [12, 13]. Согласно этой модели будут созданы вычислительно-информационные центры разного уровня (TierO, Tierl, ., Tier4) в странах-участницах экспериментов. На рис. 0.0.1 представлена примерная схема иерархии вычислительно-информационных центров для LHC и приведены требуемые скорости коммуникаций. Реализация таких структур предполагает использование современных grid-технологий [14], в которых находит свою практическую реализацию недавно сформулированная концепция GRID, предполагающая интеграцию большого объема вычислительных и информационных ресурсов, удаленных географически друг от друга.
GRID - это зарождающаяся инфраструктура, которая может кардинально изменить наши привычные представления о компьютинге. Предполагается, что grid-структуры смогут объединить региональные и национальные вычислительные компьютерные инфраструктуры для создания всеобщего ресурса вычислительной мощности. Само название "grid" было выбрано по аналогии с электрическими сетями (power grid), в которых обеспечивается всеобщий доступ к электрической мощности и которые оказали огромное влияние на человеческие возможности и общество. Как и в электрических сетях, предполагается интегрировать большой объем географически удаленных ресурсов. Если доступ к вычислительным grid-структурам будет всеобщим, надежным, постоянным и согласованным, а также недорогим, то предполагается, что их влияние на развитие компьютинга и, в конечном итоге, на общественное развитие будет революционным. Можно определить GRID как компьютерную инфраструктуру будущего и основной фундамент в создании глобального информационного общества XXI века.
Физика частиц всегда способствовала значительному прогрессу компьютерных технологий. Примером тому может служить Всемирная паутина -WWW, созданная именно в CERN. Продолжая эту традицию, физика ча
-d я p о о К
CD X со § к о а Я 4 5 сг я 0 1
Я Я 9о § я о а аз S3 х в
CD И н о
СП Г К О
1 Pbytes/sec
Tier 1
Tier 2
Tier 3 С Отдельные институты
V~1 Mbytes/sec i i i рабочие места физиков
Приведенные требуемые скорости коммуникаций в структуре региональных центров для ЬНС даны в соответствии с требованиями ЬНС-коллабораций и результатами моделирования по проекту МСШАЫС.
Tier 4 стиц скоро (с запуском ускорителя LHC и физических установок на нем) предоставит широкие возможности для испытания grid-систем - мощных управляемых распределенных систем информации.
Для обеспечения участия специалистов ОИЯИ в работах по эксперименту CMS была создана инфомационно - вычислительная среда, что предоставило возможность сотрудникам ОИЯИ полноценно участвовать в работах по CMS на протяжении ряда лет непосредственно в ОИЯИ и создало определенную базу для участия ОИЯИ в организации регионального распределенного информационно-вычислительного центра для LHC в России [15] (т.е. не только для эксперимента CMS, а для всех экспериментов, строящихся на LHC). В настоящее время начаты совместные работы с другими российскими институтами в направлении создания распределенных информационно-вычислительных структур в Московском регионе
Перейдем теперь к вопросам исследования свойств проблемно - ориентированной среды и повышения эффективности использования ЭВМ Суперкомпьютерного центра (СКЦ) ОИЯИ [1] для решения некоторых физических задач. По мере появления в СКЦ ОИЯИ новых ЭВМ необходимо было освоить особенности работы на этих компьютерах для того, чтобы пользователи центра могли решать свои задачи наиболее эффективным образом.
Так, например, для исследования векторно-параллельной ЭВМ Convex-220 была выбрана задача построения генератора случайных чисел на базе клеточного автомата. Эта задача интересна как с точки зрения попытки создания генератора, соответствующего требованиям, предъявляемым к генераторам случайных чисел, так и с точки зрения реализации генератора, производящего вектор случайных величин, на компьютере векторной архитектуры. Более того, программа генератора может рассматриваться как составная часть инструментария проблемно - ориентированной среды; иными словами - как часть промежуточного слоя специализированного программного обеспечения.
Для разработки программного обеспечения в экспериментальной и теоретической физике важно наличие быстрого и надежного генератора случайных чисел (ГСЧ). Опыт предыдущих усилий в этом направлении [16] показывает безусловное преимущество ГСЧ, работающих в режиме групповой генерации. Последнее приводит к идее использования клеточного автомата (КА).
Известная работа С.Вольфрама [17] дает детальный пример и теоретическое обоснование ГСЧ на базе одномерного КА, реализующего псевдослучайную последовательность Фибоначчи. В этой связи возникла идея использования более широких возможностей двумерного КА и создания программы генератора для практического использования.
По определению классической работы Т.Тоффоли [19]: "Клеточные автоматы являются дискретными динамическими системами, поведение которых полностью определяется в терминах локальных зависимостей." Эволюция КА развертывается в дискретных пространствах, состоящих из клеток (ячеек). Законы эволюции локальны, т.е. динамика системы задается неизменным набором правил, по которым осуществляется вычисление нового состояния клеток в зависимости от состояния окружающих ее соседей. Существенно, что эта смена состояний происходит одновременно и параллельно, а время идет дискретно.
Несмотря на определенную простоту их построения КА могут демонстрировать разнообразное и сложное поведение [20] , что дает возможность использовать КА в моделировании природных систем и физических процессов [21, 22], а также и для генерации случайных чисел.
Исследовались различные варианты генерации случайных последовательностей с помощью двумерного бинарного КА, т.е. задавались различные правила работы КА, после чего был выбран некоторый оптимальный вариант с точки зрения соответствия требованиям к генераторам псевдослучайных чисел.
Трудности чисто аналитического характера при исследовании свойств ГСЧ отмечались еще в [16] и привели к необходимости статистической проверки получаемого генератора для определения периода и исследования статистических качеств. Таким образом, потребовалось разработать также и адекватный статистический инструментарий для надежной проверки получаемой последовательности. Помимо традиционных теста интервалов, теста на монотонность [18], проверки на периодичность и корреляционного теста применяется оригинальный метод проверки равномерности распределения многомерных случайных векторов, называемый методом вложенных гистограмм [60].
Программная реализация формул, определяющих поведение КА, с использованием векторных возможностей языка Fortran-90 позволила существенно оптимизировать программу генератора по сравнению со скалярным вариантом.
Таким образом, в диссертации предлагается новый способ генерации многомерной случайной последовательности с помощью двумерного бинарного КА и разработаны алгоритмы для проверки периодичности и качества распределения (в том числе, в многомерном единичном кубе). Эффективность генератора обеспечена использованием векторных возможностей ЭВМ Convex-220, а также использованием встроенных в транслятор Convex Fortran 77 операторов языка программирования Fortran 90.
Для исследования возможностей параллелизации на суперкомпьютере SPP-2000 была выбрана задача минимизации функционала при построении оптимальной передаточной функции для наиболее точного измерения координаты заряженной частицы в торцевых мюонных детекторах установки CMS. Следует отметить, что проблема минимизации функционалов по параметрам присуща широкому кругу задач обработки экспериментальных данных, где возникает необходимость получения оптимальных оценок подгонки параметров. Итогом работы явилось создание программы с параллелизацией внутренних вычислительных циклов, в которых не содержится обращений к наборам экспериментальных данных. Были также исследованы оптимизирующие возможности транслятора с языка Fortran 77 на ЭВМ SPP-2000 и были произведены сравнительные оценки возможностей данного транслятора по сравнению с транслятором с языка Fortran 77 в среде операционной системы Solaris.
На основе полученного опыта работы в соответствующей среде операционных систем и выработанными на этой основе методическими рекомендациями для пользователей ЭВМ семейства Convex было подготовлено и издано обширное руководство, содержащее общие сведения по работе в Unix-среде, а также практические рекомендации по работе с трансляторами, математическими библиотеками, организации запуска задач пользователей в пакетном режиме. Руководство содержит справочный материал по системе UNIX-команд, сравнительный анализ команд операционных систем VMS и UNIX, рекомендации по использованию информационных средств, описание работы с почтовым сервисом и работы с текстовыми редакторами.
Более детальное ознакомление со специализированным математическим обеспечением для эксперимента CMS привело к исследованиям, связанным с усовершенствованием алгоритма восстановления трек-сегментов в торцевых мюонных камерах установки CMS [23].
Мюонная система является важной частью установки CMS. Мюонная система CMS должна обеспечивать при тяжелых фоновых условиях высокую эффективность восстановления мюонных треков с высоким пространственным разрешением. В качестве мюонных детекторов в торцевой области установки CMS используются 6-ти слойные многопроволочные пропорциональные стриповые камеры (CSC - Cathode Strip Chambers) с нарезкой катодов на полосы - радиальные стрипы. Считывание сигнала производится с этих катодных стрипов. Распределение ошибки измерений мюонных координат вследствие сильного засорения не является нормальным распределением. В подобных случаях использование традиционного метода наименьших квадратов (МНК) для обработки данных становится необоснованным. В таких тяжелых фоновых условиях необходимо применение робастных2 методов подгонки параметров. Теория робастности (стабильности) статистических оценок и выводов (т.е. устойчивости к засорению выборки) достаточно обширно развита в современной математической статистике (см., например, [76, 25]).
Задачей теории робастности является разработка таких статистических процедур, которые лишь незначительно уступают в эффективности классическим оптимальным процедурам при точном выполнении условий их оптимальности и в отличие от них сохраняют высокую эффективность при нарушении этих условий." [26] Термин "робастный" в указанном выше смысле был введен в 1953 году Боксом [27].
В диссертации излагается робастный подход для получения оптимальных оценок параметров мюонных трек-сегментов в CSC. Для фитирова-ния трек-сегментов в CS С и определения пространственного разрешения камеры предлагается робастный метод с суб-оптимальной весовой функцией (М-оценка). Значения весов определяются по методу максимального правдоподобия (ММП) и затем аппроксимируются полиномами 4-го и 8-го порядков, что позволяет организовать итерационную процедуру для получения значений искомых параметров. Сравнительный анализ результатов, полученных с использованием традиционного МНК и робастного метода, был произведен как на модельных данных, так и на экспериментальных данных, полученных на ускорителе SPS в CERN на дубненском прототипе CSC [28].
Таким образом, в диссертации рассмотрен и решен ряд вопросов, связанных с созданием и исследованием свойств информационно-вычислительной
2от англ.robust - здоровый, крепкий среды для физических экспериментов, а также с решением конкретных практических задач моделирования и обработки данных для физических экспериментов, и цели диссертационной работы можно определить следующим образом:
• создание информационно-вычислительной среды для эксперимента CMS для обеспечения возможности проведения в ОИЯИ необходимых работ по данному эксперименту, требующих привлечения программных средств, на стадии строительства данной установки и как основы для участия ОИЯИ в организации регионального информационно-вычислительного центра для LHC в России на действующей фазе ускорителя LHC и физических установок (после 2005 г.);
• исследование возможностей повышения эффективности решения физических задач пользователей в проблемно - ориентированной программной среде на ЭВМ СКЦ ОИЯИ векторной и параллельной архитектуры и оказание методической поддержки пользователям СКЦ ОИЯИ:
- создание алгоритма и программы для реализации генератора псевдослучайных векторов на базе бинарного двумерного клеточного автомата на ЭВМ Convex-220 и исследование статистичеких свойств данного генератора;
- параллельная реализация на ЭВМ SPP-2000 задачи минимизации функционала при обработке экспериментальных данных с прототипа мюонных торцевых камер эксперимента CMS;
• разработка, программная реализация и тестирование робастного подхода для нахождения оптимальных параметров трек-сегментов в мюонных катодно-стриповых камерах эксперимента CMS и оценки пространственного разрешения в них .
Актуальность работы определяется следующим:
• Поскольку ОИЯИ участвует в проектировании, изготовлении и вводе в эксплуатацию торцевых адронных калориметров и передней мюон-ной станции ME 1/1 для установки CMS, принимает участие в работах по созданию предливневого детектора и программ физического анализа экспериментальных данных эксперимента CMS, а перечисленные выше работы требуют, в том числе, привлечения и использования большого спектра специализированного математического обеспечения, то для создания условий полноценного сотрудничества специалистов ОИЯИ в рамках CMS была поставлена задача создания информационно - вычислительной среды для эксперимента CMS в ОИЯИ.
Дальнейшее участие специалистов ОИЯИ в строящихся на LHC экспериментах (ATLAS, CMS и ALICE), в особенности на действующей фазе ускорителя и установок, требует создания в России регионального информационно- вычислительного центра для LHC. В этом контексте создание информационно- вычислительной среды для эксперимента CMS в ОИЯИ в значительной степени послужило основой для участия ОИЯИ в общероссийском проекте создания в России распределенного регионального информационно-вычислительного центра для LHC.
• Созданная для целей физических экспериментов информационно -вычислительная среда на ЦВК ОИЯИ требовала изучения ее свойств. В контексте этого на начальном этапе эксплуатации ЭВМ Convex-220 и SPP-2000 были поставлены задачи изучения особенностей работы на этих ЭВМ с точки зрения возможностей векторизации и параллели-зации на конкретных практических задачах.
• Создание инструментария, иначе говоря, промежуточного слоя специализированного программного обеспечения как средств проблемно ориентированной программной среды для решения физических задач является важной и актуальной задачей.
Для разработки программного обеспечения в экспериментальной и теоретической физике важно наличие быстрого и надежного генератора случайных чисел. Опыт предыдущих усилий в этом направлении показывает безусловное преимущество генераторов случайных чисел, работающих в режиме групповой генерации. Таким образом, была поставлена задача создания генератора случайных векторов на базе клеточного автомата как некоторого инструментального средства.
• Создание программных приложений для конкретных практических областей является неотъемлимой частью создания информационно -вычислительной среды.
Возрастающие требования к высокой эффективности реконструкции траекторий заряженных частиц в координатных детекторах и повышению точности восстановления параметров треков в условиях сильного зашумления данных приводят к выводу, что традиционные методы оценок параметров треков (например, общепринятый метод наименьших квадратов) теряют свои оптимальные свойства. Поэтому становится актуальной задача разработки нового математического и алгоритмического аппарата для оптимальной подгонки параметров треков в подобных условиях и, наконец, создания собственно программного приложения для практического использования.
Диссертация состоит из введения, трех глав и заключения.
Заключение диссертация на тему "Создание информационно-вычислительной среды и решение некоторых задач моделирования и обработки данных для физических экспериментов"
Заключение
Основными результатами диссертации являются:
1. Создание в Объединенном институте ядерных исследований информационно - вычислительной среды для крупного международного физического эксперимента CMS. Созданная информационно - вычислительная среда полностью соответствует требованиям данного эксперимента. Создан единый пользовательский интерфейс при работе в этой среде во всех операционных системах UNIX-платформы (ConvexOS, HP-UX, SPP-UX, Solaris, Linux), поддерживаемых на СКЦ ОИЯИ. Создан информационный WWW-сервер для освещения участия российских институтов и стран-участниц ОИЯИ в эксперименте CMS. На информационном WWW-сервере реализован удобный пользовательский интерфейс для доступа к инженерной и конструкторской документации.
Создание информационно-вычислительной среды для эксперимента CMS стало основой для участия ОИЯИ в российском проекте по организации регионального информационно-вычислительного центра для LHC в России, в разработке которого автор принимает большое участие.
2. Разработан новый генератор псевдослучайных векторов на базе двумерного клеточного автомата, имеющий удовлетворительные статистические качества. Приведены результаты испытаний генератора на базе стандартных статистических тестов (теста на монотонность, теста интервалов), проверке на корреляцию и проверке на длину периода, а также с помощью метода вложенных гистограмм. Генератор успешно использовался в задаче вычисления теплоемкости в точке кроссовера для SU(2) калибровочной теории на решетке, что продемонстрировало, в частности, отсутствие корреляций высокого порядка. Созданная программа генератора является новым инструментальным средством проблемно - ориентированной среды, созданной на ЦВК ОИЯИ для целей физических исследований.
3. Параллельная реализация на ЭВМ SPP-2000 задачи минимизации функционала при обработке экспериментальных данных с прототипа мю-онных торцевых камер установки CMS не только позволила решать более эффективно эту ресурсоемкую задачу, но также изучить оптимизирующие возможности транслятора Exemplar Fortran 77, что имело важное методическое значение.
4. Разработан и протестирован робастный метод для нахождения оптимальных параметров трек-сегментов в мюонных катодно-стриповых камерах эксперимента CMS и оценки пространственного разрешения камер в условиях сильного зашумления данных. Результаты сравнительного анализа результатов, получаемых с помощью традиционного метода наименьших квадратов и предлагаемого робастного метода определенно доказывают необходимость использования робастного подхода для решения данной задачи.
Программная реализация предложенного метода используется как практическое программное приложение информационно - вычислительной среды для эксперимента CMS как для целей моделирования, так и для обработки экспериментальных данных с дубненского полномасштабного прототипа катодно - стриповой камеры. При этом удалось повысить точность оценки параметров в 1.7 раза и повысить эффективность реконструкции треков на 3 %, что позволило удовлетворить техническим требованиям для данных камер.
Научная новизна изложенных результатов состоит в следующем:
• ОИЯИ стал первым и оставался единственным с 1996 года до 2000 года в России из институтов-участников эксперимента CMS, где была создана информационно - вычислительная среда для эксперимента CMS для стадии конструирования установки, и, тем самым, была подготовлена основательная база для участия ученых ОИЯИ в будущей работе на действующей установке CMS.
• Впервые был реализован генератор случайных чисел на базе двумерного бинарного клеточного автомата, выдающий на каждом такте последовательность случайных векторов.
• Разработан математический подход, алгоритм и программная реализация робастного фитирования треков в катодно-стриповых камерах, впервые позволяющие получить оптимальные оценки параметров треков в этих камерах, несмотря на сильное загрязнение данных.
Практическая значимость диссертационной работы может быть определена следующим образом:
• В созданной в ОИЯИ информационно - вычислительной среде для проведения работ по тематике CMS сотрудниками ЛИТ и ЛФЧ ОИЯИ в течение последних 6 лет проводилась обработка данных с прототипов детекторов CMS и велась работа по моделированию физических процессов и установки, активно использовались возможности архивирования для электронных и механических разработок. Количество пользователй созданной информационно - вычислительной среды -около 100 сотрудников ОИЯИ, участвующих в эксперименте CMS.
-88
Информационная поддержка коллаборации RDMS (Russia and Dubna Member States) CMS средствами www способствовала координации в работе институтов, участвующих в проекте.
Заложен определенный фундамент для участия ОИЯИ в создании регионального информационно-вычислительного центра для LHC.
• Реализованный новый генератор случайных векторов на базе бинарного двумерного клеточного автомата успешно использовался в практической задаче SU(2) калибровочной теории на решетке.
• Предложенный вместо метода наименьших квадратов робастный подход позволил получить достоверные оценки параметров треков в катодно стриповых камерах в условиях сильного загрязнения данных, удовлетворяющие требованиям эксперимента CMS. При этом по простоте реализации предлагаемый подход приближается к методу наименьших квадратов, что также представляет его практическую ценность.
Разработанный метод используется на практике для целей моделирования и обработки экспериментальных данных с прототипа катодно-стриповой камеры.
Я глубоко признательна моим учителям и научным руководителям и соавторам проф. Геннадию Алексеевичу Ососкову и к.ф.-м.н. Владимиру Васильевичу Коренькову, которые всемерно способствовали моему профессиональному становлению. Я хочу выразить также восхищение их увлеченностью и преданностью науке и внимательным, неравнодушным отношением к своим ученикам и коллегам. Я сердечно благодарна проф. Игорю Анатольевичу Голутвину за многолетнее сотрудничество, постоянную поддержку и многочисленные полезные советы. Мне хотелось бы также выразить искреннюю признательность проф. Евгению Петровичу Жидкову, чье внимательное и дружелюбное отношение и интерес к моей работе во многом способствовали тому, что я наконец оформила некоторые результаты своих работ в виде данной диссертационной работы. Я считаю своим приятным долгом выразить благодарность и признательность сотрудникам Лаборатории информационных технологий (ЛИТ) ОИЯИ к.ф.-м.н. Владимиру Владимировичу Пальчику и Александру Михайловичу Задорожному и сотрудникам Лаборатории физики частиц (ЛФЧ) ОИЯИ к.ф.-м.н. Юрию Тихоновичу Кирюшину и Сергею Александровичу Мовчану за интересное многолетнее и плодотворное сотрудничество, результаты которого представлены в диссертации. Особую благодарность за плодотворное многолетнее сотрудничество я хочу выразить своему коллеге и доброму товарищу с.н.с. Валерию Валентиновичу Мицыну - блестящему специалисту в области информационно - вычислительных систем. Также я хочу поблагодарить всех своих многочисленных коллег и друзей за сотрудничество и поддержку.
Библиография Тихоненко, Елена Александровна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. V.Korenkov. Status and Perspectives of J1.R Computing Center.// Proc. of Int.Conference HIPER'98, Zurich, Switzerland, 1998, pp. 224-227.
2. CMS Collaboration. The Compact Muon Solenoid, Technical Proposal, CERN/LHCC 94-38, LHCC/P1, CERN, Geneva, 1994.
3. L.R.Evans. The Large Hadron Collider. AC/95-02, LHC Document, CERN, Geneva, 1995.
4. CMS Collaboration. CMS Computing Technical Proposal. 96-45, CERN/LHCC Document, CERN, Geneva, 1996.5. http://cmsdoc.cern.ch/cmsim/cmsim.html6. http://cmsdoc.cern.ch/orca
5. G.P.Yeh. Computing Farms. Fermilab-Conf-00/053, 2000.8. http://wwwinfo.cern.ch/cmz9. http://www.cvshome.org/10. http://cmsdoc.cern.ch/cgi-cms/scrampage
6. Б.Страуструп. Язык программирования С++. BINOM Publishers, M., 1999.12. http://www. cern. ch/MONARC
7. M.Aderholz et al. Models of Networked Analysis at Regional Centres for LHC Expriments. KEK Preprint 2000-8, CERN/LCB 2000-001, 2000.
8. J.Foster and K.Kesselman, editors. GRID: a Blueprint to the New Computing Infrastructure. Morgan Kaufman Publishers, 1999.15. http://theory.npi.msu.suAlyin/RIVK-BAK
9. F James. A Rewiew of Pseudorandom Number Generators.// Computer Physics Communications, 60(1990), pp. 329-344.
10. S.Wolfram. Ramdom Sequences Generation by Cellular Automata.// Advances in Applied Mathematics 7, 1986, pp. 123-169.
11. D.E.Knuth. Seminumerical Algorithms. Vol.2, Addison-Wesley, Mass., 1981.
12. T.Toffoli, N.Margolus. Cellular Automata Machines: A New Environment For Modelling. MIT Press, Cambridge, Mass., 1987.
13. S.Wolfram. Statistical Mechanics of Cellular Automata.// Rev.Modern Phys., 55, 1983.
14. B.Denby. Neural Networks and Cellular Automata in Experimential High Energy Physics.// Computer Physics Communications 49, 1988, pp. 429-448.
15. B.Boghosian. Lattice Gases Illustrate the Power of Cellular Automata in Physics.// Computers in Physics, Nov/Dec, 1991, pp. 585-590.
16. The Muon Project. Techical Design Report. 97-32, CERN/LHCC Document, CMS TDR 3, CERN, Genvea, 1997.
17. Ф.Хампель, Э.Рончетти, П.Рауссеу, В.Штаэль. Робастность в статистике. М., Мир, 1989.
18. П.Хьюбер. Робастность в статистике. М., Мир, 1984.
19. А.А.Ершов. Стабильные методы оценки параметров.// Автоматика и телемеханика, М., Наука, т.8, 1978, с. 66-100.
20. Box G.E.P. Non-normality and tests on variances.// Biometrika, v.40, 153, pp. 318-335.
21. I.A.Golutvin et al. Muon track reconstruction efficiency of ME1/1 prototype in the Integrated Test, CMS Note/ 1997-084 , CERN, Geneva, 1997.29. http://www. globus, org
22. O.Kodolova, E.Tikhonenko. Russian Regional Computing Center for LHC: Current Status and Plans.// CMS Conference talk 2000-030, CERN, Geneva, 2000.
23. В.В.Кореньков, Е.А.Тихоненко. О необходимости создания российского Grid-сегмента.// Сборник тезисов всероссийской научной конференции "INTERNET в научных исследованиях, М., изд.МГУ, 2000, с.86.
24. O.Kodolova, E.Tikhonenko "CMS Computing Activities in Russia".// Book of Abstracts of XVIII JINR Int. Symposium on Nuclear Electronics & Computing, JINR, Dubna, 2001, p.27.
25. I.Golutvin, V.Korenkov, A.Lavrent'ev, R.Pose, E.Tikhonenko. CMS Computing Support at JINR. Communication of the JINR, Dll-98-122, Dubna: JINR, 1998, 10 p.36. http://wwwinfo. cern. ch/asd/lhc+ +37. http://www.sgi.com/software
26. T.Davis. OpenGL Programming Guide: The Official Guide to Learning OpenGl, Massachusetts, Addison-Wesley, 1993.39. http://www.sgi.eom/Technology/Inventor.html40. http://www. tgs. com
27. В.В.Кореньков, В.В.Мицын, Е.А.Тихоненко. Участие ОИЯИ в организации регионального информационно- вычислительного центра для LHC в России. Сообщение ОИЯИ, Р11-2001-24, Дубна: ОИЯИ, 2001, 8 с.
28. В.В.Кореньков, В.В.Мицын, Е.А.Тихоненко. Концепция GRID: на пути к глобальному информационному обществу XXI века. Сообщение ОИЯИ, Р11-2001-58, Дубна: ОИЯИ, 2001, 10 с.
29. В.В.Кореньков, Е.А.Тихоненко. Концепция GRID и компьютерные технологии в эру LHC. // Физика элементарных частиц и атомного ядра (ЭЧАЯ), 2001, т.32, вып.6, с. 1458-1493.
30. В.В.Кореньков, Е.А.Тихоненко. Организация вычислений в научных отраслях.// Открытые системы, N.2, 2001, с. 30-35.
31. Г.А.Ососков, Е.А.Тихоненко "Новый генератор случайных чисел на базе двумерного клеточного автомата.// Математическое моделирование, Т.8, N12, 1996, с. 77-84; Препринт ОИЯИ, Е11-95-198, Дубна: ОИЯИ, 1995.
32. B.Lautrup, M.Nauenberg. Correlations and Specific Heat of SU(2) Lattice Gauge Model".// Physical Revue Letters, 45, 1980, p. 1775.
33. Yu.L.Levitan, I.M.Sobol. On a Pseudo-random Generator for Personal Computers.// Математическое моделирование, T.2, N.8/1990.
34. Г.А.Ососков. Вероятностные модели и математическое обеспечение для автоматических систем измерения и предварительного анализи изображений в ядерной физике. Дисертация на соискание степени доктора физ.-мат.наук, Дубна: ОИЯИ, 1986.
35. M.Liicher. A Portable High-Quality Random Number Generator for Lattice Field Theory Simulations.// Computer Physics Communications 79(1994), 1994, pp. 100-110.
36. V.Korenkov, G.Ososkov, E.Tikhonenko, A.Zadorozhny. CONVEX C-220 Vector Implementation of a New Random Number Generator on the Base of Cellular Automata.// Proc. of ECUC'95, Brussels, Belgium, 1995, 4 p.
37. V.Korenkov, V.Palichik, E.Tikhonenko. On Experience of SPP-2000 Usage for Solving of Minimization Tasks in Data Processing for CMS Muon Detector Prototypes.// Proc. of HIPER'98, Zurich, Swirzerland, 1998, pp. 228-231.
38. В.В.Галактионов, Н.И.Громова, В.В.Мицын, А.П.Сапожников, Е.А.Тихоненко.// Руководство для пользователей ЭВМ CONVEX. PI1-95-221, Дубна, 1995, 67 с.
39. С.А.Айвазян, И.С.Енюков, Л.Д.Мешалкин. Прикладная стати-стика.Исследование зависимостей, М., Финансы и статистика, 1985.
40. С.А.Смоляк, Б.П.Титаренко. Устойчивые методы оценивания (Статистическая обработка неоднородных совокупностей), М., Статистика, 1980.
41. P.Huber. Robust Statistics , J.Willey&Sons, NY, 1981. П.Хьюбер. Po-бастность в статистике, M., Мир, 1984.
42. G.A.Ososkov, V.V.Palichik, E.A.Tikhonenko. Robust Approach for CMS Muon Chamber Spatial Resolution.// Book of Abstracts of the lnd Int.Conf. "Modern Trends in Computational Physics", 1998, Dubna, Russia, p. 135.
43. I.A.Golutvin, Y.T.Kiriouchine, S.A.Movchan, G.A.Ososkov, V.V.Palichik, E.A.Tikhonenko. Robust estimates of track parameters and spatial resolution for CMS muon charnbers.//Computer Physics Communications, 126(2000), 2000, pp. 72-76.
44. Вероятность и математическая статистика. Энциклопедия. Гл.ред. Ю.В.Прохорову М., Большая Российская энциклопедия, 1999.
45. J.W.Tukey. A survey of sampling from contaminated distribution, in: Contribution to Probability and Statistics. Ed.I.Olkin, Stanford: Stanford Univ. Press, 1960, pp.446-486.
46. GEANT Detector Description and Simulation Tool. CERN Program Library Long Writeup W5013, CERN, Geneva, 1993.
47. Ф.Хампель, Э.Рончетти, П.Рауссеу, В.Штаэль. Робастность в статистике, М., Мир, 1989.
48. N.I.Chernov, G.A.Ososkov. Joint estimates of location and scale parameters. Communication of the JINR, E10-86-282, Dubna: JINR, 1986.
49. G.Agakishiev et al. Cherenkov ring fitting techniques for the CERES RICH detectors.//Nuclear Instruments and Methods, A 371, 1986, p.243.
50. F.Mosteller, W.Tukey. Data analysis and regression: a second course in statistics, Addison Wesley, 1977.
51. А.М.Шурыгин. Прикладная стохастика: робастность, оценивание, прогноз, М., Финансы и статистика, 2000.
52. I.Golutvin, S.Movtchan, G.Ososkov, V.Palichik, E.Tikhonenko. Optimal Choice of Track Fitting Procedure for Contaminated Data in High-Accuracy Cathode Strip Chambers.// Proc. of CHEP'2000, Padova, Italy, 2000, pp. 128-131.
53. А.М.Шурыгин. Прикладная стохастика: робастность, оценивание, прогноз, М., Финансы и статистика, 2000.
54. У.С.Аджи, Р.Х.Тернер. Применение методов помехоустойчивого оценивания в анализе данных о траекториях движения. В сб. Устойчивые статистические методы оценки данных, под ред. Р.П.Лонера и Г.Н.Уилкинсона. М., Машиностроение, 1984, с. 86-105.
55. Ландау Л.Д. О потерях энергии быстрыми частицами на ионизацию. J.Phys.USSR, 1944, vol.8, р.201. Собрание трудов, Т.1.М.: Наука, 1969. 482 с.
56. E.Gatti et al. Optimum Geometry for Strip Cathodes or Grids in MWPC for Avalanche Localization along the Anode Wires. Nuclear Instruments and Methods, 163, 1979, pp. 83-92.
57. Y.Kirousnine, S.Movchan, G.Ososkov, V.Palichik, E.Tikhonenko. Estimation of CSC Prototype Spatial Resolution by Robust Method, in: Proc. of Third RMDS CMS Annual Meeting, 1997-168, CERN, Geneva, 1998, pp. 363-370.
58. H.Cramer. Mathematical Methods of Statistics. Stockholm, 1946.
59. C.Caso et al. Review of Particle Physics.// Eur.Phys.J., С 3, 1998, p. 174.
60. D.J.Hudson. Statistics Lectures 11.64-18, CERN, Geneva, 1964.
61. R.V.Hogg. Adaptive Robust Procedure: A Partial Review and Some Suggestions for Future Applications and Theory. Journal of the American Statistical Association. Vol.69, No.348, 1974, pp. 909-927.
62. М.Кендал, А.Стюарт. Статистические выводы и связи, М., Наука, 1973.
-
Похожие работы
- Система поддержки принятия решений в модели компьютерной обработки эксперимента
- Информационная система поддержки вычислительного эксперимента в задачах изучения фазового состояния газонефтяных систем
- Математическое моделирование диспетчеров задач в многопроцессорных вычислительных системах на основе стохастических сетей массового обслуживания
- Инструментальная система поддержки вычислительного эксперимента на примере исследования реакции лесных экосистем на техногенное воздействие
- Математическое моделирование процессов распространения примесей в атмосфере и программная реализация информационно-аналитической системы природоохранных служб
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность