автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Метод встроенного функционального мониторинга с динамической актуализацией модели поведения для систем на кристалле

кандидата технических наук
Быковский, Сергей Вячеславович
город
Санкт-Петербург
год
2015
специальность ВАК РФ
05.13.12
Автореферат по информатике, вычислительной технике и управлению на тему «Метод встроенного функционального мониторинга с динамической актуализацией модели поведения для систем на кристалле»

Автореферат диссертации по теме "Метод встроенного функционального мониторинга с динамической актуализацией модели поведения для систем на кристалле"

9 15-5/172

На правах рукописи /

Быковский Сергей Вячеславович

МЕТОД ВСТРОЕННОГО ФУНКЦИОНАЛЬНОГО МОНИТОРИНГА С ДИНАМИЧЕСКОЙ АКТУАЛИЗАЦИЕЙ МОДЕЛИ ПОВЕДЕНИЯ ДЛЯ СИСТЕМ НА КРИСТАЛЛЕ

Специальность 05.13.12 - Системы автоматизации проектирования

(приборостроение)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург - 2015

Работа выполнена в Санкт-Петербургском национальном исследовательском университете информационных технологий, механики и оптики.

Научный руководитель: кандидат технических наук

Кустарев Павел Валерьевич

Официальные оппоненты: Мурсаев Александр Хафизович

доктор технических наук, профессор кафедра вычислительной техники ФГАОУ ВО «Санкт-Петербургский электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина)», профессор

Филиппов Алексей Семенович

кандидат технических наук, доцент кафедра компьютерных систем и программных технологий ФГАОУ ВО «Санкт-Петербургский политехнический университет Петра Великого», доцент

Ведущая организация: ФГУП «Санкт-Петербургское опытно-

конструкторское бюро «Электроавтоматика» им. П.А. Ефимова»

Защита состоится «25» июня 2015 г. в 15 часов 50 минут на заседании диссертационного совета Д 212.227.05 при Санкт-Петербургском национальном исследовательском университете информационных технологий, механики и оптики по адресу: 197101, Санкт-Петербург, Кронверкский пр., д.49., ауд. 285.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского национального исследовательского университета информационных технологий, механики и оптики по адресу: 197101, Санкт-Петербург, Кронверкский пр., д.49 и на сайте fppo.ifmo.ru .

Автореферат разослан « || » ио-о^а. 2015 года. Ученый секретарь

диссертационного совета Д 212.227.05 кандидат технических наук, доцент

з ! Российская

| гос дарственная ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЬГ И ОТеКЭ

Актуальность темы. Современные системы на кристалле (СнК) содержат от десятков до сотен параллельно работающих сложно-функциональных блоков (СФ-блоков), совместная верификация которых требует значительных временных и финансовых затрат.

Сегодня на функциональную верификацию СнК тратится до 70% ресурсов проекта. С помощью средств компьютерного моделирования удается обнаружить и исправить только 53% ошибок'. В процессе моделирования сложно проанализировать поведение СнК в реальном времени и с учетом всех условий окружающей среды. В связи с этим, актуальной задачей является верификация СнК в процессе натурных испытаний и эксплуатации.

Более половины ошибок, выявленных на этапе натурных испытаний и эксплуатации, относятся к ошибкам в реализации алгоритмов управления и взаимодействия СФ-блоков СнК, в число которых входят процессоры, аппаратные ускорители, коммуникационные контроллеры и др. Время поиска ошибок в данных блоках зависит не только от качества тестового покрытия, но и от эффективности средств сбора данных о поведении СФ-блоков в процессе испытаний.

Для наблюдения за поведением СФ-блоков в составе СнК используют специальные агенты-мониторы, встроенные в систему. Существующие технологии встроенного мониторинга имеют два существенных недостатка. Они либо не позволяют вести наблюдение за системой на длительном промежутке времени (мониторы с журналированием событий), либо не позволяют точно определить последовательность событий, которая привела к сбою/отказу (мониторы утверждений).

Ограничение на время наблюдения связано с зависимостью размера журнала от времени работы системы и размером доступной памяти СнК. В большинстве случаев памяти хватает от секунд до единиц минут наблюдения. Это является недостаточным для обнаружения «плавающих» отказов, характерных для систем обработки данных с множеством параллельно работающих узлов.

Верификация системы с использованием мониторов утверждений (assertion-based verification) позволяет фиксировать только факт некорректного поведения. После обнаружения сбоя/отказа для поиска его причин необходимо проводить уточнение утверждений, вводить в систему новые мониторы. Модификация СнК и повтор испытаний требуют дополнительного времени и финансовых затрат, особо ощутимых в случае реализации СнК в виде специализированной микросхемы (Application Specific Integrated Circuit, ASIC).

Таким образом, актуально уменьшение размера данных наблюдения с поддержкой возможности анализа причин выявленных сбоев/отказов. В данном контексте, возникает задача разработки новых методов наблюдения за поведе-

1 Wagner I., Bertacco V. Post-Silicon and Runtime Verification for Modern Processors. Springer, 2011. P. 224.

нием СФ-блоков, методов синтеза соответствующих средств наблюдения (мониторов) и методов верификации. Это определило направление диссертационной работы.

Объектом исследования являются механизмы встроенной функциональной верификации систем на кристалле.

Предметом исследования являются методы встроенного функционального мониторинга систем на кристалле, позволяющие наблюдать за поведением сложно - функциональных блоков на протяжении длительных периодов натурных испытаний и в процессе эксплуатации.

Целью работы является повышение качества функциональной верификации систем на кристалле на этапе натурных испытаний за счет создания метода и средств встроенного функционального мониторинга, позволяющих наблюдать за поведением системы на протяжении длительных периодов непрерывной работы (дни, недели, месяцы) и обнаруживать:

• внезапные и перемежающиеся («плавающие») отказы;

• несколько отказов за один сеанс наблюдения;

• последовательность событий, которая привела к отказу.

Задачи исследования.

1. Провести анализ существующих методов формального описания поведения функциональных блоков вычислительных систем, в том числе применения данных методов для представления результатов встроенного функционального мониторинга сложно-функциональных блоков систем на кристалле.

2. Разработать метод мониторинга, позволяющий наблюдать за поведением сложно-функциональных блоков на протяжении длительных периодов непрерывной работы и реализуемого с учетом ресурсов систем на кристалле.

3. Разработать метод анализа результатов мониторинга, позволяющий оценивать функциональное покрытие, вероятность пребывания системы в заданных состояниях, определять последовательность событий, которая привела к отказу.

4. Разработать микроархитектуру встраиваемого в СнК унифицированного функционального блока монитора, реализующего предложенный метод мониторинга.

5. Разработать технологию автоматизированного синтеза системы функционального мониторинга в рамках маршрута проектирования систем на кристалле.

Методы исследования. Для решения поставленных задач использовались методы системного анализа, математического и имитационного моделирования, теории конечных автоматов, теории графов, теории множеств, математический аппарат модальных логик, методы функционального и объектно-ориентированного программирования.

Научная новизна. В диссертационной работе получены следующие результаты, характеризующиеся научной новизной:

1. Разработан метод наблюдения за поведением сложно-функциональных блоков систем на кристалле с использованием динамической актуализации модели поведения. Разработанный метод позволяет вести наблюдение на длительном промежутке времени (часы, дни, месяцы), обнаруживать несколько сбоев/отказов за один сеанс наблюдения и находить последовательность событий, которая привела к сбою/отказу.

2. Разработан метод сравнения моделей ожидаемого и наблюдаемого поведения сложно-функциональных блоков. Обоснована эффективность использования метода для решения задачи функциональной верификации систем на кристалле.

3. Предложена микроархитектура конфигурируемого аппаратного монитора, реализующего разработанный метод мониторинга.

4. Предложена технология автоматизированного синтеза системы функционального мониторинга с динамической актуализацией модели поведения, которая может быть использована при создании САПР встроенных средств контроля и диагностики систем на кристалле.

Основные защищаемые положения.

1. Метод динамической актуализации модели поведения сложно-функциональных блоков систем на кристалле, характеризующийся низкими требованиями к ресурсам памяти для хранения результатов мониторинга.

2. Метод анализа результатов мониторинга, позволяющий оценивать функциональное покрытие, вероятность пребывания системы в заданных состояниях, определять последовательность событий, которая привела к отказу.

3. Микроархитектура конфигурируемого функционального монитора с динамической актуализацией модели поведения.

4. Технология автоматизированного синтеза системы функционального мониторинга с динамической актуализацией модели поведения, позволяющая снизить вероятность появления ошибок при реализации встроенной системы контроля и диагностики систем на кристалле.

Практическая значимость. В процессе диссертационного исследования были получены следующие практические результаты:

1. Создан прототип программных средств моделирования и оценки эффективности методов наблюдения за поведением сложных функциональных блоков систем на кристалле с использованием высокоуровневых моделей сетей взаимодействующих конечных автоматов.

2. Разработан прототип инструментального программного обеспечения функциональной верификации систем на кристалле на основе актуализированных моделей наблюдаемого поведения.

3. Разработан прототип инструментального программного обеспечения для автоматизированного синтеза аппаратной реализации функциональных мониторов из высокоуровневой спецификации моделей ожидаемого поведения.

4. Реализованы и апробированы в реальных проектах блоки функциональных мониторов, реализующие предложенный метод.

Комплекс разработанных средств имеет следующую практическую значимость:

1. Позволяет повысить качество и снизить сложность процесса натурной верификации систем на кристалле на длительных промежутках времени (дни, недели, месяцы), за счет использования нового метода наблюдения и автоматизации отдельных этапов решения задачи.

2. Может быть использован в качестве основы при создании средств САПР для решения задачи натурной верификации.

Апробация результатов работы производилась в 8 докладах на 6 конференциях, из которых 2 всероссийские и 1 международная:

1. XLIV научной и учебно-методической конференции. Университет ИТМО. Санкт-Петербург. 2015 г.

2. 14th GeoConference оп Informatics, Geoinformatics and Remote Sensing. SGEM 2014. Albena. Bulgaria. 2014.

3. VI Научно-практическая конференция молодых ученых «Вычислительные системы и сети (Майоровские чтения)». Университет ИТМО. Сан кт- Петербург. 2014 г.

4. III Всероссийский конгресс молодых ученых. Университет ИТМО. Санкт- Петербург. 2014 г.

5. XLIII научная и учебно-методическая конференция. Университет ИТМО. Санкт-Петербург. 2014 г.

6. II Всероссийский конгресс молодых ученых. Университет ИТМО. Санкт- Петербург. 2013 г.

Публикации. Основные результаты опубликованы в 6 научных публикациях общим объемом в 41 стр., в том числе в 3-х статьях в изданиях, включенных в перечень ВАК и 3-х статьях в изданиях, индексируемых SCOPUS.

Внедрение результатов работы. Основные результаты работы были внедрены:

1. В ОКР:

1.1 .«Разработка программного обеспечения ПЛИС модулей блока обработки информации» (ОАО «НЦ ПЭ», г. Санкт-Петербург, 2013-2014 гг.).

1.2.«Разработка и изготовление образца цифровой системы управления и обработки информации» (ФГУП «ЦНИРТИ им. академика А.И. Берга», г. Москва, 2013-2014 гг.).

2. В НИР:

2.1.НИР № 214434 «Исследование механизмов обеспечения надежности аппаратно-резервированных информационно-измерительных систем на базе ПЛИС» (Университет ИТМО, 2014 г.).

2.2.НИР № 713564 «Создание бесшовных технологий проектирования встраиваемых систем и систем на кристалле на основе реконфигурируемых архитектур» (Университет ИТМО, 2013 г.).

3. В учебных курсах магистратуры «Методы и технологии проектирования систем на кристалле» и «Организация вычислительного процесса: модели и методы»» (кафедра вычислительной техники, Университет ИТМО, 2015 г.).

4. В исследованиях международной научной лаборатории Университета ИТМО «Архитектура и методы проектирования встраиваемых систем и систем на кристалле» (2014 г.).

Личный вклад автора. Решение задач диссертации, разработанные методы и их реализации принадлежат автору.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и трех приложений. Полный объем диссертации 113 страниц текста с 35 рисунками и 15 таблицами. Список литературы содержит 106 наименований.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, сформулирована цель и задачи исследования, перечислены положения, выносимые на защиту.

В первой главе рассматриваются основные подходы к проектированию вычислительных систем класса «Система на кристалле». Описываются основные ошибки, допускаемые в процессе проектирования и реализации СнК, которые являются причинами отказов системы во время её эксплуатации. Приводится обзор существующих методов и средств функциональной верификации СнК на всех этапах жизненного цикла продукта и оценивается их эффективность.

Отмечается, что до выпуска первого экземпляра микросхемы с помощью средств формальной верификации и имитационного моделирования удается обнаружить только 53% ошибок. Остальная часть ошибок обнаруживается на этапах натурных испытаний и эксплуатации. При этом большинство ошибок (65 %) содержатся в алгоритмах работы СФ-блоков СнК. Ошибки в СФ-блоках являются причиной многократного перевыпуска микросхемы перед её введением в эксплуатацию. Каждый перевыпуск при современных технологических нормах (90-28 нм.) стоит от $2 млн. до $4 млн, а в среднем необходимо 3-5 перевыпуска.

Существующие методы наблюдения за поведением СФ-блоков в составе микросхемы СнК являются неэффективными при обнаружении причин редких и «плавающих» сбоев. Встроенные логические анализаторы и системы непрерывного журналирования событий (ARM CoreSight Trace Macrocells, NEXUS 5001) не позволяют вести наблюдение за системой на протяжении всего цикла натурных испытаний (часов и дней) из-за малых объемов встроенной памяти СнК (десятки - сотни Мбайт), доступной для хранения результатов мониторинга. Мониторы утверждений (MBAC, FoCs) хотя и позволяют проводить длительное наблюдение, но результатам мониторинга отражают только статистику нарушений заранее определенных шаблонов поведения, по которой сложно выявить причины этих нарушений.

Для преодоления обозначенных недостатков автором предлагается фиксировать реальное поведение системы в виде формальных моделей, которые используются в процессе проектирования: конечные автоматы Мили/Мура, временные автоматы, гибридные автоматы, вероятностные автоматы, структуры Крипке, системы с помеченными переходами и др. Это позволит сократить не только ресурсы памяти, но и предоставит возможность использовать результаты мониторинга как входные данные для существующих средств формальной верификации.

Формулируется задача разработки методов и средств непрерывного наблюдения за поведением СФ-блоков СнК с возможностью восстановления (актуализации) формальной модели поведения.

Во второй главе предложен метод встроенного функционального мониторинга СФ-блоков СнК, основанный на восстановлении формальной модели

реального поведения СФ-блоков в процессе их функционирования на базе информации об ожидаемом поведении (модели ожидаемого поведения). Данный процесс назван динамической актуализацией модели поведения.

Метод состоит из 5 этапов (шагов) (рисунок 1), выполнение которых предполагает преобразование формальных моделей системы между тремя уровнями представления: уровнем алгоритма, уровнем поведения, уровнем актуализации.

Шаг 1: создание спецификации алгоритма

mm

Шаг 2: создание моделей ожидаемого поведения (МЕВ) для процессов

Шаг 3: синтез функциональных мониторов и интеграция их в СнК

USB ¡RAM CPU

V Г У

Анализ и интерпретация результатов наблюдения

- I

Шаг 5: получение моделей наблюдаемого поведения (MOB) и модепей нарушения функционирования (MFB)

SysBus

Шаг 4: динамическая актуапиэация модепей поведения

Рисунок 1 - Структура метода мониторинга с динамической актуализацией модели поведения

На первом шаге создается эталонная спецификация системы или её части. Спецификация задается в виде гетерогенной иерархической модели, структура которой описывается в терминах сети процессов (process network, PN). Каждый процесс определяет поведение СФ-блока СнК. Спецификация каждого процесса описывается с помощью моделей детерминированного конечного автомата Мили.

На втором шаге производится преобразование модели каждого процесса к модели ожидаемого поведения процесса (model of expected behavior, МЕВ). Модели МЕВ (рисунок 2) представляются в виде одного из расширений модели конечного детерминированного автомата модели системы с помеченными переходами (labelled transition system, LTS), для которой определено множество наблюдаемых событий Е = {еп, е/, ...}. Наблюдаемое событие - факт изменения значений сигналов, доступных для наблюдения, например, сигналов на выходных/выходных портах, значений отдельных регистров. Переход к моделям

МЕВ обусловлен существующими ограничениями по наблюдению за поведением СФ-блоков реальных СнК. Многие СФ-блоки являются закрытыми 1Р-ядрами (1Р-ядро - лицензируемый СФ-блок СнК), для которых доступно наблюдение только за изменением входных/выходных сигналов. Если исходная спецификация алгоритма описывает систему как «белый ящик», то модель МЕВ - это описание системы в виде «серого», либо «черного ящика».

Рисунок 2 - Поведенческая модель процесса: а) автомат Мили; б) модель ожидаемого поведения (МЕВ)

На третьем шаге производится извлечение из моделей МЕВ правил наблюдения - профиля наблюдения. Профиль наблюдения позволяет фиксировать не только шаблоны корректного поведения, соответствующие МЕВ, но и отклонения поведения от нормы. На основе профиля наблюдения производится синтез функциональных мониторов, встраиваемых в СнК. Интеграция (встраивание) мониторов в СнК производится в рамках типовой технологической цепочки создания СнК.

На четвертом шаге производится функциональный мониторинг СнК средствами встроенных мониторов. В процессе функционирования системы встроенные мониторы динамически формируют (актуализируют) в своей внутренней памяти модель поведения для каждого процесса, представленного в исходной спецификации. Модели поведения процессов, создаваемые мониторами, называются актуализированными моделями поведения и обозначаются, как AM.

На пятом шаге модели AM каждого процесса извлекаются из памяти мониторов посредством инструментального диагностического интерфейса и преобразуются в формат моделей наблюдаемого поведения (model of observed behavior, MOB), эквивалентный формату МЕВ.

Модели МЕВ и MOB для каждого процесса используются для решения задачи функциональной верификации. При этом в явном виде возможно выявить факты отклонения поведения процесса от нормы (model of faulty behavior, MFB). Ошибки в реализации алгоритмов взаимодействия процессов выявляются в результате обнаружения отказов в работе СФ-блоков, в которых задействованы события, общие для нескольких процессов.

Как сказано выше, в процессе наблюдения в памяти создается модель AM - актуализированная модель поведения. При фиксации нового события <?, е Е в памяти монитора сохраняется информация о новом переходе cur_staie—-—>state_ stamp и модифицируется указатель текущего состояния

cur_state. Если информация о переходе уже есть в Там, то модифицируется только указатель cur_state.

Там ~ ТаМ u (смг _ s,a,e —~—>state _ stamp} ^ cur _ state = state _ stamp

Переменная state_stamp хранит информацию о текущем состоянии. Возникает задача выделения состояний процесса по данным о событиях. В работе предложено два метода выделения состояний процесса.

Первый метод использует свойства конечных автоматов, как распознавателей регулярных языков. Состояние определяется через множество слов р, которые приводят автомат в состояние q е Q. Множество слов р языка L а Е* образуют класс эквивалентности £ е I. Для множества классов эквивалентности определено отображение у/ : £ —» Q, где Q множество состояний модели МЕВ. Для минимальных форм моделей МЕВ функция у/ является биекцией. Состояния процесса выделяются на основе предыстории, то есть последовательности событий, которые произошли в прошлом. Показано, что для моделей МЕВ окно наблюдения, позволяющее различить все достижимые состояния, имеет фиксированный размер к < -1.

/утах = max | Pj\,Pie4j,Sje-L

, , '=0 (2)

1-1 . _ 1 '. .шах « - min I j

7=0

Процесс наблюдения заключается в сохранении возникающих событий в очереди ev queue размера к. Информация о текущем состоянии полностью определяется содержимым очереди событий, то есть state stamp = ev queue. Мониторы, реализующие данный алгоритм выделения состояний назовем мониторами последовательностей (monitor of sequences, MS).

Второй метод выделения состояний основан на предположении о том, что для многих моделей, при условии, что Л <|£|, можно фиксировать не последовательность событий, а только факты возникновения событий. Такие мониторы назовем мониторами фактов (monitor of facts, MF). В данном случае state stamp = set(ev_queue). Операция set предполагает получение неупорядоченного множества из последовательности событий, сохраненной в ev_queue, например set(e/ —+ с'2 —►<?/—► ез) = /е/, е?, ej}. Это позволяет сократить размер модели AM.

mscMS = \E\k

MS

mscMF

В (3) лисд^у тзсМр - максимальное количество состояний модели АМ для мониторов М8 и МР соответственно. Таким образом, при к > /, учитывая, что максимальное количество переходов модели равно тзсг, размер модели АМ

ния количества недостижимых состояний МЕВ, которые можно различить в модели АМ. Так как время обработки события в алгоритме (1) пропорционально размеру модели АМ, то есть 0(\ ТАм[), то мониторы MF обладают лучшими показателями производительности по сравнению с MS-мониторами.

Также предложена оптимизированная версия монитора MF, основанная на том, что для различения разных состояний модели МЕВ требуется разный

размер окна к, то есть, исходя из (2), /J™* * /у13*, / * j. Версию монитора, изменяющего размер окна к в процессе наблюдения, назовем оптимизированным монитором MF (optimized monitor of facts, OMF).

Профиль наблюдения для MS- и MF-мониторов определяется размером окна наблюдения, то есть числом к. Профиль наблюдения для OMF-монитора состоит из правил изменения окна наблюдения на основе предыстории. Алгоритм получения профиля наблюдения OMF-монитора основан на преобразовании разметки реберного графа модели МЕВ и представлен в тексте диссертации.

Результаты моделирования работы MS, MF, OMF мониторов при наблюдении за функционированием коммуникационных контроллеров протоколов Modbus и PAR (Positive Acknowledgment with Retransmission) представлены на рисунке 3 и рисунке 4.

На рисунке 3 видно, что в установившемся режиме, при функционировании без отказов, размер памяти, необходимый для хранения модели АМ, является фиксированным. Размер указан в условных единицах и определяется как s+3*t, где s - количество состояний, t - количество переходов модели АМ. Таким образом, для хранения информации об одном состоянии требуется одна условная ячейка памяти, а об одном переходе - три ячейки памяти. OMF-монитор позволяет уменьшить размер АМ в 2 раза.

Из рисунка 4 видно, что размер модели АМ у MF-монитора в сравнении с MS-монитором уменьшается за счет сокращения количества состояний, сохраняя возможность различения всех достижимых состояний МЕВ.

можно уменьшить в

mscMS mscMF

раз. Размер модели уменьшается за счет уменьше-

Modbus (к = 2)

2 <

50

0 100 200 300 400 500 ООО время наблюдения (кол-во событий)

ms

mf

OMF [

par (к = 4)

г-1= s 120 ь

F—1 1 100

г =

г 2 80

1 <

Уг1 к 00

i с;

1 | 40

1 s

! 20

сг

: I . & 0

0 100 200 300 400 500 600 время наблюдения (кол-во событий)

ms

mf

omf

Рисунок 3 - Зависимость размера модели АМ в памяти от времени наблюдения (функционирование без отказов)

40

Ь 30

20

10

Modbus

PAR

Modbus

PAR

Ii ms Ii mf Gd omf

Ii ms Ii mf Co omf !

Рисунок 4 - Сравнение количества состояний и переходов модели AM для разработанных мониторов

По окончанию наблюдения из состояний полученной модели AM выделяют пространство состояний модели МЕВ на основе информации о множестве классов эквивалентностей Z и биективного отображения у. После выделения достижимых состояний МЕВ из AM получается модель наблюдаемого поведения MOB. Анализ модели MOB позволяет:

• определить состояния МЕВ, в которых система физически пребывала в процессе работы, то есть оценить функциональное покрытие;

• определить состояния, в которые процесс перешел, но которые не принадлежат МЕВ, то есть факты отклонения поведения от нормы.

Определение состояний, не принадлежащих МЕВ возможно, так как состояния процесса выделяются на основе информации о произошедших событиях, что потенциально дает возможность наблюдать все пространство состояний

МЕВ, как достижимых q е Q, так и недостижимых, то есть все множество переходов Qx Е —> . Модель MOB позволяет выявлять также последовательность событий, которые привели к переходу в состояния, недостижимые в МЕВ.

В дополнение к базовому набору мониторов MS, MF, OMF предложены специализированные мониторы: с подсчетом фактов переходов, с учетом реального времени. Монитор со счетчиками переходов (probabilistic MS, MF, OMF: P-MS, P-MF, P-OMF) позволяет рассчитывать вероятность пребывания процесса в заданных состояниях. Монитор реального времени (real-time MS, MF, OMF: RT-MS, RT-MF, RT-OMF) позволяет учитывать время пребывания процесса в заданных состояниях.

На рисунке 5 представлена зависимость размера результатов мониторинга от времени наблюдения для разработанных мониторов в сравнении с существующим методом журналирования (TMON) при фиксации однократных сбоев на 100, 150, и 200 событии.

время наблюдения (кол-во событий)

i— ms — mf — omf --- tmon i

Рисунок 5 - Зависимость размера результатов мониторинга при фиксации сбоев для разработанных мониторов (MS, MF, OMF) и мониторов журналов

(TMON)

Из рисунка 5 видно, что разработанный метод наблюдения позволяет преодолеть прямую зависимость размера результатов мониторинга от времени наблюдения. Размер результатов мониторинга увеличивается только при фиксации новых шаблонов поведения.

В третьей главе предложена технология автоматизированного синтеза системы функционального мониторинга СнК, в рамках которой определены процедуры, выполняемые разработчиком с использованием средств САПР.

На рисунке 6 представлена структурная схема многодоменной системы функционального мониторинга в составе СнК. Каждый домен (domain 0, 1) выполняет наблюдение за поведением разных групп СФ-блоков (Core 0, ...

Core N). Разделение на домены может быть обусловлено проектированием модульной системы, состоящей из нескольких СнК. В данном случае используется одна спецификация алгоритма, но для каждой СнК создается своя подсистема функционального мониторинга. Также выделение доменов оправдано при необходимости разделения доступа внутри СнК к информации о поведении различных процессов (рисунок 6).

JTAG 1147.1

Рисунок 6 - Структурная схема СнК с встроенной системой функционального мониторинга

Мониторы (М 0.0, М 1.0, ...) подключаются непосредственно к интерфейсам СФ-блоков и наблюдают за изменением их сигналов. Результаты мониторинга предаются по выделенным последовательным каналам (monitor data channel), которые не используются основной системой в процессе выполнения прикладной задачи.

Ошибки в реализации системы мониторинга приводят к искажению информации о реальном поведении системы. С целью снижения риска внесения ошибок на этапе реализации разработана технология функционального мониторинга, включающая использование средств САПР для автоматизации таких процедур, как оценка корректности моделей ожидаемого поведения МЕВ, синтез RTL-описаний блоков системы функционального мониторинга и анализ результатов мониторинга. Организация взаимодействия разработчика и средств САПР в рамках предложенной технологии представлена на рисунке 7.

Предложена микроархитектура унифицированного функционального монитора, реализующего алгоритм наблюдения с динамической актуализацией модели поведения. Обобщенная структура функционального монитора представлена на рисунке 8.

Среда выполнения (Runtime)

Разработчик

СнК с подсистемой мониторинга

модели МЕВ и их характеристики подтверждение корректности МЕВ

IP-ядра системы мониторинга

модели MOB результаты анализа MOB

определение наблюдаемых событий и доменов мониторинга

И

Рисунок 7 - Организация взаимодействия разработчика и средств САПР в рамках разработанной технологии функционального мониторинга

Монитор состоит из блоков захвата событий (Event Capture Unit, ECU), которые фиксируют факты изменения наблюдаемых сигналов (Observed Signal, OS) по заданному шаблону, очередей событий (FIFO), арбитра событий (Event Arbiter, ЕА), блока обработки событий (Event Handler, EH), устройства управления (control unit, CU), контроллера ввода-вывода (Ю Ctrl) и таймера (Timer), необходимого для создания временных меток для событий.

Рисунок 8 - Обобщенная структура разработанного функционального монитора

Произведена оценка эффективности мониторов по параметрам производительности, требуемым ресурсам памяти и площади кристалла. Результаты синтеза блоков мониторов для микросхемы программируемой логики

ХС72020Си3484 (платформа ХНтх гупц-7000) представлены в таблице I. Параметры производительности мониторов представлены в таблице 2. Время между событиями было измерено для системы с частотой синхросигнала в 100 МГц.

Таблица 1 - Количество занимаемых ресурсов блоками мониторов

Тип монитора Площадь (экв. вентили NAND2) XC7Z020CLG484 (Zynq-7000) LUT/FF (% ресурсов ПЛИС)

Базовые типы мониторов

MS 6240 416/425 (0.8% ПЛИС)

MF 6285 419/430 (0.8% ПЛИС)

OMF 6750 450/443 (0.9% ПЛИС)

Специализированные мониторы

Real-time (RT) + 20% к ресурсам базовых мониторов

Probabilistic (P) + 1 % к ресурсам базовых мониторов

Таблица 2 - Производительность блоков мониторов

Процесс Тип монитора Размер МЕВ Память (байт) Ср./макс. время обработки события (мкс.) Ср. время между событиями

PAR ОМР 42 106 0.99/2.15 60 мкс.

МоёЬив ОМР 36 167 1.42/3.6 150 мкс.

Предложен метод автоматизированного синтеза блоков функциональных мониторов из высокоуровневого описания - моделей МЕВ. Входными данными для задачи синтеза являются:

1. описание домена мониторинга: список моделей МЕВ. Домен й = {МЕВI, МЕВ2...};

2. параметры домена мониторинга: требования к производительности (X/,,,,), ресурсам памяти (У/,,,,), площади кристалла 2\ип\

3. характеристики процессов домена: минимальный интервал следования событий, средняя наработка на отказ, необходимость фиксации статистики переходов (Р -монитор) и времени пребывания в состояниях (ЯТ - монитор);

4. описание наблюдаемых событий для каждой МЕВ.

Результатом синтеза является набор физических мониторов в виде ИТЬ-описаний, которые затем используются для создания системы функционального мониторинга СнК.

Каждому процессу ставится в соответствие логический монитор. Функции N логических мониторов могут быть реализованы на 1 до N физических мониторов. В процессе синтеза определяется набор физических мониторов, удовлетворяющих критерию (4).

н---> nun

^¡т ^Чт

Х(щ)<Хш (4)

Пщ)<У\ш

В (4) - вариант отображения логических мониторов на физические, Х((ц) - производительность решения, У (со,) - требуемые ресурсы памяти, 1(со,) -требуемая площадь кристалла для ад. £2 = {со/, аь, ... } - все множество вариантов отображения такое, что П —► М, где М = {т/, ...} - множество физических мониторов, реализующих функции Дологических мониторов. Процесс синтеза включает выполнение следующих шагов:

Ю

1. Производится оценка ресурсов памяти У (О) = £ У(МЕВ^).

/=1

2. Проверяется возможность генерации наборов мониторов, удовлетворяющих требованию К(О) < . Если условие не выполняется, то процесс синтеза останавливается и разработчику необходимо изменить содержимое домена, например, сократив список контролируемых моделей МЕВ, и заново произвести оценку У(й).

3. Определяется верхняя граница пространства поиска вариантов отображений. Для этого производится предварительная оценка необходи-

, И

мой площади кристалла 2 = гшп 2(МЕВ,). Предварительная оценка

;=1

основана на допущении, что все физические мониторы будут реали-зовывать функции логического монитора с минимальными ресурса-

у

ми. Находится число И = —^. Число И равно максимальному числу

г

мониторов (оптимистическая оценка), которые можно реализовать с учетом требований 2цт,

4. В соответствии с критерием (4) производится поиск варианта отображения (локальный минимум) среди Я возможных вариантов. Я =

jN . Число S(N,k) - это число

Л И \ к . . кл

I 1-1 (-\)k+J .

к= 0 к= 0«! /=0 и,

Стирлинга второго рода, которое определяет количество возможных разбиений Ы-элементного множества на к непустых непересекающихся подмножеств.

В процессе синтеза для физических блоков мониторов определяется микроархитектура блоков захвата событий (ECU) на основе списка наблюдаемых событий МЕВ, микроархитектура блока арбитра событий (ЕА) и блока обработки событий (ЕН) на основе профиля наблюдения моделей МЕВ. Устройство управления (CU) и контроллер ввода-вывода (Ю Ctrl) унифицированы для всех вариантов мониторов.

В четвертой главе описаны сферы применения разработанного метода встроенного мониторинга. Определены преимущества использования метода при прототипировании СнК на микросхемах программируемой логики (ПЛИС), при натурных испытаниях и в процессе эксплуатации. Приводится описание практики использования предложенного метода в двух реализованных проектах.

Целью первого проекта являлась разработка модульной вычислительной системы цифровой обработки быстрых радиосвязных сигналов (СнК ЦОС) (рисунок 9).

На этапе натурных испытаний в систему была интегрирована двухдомен-ная система функционального мониторинга с динамической актуализацией модели поведения, выполняющая функции наблюдения за реализацией механизмов диспетчеризации процессов реального времени.

Рисунок 9 - Модульная вычислительная системы цифровой обработки

сигналов

В рамках второго проекта была разработана унифицированная информационно-измерительная платформа контроля качества технологического процесса при производстве интегральных микросхем (ИМС) (рисунок 10). Разработанная система (ИИС СнК) осуществляла измерение параметров функционирования тестовых образцов логических элементов (Б!, Б2, ... Б16), распределенных по кристаллу.

В составе информационно-измерительной платформы была реализована однодоменная система функционального мониторинга, выполняющая наблюдение за поведением системы при различных режимах работы измерительного тракта.

ТТА ртос * ALU t Data MEM + SoC Tfans OMF-monilor

ОСР bus

$ ОСР HPI * à à й

ОСР bus

t /TAG Ctrl \ UA et ÏT 1 L » Гетр monit ctrl f

| PC Instrumentation | j Analog dedicated monitor |

Рисунок 10 - Структурная схема информационно-измерительной платформы контроля качества технологического процесса при производстве ИМС

В таблице 3 приведены характеристики разработанных систем встроенного функционального мониторинга для двух представленных проектов. В таблице 3 сокращение LC расшифровывается как Logic Cells - конфигурируемая ячейка ПЛИС.

Таблица 3 - Характеристики разработанных систем встроенного функционального мониторинга

Характеристика/Система СнК ЦОС ИИС СнК

Количество процессов 3 3

Количество физических мониторов 2 I

Частота синхросигнала 80 МГц 100 МГц

Средняя частота появления событий в системе I мс. 1 мс.

Количество занимаемых ресурсов на ПЛИС 1241 LC 836 LC

Процент занимаемых ресурсов системы 6% 4%

Среднее время обработки события 7.5 мкс. 4 мкс.

Ресурсы памяти I Кбайт 512 байт

Платформа ПЛИС EP2S90F1020C4 (Altera Stratix II) ПЛИС XC5VFX70T (Xilinx Virtex-5)

Была произведена сравнительная оценка реализаций систем функционального мониторинга, выполненных на базе метода наблюдения, предложенного автором, на базе методов журналирования, а также с использованием мониторов утверждений. Результаты экспериментальной оценки трех подходов представлены в таблице 4.

Предлагаемый метод требует на порядок меньше памяти для хранения результатов наблюдения, но характеризуется большим временем обработки событий. Таким образом, разработанный метод эффективен для наблюдения за СФ-блоками СнК, в которых интервал следования событий не меньше десятков мкс. Реализованные проекты подтвердили эффективность метода при наблюдении за реализацией алгоритмов внутрикристального взаимодействия СФ-блоков.

Таблица 4 - Характеристики предложенного и существующих методов мониторинга

Название метода/ параметры сравнения Наблюдение с использованием журнала событий Мониторы утверждений (assertion-based verification) Предлагаемый метод

Время обработки событий НС. НС. мкс.

Требуемая память Мбайты - Гбайты байты Кбайты

Ресурсы кристалла в процентах от размеров системы 3-6% 0.1-0.8% 4%, 6%

Получение последовательности событий поддерживается не поддерживается поддерживается

В заключении представлены основные результаты работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Основным научным результатом диссертационной работы является создание метода встроенного функционального мониторинга СФ-блоков СнК, который позволяет проводить наблюдение за поведением СФ-блоков на протяжении длительных периодов непрерывной работы в процессе натурных испытаний и эксплуатации, а результаты мониторинга использовать для:

1. обнаружения внезапных и перемежающихся («плавающих») отказов;

2. определения несколько сбоев/отказов за один сеанс наблюдения;

3. определения последовательности событий, которая привела к сбою/отказу;

4. анализа функционального покрытия;

5. определения вероятности пребывания системы в заданных состояниях.

Основным преимуществом метода являются низкие требования к ресурсам памяти, за счет сохранения данных только о новых действиях СФ-блоков СнК и предотвращения накапливания протоколов нормального функционирования. Это позволяет использовать предложенный метод для длительного наблюдения за системой.

В процессе разработки метода были получены следующие результаты:

1. Разработаны два алгоритма наблюдения за поведением функциональных блоков системы: алгоритм наблюдения с выделением состояний на основе последовательности произошедших событий и алгоритма наблюдения с выделением состояний на основе фактов произошедших событий. Для последнего варианта разработана оптимизированная версия, позволяющая снизить требования к ресурсам памяти на 45-50%.

2. Предложен метод анализа результатов мониторинга, включающий оценку функционального покрытия, определение вероятности переходов и нахождения функциональных узлов в определенных состояниях, определения последовательности событий, которая привела к сбою.

3. Предложена микроархитектура встраиваемых функциональных мониторов. Блоки мониторов являются пассивными устройствами в системе и не оказывают непосредственного влияния на выполнение прикладной задачи, требуют для своей работы менее 1 Кбайт памяти, а время обработки одного события составляет единицы мкс.

4. Предложена технология автоматизированного синтеза системы встроенного функционального мониторинга, включающая использование средств САПР для автоматизации таких процедур, как оценка корректности моделей ожидаемого поведения и синтез ЯТЬ-описаний для блоков системы функционального мониторинга.

5. Введены понятия логического и физического монитора. Формализована задача поиска оптимального отображения логических мониторов на ресурсы аппаратной платформы с учетом требований спецификации.

ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

1. Быковский С.В. Метод встроенной динамической актуализации функциональных моделей систем на кристалле // Известия высших учебных заведений. Приборостроение. 2015. Т. 58, № 3. С. 197-202.

2. Bikovsky S., Kustarev Р, Antonov A., Yanalov R. Process control and synchronization patterns for SOC // 14th GeoConference on Informatics, Geoinformatics and Remote Sensing. Conference Proceedings. - 2014. -Iss. 1. - N 1. - P. 287-294.

3. Bikovsky S., Pinkevich V., Kustarev P. Hardware violation monitor of transaction level real - time constraints for reliable systems on a chip // 14th GeoConference on Informatics, Geoinformatics and Remote Sensing. Conference Proceedings. - 2014. - Iss. 1. - N 1. - P. 201-208.

4. Bikovsky S., Antonov A., Kustarev P. Digital thermal sensor for FPGA local area based on Monte-Carlo method // 14th GeoConference on Informatics, Geoinformatics and Remote Sensing. Conference Proceedings. - 2014. -Iss. l.-N l.-P. 127-134.

5. Быковский С.В., Кустарев П.В., Антонов А.А. Монитор временных ограничений для систем на кристалле // Известия высших учебных заведений. Приборостроение. - 2014. - Т. 57. - С. 53-57.

6. Быковский С.В., Кустарев П.В. Техника измерения температуры локального участка программируемых интегральных схем на базе метода Монте-Карло // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург, 2013. - Вып. 6(88). - С. 86-91.

15~ 6868

Формат: 60x84 1/16 Печать офсетная. Бумага офсетная. Гарнитура Times. Тираж: ЮОэкз. Заказ: 389 Отпечатано: Типография на Биржевой Учреждение «Университетские телекоммуникации» 197101, Санкт-Петербург, Саблинская ул., д. 14

2015676738

2015676738