автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Исследование и разработка средств обеспечения отказоустойчивости в бортовых вычислительных системах

кандидата технических наук
Душутина, Елена Владимировна
город
Санкт-Петербург
год
1998
специальность ВАК РФ
05.13.13
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка средств обеспечения отказоустойчивости в бортовых вычислительных системах»

Автореферат диссертации по теме "Исследование и разработка средств обеспечения отказоустойчивости в бортовых вычислительных системах"

На правах рукописи

ДУШУТИНА Елена Владимировна

ИССЛЕДОВАНИЕ И РАЗРАБОТКА СРЕДСТВ ОБЕСПЕЧЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ В БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

Специальность 05.13.13 - Вычислительные машины,

комплексы, системы и сети

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт - Петербург 1998

Работа выполнена в Санкт-Петербургском государственном техническом университете.

Научный руководитель доктор технических наук, профессор Колесников Д. Н.

Официальные оппоненты: доктор технических наук, профессор Алиев Т.И., кандидат технических наук, доцент Гордеев А.В,

Ведущая организация:

АОО НИИ вычислительных средств «Спектр» холдинговой компании «Ленинец», г. Санкт-Петербург

Защита состоится

</% 1998г. в /¿г

часов

на заседании диссертационного совета Д 063.38.04 Санкт-Петербургского государственного технического университета по адресу: 195251 г. Санкт-Петербург, Политехническая ул.29, корпус 9, аудитория 325.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного технического университета по адресу: 195251 г. Санкт-Петербург, Политехническая ул.29.

Автореферат разослан «

в

» ггулг'^ 1998г. /

Ученый секретарь диссертационного совета

Дурандин К.П.

Общая характеристика работы

Актуальность темы

Быстрое развитие вычислительной техники и управляющих вычислительных систем в частности, внедрение новых технологий в разработку аппаратных и программных средств привели к необходимости развития новых подходов к проектированию средств обеспечения отказоустойчивости (СОО). Стало очевидным, что использование в сложных вычислительных системах (ВС) традиционных способов введения структурной, временной и программной избыточности эффективно только при условии, что они находятся в точном соответствии с организацией управления вычислительным процессом (ВП), реализуемого операционной системой (ОС). Этот факт нашел отражение в отечественных публикациях с середины девяностых годов в виде попыток систематизации способов управления и восстановления ВП, а также выявления закономерностей их взаимосвязи. Наиболее планомерные исследования в этом направлении проводятся Институтом проблем управления (РАН) на основе обобщения опыта отечественных и зарубежных разработок промышленных и бортовых ВС (БВС), в работах Э.М.Мамедли, Соболева H.A., Менна A.A. и др. Теоретической основой исследований в этой области послужили труды Пархоменко П.П., Прангишвили И.В., Мироновского Л.А., Черкесова Г.Н., Шубинского И.Б., Щербакова О.В., Иыуду К.А. и др.

В последнее время очевиден рост количества зарубежных ОС реального времени, предназначенных для промышленного применения и использующих широкий спектр программно-аппаратных и программных СОО. Большинство из этих систем являются промышленной модификацией систем военного применения. Наиболее существенные результаты зарубежных исследований в области организации и разработки отказоустойчивых ВС (ОВС) представляются на ежегодном симпозиуме: International Symposium on FTC (IEEE Computer Society), где в последние годы стала очевидной тенденция смещения интересов исследователей в область создания СОО в виде системных приложений для «микроядерных» ОС. Наиболее интересные работы в этом направлении опубликованы такими авторами, как Rick Harper, Alan Wood, R.Perez, H.Kim, Y.Huang, C.Kintala и др. Широко используется, так называемая, FLEET - технология проектирования структурно-избыточных ОВС. В силу этого необходим анализ и обобщение способов и механизмов управления и восстановления ВП, а также их реализации в ОС.

Таким образом, актуальность решаемых в диссертационной работе задач определяется необходимостью в организации процессов восстановления ВП в реальном времени с учетом свойств как структуры ВС, так и элементов ОС, управляющих вычислениями. Показатели качества ОВС существенно зависят от выбираемых механизмов и способов восстановления ВП, а последние, в свою очередь, определяются способом управления ВП. Поэтому наряду с классификацией и параметризацией отказоустойчивых бортовых ВС необходим анализ свойств и особенностей организации ВП в БВС, а также формализации описания программных СОО, являющихся составной частью операционной системы.

Кроме того, сама задача оценки качества как средств обеспечения отказоустойчивости, так и ОВС в целом не тривиальна. В связи с этим возникает необходимость в создании методики оценки вычислительной сложности и

надежности с учетом процесса восстановления, осуществляемого средствами ОС, в частности, гипервизором.

Широта спектра показателей, характеризующих структуру, особенности аппаратной и программной реализации ОВС, необходимых для комплексной оценки ее качества, существенно усложняет сам процесс оценки и сбор требуемой исходной информации. Для решения этой проблемы требуются специализированные средства моделирования, ориентированные на имитацию процесса функционирования ОВС.

Разнообразие структурно-алгоритмических методов и средств, предлагаемых сегодня для повышения отказоустойчивости ВС, делает трудоемким процесс выбора необходимых проектных решений для разработчика. Возникает необходимость в систематизации и формировании базового набора способов и механизмов восстановления, а также реализующих их алгоритмов применительно к БВС заданных классов в соответствии со свойствами и особенностями организации в них ВП.

В силу перечисленных причин диссертационная работа посвящена анализу существующих подходов и развитию на их основе системного подхода к проектированию средств обеспечения отказоустойчивости в структурно-избыточных управляющих ВС.

Тема диссертационной работы согласуется с приоритетными направлениями развития науки и техники, утвержденными Правительственной комиссией Российской Федерации по научно-технической политике № 2727п-П8 от 21 июля 1996 года [направление «Фундаментальные исследования», раздел «Информатика, вычислительная техника, автоматизация», а также разделы В.4.2.1, В.4.1.5 перечня технологий двойного назначения]; Федеральной научно-технической программой «Конверсия и высокие технологии 1997-2000 гг.» [раздел 2 «Информационные технологии, электроника и связь»]; Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов»; с планом госбюджетной научно-исследовательской работы «Исследование и разработка систем управления, контроля и диагностики», N 0890301; с планами работ по Всероссийским грантам 1996-1997 гг, 1998-1999 гг. по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи.

Предмет исследования:

- управление восстановлением вычислительного процесса при проявлении дефекта;

- организация структур и процессов в вычислительных средствах обеспечения отказоустойчивости;

- математическое и программное обеспечение средств диагностирования, реконфигурации и восстановления вычислений в бортовых системах управления и контроля;

- модели для определения качества средств обеспечения отказоустойчивости и их влияния на общие характеристики бортовой ВС;

- средства моделирования процессов функционирования отказоустойчивых ВС. Пелыо диссертации является: разработка системного подхода для

проектирования программных и программно-аппаратных средств обеспечения отказоустойчивости управляющих структурно-избыточных ВС с детерминированным распределением ресурсов и создание на его основе математического обеспечения для восстановления ВП в бортовых ВС управления и контроля.

Для достижения поставленной цели необходимо выполнить следующие основные этапы и задачи;

1. Классификация и параметризация ОВС в соответствии с предъявляемыми к ним требованиями и применением, а также анализ свойств и особенностей организации ВП, определяющих способы и механизмы его восстановления в случае возникновения дефектов.

Цели этого этапа:

- определить типы управления отказоустойчивостью и основные структурные параметры;

- классифицировать БВС по применению и определить соответствующие им наборы прикладных задач;

- выделить класс БВС для дальнейшего рассмотрения и провести анализ свойств и особенностей организации вычислительного процесса для выделенного класса ВС.

2. Определение базовых функций и структурирование программного обеспечения (ПО) для поддержки отказоустойчивости в ВС.

Цели этапа:

- сформулировать основные функции ПО, реализующие управление и восстановление ВП;

- распределить эти функции между элементами ОС в соответствии со структурными параметрами и способами управления;

- проанализировать варианты размещения ПО между структурными элементами ВС с целью оптимизации ее функционирования;

- определить функции средств самоконтроля, разрабатываемого ПО и распределить их между элементами ОС;

3. Формализация процесса проектирования гипервизора на основе его многоуровневого представления.

Цель этапа - предложить способ формального описания архитектуры программных средств обеспечения отказоустойчивости и, в частности, гипервизора для решения задачи синтеза этих средств.

4. Выбор системы показателей качества для средств обеспечения отказоустойчивости и ОВС в целом, а также методика оценки этих показателей.

5. Разработка средств моделирования для оценки качества ОВС на основе сформированной системы критериев.

Цель этапа - предоставить пользователю инструментарий и методику построения системы моделей функционирования ВС с выбранной конфигурацией программных и аппаратных средств обеспечения отказоустойчивости, а также возможность их коррекции и оптимизации на основе качествешгах и количественных оценок.

6. Проектирование математического обеспечения структурно-избыточных ВС с детерминированным распределением ресурсов. Оценка вычислительной сложности разрабатываемых средств с учетом аппаратных и программных решений, формирование комплексной оценки процессов диагностирования, реконфигурации и восстановления ВП, а также их влияния на производительность и надежность системы в целом.

Цели этапа:

- предложить функционально-структурную, семантическую, информационную и логическую организацию локального гипервизора отказоустойчивого комплекса выбранного класса, а также алгоритмический состав для его формирования;

- оценить временные затраты и расходуемую память для различных механизмов и способов восстановления, реализованных в сформированном алгоритмическом базисе;

- оценить качество процессов по интегральному критерию с учетом показателей, характеризующих аппаратную, временную и информационную избыточности;

- проанализировать влияние качества исследуемых процессов на надежностные и иные комплексные оценки отказоустойчивой ВС;

- оценить снижение потенциальных характеристик системы относительно идеально функционирующей гипотетической ВС.

7. Разработка СОО для ВВС с заданными архитектурой и ОС с учетом ограничений на выбор механизмов управления и восстановления ВП.

Цель этапа: предложить способ восстановления вычислительного процесса, соответствующий механизмам управления функционирования, предусмотренным в заданной ОС; сформировать набор алгоритмов, реализующих диагностирование в стационарном режиме и восстановление ВП при проявлении дефектов; оценить качество предлагаемых средств и изменение характеристик ВВС, используя предложенные методики и разработанные средства моделирования.

Методы исследования В работе использованы методы технической диагностики и системного анализа, теории вероятностей и математической статистики, теории случайных процессов, имитационного моделирования.

Научные результаты и иж новизна 1. Сформулированы основные этапы проектирования СОО на основе системного подхода в структурно-избыточных ВС с учетом операционной системы. Предложено формализованное многоуровневое описание программных СОО, в том числе организации гипервизора, как основной составляющей СОО. В результате выделены новые типы объектов: текущий и полный локальный и глобальный гипервизоры, системная и прикладная составляющие гипервизора.

2. Сформирована система показателей качества СОО. Предложена обобщенная модель функционирования ОВС с учетом дефектов и формирования текущего гипервизора в соответствии со структурной и функциональной деградацией системы. Предложена концепция построения средств моделирования в виде проблемно-ориентированных библиотек, встраиваемых в существующие универсальные интегрированные среды проектирования ВС. Новизна достигается за счет включения в процесс моделирования структурной организации ВС, свойств и особенностей организации ВП, в том числе механизмов и способов управления и восстановления ВП, реализуемых элементами ОС, а также дефектов с различными формами их проявления.

3.Предложена методика оценки качества СОО и их влияния на производительность и надежность ОВС. В отличие от других существующих методик она позволяет учесть процесс восстановления с точностью до алгоритмической реализации отдельных механизмов и способов его организации.

4.Сформирован базисный набор способов и механизмов восстановления ВП, а также реализующих их алгоритмов применительно к структурно-избыточным ВВС

управления и контроля с детерминированным распределением ресурсов. Состав учитываемых факторов при формировании базиса расширен в соответствии с особенностями функционирования БВС.

5.Разработаны модели функционирования структурно-избыточных ВС с детерминированным распределением ресурсов на основе предложенных вариантов локального гипервизора, реализующих различные способы восстановления, с целью их сравнительной оценки. Представленные модели позволяют выбирать необходимое сочетание СОО, способствующее улучшению технических характеристик за счет согласования структурной избыточности, системы дефектов и взаимоподобных механизмов управления и восстановления ВП.

6.Разработано математическое обеспечение бортового комплекса управления и контроля с учетом ограничений заданной ОС. По сравнению с исходным бортовым комплексом предлагаемый отличается повышенной сбоеустойчивостью и точностью локализации дефекта без необходимости в перезагрузке или многократном выполнении копий прикладной задачи.

Основные положения, выносимые на защиту, представлены в разделе «Научные результаты и их новизна».

Достоверность результатов '• '"'•

Обоснованность и достоверность результатов подтверждается моделированием, экспериментальными исследованиями; результатами экспертизы Регионального центра научно-технической экспертизы; корректным использованием математического аппарата; апробацией работы в виде докладов на Всероссийских и Международных конференциях и публикациях в научных и учебно-методических изданиях.

Научная значимость результатов

состоит в развитии системного подхода к проектированию СОО в виде: формализации многоуровневого описания программных СОО, систематизации способов и механизмов восстановления ВП для ' класса - бортовых ВС, а также концепции проектирования системы моделирования для оценки качества разрабатываемых средств.

Практическая ценность результатов

На основе полученных в диссертационной работе теоретических результатов:

- разработаны открытые проблемно-ориентированные библиотеки для комплексного моделирования функционирования ОВС с учетом ОС, встраиваемые в различные универсальные интегрированные среды проектирования. Предлагаемые средства, а также возможность их выбора способствуют снижению трудоемкости и сокращению времени проектирования СОО и ОВС в целом;

- сформированный базис способов и механизмов восстановления ВП, а также алгоритмический базис для выбранного класса систем позволяет повысить качество проектирования БВС управления и контроля;

- разработанные варианты локального гипервизора позволяют комплексировать разработанные средства с целью достижения компромиссных решений между затратами ресурсов и необходимым уровнем отказоустойчивости за счет варьирования различных параметров ВС и ВП.

Реализация результатов работы

Предложенные в работе подходы, методики и средства моделирования могут применяться без существешшх изменений для более широкого класса управляющих ВС, используемых в судостроении, энергетике и других отраслях промышленности.

Это подтверждается исследованиями, проводившимися в соответствии с планом работ по Всероссийскому гранту 1996-1997 гт по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи [в рамках научно-технической программы «Цифровые и цифро-аналоговые вычислительные комплексы»] по теме "Организация вычислительных процессов в бортовых системах функционального диагностирования" (№ 5868011). Полученные в диссертационной работе результаты, связанные с созданием системы моделирования процессов функционирования отказоустойчивых ВС, явились основой для дальнейшего развития направления и получения гранта 1998-1999гг. по теме "Разработка средств моделирования дня анализа качества программно-аппаратных средств обеспечения отказоустойчивости бортовых вычислительных систем» (№ гос. регистрации 0198.0003849).

Реализация работы связана с использованием полученных результатов в НИР «Паритет» НИИ вычислительных средств «Спектр» по проектированию базового комплекта бортового оборудования летательных аппаратов пятого поколения, а также в НИР, проводимой НИИ радиоэлектронных систем холдинговой компании «Ленинец» в соответствии с Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов» (1997г.).

Предложенные средства и методики используются в учебном процессе при организации практических занятий по курсам «Периферийные устройства ЭВМ и ВС», «Системное программное обеспечение», «Сети ЭВМ», а также при подготовке бакалавров и магистров соответствующих направлений.

Апробация работы

Результаты диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях (НТК): на ежегодной Международной НТК «Диагностика, информатика, метрология, экология и безопасность» (СПб.: 1995, 1996, 1997, 1998гт.), Международной НТК «Информационные технологии в моделировании и управлении» (СПб., 1996г.), Международной НТК «Управление и информационные технологии на транспорте» («ТРАНСКОМ- 97»), XV международной межвузовской школе - семинаре «Методы и средства технической диагностики» (Йошкар-Ола: МарГУ, 1998) и др.

Полнота изложения результатов диссертации в опубликованных работах

По материалам диссертации опубликовано 17 печатных работ, в том числе 4 учебных пособия (включая переиздание одного из пособий автора в 1998г.).

Структура и обьеи работы

Диссертация включает введение, пять разделов, заключение, список литературы и приложения. Материал изложен на 311 страницах машинописного текста (основной текст - 292 страницы), содержит 107 рисунков, 68 таблиц, библиографию из 152 наименований.

Содержание работы по разделам

Во введении обосновывается актуальность темы диссертационной работы, формулируются цель и основные задачи исследования, приводятся наиболее существенные результаты исследования.

В первом разделе анализируется современное состояние проблемы. Выделяются основные классы отказоустойчивых ВС с различивши структурами управления восстановлением ВП, а именно: распределенной, сосредоточенной и смешанной (распределенно-сосредоточенной). Под восстановлением ВП понимается диагностирование в стационарном и нестационарном режимах работы, реконфигурация и восстановление функционирования в новой конфигурации.

Проводится классификация БВС по применению и рассматривается состав прикладных задач каждого класса.

Формируется набор наиболее существенных свойств и особенностей ВП, влияющих на выбор механизмов и способов его восстановления. В соответствии с предложенным набором определяются классы БВС для дальнейшего рассмотрения:

1. ВС с распределенной структурой управления восстановлением, детерминированным распределением ресурсов, «полудинамической» структурой межкомплексных и статической структурой внутрикомплесных связей, распределенной или распределенно-сосредоточенной структурой управления обменом, постоянным резервированием внутри комплекса, позволяющим реализовать стратегию локализации дефекта, с возможностью дальнейшей автоматической реконфигурации на двух уровнях: комплекса и системы, при общем количестве уровней деградации, равном [m(n-l)-l], где п - кратность резервирования в комплексе, am- количество комплексов с второстепенными функциями.

2. ВС с сосредоточенной структурой управления Восстановлением ВП, детерминированным распределением ресурсов, статической структурой связей, функционально и структурно выделенным сегментом диагностирования для оборудования бортового объекта. Его характеристики определены: сегмент содержит функционально ориентированные одно- или многопроцессорные ЭВМ; распределение ресурсов на уровне ЭВМ - недетерминированное, с распараллеливанием ВП при недостаточном быстродействии одного процессора; механизм диспетчеризации - списковый в сочетании с внешними прерываниями; резервирование - двухкратное постоянное; общая стратегия восстановления -маскирование сбоев и локализация отказов диагностируемого оборудования с целью замены отказавшего на исправный дублирующий, если такой имеется.

Обосновывается необходимость системного подхода к проектированию средств обеспечения отказоустойчивости. Под системным подходом в данной работе понимается включение основных принципов системности: принципа целостности, принципа структурности, принципа иерархичности, принципа взаимодействия с окружающей средой - в процесс создания программных средств обеспечения отказоустойчивости ВС. Анализируются методы и средства для оценки качества разрабатываемых СОО и их влияния на общие характеристики системы. В заключении раздела формулируется перечень задач, решаемых в диссертационной работе.

Во втором разделе излагаются основные этапы системного подхода (рис.1), методы и способы их реализации. Формируются функциональный состав и структурная организация программных СОО, распределенных по элементам ОС и прикладного ПО для ВС с различной структурой управления восстановления ВП. Выделяются новые объекты типа: локальный и глобальный гипервизор, полный и текущий гипервизор, системная и прикладная составляющие гипервизора. На основе многоуровневого описания гипервизора предлагается формализованный подход к его

Этапы проектирования программных средств обеспечения отказоустойчивости ВС

Анализ свойств и особенностей организации управления ВП и

управления восстановлением ВП 1

Состав программных СОО по элементам ОС и прикладного ПО 2

Функции каждого

элемента ОС и ППО с точки зрения обеспечения

отказоустойчивости 3

Программные СОО в составе супервизора

Средства самоконтроля

В составе ядра

смо

Средства контроля в каналах передачи

Гипервюор

Полный £

Текущий

Локальный

^ Глобальный

Стратегия восстановления

Формализованное описание организации гипервизора

X

Функциональный

Уровни описания

Структурный

X

Логический

Информационный

-> Семантический

Система показателей "качества СОО и ОВС 5

Средства моделирования 6

Синтез гипервизора

Рис.1

Основные этапы оценки показателей качества

Рис.2

покомпонентному формированию в стационарном и нестационарном режимах функционирования.

В обобщенном виде задача системного проектирования ОС отказоустойчивой ВС представляется следующим образом:

z,= м

U

Ms

Мт\Р

кг "L. .

.vUk,

"L. .

м,

РШУ 1 Pghv 4 и*,

гда Ms,

KVk,

- модель супервизора (первая составляющая целостной модели

отказоустойчивой ОС), е £ }- элементы ОС (или их отдельные компоненты), pv -

параметры функционирования составляющих ОС;

м,

"L. .

модель ядра ВС

при заданных правилах взаимодействия структурно-избыточных элементов, исходной

кратности резервирования ш и текущей кратности резервирования, соответствующей

/ \

уровню деградации i (вторая составляющая);

Pun" Pi

GUV'

- модель

пшервизора, включающая локальную и глобальную составляющие, соответствующие модели средств обеспечения отказоустойчивости в комплексе со статическими связями и в системе с динамической организацией взаимодействия комплексов; \ут -векторная оценка 2>'",JVj эффективности ОС на некоторой совокупности

показателей, представленная здесь в виде трех векторных составляющих, отражающих иерархический характер построения ОС отказоустойчивой ВС.

Предлагается итеративная процедура синтеза гипервизора на основе анализа организации ВП, т.к. восстановление ВП и диагностирование в стационарном режиме функционирования осуществляются под управлением гипервизора.

Предлагается система частных и интегральных показателей, а также методика оценки качества СОО и их влияния на характеристики БВС в целом (рис. 2). В основе методики лежит сочетание аналитических подходов и имитационного моделирования.

В третьем разделе предлагается и обосновывается общая концепция разработки проблемно ориентированных средств моделирования, встраиваемых в уже существующие универсальные интегрированные среды проектирования ВС, и предназначенных для анализа качества отказоустойчивых ВС. Предлагаемая концепция моделирования предполагает наличие двух основных этапов:

- формирование базового набора знаний о средствах обеспечения отказоустойчивости на основе существующих сред моделирования, предназначенных для автоматизации проектирования ВС;

- формирование нетиповых компонент и синтез целостной модели из компонентов этого набора с целью оценки проектного решения в соответствии с системой критериев.

Формируется базовый набор знаний, представляющий собой функционально полный набор и включающий имитационные модели элементов проектируемых средств обеспечения отказоустойчивости, элементов ОС, а также элементов, отражающих реальные условия функционирования и режимы эксплуатации создаваемой отказоустойчивой ВС. Таким образом, предлагается следующий перечень разделов атомарных имитационных моделей:

- библиотека структурных элементов (модели функционирования отдельной ЭВМ, модели наиболее часто используемых интерфейсов, базовый набор структур комплексов с различными типами резервирования);

- модели алгоритмов диагностирования с различными параметрами, учитывающие характер структур комплексов и ВС в целом;

- модели процедур реконфигурации для каждого типа комплексов базового набора;

- библиотека моделей дефектов и модели реакции системы на дефект, возникший при восстановлении вычислительного процесса;

- модели, имитирующие функционирование ОС: процедуры диспетчеризации, имитация режима реального времени, имитация событий и прерываний; очередь и выполнение прикладных заданий и т.д.

Функциональная структура библиотеки представлена на рис. 3.

Предлагается обобщенная модель функционирования ОВС (рис.4): м= ( s> WrW2> F> АЛА , О, G, К ), где S - множество внутренних состояний работоспособности системы; щ, - множества возможных дефектов; F- множество вариантов алгоритмического состава пшервизора; 8i'Si'S3 " функц™ переходных процессов восстановления ВП в результате

возникновения различных дефектов (St: —> ); Р - множество вариантов

распределения задач (или функций) по комплексам в системе; А- функция переходов по восстановлению ВП на межкомплексном уровне; О - распределение задач по имеющимся ресурсам (возможно с временной или полной потерей части второстепенных функций); G - состав гипервизора, соответствующий текущей конфигурации ВС; К - вектор показателей качества, в соответствии с системой показателей, предложенной в разделе 2. Множества: F, Р - рассматриваются

как входные; О, G, К - как выходные. Функционирование модели в самом простейшем случае может быть задано преобразованием:

Выбираются базовые средства моделирования, на основе которых формируются проблемно-ориентированные библиотеки. Представляется описание двух из трех разработанных библиотек на основе F-сетей и конечных автоматов, а также программных сред соответственно PETRIWIN и COVERS. Излагается методика компоновки целостной модели функционирования объекта на основе формальных спецификаций двух типов: параметрической и функциональной. Предлагаемые средства моделирования являются функционально полными и открытыми для расширения каждого из разделов новыми средствами.

В четвертом разделе формируется базис механизмов восстановления и соответствующий ему алгоритмический набор для БВС с детерминированным распределением ресурсов. Для выбранных классов БВС предлагается семантическая, информационная и логическая организация гипервизора, описывающая статические

Рис. 3

свойства и динамику взаимодействия его компонент. Процесс реализации компонент гипервизора представлен на рис. 5. В соответствии с формализованным подходом, предложенным в п. 2.3, формируются возможные варианты локального гипервизора с различными способами восстановления ВП.

С помощью разработанных и представленных в разделе 3 средств моделирования осуществляется построение соответствующих этим вариантам моделей функционирования БВС в различных режимах:

- элементарные модели, имитирующие все механизмы восстановления, составляющие базис механизмов, реализуемых посредством алгоритмов соответствующего базиса. Формирование элементарных моделей сводится к выбору их из проблемно-ориентированной библиотеки и внесению необходимых параметров в спецификации;

- модели функционирования текущих гипервизоров в стационарном и нестационарном режиме, имитирующие различные способы восстановления ВП;

- модели функционирования ВС с учетом априорной информации о системе. Построите этих моделей осуществляется в соответствии с методикой компоновки целостной модели, предложенной в разделе 3.

На основе предложенной в разделе 2 методики оцениваются характеристики локальных гипервизоров и даются рекомендации о целесообразности использования того или иного способа восстановления ВП. В разделе и приложениях к работе приводятся графики зависимостей и таблицы численных значений следующих показателей:

- временных и емкостных характеристик каждого алгоритма базиса, реализующего тот или иной механизм восстановления;

- вычислительной сложности текущего гипервизора, реализующего тот или иной выбранный способ восстановления для отказоустойчивой ВС заданной структуры;

- интегральных временных показателей функционирования ВС, а также емкостных характеристик полного гипервизора;

- частных показателей надежности на основе графа восстановления дтя различных струкгур отказоустойчивой ВС;

- общих показателей надежности ВС, определяемых аналитически на основе частных показателей, полученных в результате имитационного моделирования.

Система результатов, параметров моделирования и исходных данных, отражающих априорную информацию о системе, формируются на основе формальных спецификаций двух типов: функциональных и параметрических. Основные результаты, представленные в разделе, концентрируются в 23-х рисунках и 15-и таблицах раздела.

Законченный цикл формирования гипервизора полностью соответствует выполнению этапов проектирования, предложенных при изложении системного подхода. Раздел завершается основными теоретическими выводами, сделанными на основе результатов исследования, а также предлагается методика формирования гипервизора.

В пятом разделе полученные в работе результаты апробируются применительно к БВС с заданными архитектурой и ОС. При этом решаются две задачи: 1) повышения сбоеустойчивости бортового комплекса диагностирования, состоящего из функционально неоднородных вычислительных каналов и не имеющего структурной избыточности; 2) повышения отказоустойчивости в

Реализация компонент гипервизора

Характеристики и параметры, определяющие организацию ВП в ОВС

Алгоритмический базис для реализации механизмов восстановления

Основные шаги процесса восстановления Механизмы восстановления

Преобразование ИН а а,

Выбор согласованного значения Р -

Обнаружение дефекта Г ух,уг,..., У; .... -

Локализация дефекта 5 8\>8г> 5ъ

Идентификация е £\' ■■■' Ея

Восстановление после сбоя Я - -

Блокирование отказавшей части и восстановление после отказа 7 ■■■' ш •••■ -

Группа способов восстановления

Способ восстановления

для выбранной организации ВП

Группа

В

Б

♦ •Е

Содержание

Дружественные дефекты На уровне устройства

Дружественные дефекты На уровне канала

Дружественные и часть враждебных

На уровне канала

Враждебные дефекты На уровне канала

При отсутствии локализации

Рис.5

М>г

Г

|пипМ |

5 дг

|шахМ |

0

Набор алгоритмов

а, /1?'. • Л?'- -

Р

У, Ж'.....

5, ....

£т ....

.... .....

п. •••• л?-. •

Выбранный набор алгоритмов реализуется текущим локальным гипервизором

Глубина диагностирования

Уровень реконфигурации

Полнота диагностирования

А^и.кНсЛл',} л-.'&и.^НсГ.л.,}

^ кнюи'ккця'кппЧ

Рис.4

»

функционально и структурно однородном многоканальном комплексе с аналогичной ОС, но другим набором прикладных задач.

В соответствии с заданными ограничениями на выбор механизмов и способов управления и восстановления ВП разрабатывается математическое обеспечение, формируются модели функционирования БВС с учетом реальной ОС, анализируется возможность и целесообразность применения различных способов восстановления при заданной системе ограничений.

Разработка СОО для заданной БВС осуществляется в соответствии с этапами проектирования, предложенными в разделе 2. Для исходной БВС: проводится анализ свойств и особенностей организации ВП; представляется состав, функциональная и структурная организация ПО, главным образом, ОС; анализируются имеющиеся в исходной БВС средства встроенного контроля и система дефектов; формируется многоуровневое описание СОО; формируется граф восстановления; на основе проблемно ориентированных средств моделирования строится модель функционирования БВС с учетом ОС; оцениваются частные и общие показатели вычислительной сложности и надежности минимальной системы, а также имеющаяся ресурсная избыточность; на основе которых обосновывается необходимость внедрения в ОС дополнительных программных средств с целью повышения сбое- и отказоустойчивости. Для модификации БВС: формируется многоуровневое описание СОО; расширяется система обнаруживаемых и устраняемых дефектов; корректируется и дополняется граф восстановления в соответствии с исследуемыми способами восстановления ВП; формируется модель, состав которой дополняется гипервизором, корректируются супервизор и ядро; доказывается адекватность полученной модели и достоверность результатов на основе сопоставления аналитических и статистических оценок; оценивается качество разработанных средств в соответствии с ранее сформированной системой показателей. Результаты исследований сведены в таблицы и представлены графиками в разделе и приложениях.

В виде графиков представлено изменение качества системы при дополнении БВС механизмами гипервизора, соответствующими различным группам способов восстановления ВП. Для заданной системы с минимальной конфигурацией на заданном интервале времени t = [0:1000 ч] вероятность безотказной работы (Рбо) составляет 0,88, тогда как при использовании программных СОО для трех рассмотренных групп В, С, D значение (1'бо) может бьггь увеличено до 0,93. В результате сравнения статистических и аналитических оценок вероятностей безотказной работы, было определено, что полученные значения различаются не более чем на 0,018. Проведен анализ затрат ресурсов, в соответствии с которым показано, что наиболее предпочтительным для рассматриваемой БВС является способ восстановления из группы D на основе сбоеустойчивого информационного согласования с многораундной процедурой обмена между вычислительными каналами, не требующий организации дополнительной контрольной задачи к общему списку задач.

В приложениях представлены файловая структура и формальные спецификации проблемно-ориентированных библиотек, встраиваемых в среды PETRIWIN, COVERS 2.0, COVERS 3.0, исходные данные и промежуточные результаты для оценки качества разрабатываемых средств БВС с заданными архитектурой и ОС.

ЗАКЛЮЧЕНИЕ

В ходе диссертационной работы были получены следующие научные и практические результаты:

1. Обоснована необходимость представления функциональной и структурной организации средств обеспечения отказоустойчивости, распределенных по элементам ОС и прикладного ПО, на основе анализа свойств и особенностей управления и восстановления ВП, а также структуры управления отказоустойчивостью для многомашинных ВС с детерминированным распределением ресурсов с учетом предъявляемых к ВС требований.

2. Предложено многоуровневое формализованное описание одного из элементов ОС -гипервизора, под управлением которого осуществляется функционирование программных СОО. В качестве таких уровней рассмотрены: функциональный, структурный, семантический, информационный и логический уровни организации, отражающие статические и динамические свойства функционирования гипервизора и ВС в целом.

3. Выбрана система показателей, целесообразная для оценки качества разрабатываемых средств обеспечения отказоустойчивости, включающая дифференциальные и интегральные показатели вычислительной сложности (временные и емкостные), интегральные показатели отказоустойчивости, а также показатели влияния качества СОО на показатели надежности и производительности ВС.

4. Предложен системный подход к проектированию программных СОО в ВС с детерминированным распределением ресурсов и распределенной или смешанной структурой управления отказоустойчивостью. В основе этого подхода лежит многоуровневое формализованное представление СОО, позволяющее синтезировать гипервизор (и необходимые модули ядра и супервизора) в результате итеративной процедуры выбора и оптимизации решения на основе частичных и полных (в зависимости от стадии проектирования) векторных оценок качества. Оценки качества предлагается формировать, используя данные, полученные в результате имитационного моделирования.

5. Предложена общая концепция разработки специальных средств моделирования для анализа качества отказоустойчивых ВС на основе уже существующих универсальных сред моделирования и проектирования ВС. В соответствии с этой концепцией созданы и апробированы проблемно-ориентированные библиотеки и методики сборки на ее основе целостных моделей функционирования отказоустойчивой ВС. Такие модели позволяют учесть особенности функционирования структурно-избыточных систем, наличие дефектов, процессы восстановления, их аппаратную и программную реализации, а также механизмы и способы управления и восстановления ВП, предусмотренные операционной системой.

6. Для реализации этой концепции: произведен выбор инструментальных средств и методов моделирования; предложена обобщенная математическая модель функционирования отказоустойчивой ВС в соответствии с системой показателей оценки их качества и функционально-структурным представлением средств обеспечения отказоустойчивости; разработаны две проблемно-ориентированные библиотеки на основе F-сетей и конечных автоматов и соответствующих этим методам сред Petriwin и Covers (версии 2.0 и 3.0). Для библиотек представлены:

функциональная структура, модули и спецификации, файловые структуры и методика использования этих библиотек для построения моделей ВП в отказоустойчивых ВС при нормальном функционировании и наличии дефектов.

7. Сформирован базис механизмов и способов восстановления ВП, а также соответствующий им алгоритмический базис для структурно-избыточных ВВС с детерминированным распределением ресурсов.

8. Предложены различные варианты текущих и полных локальных гипервизоров для отказоустойчивых комплексов постоянного резервирования с синхронным типом обмена с точностью до алгоритмической реализации.

9. На основе проблемно-ориентированных средств моделирования и сформированных базисов разработаны модели каждого из них,с учетом архитектуры комплекса (без учета других элементов операционной системы и прикладного ПО).

10. Предложена методика оценки качества СОО, в соответствии с которой получены характеристики разработанных гипервизоров и проведен анализ влияния механизмов и способов восстановления ВП на показатели качества отказоустойчивой ВС.

11. Предложена методика разработки гипервизора отказоустойчивых комплексов со структурной избыточностью и распределенным управлением диагностированием и реконфигурацией.

12. Разработан гипервизор, встраиваемый в заданную ОС БВС, а также системные средства его поддержки на уровне ядра и супервизора. Доказана целесообразность использования выбранных в работе механизмов, способа и алгоритмов восстановления ВП для реализации сформированного гипервизора в заданной БВС.

13. На основе проблемно-ориентированной библиотеки построены модели функционирования исходной БВС с учетом механизмов управления ВП заданной ОС и средств встроенного контроля, а также модели БВС, программное обеспечение которой дополнено средствами гипервизора.

14. Разработан набор атомарных моделей, функционально образующий самостоятельный раздел библиотеки, предназначенный для моделирования типовых механизмов управления ВП ОС (включая функционирование в реальном времени, дисциплины диспетчеризации, различные режимы обмена информацией и др.).

15. При использовании предложенной методики получены оценки качества исходной и модифицированной БВС, доказывающие необходимость учета при проектировании средств обеспечения отказоустойчивости механизмов и способов управления и восстановления ВП, реализуемых средствами ОС.

В заключении сформулируем наиболее существенные теоретические выводы, сделанные на основе результатов, полученных в диссертационной работе.

1. В структурно избыточных ВС, где в качестве структурных элементов используются сложные объекты (типа ЭВМ или комплекса), взаимодействие которых обеспечивается средствами ОС и специального ПО, существенное влияние на характеристики ВС оказывает выбор способа восстановления ВП при проявлении дефекта.

2. Увеличение структурной избыточности целесообразно, только если оно сопровождается расширением системы дефектов, локализуемых и устраняемых средствами обеспечения отказоустойчивости при использовании соответствующих механизмов и способов восстановления.

3. Выбор более совершенных с точки зрения повышения отказоустойчивости , , способов восстановления приводит к существенному увеличению затрат ресурсов.

Поэтому необходим поиск компромиссных решений с целью удовлетворения системе ограничений реального времени, емкостных и аппаратных затрат, а также требованиям надежности.

4. Для получения корректной оценки затрат ресурсов на реализацию того или иного способа восстановления необходимо учитывать ресурсы, затрачиваемые не только гипервизором, но и другими элементами ОС, а также механизмы диспетчеризации задач в проектируемой или модифицируемой ОС.

Таким образом, распределение средств обеспечения отказоустойчивости по всем элементам ОС и прикладного ПО, их взаимосвязь и взаимное влияние обусловливают необходимость комплексной оценки на основе аналитических и имитационных моделей функционирования ВС, учитывающих как архитектуру, так и реализацию операционной системой способов управления и восстановления ВП в стационарном и нестационарном режимах.

Решения, предложенные в диссертационной работе, способствуют развитию системного подхода к проектированию СОО ВС. Применительно к БВС управления и контроля были решены задачи: анализа свойств и особенностей организации ВП; синтеза СОО на основе анализа; комплексной оценки качества СОО и ВС в целом; а также создания системы моделирования для комплексной оценки качества отказоустойчивых ВС. Это полностью соответствует исходной постановке задачи и цели диссертационной работы.

Список опубликованных работ

1. Душутина Е. В. Методы построения отказоустойчивых вычислительных систем с реконфигурацией и оценка их эффективности.// Международная научно-техническая конференция «Диагностика, информатика и метрология - 95»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб., 1995, с. 129 - 130.

2. Колесников Д.Н., Душутина Е.В., Пахомова В.И. Введение в MATLAB с примерами решения задач оптимизации и моделирования: Учебное пособие/ СПбГТУ. СПб., 1995,115 с. (усл. печ. л. 7,25).

3. Душутина Е. В., Колесников Д. Н. Формализация процесса разработки программно-аппаратных средств для обеспечения отказоустойчивости в многомашинных вычислительных системах. // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность - 96»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб., 1996, с. 57 - 58.

4. Душутина Е.В. Организация обмена информацией в режиме прерываний в ЭВМ и ВС на основе микропроцессоров INTEL80x86: Учебное пособие/. СПбГТУ. СПб., 1996, 80 с. (усл. печ. л 4,25).

5. Душутина Е. В., Колесников Д. Н. Структуризация задач разработки программно-аппаратных средств для обеспечения отказоустойчивости в МВС. // Международная научно - техническая конференция «Информационные технологии в моделировании и управлении»: Тез. докл. /СПбГТУ - СПб., 1996, с. 147- 148.

6. Душутина Е. В., Колесников Д. Н. Критерии оценки качества реконфигурации в отказоустойчивых многомашинных вычислительных системах // Вычислительные

измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 462. - СПб., 1996, с.79-86.

7. Душутина Е. В., Колесников Д. Н. Выбор структуры программных средств обеспечения отказоустойчивости на основе анализа особенностей организации вычислительного процесса в управляющих системах.// Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 462. - СПб, 1996, с. 86-96.

8. Душутина Е. В., Колесников Д. Н. Оценка средств обеспечения отказоустойчивости судовых ВС// Управление и информационные технологии на транспорте: Тезисы докладов международной научно-технической конференции «ТРАНСКОМ- 97». СПб.: СПГУВК, 1997, с. 62 - 63.

9. Душутина Е. В, Колесников Д. Н. Формализация синтеза программных средств обеспечения отказоустойчивости ВС// Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 468. - СПб, 1997, с. 90-92.

10. Душутина Е. В, Колесников Д. Н. Оценка средств обеспечения отказоустойчивости вычислительных систем. // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность - 97»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб, 1997, с. 62-63.

11. Душутина Е. В, Колесников Д. Н. Средства моделирования для анализа качества отказоустойчивости бортовых вычислительных систем // XV международная межвузовская школа - семинар «Методы и средства технической диагностики» (МиСТД-98): Сборник докладов. - Йошкар-Ола: МарГУ, 1998, с. 67-71.

12. Душутина Е. В, Колесников Д. Н. Определение показателей качества отказоустойчивых вычислительных систем // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность -98»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб, 1998.

13. Душутина Е. В, Колесников Д. Н. Построение библиотеки моделей для анализа качества отказоустойчивых ВС // Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 472. - СПб, 1998.

14. Душутина Е.В. Организация обмена информацией в режиме прерываний в ЭВМ и ВС на основе микропроцессоров INTEL: Учебное пособие/ СПб. - СПбГТУ, 1998, 81с. (усл. печ. л. 4,25).

15. Алексеев В.Н, Душутина Е.В, Душутин И.Д. Управление периферийными устройствами и организация обмена информацией в микроЭВМ: Лабораторный практикум/ЛГТУ. Л, 1991,61с. (усл. печ. л. 4).

16.Мелехин В.Ф, Душутина Е.В, Пышкин Е.В. Автоматизация синтеза при логическом проектировании цифровых устройств на основе базовых матричных кристаллов// Вычислительные, измерительные и управляющие системы. Сборник научных трудов: Труды СПбГТУ № 449/ СПб., 1994, с.82-90.

17. Душутина Е.В, Клыков Г.А, Максимов A.B. Разработка библиотеки моделирования для оценки качества отказоустойчивых управляющих ВС//26 неделя науки СПбГТУ: Тезцсы докладов студенческой научно-технической конференции. СПб.: СПбГТУ, 1997, с. 150.

Текст работы Душутина, Елена Владимировна, диссертация по теме Телекоммуникационные системы и компьютерные сети

/ • V " '

/ {

Санкт-Петербургский Государственный Технический Университет

ИССЛЕДОВАНИЕ И РАЗРАБОТКА СРЕДСТВ ОБЕСПЕЧЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ В БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

Специальность 05.13.13 - Вычислительные машины,

комплексы, системы и сети

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель д.т.н., проф. Колесников Д.Н.

На правах рукописи

Душутина Елена Владимировна

Санкт - Петербург 1998

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ ........................................................................................5

Раздел 1. Сравнительный анализ основных принципов построения

отказоустойчивых бортовых ВС и методов анализа их качества

1.1. Основные понятия и определения ........................................................13

1.2. Классификация БВС с учетом их применения и управления процессом обеспечения отказоустойчивости .........................................................16

1.3. Анализ и особенности организации вычислительного процесса в ОБВС

с различными структурами управления отказоустойчивостью......................29

1.4. Методы анализа характеристик БВС .................................................... 37

1.5. Постановка задачи диссертационной работы........................................... 52

Раздел 2. Основные этапы и задачи системного подхода к проектированию

программно-аппаратных средств обеспечения отказоустойчивости

2.1. Формирование состава программных средств обеспечения отказоустойчивости .........................................................................55

2.2. Определение базовых функций и структуризация программных

средств обеспечения отказоустойчивости .............................................59

2.3. Формализация процесса разработки гипервизора отказоустойчивых бортовых ВС..................................................................................68

2.4. Система показателей для оценки качества

средств обеспечения отказоустойчивости .............................................82

2.4.1. Оценка показателей вычислительной сложности........................... 84

2.4.2. Оценка показателей отказоустойчивости и надежности ................. 90

Выводы к разделу ............................................................................... 100

Раздел 3. Разработка средств моделирования для анализа качества

отказоустойчивых ВС

3.1. Общие принципы разработки средств моделирования для анализа качества отказоустойчивых ВС .......................................................................... 101

3.2. Разработка проблемно-ориентированной библиотеки для проектирования средств обеспечения отказоустойчивости ................................................ 114

3.2.1. Построение элементарных моделей проблемно-

ориентированной библиотеки в среде PETRIWIN................................. 121

3.2.2. Построение элементарных моделей проблемно-

ориентированной библиотеки в среде СО VERS3.0 ...............................135

3.3 Формирование целостных моделей функционирования отказоустойчивых

ВС и проверка их достоверности ..............................................................149

Выводы к разделу ................................................................................163

Раздел 4. Разработка гипервизора в комплексах со структурной избыточностью и распределенным управлением восстановлением ВП

4.1. Многоуровневое представление гипервизора.........................................164

4.2. Формирование локального гипервизора................................................ 187

4.3. Построение моделей для выбора локального гипервизора ......................... 196

Выводы к разделу ................................................................................ 217

Раздел 5. Разработка средств обеспечения отказоустойчивости для БВС

с заданными архитектурой и операционной системой

5.1. Анализ свойств и особенностей организации ВП заданной БВС .................218

5.2. Функционально-структурная организация ПО БВС с дополнительными

программными средствами обеспечения отказоустойчивости .................233

5.3. Моделирование процесса функционирования БВС..................................235

5.4. Моделирование механизмов управления ВП с учетом заданной ОС ...........249

5.5. Оценка качества и сравнительный анализ БВС с различными

средствами повышения отказоустойчивости .......................................256

Выводы к разделу .................................................................................275

ЗАКЛЮЧЕНИЕ ............................................................................... 276

Список литературы .............................................................................. 280

Приложения ....................................................................................... 293

Список сокращений

БВС -бортовая вычислительная система ВК - вычислительный канал

ВН - возврат назад в ходе вычислительного процесса

ВП - вычислительный процесс

ВС - вычислительная система

КПР - комплекс с постоянным резервированием

КРЗ - комплекс с резервированием замещением

КСР - комплекс со смешанным резервированием

КТ - контрольная точка

МФО - метод формального описания

ОВС - отказоустойчивая вычислительная система

ОС - операционная система

ОУ и К - объект управления и контроля

ПВ - переход вперед в ходе вычислительного процесса

ПО - программное обеспечение

РОС - резидентная ОС

СМО - средства межмашинного обмена

СОО - средства обеспечения отказоустойчивости

СП - сети Петри

СПО - системное программное обеспечение

ССУ - системные средства управления

СУ - система управления

СУРЗ - средства управления решением задач

ЯВУ - язык высокого уровня (УЯВУ - универсальный ЯВУ)

Специальные сокращения см. раздел 5

ВВЕДЕНИЕ

Вопросам разработки средств обеспечения отказоустойчивости (СОО) посвящено много научных и инженерных работ, и эта проблема не является новой. Однако быстрое развитие вычислительной техники и управляющих вычислительных систем в частности, внедрение новых технологий в разработку аппаратных и программных средств привели к необходимости пересмотра подходов к проектированию СОО.

Стало очевидным, что использование в сложных ВС традиционных структурной, временной и программной избыточностей эффективно только при условии, что они находятся в точном соответствии с организацией управления вычислительным процессом (ВП), реализуемого операционной системой (ОС). Этот факт нашел отражение в отечественных публикациях с середины девяностых годов в виде попыток систематизации способов управления и восстановления ВП, а также выявления закономерностей их взаимосвязи. Наиболее глубокие и планомерные исследования в этом направлении проводятся Институтом проблем управления (РАН) на основе обобщения опыта отечественных и зарубежных разработок промышленных и бортовых ВС (БВС), в работах Мамедли Э.М., Соболева H.A., Менна A.A. и др. Теоретической основой исследований в этой области послужили труды Пархоменко.П.П., Прангишвили И.В., Гуляева В.П., Мироновского Л.А., Черкесова.Г.Н., Шубинского И.Б., Щербакова О.В., Иыуду К. А. и др.

Кроме того, в последнее время очевиден рост количества зарубежных ОС реального времени, предназначенных для промышленного применения и использующих широкий спектр программно-аппаратных и программных средств обеспечения отказоустойчивости. Большинство из этих систем являются промышленной модификацией систем военного применения. Наиболее существенные результаты зарубежных исследований в области организации и разработки отказоустойчивых ВС представляются на ежегодном симпозиуме: International Symposium on FTC (IEEE Computer Society), где в последние годы стала очевидной тенденция смещения интересов исследователей в область создания СОО в виде системных приложений для «микроядерных» ОС. Наиболее интересные работы в этом направлении опубликованы такими авторами, как Rick Harper, Alan Wood, R.Perez, H.Kim, Y.Huang, C. Kintal а и др. Широко используется, так называемая,

FLEET - технология проектирования структурно-избыточных отказоустойчивых ВС. В силу этого необходим анализ и обобщение способов и механизмов управления и восстановления ВП, а также их реализации в ОС.

Таким образом, актуальность решаемых в диссертационной работе задач определяется необходимостью организовывать восстановление ВП в реальном времени с учетом свойств как структуры ВС, так и элементов операционной системы, управляющих вычислениями. Показатели качества отказоустойчивых ВС существенно зависят от выбираемых механизмов и способов восстановления ВП, а последние, в свою очередь, определяются способом управления.ВП. Диссертационная работа посвящена анализу существующих подходов и развитию на их основе системного подхода к проектированию средств обеспечения отказоустойчивости в структурно-избыточных управляющих ВС.

Тема диссертационной работы согласуется с приоритетными направлениями развития науки и техники, утвержденными Правительственной комиссией Российской Федерации по научно-технической политике № 2727п-П8 от 21 июля 1996 года [направление «Фундаментальные исследования», раздел «Информатика, вычислительная техника, автоматизация», а также разделы В.4.2.1, В.4.1.5 перечня технологий двойного назначения]; Федеральной научно-технической программой «Конверсия и высокие технологии 1997-2000 гг.» [раздел 2 «Информационные технологии, электроника и связь»]; Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов»; с планом госбюджетной научно-исследовательской работы «Исследование и разработка систем управления, контроля и диагностики», N 0890301; с планами работ по Всероссийским грантам 1996-1997 гг, 1998-1999 гг. по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи.

Целью диссертации является: разработка системного подхода для проектирования программных и программно-аппаратных средств обеспечения отказоустойчивости управляющих структурно-избыточных ВС с детерминированным распределением ресурсов и создание на его основе математического обеспечения для восстановления ВП в бортовых ВС управления и контроля.

Достижение поставленной цели обеспечивается решением следующих основных задач:

- взаимное структурирование аппаратурной и программной избыточности на основе

учета закономерностей, связывающих принципы, способы и механизмы

управления ВП и его восстановлением;

t

- формализация процесса разработки средств обеспечения отказоустойчивости;

- формирование функционально полной системы показателей, характеризующих программные и программно-аппаратные средства диагностирования, реконфигурации и восстановления ВП, а также их> влияние на общие характеристики ВС;

- разработка методики и программных средств оценки качества СОО на основе моделирования процесса функционирования проектируемой отказоустойчивой ВС;

- проектирование математического обеспечения структурно избыточных ВС с детерминированным распределением ресурсов на основе различных способов восстановления, построение соответствующих математических моделей для оценки качества разрабатываемых средств;

- разработка средств обеспечения отказоустойчивости для БВС с заданными архитектурой и операционной системой с учетом ограничений на выбор механизмов управления и восстановления ВП.

В работе использованы методы технической диагностики и системного анализа, теории вероятностей и математической статистики, теории случайных процессов, имитационного моделирования.

Наиболее существенные научные результаты и их новизна состоят в следующем: 1. Сформулированы основные этапы проектирования средств обеспечения отказоустойчивости на основе системного подхода в структурно-избыточных ВС с учетом операционной системы. Предложено формализованное многоуровневое описание программных СОО, в том числе организации гипервизора, как основной составляющей СОО. В результате выделены новые типы объектов: текущий и полный локальный и глобальный гипервизоры, системная и прикладная составляющие гипервизора.

2. Сформирована система показателей качества СОО. Предложена обобщенная модель функционирования ОВС с учетом дефектов и формирования текущего

гипервизора в соответствии со структурной и функциональной деградацией системы. Предложена концепция построения средств моделирования в виде проблемно-ориентированных библиотек, встраиваемых в существующие универсальные интегрированные среды проектирования ВС. Новизна достигается за счет включения в процесс моделирования структурной организации ВС, свойств и особенностей

г

организации ВП, в том числе механизмов и способов управления и восстановления ВП, реализуемых элементами ОС, а также дефектов с различными формами их проявления.

3. Предложена методика оценки качества СОО и их влияния на производительность и надежность ОВС. В отличие от других существующих методик она позволяет учесть процесс восстановления с точностью до алгоритмической реализации отдельных механизмов и способов его организации.

4.Сформирован базисный набор способов и механизмов восстановления ВП, а также реализующих их алгоритмов применительно к структурно-избыточным БВС управления и контроля с детерминированным распределением ресурсов. Состав учитываемых факторов при формировании базиса расширен в соответствии с особенностями функционирования БВС.

5.Разработаны модели функционирования структурно-избыточных ВС с детерминированным распределением ресурсов на основе предложенных вариантов локального гипервизора, реализующих различные способы восстановления, с целью их сравнительной оценки. Представленные модели позволяют выбирать необходимое сочетание СОО, способствующее улучшению технических характеристик за счет согласования структурной избыточности, системы дефектов и взаимоподобных механизмов управления и восстановления ВП.

6.Разработано математическое обеспечение бортового комплекса управления и контроля с учетом ограничений заданной ОС. По сравнению с исходным бортовым комплексом предлагаемый отличается повышенной сбоеустойчивостью и точностью локализации дефекта без необходимости в перезагрузке или многократном

и \j

выполнении копии прикладной задачи.

Таким образом, значение полученных результатов для теории состоит в развитии системного подхода к проектированию СОО в виде: формализации многоуровнего описания программных СОО, систематизации способов и механизмов

восстановления ВП для класса бортовых ВС, а также концепции проектирования системы моделирования для оценки качества разрабатываемых средств.

Сформулируем значение результатов для практики. На основе полученных в диссертационной работе теоретических результатов:

- разработаны открытые проблемно-ориентированные библиотеки для комплексного моделирования функционирования ОВС с учетом ОС, встраиваемые в различные универсальные интегрированные среды проектирования. Предлагаемые средства, а также возможность их выбора способствуют снижению трудоемкости и сокращению времени проектирования СОО и ОВС в целом;

- сформировании базис способов и механизмов восстановления ВП, а также алгоритмический базис для выбранного класса систем позволяет повысить качество проектирования БВС управления и контроля;

- разработаные варианты локального гипервизора позволяют комплексировать разработанные средства с целью достижения компромиссных решений между затратами ресурсов и необходимым уровнем отказоустойчивости за счет варьирования различных параметров ВС и ВП.

Предложенные в работе подходы, методики и средства моделирования могут применяться без существенных изменений для более широкого класса управляющих ВС, используемых в судостроении, энергетике и промышленности. Это подтверждается исследованиями, проводившимися в соответствии с планом работ по Всероссийскому гранту 1996-1997 гг по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи [в рамках научно-технической программы «Цифровые и цифро-аналоговые вычислительные комплексы»] по теме "Организация вычислительных процессов в бортовых системах функционального диагностирования" (№ 5868011). Полученные в диссертационной работе результаты, связанные с созданием системы моделирования процессов функционирования отказоустойчивых ВС, явились основой для дальнейшего развития направления и получения гранта 1998-1999гг. по теме "Разработка средств моделирования для анализа качества программно-аппаратных средств обеспечения отказоустойчивости бортовых вычислительных систем» (№ гос. регистрации 0198.0003849).

Реализация работы связана с использованием полученных результатов в НИР «Паритет» НИИ вычислительных средств «Спектр» по проектированию базового комплекта бортового оборудования летательных аппаратов пятого поколения, а также в НИР, проводимой НИИ радиоэлектронных систем холдинговой компании «Ленинец» в соответствии с Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов» (1997г.).

Результаты диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях (НТК): на ежегодной Международной НТК «Диагностика, информатика, метрология, экология и безопасность» (СПб., 1995, 1996, 1997, 1998 гг.), Междун�