автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Исследование и разработка средств обеспечения отказоустойчивости в бортовых вычислительных системах
Автореферат диссертации по теме "Исследование и разработка средств обеспечения отказоустойчивости в бортовых вычислительных системах"
На правах рукописи
ДУШУТИНА Елена Владимировна
ИССЛЕДОВАНИЕ И РАЗРАБОТКА СРЕДСТВ ОБЕСПЕЧЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ В БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
Специальность 05.13.13 - Вычислительные машины,
комплексы, системы и сети
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Санкт - Петербург 1998
Работа выполнена в Санкт-Петербургском государственном техническом университете.
Научный руководитель доктор технических наук, профессор Колесников Д. Н.
Официальные оппоненты: доктор технических наук, профессор Алиев Т.И., кандидат технических наук, доцент Гордеев А.В,
Ведущая организация:
АОО НИИ вычислительных средств «Спектр» холдинговой компании «Ленинец», г. Санкт-Петербург
Защита состоится
</% 1998г. в /¿г
часов
на заседании диссертационного совета Д 063.38.04 Санкт-Петербургского государственного технического университета по адресу: 195251 г. Санкт-Петербург, Политехническая ул.29, корпус 9, аудитория 325.
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного технического университета по адресу: 195251 г. Санкт-Петербург, Политехническая ул.29.
Автореферат разослан «
в
» ггулг'^ 1998г. /
Ученый секретарь диссертационного совета
Дурандин К.П.
Общая характеристика работы
Актуальность темы
Быстрое развитие вычислительной техники и управляющих вычислительных систем в частности, внедрение новых технологий в разработку аппаратных и программных средств привели к необходимости развития новых подходов к проектированию средств обеспечения отказоустойчивости (СОО). Стало очевидным, что использование в сложных вычислительных системах (ВС) традиционных способов введения структурной, временной и программной избыточности эффективно только при условии, что они находятся в точном соответствии с организацией управления вычислительным процессом (ВП), реализуемого операционной системой (ОС). Этот факт нашел отражение в отечественных публикациях с середины девяностых годов в виде попыток систематизации способов управления и восстановления ВП, а также выявления закономерностей их взаимосвязи. Наиболее планомерные исследования в этом направлении проводятся Институтом проблем управления (РАН) на основе обобщения опыта отечественных и зарубежных разработок промышленных и бортовых ВС (БВС), в работах Э.М.Мамедли, Соболева H.A., Менна A.A. и др. Теоретической основой исследований в этой области послужили труды Пархоменко П.П., Прангишвили И.В., Мироновского Л.А., Черкесова Г.Н., Шубинского И.Б., Щербакова О.В., Иыуду К.А. и др.
В последнее время очевиден рост количества зарубежных ОС реального времени, предназначенных для промышленного применения и использующих широкий спектр программно-аппаратных и программных СОО. Большинство из этих систем являются промышленной модификацией систем военного применения. Наиболее существенные результаты зарубежных исследований в области организации и разработки отказоустойчивых ВС (ОВС) представляются на ежегодном симпозиуме: International Symposium on FTC (IEEE Computer Society), где в последние годы стала очевидной тенденция смещения интересов исследователей в область создания СОО в виде системных приложений для «микроядерных» ОС. Наиболее интересные работы в этом направлении опубликованы такими авторами, как Rick Harper, Alan Wood, R.Perez, H.Kim, Y.Huang, C.Kintala и др. Широко используется, так называемая, FLEET - технология проектирования структурно-избыточных ОВС. В силу этого необходим анализ и обобщение способов и механизмов управления и восстановления ВП, а также их реализации в ОС.
Таким образом, актуальность решаемых в диссертационной работе задач определяется необходимостью в организации процессов восстановления ВП в реальном времени с учетом свойств как структуры ВС, так и элементов ОС, управляющих вычислениями. Показатели качества ОВС существенно зависят от выбираемых механизмов и способов восстановления ВП, а последние, в свою очередь, определяются способом управления ВП. Поэтому наряду с классификацией и параметризацией отказоустойчивых бортовых ВС необходим анализ свойств и особенностей организации ВП в БВС, а также формализации описания программных СОО, являющихся составной частью операционной системы.
Кроме того, сама задача оценки качества как средств обеспечения отказоустойчивости, так и ОВС в целом не тривиальна. В связи с этим возникает необходимость в создании методики оценки вычислительной сложности и
надежности с учетом процесса восстановления, осуществляемого средствами ОС, в частности, гипервизором.
Широта спектра показателей, характеризующих структуру, особенности аппаратной и программной реализации ОВС, необходимых для комплексной оценки ее качества, существенно усложняет сам процесс оценки и сбор требуемой исходной информации. Для решения этой проблемы требуются специализированные средства моделирования, ориентированные на имитацию процесса функционирования ОВС.
Разнообразие структурно-алгоритмических методов и средств, предлагаемых сегодня для повышения отказоустойчивости ВС, делает трудоемким процесс выбора необходимых проектных решений для разработчика. Возникает необходимость в систематизации и формировании базового набора способов и механизмов восстановления, а также реализующих их алгоритмов применительно к БВС заданных классов в соответствии со свойствами и особенностями организации в них ВП.
В силу перечисленных причин диссертационная работа посвящена анализу существующих подходов и развитию на их основе системного подхода к проектированию средств обеспечения отказоустойчивости в структурно-избыточных управляющих ВС.
Тема диссертационной работы согласуется с приоритетными направлениями развития науки и техники, утвержденными Правительственной комиссией Российской Федерации по научно-технической политике № 2727п-П8 от 21 июля 1996 года [направление «Фундаментальные исследования», раздел «Информатика, вычислительная техника, автоматизация», а также разделы В.4.2.1, В.4.1.5 перечня технологий двойного назначения]; Федеральной научно-технической программой «Конверсия и высокие технологии 1997-2000 гг.» [раздел 2 «Информационные технологии, электроника и связь»]; Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов»; с планом госбюджетной научно-исследовательской работы «Исследование и разработка систем управления, контроля и диагностики», N 0890301; с планами работ по Всероссийским грантам 1996-1997 гг, 1998-1999 гг. по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи.
Предмет исследования:
- управление восстановлением вычислительного процесса при проявлении дефекта;
- организация структур и процессов в вычислительных средствах обеспечения отказоустойчивости;
- математическое и программное обеспечение средств диагностирования, реконфигурации и восстановления вычислений в бортовых системах управления и контроля;
- модели для определения качества средств обеспечения отказоустойчивости и их влияния на общие характеристики бортовой ВС;
- средства моделирования процессов функционирования отказоустойчивых ВС. Пелыо диссертации является: разработка системного подхода для
проектирования программных и программно-аппаратных средств обеспечения отказоустойчивости управляющих структурно-избыточных ВС с детерминированным распределением ресурсов и создание на его основе математического обеспечения для восстановления ВП в бортовых ВС управления и контроля.
Для достижения поставленной цели необходимо выполнить следующие основные этапы и задачи;
1. Классификация и параметризация ОВС в соответствии с предъявляемыми к ним требованиями и применением, а также анализ свойств и особенностей организации ВП, определяющих способы и механизмы его восстановления в случае возникновения дефектов.
Цели этого этапа:
- определить типы управления отказоустойчивостью и основные структурные параметры;
- классифицировать БВС по применению и определить соответствующие им наборы прикладных задач;
- выделить класс БВС для дальнейшего рассмотрения и провести анализ свойств и особенностей организации вычислительного процесса для выделенного класса ВС.
2. Определение базовых функций и структурирование программного обеспечения (ПО) для поддержки отказоустойчивости в ВС.
Цели этапа:
- сформулировать основные функции ПО, реализующие управление и восстановление ВП;
- распределить эти функции между элементами ОС в соответствии со структурными параметрами и способами управления;
- проанализировать варианты размещения ПО между структурными элементами ВС с целью оптимизации ее функционирования;
- определить функции средств самоконтроля, разрабатываемого ПО и распределить их между элементами ОС;
3. Формализация процесса проектирования гипервизора на основе его многоуровневого представления.
Цель этапа - предложить способ формального описания архитектуры программных средств обеспечения отказоустойчивости и, в частности, гипервизора для решения задачи синтеза этих средств.
4. Выбор системы показателей качества для средств обеспечения отказоустойчивости и ОВС в целом, а также методика оценки этих показателей.
5. Разработка средств моделирования для оценки качества ОВС на основе сформированной системы критериев.
Цель этапа - предоставить пользователю инструментарий и методику построения системы моделей функционирования ВС с выбранной конфигурацией программных и аппаратных средств обеспечения отказоустойчивости, а также возможность их коррекции и оптимизации на основе качествешгах и количественных оценок.
6. Проектирование математического обеспечения структурно-избыточных ВС с детерминированным распределением ресурсов. Оценка вычислительной сложности разрабатываемых средств с учетом аппаратных и программных решений, формирование комплексной оценки процессов диагностирования, реконфигурации и восстановления ВП, а также их влияния на производительность и надежность системы в целом.
Цели этапа:
- предложить функционально-структурную, семантическую, информационную и логическую организацию локального гипервизора отказоустойчивого комплекса выбранного класса, а также алгоритмический состав для его формирования;
- оценить временные затраты и расходуемую память для различных механизмов и способов восстановления, реализованных в сформированном алгоритмическом базисе;
- оценить качество процессов по интегральному критерию с учетом показателей, характеризующих аппаратную, временную и информационную избыточности;
- проанализировать влияние качества исследуемых процессов на надежностные и иные комплексные оценки отказоустойчивой ВС;
- оценить снижение потенциальных характеристик системы относительно идеально функционирующей гипотетической ВС.
7. Разработка СОО для ВВС с заданными архитектурой и ОС с учетом ограничений на выбор механизмов управления и восстановления ВП.
Цель этапа: предложить способ восстановления вычислительного процесса, соответствующий механизмам управления функционирования, предусмотренным в заданной ОС; сформировать набор алгоритмов, реализующих диагностирование в стационарном режиме и восстановление ВП при проявлении дефектов; оценить качество предлагаемых средств и изменение характеристик ВВС, используя предложенные методики и разработанные средства моделирования.
Методы исследования В работе использованы методы технической диагностики и системного анализа, теории вероятностей и математической статистики, теории случайных процессов, имитационного моделирования.
Научные результаты и иж новизна 1. Сформулированы основные этапы проектирования СОО на основе системного подхода в структурно-избыточных ВС с учетом операционной системы. Предложено формализованное многоуровневое описание программных СОО, в том числе организации гипервизора, как основной составляющей СОО. В результате выделены новые типы объектов: текущий и полный локальный и глобальный гипервизоры, системная и прикладная составляющие гипервизора.
2. Сформирована система показателей качества СОО. Предложена обобщенная модель функционирования ОВС с учетом дефектов и формирования текущего гипервизора в соответствии со структурной и функциональной деградацией системы. Предложена концепция построения средств моделирования в виде проблемно-ориентированных библиотек, встраиваемых в существующие универсальные интегрированные среды проектирования ВС. Новизна достигается за счет включения в процесс моделирования структурной организации ВС, свойств и особенностей организации ВП, в том числе механизмов и способов управления и восстановления ВП, реализуемых элементами ОС, а также дефектов с различными формами их проявления.
3.Предложена методика оценки качества СОО и их влияния на производительность и надежность ОВС. В отличие от других существующих методик она позволяет учесть процесс восстановления с точностью до алгоритмической реализации отдельных механизмов и способов его организации.
4.Сформирован базисный набор способов и механизмов восстановления ВП, а также реализующих их алгоритмов применительно к структурно-избыточным ВВС
управления и контроля с детерминированным распределением ресурсов. Состав учитываемых факторов при формировании базиса расширен в соответствии с особенностями функционирования БВС.
5.Разработаны модели функционирования структурно-избыточных ВС с детерминированным распределением ресурсов на основе предложенных вариантов локального гипервизора, реализующих различные способы восстановления, с целью их сравнительной оценки. Представленные модели позволяют выбирать необходимое сочетание СОО, способствующее улучшению технических характеристик за счет согласования структурной избыточности, системы дефектов и взаимоподобных механизмов управления и восстановления ВП.
6.Разработано математическое обеспечение бортового комплекса управления и контроля с учетом ограничений заданной ОС. По сравнению с исходным бортовым комплексом предлагаемый отличается повышенной сбоеустойчивостью и точностью локализации дефекта без необходимости в перезагрузке или многократном выполнении копий прикладной задачи.
Основные положения, выносимые на защиту, представлены в разделе «Научные результаты и их новизна».
Достоверность результатов '• '"'•
Обоснованность и достоверность результатов подтверждается моделированием, экспериментальными исследованиями; результатами экспертизы Регионального центра научно-технической экспертизы; корректным использованием математического аппарата; апробацией работы в виде докладов на Всероссийских и Международных конференциях и публикациях в научных и учебно-методических изданиях.
Научная значимость результатов
состоит в развитии системного подхода к проектированию СОО в виде: формализации многоуровневого описания программных СОО, систематизации способов и механизмов восстановления ВП для ' класса - бортовых ВС, а также концепции проектирования системы моделирования для оценки качества разрабатываемых средств.
Практическая ценность результатов
На основе полученных в диссертационной работе теоретических результатов:
- разработаны открытые проблемно-ориентированные библиотеки для комплексного моделирования функционирования ОВС с учетом ОС, встраиваемые в различные универсальные интегрированные среды проектирования. Предлагаемые средства, а также возможность их выбора способствуют снижению трудоемкости и сокращению времени проектирования СОО и ОВС в целом;
- сформированный базис способов и механизмов восстановления ВП, а также алгоритмический базис для выбранного класса систем позволяет повысить качество проектирования БВС управления и контроля;
- разработанные варианты локального гипервизора позволяют комплексировать разработанные средства с целью достижения компромиссных решений между затратами ресурсов и необходимым уровнем отказоустойчивости за счет варьирования различных параметров ВС и ВП.
Реализация результатов работы
Предложенные в работе подходы, методики и средства моделирования могут применяться без существешшх изменений для более широкого класса управляющих ВС, используемых в судостроении, энергетике и других отраслях промышленности.
Это подтверждается исследованиями, проводившимися в соответствии с планом работ по Всероссийскому гранту 1996-1997 гт по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи [в рамках научно-технической программы «Цифровые и цифро-аналоговые вычислительные комплексы»] по теме "Организация вычислительных процессов в бортовых системах функционального диагностирования" (№ 5868011). Полученные в диссертационной работе результаты, связанные с созданием системы моделирования процессов функционирования отказоустойчивых ВС, явились основой для дальнейшего развития направления и получения гранта 1998-1999гг. по теме "Разработка средств моделирования дня анализа качества программно-аппаратных средств обеспечения отказоустойчивости бортовых вычислительных систем» (№ гос. регистрации 0198.0003849).
Реализация работы связана с использованием полученных результатов в НИР «Паритет» НИИ вычислительных средств «Спектр» по проектированию базового комплекта бортового оборудования летательных аппаратов пятого поколения, а также в НИР, проводимой НИИ радиоэлектронных систем холдинговой компании «Ленинец» в соответствии с Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов» (1997г.).
Предложенные средства и методики используются в учебном процессе при организации практических занятий по курсам «Периферийные устройства ЭВМ и ВС», «Системное программное обеспечение», «Сети ЭВМ», а также при подготовке бакалавров и магистров соответствующих направлений.
Апробация работы
Результаты диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях (НТК): на ежегодной Международной НТК «Диагностика, информатика, метрология, экология и безопасность» (СПб.: 1995, 1996, 1997, 1998гт.), Международной НТК «Информационные технологии в моделировании и управлении» (СПб., 1996г.), Международной НТК «Управление и информационные технологии на транспорте» («ТРАНСКОМ- 97»), XV международной межвузовской школе - семинаре «Методы и средства технической диагностики» (Йошкар-Ола: МарГУ, 1998) и др.
Полнота изложения результатов диссертации в опубликованных работах
По материалам диссертации опубликовано 17 печатных работ, в том числе 4 учебных пособия (включая переиздание одного из пособий автора в 1998г.).
Структура и обьеи работы
Диссертация включает введение, пять разделов, заключение, список литературы и приложения. Материал изложен на 311 страницах машинописного текста (основной текст - 292 страницы), содержит 107 рисунков, 68 таблиц, библиографию из 152 наименований.
Содержание работы по разделам
Во введении обосновывается актуальность темы диссертационной работы, формулируются цель и основные задачи исследования, приводятся наиболее существенные результаты исследования.
В первом разделе анализируется современное состояние проблемы. Выделяются основные классы отказоустойчивых ВС с различивши структурами управления восстановлением ВП, а именно: распределенной, сосредоточенной и смешанной (распределенно-сосредоточенной). Под восстановлением ВП понимается диагностирование в стационарном и нестационарном режимах работы, реконфигурация и восстановление функционирования в новой конфигурации.
Проводится классификация БВС по применению и рассматривается состав прикладных задач каждого класса.
Формируется набор наиболее существенных свойств и особенностей ВП, влияющих на выбор механизмов и способов его восстановления. В соответствии с предложенным набором определяются классы БВС для дальнейшего рассмотрения:
1. ВС с распределенной структурой управления восстановлением, детерминированным распределением ресурсов, «полудинамической» структурой межкомплексных и статической структурой внутрикомплесных связей, распределенной или распределенно-сосредоточенной структурой управления обменом, постоянным резервированием внутри комплекса, позволяющим реализовать стратегию локализации дефекта, с возможностью дальнейшей автоматической реконфигурации на двух уровнях: комплекса и системы, при общем количестве уровней деградации, равном [m(n-l)-l], где п - кратность резервирования в комплексе, am- количество комплексов с второстепенными функциями.
2. ВС с сосредоточенной структурой управления Восстановлением ВП, детерминированным распределением ресурсов, статической структурой связей, функционально и структурно выделенным сегментом диагностирования для оборудования бортового объекта. Его характеристики определены: сегмент содержит функционально ориентированные одно- или многопроцессорные ЭВМ; распределение ресурсов на уровне ЭВМ - недетерминированное, с распараллеливанием ВП при недостаточном быстродействии одного процессора; механизм диспетчеризации - списковый в сочетании с внешними прерываниями; резервирование - двухкратное постоянное; общая стратегия восстановления -маскирование сбоев и локализация отказов диагностируемого оборудования с целью замены отказавшего на исправный дублирующий, если такой имеется.
Обосновывается необходимость системного подхода к проектированию средств обеспечения отказоустойчивости. Под системным подходом в данной работе понимается включение основных принципов системности: принципа целостности, принципа структурности, принципа иерархичности, принципа взаимодействия с окружающей средой - в процесс создания программных средств обеспечения отказоустойчивости ВС. Анализируются методы и средства для оценки качества разрабатываемых СОО и их влияния на общие характеристики системы. В заключении раздела формулируется перечень задач, решаемых в диссертационной работе.
Во втором разделе излагаются основные этапы системного подхода (рис.1), методы и способы их реализации. Формируются функциональный состав и структурная организация программных СОО, распределенных по элементам ОС и прикладного ПО для ВС с различной структурой управления восстановления ВП. Выделяются новые объекты типа: локальный и глобальный гипервизор, полный и текущий гипервизор, системная и прикладная составляющие гипервизора. На основе многоуровневого описания гипервизора предлагается формализованный подход к его
Этапы проектирования программных средств обеспечения отказоустойчивости ВС
Анализ свойств и особенностей организации управления ВП и
управления восстановлением ВП 1
Состав программных СОО по элементам ОС и прикладного ПО 2
Функции каждого
элемента ОС и ППО с точки зрения обеспечения
отказоустойчивости 3
Программные СОО в составе супервизора
Средства самоконтроля
В составе ядра
смо
Средства контроля в каналах передачи
Гипервюор
Полный £
Текущий
Локальный
^ Глобальный
Стратегия восстановления
Формализованное описание организации гипервизора
X
Функциональный
Уровни описания
Структурный
X
Логический
Информационный
-> Семантический
Система показателей "качества СОО и ОВС 5
Средства моделирования 6
Синтез гипервизора
Рис.1
Основные этапы оценки показателей качества
Рис.2
покомпонентному формированию в стационарном и нестационарном режимах функционирования.
В обобщенном виде задача системного проектирования ОС отказоустойчивой ВС представляется следующим образом:
z,= м
U
Ms
Мт\Р
кг "L. .
.vUk,
"L. .
м,
РШУ 1 Pghv 4 и*,
гда Ms,
KVk,
- модель супервизора (первая составляющая целостной модели
отказоустойчивой ОС), е £ }- элементы ОС (или их отдельные компоненты), pv -
параметры функционирования составляющих ОС;
м,
"L. .
модель ядра ВС
при заданных правилах взаимодействия структурно-избыточных элементов, исходной
кратности резервирования ш и текущей кратности резервирования, соответствующей
/ \
уровню деградации i (вторая составляющая);
Pun" Pi
GUV'
- модель
пшервизора, включающая локальную и глобальную составляющие, соответствующие модели средств обеспечения отказоустойчивости в комплексе со статическими связями и в системе с динамической организацией взаимодействия комплексов; \ут -векторная оценка 2>'",JVj эффективности ОС на некоторой совокупности
показателей, представленная здесь в виде трех векторных составляющих, отражающих иерархический характер построения ОС отказоустойчивой ВС.
Предлагается итеративная процедура синтеза гипервизора на основе анализа организации ВП, т.к. восстановление ВП и диагностирование в стационарном режиме функционирования осуществляются под управлением гипервизора.
Предлагается система частных и интегральных показателей, а также методика оценки качества СОО и их влияния на характеристики БВС в целом (рис. 2). В основе методики лежит сочетание аналитических подходов и имитационного моделирования.
В третьем разделе предлагается и обосновывается общая концепция разработки проблемно ориентированных средств моделирования, встраиваемых в уже существующие универсальные интегрированные среды проектирования ВС, и предназначенных для анализа качества отказоустойчивых ВС. Предлагаемая концепция моделирования предполагает наличие двух основных этапов:
- формирование базового набора знаний о средствах обеспечения отказоустойчивости на основе существующих сред моделирования, предназначенных для автоматизации проектирования ВС;
- формирование нетиповых компонент и синтез целостной модели из компонентов этого набора с целью оценки проектного решения в соответствии с системой критериев.
Формируется базовый набор знаний, представляющий собой функционально полный набор и включающий имитационные модели элементов проектируемых средств обеспечения отказоустойчивости, элементов ОС, а также элементов, отражающих реальные условия функционирования и режимы эксплуатации создаваемой отказоустойчивой ВС. Таким образом, предлагается следующий перечень разделов атомарных имитационных моделей:
- библиотека структурных элементов (модели функционирования отдельной ЭВМ, модели наиболее часто используемых интерфейсов, базовый набор структур комплексов с различными типами резервирования);
- модели алгоритмов диагностирования с различными параметрами, учитывающие характер структур комплексов и ВС в целом;
- модели процедур реконфигурации для каждого типа комплексов базового набора;
- библиотека моделей дефектов и модели реакции системы на дефект, возникший при восстановлении вычислительного процесса;
- модели, имитирующие функционирование ОС: процедуры диспетчеризации, имитация режима реального времени, имитация событий и прерываний; очередь и выполнение прикладных заданий и т.д.
Функциональная структура библиотеки представлена на рис. 3.
Предлагается обобщенная модель функционирования ОВС (рис.4): м= ( s> WrW2> F> АЛА , О, G, К ), где S - множество внутренних состояний работоспособности системы; щ, - множества возможных дефектов; F- множество вариантов алгоритмического состава пшервизора; 8i'Si'S3 " функц™ переходных процессов восстановления ВП в результате
возникновения различных дефектов (St: —> ); Р - множество вариантов
распределения задач (или функций) по комплексам в системе; А- функция переходов по восстановлению ВП на межкомплексном уровне; О - распределение задач по имеющимся ресурсам (возможно с временной или полной потерей части второстепенных функций); G - состав гипервизора, соответствующий текущей конфигурации ВС; К - вектор показателей качества, в соответствии с системой показателей, предложенной в разделе 2. Множества: F, Р - рассматриваются
как входные; О, G, К - как выходные. Функционирование модели в самом простейшем случае может быть задано преобразованием:
Выбираются базовые средства моделирования, на основе которых формируются проблемно-ориентированные библиотеки. Представляется описание двух из трех разработанных библиотек на основе F-сетей и конечных автоматов, а также программных сред соответственно PETRIWIN и COVERS. Излагается методика компоновки целостной модели функционирования объекта на основе формальных спецификаций двух типов: параметрической и функциональной. Предлагаемые средства моделирования являются функционально полными и открытыми для расширения каждого из разделов новыми средствами.
В четвертом разделе формируется базис механизмов восстановления и соответствующий ему алгоритмический набор для БВС с детерминированным распределением ресурсов. Для выбранных классов БВС предлагается семантическая, информационная и логическая организация гипервизора, описывающая статические
Рис. 3
свойства и динамику взаимодействия его компонент. Процесс реализации компонент гипервизора представлен на рис. 5. В соответствии с формализованным подходом, предложенным в п. 2.3, формируются возможные варианты локального гипервизора с различными способами восстановления ВП.
С помощью разработанных и представленных в разделе 3 средств моделирования осуществляется построение соответствующих этим вариантам моделей функционирования БВС в различных режимах:
- элементарные модели, имитирующие все механизмы восстановления, составляющие базис механизмов, реализуемых посредством алгоритмов соответствующего базиса. Формирование элементарных моделей сводится к выбору их из проблемно-ориентированной библиотеки и внесению необходимых параметров в спецификации;
- модели функционирования текущих гипервизоров в стационарном и нестационарном режиме, имитирующие различные способы восстановления ВП;
- модели функционирования ВС с учетом априорной информации о системе. Построите этих моделей осуществляется в соответствии с методикой компоновки целостной модели, предложенной в разделе 3.
На основе предложенной в разделе 2 методики оцениваются характеристики локальных гипервизоров и даются рекомендации о целесообразности использования того или иного способа восстановления ВП. В разделе и приложениях к работе приводятся графики зависимостей и таблицы численных значений следующих показателей:
- временных и емкостных характеристик каждого алгоритма базиса, реализующего тот или иной механизм восстановления;
- вычислительной сложности текущего гипервизора, реализующего тот или иной выбранный способ восстановления для отказоустойчивой ВС заданной структуры;
- интегральных временных показателей функционирования ВС, а также емкостных характеристик полного гипервизора;
- частных показателей надежности на основе графа восстановления дтя различных струкгур отказоустойчивой ВС;
- общих показателей надежности ВС, определяемых аналитически на основе частных показателей, полученных в результате имитационного моделирования.
Система результатов, параметров моделирования и исходных данных, отражающих априорную информацию о системе, формируются на основе формальных спецификаций двух типов: функциональных и параметрических. Основные результаты, представленные в разделе, концентрируются в 23-х рисунках и 15-и таблицах раздела.
Законченный цикл формирования гипервизора полностью соответствует выполнению этапов проектирования, предложенных при изложении системного подхода. Раздел завершается основными теоретическими выводами, сделанными на основе результатов исследования, а также предлагается методика формирования гипервизора.
В пятом разделе полученные в работе результаты апробируются применительно к БВС с заданными архитектурой и ОС. При этом решаются две задачи: 1) повышения сбоеустойчивости бортового комплекса диагностирования, состоящего из функционально неоднородных вычислительных каналов и не имеющего структурной избыточности; 2) повышения отказоустойчивости в
Реализация компонент гипервизора
Характеристики и параметры, определяющие организацию ВП в ОВС
Алгоритмический базис для реализации механизмов восстановления
Основные шаги процесса восстановления Механизмы восстановления
Преобразование ИН а а,
Выбор согласованного значения Р -
Обнаружение дефекта Г ух,уг,..., У; .... -
Локализация дефекта 5 8\>8г> 5ъ
Идентификация е £\' ■■■' Ея
Восстановление после сбоя Я - -
Блокирование отказавшей части и восстановление после отказа 7 ■■■' ш •••■ -
Группа способов восстановления
Способ восстановления
для выбранной организации ВП
Группа
В
Б
♦ •Е
Содержание
Дружественные дефекты На уровне устройства
Дружественные дефекты На уровне канала
Дружественные и часть враждебных
На уровне канала
Враждебные дефекты На уровне канала
При отсутствии локализации
Рис.5
М>г
Г
5Х
|пипМ |
8г
5 дг
|шахМ |
0
Набор алгоритмов
а, /1?'. • Л?'- -
Р
У, Ж'.....
5, ....
£т ....
.... .....
п. •••• л?-. •
Выбранный набор алгоритмов реализуется текущим локальным гипервизором
Глубина диагностирования
Уровень реконфигурации
Полнота диагностирования
А^и.кНсЛл',} л-.'&и.^НсГ.л.,}
^ кнюи'ккця'кппЧ
Рис.4
»
функционально и структурно однородном многоканальном комплексе с аналогичной ОС, но другим набором прикладных задач.
В соответствии с заданными ограничениями на выбор механизмов и способов управления и восстановления ВП разрабатывается математическое обеспечение, формируются модели функционирования БВС с учетом реальной ОС, анализируется возможность и целесообразность применения различных способов восстановления при заданной системе ограничений.
Разработка СОО для заданной БВС осуществляется в соответствии с этапами проектирования, предложенными в разделе 2. Для исходной БВС: проводится анализ свойств и особенностей организации ВП; представляется состав, функциональная и структурная организация ПО, главным образом, ОС; анализируются имеющиеся в исходной БВС средства встроенного контроля и система дефектов; формируется многоуровневое описание СОО; формируется граф восстановления; на основе проблемно ориентированных средств моделирования строится модель функционирования БВС с учетом ОС; оцениваются частные и общие показатели вычислительной сложности и надежности минимальной системы, а также имеющаяся ресурсная избыточность; на основе которых обосновывается необходимость внедрения в ОС дополнительных программных средств с целью повышения сбое- и отказоустойчивости. Для модификации БВС: формируется многоуровневое описание СОО; расширяется система обнаруживаемых и устраняемых дефектов; корректируется и дополняется граф восстановления в соответствии с исследуемыми способами восстановления ВП; формируется модель, состав которой дополняется гипервизором, корректируются супервизор и ядро; доказывается адекватность полученной модели и достоверность результатов на основе сопоставления аналитических и статистических оценок; оценивается качество разработанных средств в соответствии с ранее сформированной системой показателей. Результаты исследований сведены в таблицы и представлены графиками в разделе и приложениях.
В виде графиков представлено изменение качества системы при дополнении БВС механизмами гипервизора, соответствующими различным группам способов восстановления ВП. Для заданной системы с минимальной конфигурацией на заданном интервале времени t = [0:1000 ч] вероятность безотказной работы (Рбо) составляет 0,88, тогда как при использовании программных СОО для трех рассмотренных групп В, С, D значение (1'бо) может бьггь увеличено до 0,93. В результате сравнения статистических и аналитических оценок вероятностей безотказной работы, было определено, что полученные значения различаются не более чем на 0,018. Проведен анализ затрат ресурсов, в соответствии с которым показано, что наиболее предпочтительным для рассматриваемой БВС является способ восстановления из группы D на основе сбоеустойчивого информационного согласования с многораундной процедурой обмена между вычислительными каналами, не требующий организации дополнительной контрольной задачи к общему списку задач.
В приложениях представлены файловая структура и формальные спецификации проблемно-ориентированных библиотек, встраиваемых в среды PETRIWIN, COVERS 2.0, COVERS 3.0, исходные данные и промежуточные результаты для оценки качества разрабатываемых средств БВС с заданными архитектурой и ОС.
ЗАКЛЮЧЕНИЕ
В ходе диссертационной работы были получены следующие научные и практические результаты:
1. Обоснована необходимость представления функциональной и структурной организации средств обеспечения отказоустойчивости, распределенных по элементам ОС и прикладного ПО, на основе анализа свойств и особенностей управления и восстановления ВП, а также структуры управления отказоустойчивостью для многомашинных ВС с детерминированным распределением ресурсов с учетом предъявляемых к ВС требований.
2. Предложено многоуровневое формализованное описание одного из элементов ОС -гипервизора, под управлением которого осуществляется функционирование программных СОО. В качестве таких уровней рассмотрены: функциональный, структурный, семантический, информационный и логический уровни организации, отражающие статические и динамические свойства функционирования гипервизора и ВС в целом.
3. Выбрана система показателей, целесообразная для оценки качества разрабатываемых средств обеспечения отказоустойчивости, включающая дифференциальные и интегральные показатели вычислительной сложности (временные и емкостные), интегральные показатели отказоустойчивости, а также показатели влияния качества СОО на показатели надежности и производительности ВС.
4. Предложен системный подход к проектированию программных СОО в ВС с детерминированным распределением ресурсов и распределенной или смешанной структурой управления отказоустойчивостью. В основе этого подхода лежит многоуровневое формализованное представление СОО, позволяющее синтезировать гипервизор (и необходимые модули ядра и супервизора) в результате итеративной процедуры выбора и оптимизации решения на основе частичных и полных (в зависимости от стадии проектирования) векторных оценок качества. Оценки качества предлагается формировать, используя данные, полученные в результате имитационного моделирования.
5. Предложена общая концепция разработки специальных средств моделирования для анализа качества отказоустойчивых ВС на основе уже существующих универсальных сред моделирования и проектирования ВС. В соответствии с этой концепцией созданы и апробированы проблемно-ориентированные библиотеки и методики сборки на ее основе целостных моделей функционирования отказоустойчивой ВС. Такие модели позволяют учесть особенности функционирования структурно-избыточных систем, наличие дефектов, процессы восстановления, их аппаратную и программную реализации, а также механизмы и способы управления и восстановления ВП, предусмотренные операционной системой.
6. Для реализации этой концепции: произведен выбор инструментальных средств и методов моделирования; предложена обобщенная математическая модель функционирования отказоустойчивой ВС в соответствии с системой показателей оценки их качества и функционально-структурным представлением средств обеспечения отказоустойчивости; разработаны две проблемно-ориентированные библиотеки на основе F-сетей и конечных автоматов и соответствующих этим методам сред Petriwin и Covers (версии 2.0 и 3.0). Для библиотек представлены:
функциональная структура, модули и спецификации, файловые структуры и методика использования этих библиотек для построения моделей ВП в отказоустойчивых ВС при нормальном функционировании и наличии дефектов.
7. Сформирован базис механизмов и способов восстановления ВП, а также соответствующий им алгоритмический базис для структурно-избыточных ВВС с детерминированным распределением ресурсов.
8. Предложены различные варианты текущих и полных локальных гипервизоров для отказоустойчивых комплексов постоянного резервирования с синхронным типом обмена с точностью до алгоритмической реализации.
9. На основе проблемно-ориентированных средств моделирования и сформированных базисов разработаны модели каждого из них,с учетом архитектуры комплекса (без учета других элементов операционной системы и прикладного ПО).
10. Предложена методика оценки качества СОО, в соответствии с которой получены характеристики разработанных гипервизоров и проведен анализ влияния механизмов и способов восстановления ВП на показатели качества отказоустойчивой ВС.
11. Предложена методика разработки гипервизора отказоустойчивых комплексов со структурной избыточностью и распределенным управлением диагностированием и реконфигурацией.
12. Разработан гипервизор, встраиваемый в заданную ОС БВС, а также системные средства его поддержки на уровне ядра и супервизора. Доказана целесообразность использования выбранных в работе механизмов, способа и алгоритмов восстановления ВП для реализации сформированного гипервизора в заданной БВС.
13. На основе проблемно-ориентированной библиотеки построены модели функционирования исходной БВС с учетом механизмов управления ВП заданной ОС и средств встроенного контроля, а также модели БВС, программное обеспечение которой дополнено средствами гипервизора.
14. Разработан набор атомарных моделей, функционально образующий самостоятельный раздел библиотеки, предназначенный для моделирования типовых механизмов управления ВП ОС (включая функционирование в реальном времени, дисциплины диспетчеризации, различные режимы обмена информацией и др.).
15. При использовании предложенной методики получены оценки качества исходной и модифицированной БВС, доказывающие необходимость учета при проектировании средств обеспечения отказоустойчивости механизмов и способов управления и восстановления ВП, реализуемых средствами ОС.
В заключении сформулируем наиболее существенные теоретические выводы, сделанные на основе результатов, полученных в диссертационной работе.
1. В структурно избыточных ВС, где в качестве структурных элементов используются сложные объекты (типа ЭВМ или комплекса), взаимодействие которых обеспечивается средствами ОС и специального ПО, существенное влияние на характеристики ВС оказывает выбор способа восстановления ВП при проявлении дефекта.
2. Увеличение структурной избыточности целесообразно, только если оно сопровождается расширением системы дефектов, локализуемых и устраняемых средствами обеспечения отказоустойчивости при использовании соответствующих механизмов и способов восстановления.
3. Выбор более совершенных с точки зрения повышения отказоустойчивости , , способов восстановления приводит к существенному увеличению затрат ресурсов.
Поэтому необходим поиск компромиссных решений с целью удовлетворения системе ограничений реального времени, емкостных и аппаратных затрат, а также требованиям надежности.
4. Для получения корректной оценки затрат ресурсов на реализацию того или иного способа восстановления необходимо учитывать ресурсы, затрачиваемые не только гипервизором, но и другими элементами ОС, а также механизмы диспетчеризации задач в проектируемой или модифицируемой ОС.
Таким образом, распределение средств обеспечения отказоустойчивости по всем элементам ОС и прикладного ПО, их взаимосвязь и взаимное влияние обусловливают необходимость комплексной оценки на основе аналитических и имитационных моделей функционирования ВС, учитывающих как архитектуру, так и реализацию операционной системой способов управления и восстановления ВП в стационарном и нестационарном режимах.
Решения, предложенные в диссертационной работе, способствуют развитию системного подхода к проектированию СОО ВС. Применительно к БВС управления и контроля были решены задачи: анализа свойств и особенностей организации ВП; синтеза СОО на основе анализа; комплексной оценки качества СОО и ВС в целом; а также создания системы моделирования для комплексной оценки качества отказоустойчивых ВС. Это полностью соответствует исходной постановке задачи и цели диссертационной работы.
Список опубликованных работ
1. Душутина Е. В. Методы построения отказоустойчивых вычислительных систем с реконфигурацией и оценка их эффективности.// Международная научно-техническая конференция «Диагностика, информатика и метрология - 95»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб., 1995, с. 129 - 130.
2. Колесников Д.Н., Душутина Е.В., Пахомова В.И. Введение в MATLAB с примерами решения задач оптимизации и моделирования: Учебное пособие/ СПбГТУ. СПб., 1995,115 с. (усл. печ. л. 7,25).
3. Душутина Е. В., Колесников Д. Н. Формализация процесса разработки программно-аппаратных средств для обеспечения отказоустойчивости в многомашинных вычислительных системах. // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность - 96»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб., 1996, с. 57 - 58.
4. Душутина Е.В. Организация обмена информацией в режиме прерываний в ЭВМ и ВС на основе микропроцессоров INTEL80x86: Учебное пособие/. СПбГТУ. СПб., 1996, 80 с. (усл. печ. л 4,25).
5. Душутина Е. В., Колесников Д. Н. Структуризация задач разработки программно-аппаратных средств для обеспечения отказоустойчивости в МВС. // Международная научно - техническая конференция «Информационные технологии в моделировании и управлении»: Тез. докл. /СПбГТУ - СПб., 1996, с. 147- 148.
6. Душутина Е. В., Колесников Д. Н. Критерии оценки качества реконфигурации в отказоустойчивых многомашинных вычислительных системах // Вычислительные
измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 462. - СПб., 1996, с.79-86.
7. Душутина Е. В., Колесников Д. Н. Выбор структуры программных средств обеспечения отказоустойчивости на основе анализа особенностей организации вычислительного процесса в управляющих системах.// Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 462. - СПб, 1996, с. 86-96.
8. Душутина Е. В., Колесников Д. Н. Оценка средств обеспечения отказоустойчивости судовых ВС// Управление и информационные технологии на транспорте: Тезисы докладов международной научно-технической конференции «ТРАНСКОМ- 97». СПб.: СПГУВК, 1997, с. 62 - 63.
9. Душутина Е. В, Колесников Д. Н. Формализация синтеза программных средств обеспечения отказоустойчивости ВС// Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 468. - СПб, 1997, с. 90-92.
10. Душутина Е. В, Колесников Д. Н. Оценка средств обеспечения отказоустойчивости вычислительных систем. // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность - 97»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб, 1997, с. 62-63.
11. Душутина Е. В, Колесников Д. Н. Средства моделирования для анализа качества отказоустойчивости бортовых вычислительных систем // XV международная межвузовская школа - семинар «Методы и средства технической диагностики» (МиСТД-98): Сборник докладов. - Йошкар-Ола: МарГУ, 1998, с. 67-71.
12. Душутина Е. В, Колесников Д. Н. Определение показателей качества отказоустойчивых вычислительных систем // Международная научно-техническая конференция «Диагностика, информатика, метрология, экология, безопасность -98»: Тез. докл. /АДИОС, Метрологическая Академия России, Международная Академия Информатизаций и др. - СПб, 1998.
13. Душутина Е. В, Колесников Д. Н. Построение библиотеки моделей для анализа качества отказоустойчивых ВС // Вычислительные измерительные и управляющие системы: Сборник научных трудов. Труды СПбГТУ, N 472. - СПб, 1998.
14. Душутина Е.В. Организация обмена информацией в режиме прерываний в ЭВМ и ВС на основе микропроцессоров INTEL: Учебное пособие/ СПб. - СПбГТУ, 1998, 81с. (усл. печ. л. 4,25).
15. Алексеев В.Н, Душутина Е.В, Душутин И.Д. Управление периферийными устройствами и организация обмена информацией в микроЭВМ: Лабораторный практикум/ЛГТУ. Л, 1991,61с. (усл. печ. л. 4).
16.Мелехин В.Ф, Душутина Е.В, Пышкин Е.В. Автоматизация синтеза при логическом проектировании цифровых устройств на основе базовых матричных кристаллов// Вычислительные, измерительные и управляющие системы. Сборник научных трудов: Труды СПбГТУ № 449/ СПб., 1994, с.82-90.
17. Душутина Е.В, Клыков Г.А, Максимов A.B. Разработка библиотеки моделирования для оценки качества отказоустойчивых управляющих ВС//26 неделя науки СПбГТУ: Тезцсы докладов студенческой научно-технической конференции. СПб.: СПбГТУ, 1997, с. 150.
Текст работы Душутина, Елена Владимировна, диссертация по теме Телекоммуникационные системы и компьютерные сети
/ • V " '
/ {
Санкт-Петербургский Государственный Технический Университет
ИССЛЕДОВАНИЕ И РАЗРАБОТКА СРЕДСТВ ОБЕСПЕЧЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ В БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
Специальность 05.13.13 - Вычислительные машины,
комплексы, системы и сети
Диссертация на соискание ученой степени кандидата технических наук
Научный руководитель д.т.н., проф. Колесников Д.Н.
На правах рукописи
Душутина Елена Владимировна
Санкт - Петербург 1998
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ........................................................................................5
Раздел 1. Сравнительный анализ основных принципов построения
отказоустойчивых бортовых ВС и методов анализа их качества
1.1. Основные понятия и определения ........................................................13
1.2. Классификация БВС с учетом их применения и управления процессом обеспечения отказоустойчивости .........................................................16
1.3. Анализ и особенности организации вычислительного процесса в ОБВС
с различными структурами управления отказоустойчивостью......................29
1.4. Методы анализа характеристик БВС .................................................... 37
1.5. Постановка задачи диссертационной работы........................................... 52
Раздел 2. Основные этапы и задачи системного подхода к проектированию
программно-аппаратных средств обеспечения отказоустойчивости
2.1. Формирование состава программных средств обеспечения отказоустойчивости .........................................................................55
2.2. Определение базовых функций и структуризация программных
средств обеспечения отказоустойчивости .............................................59
2.3. Формализация процесса разработки гипервизора отказоустойчивых бортовых ВС..................................................................................68
2.4. Система показателей для оценки качества
средств обеспечения отказоустойчивости .............................................82
2.4.1. Оценка показателей вычислительной сложности........................... 84
2.4.2. Оценка показателей отказоустойчивости и надежности ................. 90
Выводы к разделу ............................................................................... 100
Раздел 3. Разработка средств моделирования для анализа качества
отказоустойчивых ВС
3.1. Общие принципы разработки средств моделирования для анализа качества отказоустойчивых ВС .......................................................................... 101
3.2. Разработка проблемно-ориентированной библиотеки для проектирования средств обеспечения отказоустойчивости ................................................ 114
3.2.1. Построение элементарных моделей проблемно-
ориентированной библиотеки в среде PETRIWIN................................. 121
3.2.2. Построение элементарных моделей проблемно-
ориентированной библиотеки в среде СО VERS3.0 ...............................135
3.3 Формирование целостных моделей функционирования отказоустойчивых
ВС и проверка их достоверности ..............................................................149
'г
Выводы к разделу ................................................................................163
Раздел 4. Разработка гипервизора в комплексах со структурной избыточностью и распределенным управлением восстановлением ВП
4.1. Многоуровневое представление гипервизора.........................................164
4.2. Формирование локального гипервизора................................................ 187
4.3. Построение моделей для выбора локального гипервизора ......................... 196
Выводы к разделу ................................................................................ 217
Раздел 5. Разработка средств обеспечения отказоустойчивости для БВС
с заданными архитектурой и операционной системой
5.1. Анализ свойств и особенностей организации ВП заданной БВС .................218
5.2. Функционально-структурная организация ПО БВС с дополнительными
программными средствами обеспечения отказоустойчивости .................233
5.3. Моделирование процесса функционирования БВС..................................235
5.4. Моделирование механизмов управления ВП с учетом заданной ОС ...........249
5.5. Оценка качества и сравнительный анализ БВС с различными
средствами повышения отказоустойчивости .......................................256
Выводы к разделу .................................................................................275
ЗАКЛЮЧЕНИЕ ............................................................................... 276
Список литературы .............................................................................. 280
Приложения ....................................................................................... 293
Список сокращений
БВС -бортовая вычислительная система ВК - вычислительный канал
ВН - возврат назад в ходе вычислительного процесса
ВП - вычислительный процесс
ВС - вычислительная система
КПР - комплекс с постоянным резервированием
КРЗ - комплекс с резервированием замещением
КСР - комплекс со смешанным резервированием
КТ - контрольная точка
МФО - метод формального описания
ОВС - отказоустойчивая вычислительная система
ОС - операционная система
ОУ и К - объект управления и контроля
ПВ - переход вперед в ходе вычислительного процесса
ПО - программное обеспечение
РОС - резидентная ОС
СМО - средства межмашинного обмена
СОО - средства обеспечения отказоустойчивости
СП - сети Петри
СПО - системное программное обеспечение
ССУ - системные средства управления
СУ - система управления
СУРЗ - средства управления решением задач
ЯВУ - язык высокого уровня (УЯВУ - универсальный ЯВУ)
Специальные сокращения см. раздел 5
ВВЕДЕНИЕ
Вопросам разработки средств обеспечения отказоустойчивости (СОО) посвящено много научных и инженерных работ, и эта проблема не является новой. Однако быстрое развитие вычислительной техники и управляющих вычислительных систем в частности, внедрение новых технологий в разработку аппаратных и программных средств привели к необходимости пересмотра подходов к проектированию СОО.
Стало очевидным, что использование в сложных ВС традиционных структурной, временной и программной избыточностей эффективно только при условии, что они находятся в точном соответствии с организацией управления вычислительным процессом (ВП), реализуемого операционной системой (ОС). Этот факт нашел отражение в отечественных публикациях с середины девяностых годов в виде попыток систематизации способов управления и восстановления ВП, а также выявления закономерностей их взаимосвязи. Наиболее глубокие и планомерные исследования в этом направлении проводятся Институтом проблем управления (РАН) на основе обобщения опыта отечественных и зарубежных разработок промышленных и бортовых ВС (БВС), в работах Мамедли Э.М., Соболева H.A., Менна A.A. и др. Теоретической основой исследований в этой области послужили труды Пархоменко.П.П., Прангишвили И.В., Гуляева В.П., Мироновского Л.А., Черкесова.Г.Н., Шубинского И.Б., Щербакова О.В., Иыуду К. А. и др.
Кроме того, в последнее время очевиден рост количества зарубежных ОС реального времени, предназначенных для промышленного применения и использующих широкий спектр программно-аппаратных и программных средств обеспечения отказоустойчивости. Большинство из этих систем являются промышленной модификацией систем военного применения. Наиболее существенные результаты зарубежных исследований в области организации и разработки отказоустойчивых ВС представляются на ежегодном симпозиуме: International Symposium on FTC (IEEE Computer Society), где в последние годы стала очевидной тенденция смещения интересов исследователей в область создания СОО в виде системных приложений для «микроядерных» ОС. Наиболее интересные работы в этом направлении опубликованы такими авторами, как Rick Harper, Alan Wood, R.Perez, H.Kim, Y.Huang, C. Kintal а и др. Широко используется, так называемая,
FLEET - технология проектирования структурно-избыточных отказоустойчивых ВС. В силу этого необходим анализ и обобщение способов и механизмов управления и восстановления ВП, а также их реализации в ОС.
Таким образом, актуальность решаемых в диссертационной работе задач определяется необходимостью организовывать восстановление ВП в реальном времени с учетом свойств как структуры ВС, так и элементов операционной системы, управляющих вычислениями. Показатели качества отказоустойчивых ВС существенно зависят от выбираемых механизмов и способов восстановления ВП, а последние, в свою очередь, определяются способом управления.ВП. Диссертационная работа посвящена анализу существующих подходов и развитию на их основе системного подхода к проектированию средств обеспечения отказоустойчивости в структурно-избыточных управляющих ВС.
Тема диссертационной работы согласуется с приоритетными направлениями развития науки и техники, утвержденными Правительственной комиссией Российской Федерации по научно-технической политике № 2727п-П8 от 21 июля 1996 года [направление «Фундаментальные исследования», раздел «Информатика, вычислительная техника, автоматизация», а также разделы В.4.2.1, В.4.1.5 перечня технологий двойного назначения]; Федеральной научно-технической программой «Конверсия и высокие технологии 1997-2000 гг.» [раздел 2 «Информационные технологии, электроника и связь»]; Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов»; с планом госбюджетной научно-исследовательской работы «Исследование и разработка систем управления, контроля и диагностики», N 0890301; с планами работ по Всероссийским грантам 1996-1997 гг, 1998-1999 гг. по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи.
Целью диссертации является: разработка системного подхода для проектирования программных и программно-аппаратных средств обеспечения отказоустойчивости управляющих структурно-избыточных ВС с детерминированным распределением ресурсов и создание на его основе математического обеспечения для восстановления ВП в бортовых ВС управления и контроля.
Достижение поставленной цели обеспечивается решением следующих основных задач:
- взаимное структурирование аппаратурной и программной избыточности на основе
учета закономерностей, связывающих принципы, способы и механизмы
управления ВП и его восстановлением;
t
- формализация процесса разработки средств обеспечения отказоустойчивости;
- формирование функционально полной системы показателей, характеризующих программные и программно-аппаратные средства диагностирования, реконфигурации и восстановления ВП, а также их> влияние на общие характеристики ВС;
- разработка методики и программных средств оценки качества СОО на основе моделирования процесса функционирования проектируемой отказоустойчивой ВС;
- проектирование математического обеспечения структурно избыточных ВС с детерминированным распределением ресурсов на основе различных способов восстановления, построение соответствующих математических моделей для оценки качества разрабатываемых средств;
- разработка средств обеспечения отказоустойчивости для БВС с заданными архитектурой и операционной системой с учетом ограничений на выбор механизмов управления и восстановления ВП.
В работе использованы методы технической диагностики и системного анализа, теории вероятностей и математической статистики, теории случайных процессов, имитационного моделирования.
Наиболее существенные научные результаты и их новизна состоят в следующем: 1. Сформулированы основные этапы проектирования средств обеспечения отказоустойчивости на основе системного подхода в структурно-избыточных ВС с учетом операционной системы. Предложено формализованное многоуровневое описание программных СОО, в том числе организации гипервизора, как основной составляющей СОО. В результате выделены новые типы объектов: текущий и полный локальный и глобальный гипервизоры, системная и прикладная составляющие гипервизора.
2. Сформирована система показателей качества СОО. Предложена обобщенная модель функционирования ОВС с учетом дефектов и формирования текущего
гипервизора в соответствии со структурной и функциональной деградацией системы. Предложена концепция построения средств моделирования в виде проблемно-ориентированных библиотек, встраиваемых в существующие универсальные интегрированные среды проектирования ВС. Новизна достигается за счет включения в процесс моделирования структурной организации ВС, свойств и особенностей
г
организации ВП, в том числе механизмов и способов управления и восстановления ВП, реализуемых элементами ОС, а также дефектов с различными формами их проявления.
3. Предложена методика оценки качества СОО и их влияния на производительность и надежность ОВС. В отличие от других существующих методик она позволяет учесть процесс восстановления с точностью до алгоритмической реализации отдельных механизмов и способов его организации.
4.Сформирован базисный набор способов и механизмов восстановления ВП, а также реализующих их алгоритмов применительно к структурно-избыточным БВС управления и контроля с детерминированным распределением ресурсов. Состав учитываемых факторов при формировании базиса расширен в соответствии с особенностями функционирования БВС.
5.Разработаны модели функционирования структурно-избыточных ВС с детерминированным распределением ресурсов на основе предложенных вариантов локального гипервизора, реализующих различные способы восстановления, с целью их сравнительной оценки. Представленные модели позволяют выбирать необходимое сочетание СОО, способствующее улучшению технических характеристик за счет согласования структурной избыточности, системы дефектов и взаимоподобных механизмов управления и восстановления ВП.
6.Разработано математическое обеспечение бортового комплекса управления и контроля с учетом ограничений заданной ОС. По сравнению с исходным бортовым комплексом предлагаемый отличается повышенной сбоеустойчивостью и точностью локализации дефекта без необходимости в перезагрузке или многократном
и \j
выполнении копии прикладной задачи.
Таким образом, значение полученных результатов для теории состоит в развитии системного подхода к проектированию СОО в виде: формализации многоуровнего описания программных СОО, систематизации способов и механизмов
восстановления ВП для класса бортовых ВС, а также концепции проектирования системы моделирования для оценки качества разрабатываемых средств.
Сформулируем значение результатов для практики. На основе полученных в диссертационной работе теоретических результатов:
- разработаны открытые проблемно-ориентированные библиотеки для комплексного моделирования функционирования ОВС с учетом ОС, встраиваемые в различные универсальные интегрированные среды проектирования. Предлагаемые средства, а также возможность их выбора способствуют снижению трудоемкости и сокращению времени проектирования СОО и ОВС в целом;
- сформировании базис способов и механизмов восстановления ВП, а также алгоритмический базис для выбранного класса систем позволяет повысить качество проектирования БВС управления и контроля;
- разработаные варианты локального гипервизора позволяют комплексировать разработанные средства с целью достижения компромиссных решений между затратами ресурсов и необходимым уровнем отказоустойчивости за счет варьирования различных параметров ВС и ВП.
Предложенные в работе подходы, методики и средства моделирования могут применяться без существенных изменений для более широкого класса управляющих ВС, используемых в судостроении, энергетике и промышленности. Это подтверждается исследованиями, проводившимися в соответствии с планом работ по Всероссийскому гранту 1996-1997 гг по фундаментальным исследованиям в области автоматики и телемеханики, информатики, кибернетики, метрологии и связи [в рамках научно-технической программы «Цифровые и цифро-аналоговые вычислительные комплексы»] по теме "Организация вычислительных процессов в бортовых системах функционального диагностирования" (№ 5868011). Полученные в диссертационной работе результаты, связанные с созданием системы моделирования процессов функционирования отказоустойчивых ВС, явились основой для дальнейшего развития направления и получения гранта 1998-1999гг. по теме "Разработка средств моделирования для анализа качества программно-аппаратных средств обеспечения отказоустойчивости бортовых вычислительных систем» (№ гос. регистрации 0198.0003849).
Реализация работы связана с использованием полученных результатов в НИР «Паритет» НИИ вычислительных средств «Спектр» по проектированию базового комплекта бортового оборудования летательных аппаратов пятого поколения, а также в НИР, проводимой НИИ радиоэлектронных систем холдинговой компании «Ленинец» в соответствии с Государственной «Программой создания комплексов бортового оборудования для перспективных летательных аппаратов» (1997г.).
Результаты диссертационной работы докладывались и обсуждались на Международных и Всероссийских научно-технических конференциях (НТК): на ежегодной Международной НТК «Диагностика, информатика, метрология, экология и безопасность» (СПб., 1995, 1996, 1997, 1998 гг.), Междун�
-
Похожие работы
- Построение и исследование структуры бортового информационно-измерительного комплекса с повышенной отказоустойчивостью
- Отказоустойчивые программно-аппаратные вычислительные комплексы систем управления бурением с использованием интеллектуальной поддержки принятия решений
- Комплексные модели анализа и обеспечения отказоустойчивости бортовых вычислительных систем
- Методология системного проектирования авионики с отказоустойчивыми свойствами
- Алгоритмические методы обеспечения отказоустойчивости вычислительных систем
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность