автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование способов повышения отказоустойчивости параллельных вычислительных систем на основе концепции активной защиты

кандидата технических наук
Иванов, Виктор Иванович
город
Санкт-Петербург
год
1992
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование способов повышения отказоустойчивости параллельных вычислительных систем на основе концепции активной защиты»

Автореферат диссертации по теме "Исследование способов повышения отказоустойчивости параллельных вычислительных систем на основе концепции активной защиты"

САНКТ-ПЕТЕРБУРГСКАЯ ЛЕСОТЕХНИЧЕСКАЯ АКАДЕМИЯ

На правах рукописи ИВАНОВ ВИКТОР ИВАНОВИЧ

ИССЛЕДОВАНИЕ СПОСОБОВ ПОВЫШЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ НА ОСНОВЕ КОНЦЕПЦИИ АКТИВНОЙ ЗАЩИТЫ

Специальность 05.13.01- "Управление в технических

системах"

Автореферат диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 1992

Работа выполнена в Пушкинском высшем ордена Красной Звезды училище радиоэлектроники противовоздушной обороны

Научный руководитель - доктор технических наук профессор Щубинский И. Е Официальные оппоненты: доктор технических наук

профессор Кондрашкова Г. А. , кандидат технических наук доцент Заяц А. Ы.

Ведущая организация: НПО "Импульс"

Защита состоится "22 " ДЕКАБРЯ 1992 г. в 11.00 часов на заседании специализированного совета К 063.50.07 в Санкт-Петербургской лесотехнической академии ( 194018, Санкт-Петербург, Институтский пер. Б, главное здание, зал заседаний ).

С диссертацией можно ознакомиться в библиотеке лесотехнической академии

Автореферат разослан " Ноября 1992 г.

Ученый секретарь специализированного совета

ОССИИСКАЯ -

/ДЛРС V ^

,ИБЛИОТ£КА

- 3 -

1. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Рост объема функций управления, возло»энных на автоматические и автоматизированные управляющие системы, а также повышение значимости задач, возлагаемых на эти системы, приводит к необходимости повышения надежности средств вычислительной техники. Интенсивные исследования по данной проблеме в последние годы привели к возникновению новых систем - отказоустойчивых или толерантных. Анализ особенностей построения отказоустойчивых вычислительных систем (ВС) показывает, что наиболее перспективными, с точки зрения использования избыточности и реконфигурации, являются параллельные вычислительные системы(ПВС). Однако,применение традиционных способов резервирования не всегда обеспечивает требуемые уровни отказоустойчивости управляющих ВС, функционирующих в реальном времени. Это обусловлено имеющимися ограничениями по резерву времени,объему дополнительного оборудования, а также сравнительно низкими возможностями встроенных средств контроля вычислительных модулей систем. Все это свидетельствует о необходимости разработки новых подходов, направленных на достижение гибкой и эффективной адаптации ВС к отказам я сбоям на основе экономичных научно-технических решений.

В связи с этим в диссертационной работе поставлена и решена актуальная научно-техническая задача обоснования и разработки предложений по обеспечению отказоустойчивости параллельных управляющих вычислительных систем.

Предмет исследования составляют вычислительные системы и способы обеспечения отказоустойчивости ПВС реального времени.

Дель исследования заключается в разработке методических и практических рекомендаций для анализа и достижения требуемых уровней отказоустойчивости параллельных вычислительных систем реального времени в условиях ограничений по структурной избыточности и применению встроенных средств контроля.

В соответствии с указанной целью в диссертации ставились и решались следующие основные задачи:

1) разработать инженерный метод, алгоритмы и программные средства для расчета показателей надежности сложных ВС;

2) разработать методику исследования надежности параллельных ВС с активной защитой от отказов и сбоев составных вычислительных модулей( ВД);

3) разработать комплекс моделей анализа надежности функцио-

нирования параллельных ВС о агаивной аащшойС АЗ);

4; разработать экономичные и эффективные научно-технические решения по построению отказоустойчивых ПВС, функционирующих в режиме реального времени, при ограниченной или низкой эффективности встроенных средств контроля составных вычислительных модулей и в условиях незначительного резерва времени.

Методика исследования включает анализ структур существующих отказоустойчивых ВС и способов обеспечения их отказоустойчивости, а также разработку новых высоконадежных структур параллельных вычислительных систем. Она базируется на применении теории надежности, теории вычислительных систем, теории графов, математического аппарата теории вероятности, линейной алгебры, топологического полумарковского метода расчета надежности сложных систем, теории алгоритмов.

Основные положения и результаты работы, выносимые на аащиту.

1. Инженерный топологический полумарковский метод расчета показателей надежности вычислительных систем.

2. Методика анализа надежности параллельных вычислительных систем с активной защитой.

3. Комплекс моделей аналиаа показателей безотказности и готовности ПВС с активной защитой.

4. Научно-технические решения по построению параллельных вычислительных систем с одноуровневой и двухуровневой активной защитой от отказов и сбоев составных ВМ.

Научная новизна результатов состоит в следующем.

1. Разработанный инженерный топологический полумарковокий метод расчета показателей надежности вычислительных систем, алгоритмы и программное обеспечение, в отличие от известных,позволяют решать задачи повышенной размерности, что существенно расширяет возможности аналиаа надежности ВС. Штод прост в освоении и не требует значительных затрат вычислительных ресурсов ЭВМ.

2. Методика анализа надежности ПВС учитывает особенности структур ВС, в которых реализована концепция активной защиты.

3. Комплекс математических моделей анализа показателей безотказности и готовности ПВС с АЗ позволяет определять эти характеристики при произвольных распределениях времени обнаружения отказов и времени адаптации системы к ним. В отличие от известных, модели учитывают особенности функционирования ПВС с АЗ.

4. Разработанные научно-технические решения по построению отказоустойчивых параллельных ВС с активной зашдаой, в отличие от известных, позволяют с меньшими аппаратурными затратами в услопи-

ях реального времени и при ограниченной или низкой эффективности встроенных средств контроля составных ВМ, не только обнаруживать, но и классифицировать ошибки на сбой или отказ, выявлять и исключать из рабочей конфигурации отказавший ЕМ, восстанавливать вычислительный процесс.

Новизна, полезность и существенные отличия разработанных технических решений подтверждены государственной научно-технической экспертизой изобретений.

Практическая ценность работы заключается в дальнейшем развитии концепции активной защиты применительно к параллельным ВС.

Предложены новые нетрадиционные научно-тенические решения по построению отказоустойчивых параллельных ВС, функционирующих в режиме реального времени.

Использование методики и комплекса математических моделей анализа надежности ПВС с активной защитой позволяют при заданных значениях резерва времени и длительности такта АЗ выбирать соответствующий уровень и дисциплину активной защиты для обеспечения требуемого уровня надежности ВС.

Разработанный инженерный топологический полумарковский метод расчета надежности вычислительных систем пригоден для решения широкого класса задач и расширяет возможности анализа надежности ВС, так как позволяет решать задачи ;:-)И''7?нной размерности.

Реализация.

Инженерный топологический полумарковский метод расчета надежности ВС, алгоритмы и программы внедрены в Нормативный материал Межправительственной комиссии по вычислительной технике, на предприятиях НИЦЭВТ и п/я Г-4097.

В ПВУРЭ при разработке перспективных вычислительных систем использованы методика и математические модели анализа и прогнозирования отказоустойчивых параллельных ВС.

Апробация работы. Основные положения работы докладывались и обсуждались на Всесоюзном семинаре "Надежность и диагностирование ЭВМ и микропроцессорных систем'Ч г. Ленинград, 1989г.), на Всесоюзном семинаре "Надежность ЭВМ, вычислительных сетей в процессе их разработки и эксплуатации"(г. Ленинград,1990г.),на IV научно-технической конференции ЖВУРЭ (г. Житомир, 1984 г. ),на I и II научно-технических конференциях ПВУРЭ (г. Ленинград, 1988,1991гг.), на VI научно-технической конференции ОЕВОКИУ (г.Одесса,1989 г.).

Публикации. По теме работы опубликовано 35 научных трудов, в том числе получено 5 авторских свидетельств на изобретения.

Структура и объем диссертации. Работа состоит из введения,

пяти разделов, заключения, списка литературы и трех приложений. Она изложена на-185 машинописных листах, содержит -15 таблиц, 36 рисунков, библиографию из Лк 5 наименований, 4 листа приложений.

2. КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

В первом разделе дается классификация и краткая характеристика ПВО. Рассматривается различные способы реализации отказоустойчивости, виды резервирования,анализируются практические возможности известных методов обнаружения ошибок функционирования ВС.

Отказоустойчивость ВС достигается на основе комплексного использования возможностей и двойств структурной, временной и информационной избыточности при условии своевременного и правильного обнаружения отказов и сбоев ВС, а также своевременного их устранения. Эксплуатация и теоретические исследования показывают,что возможности резервирования реализуются полностью только при высокой эффективности средств контроля. Традиционные методы контроля функционирования ВС обеспечивают достоверное обнаружение и локализацию отказов либо при относительно больших временных затратах, либо при более чем двухкратной избыточности аппаратуры. Это затрудняет успешное использование реальных возможностей резервирования при создании отказоустойчивых ВС, функционирующих в режиме реального времени.

Одним из эффективных направлений повышения отказоустойчивости управляющих вычислительных систем является концепция активной защиты от отказов. Она позволяет при незначительном резерве времени и ограниченных возможностях встроенных средств контроля достичь уровней надежности близких- к принципиально возможным в условиях идеальных характеристик средств контроля, а также мгновенного переключения на резерв и соответствующей кратности резервирования. Однако в настоящее время разработаны научно-технические решения по реализации активной защиты в последовательных ВС и имеются отдельные результаты для ПВС, но они находятся на начальном этапе. Дальнейшее развитие теоретических и прикладных вопросов концепции АЗ представляет новые возможности в создании отказоустойчивых вычислительных систем.

Во втором разделе предложен инженерный топологический полумарковский метод расчета показателей надежности вычислительных систем, поведение которых описывается моделями, содержащими сотни состояний.

Предложенный инженерный метод разработан на основе известно-

го топологического полумарковского метода расчета показателей надежности сложных систем и, в отличие от известных, формализован к применению на ЭВМ. Тестовый контроль и опытная эксплуатация программного обеспечения, строго реализующего топологический полумарковский метод показали,что рост числа состояний графа, описывахщэ-го ВС,приводит к непомерным затратам вычислительных ресурсов. Так для системы представленной графом из 32 состояний,расчет показателей надежности потребовал около 4 часов машинного времени и 12 МЗ оперативной памяти ЭВМ ЕС-1045.

Поэтому были проведены экспериментальные исследования метода. Анализ полученных результатов позволил модифицировать метод путем введения в него двух основных упрощений.

Первое упрощение. Показано, что при расчете определителей по формуле Мезона

aG - l-ZCi+ ZCiCj - CiCjCg + 51 CiCjCgCr - ... ,где Ci-PijPji («■) - (ф (tjg) (ijer)

можно ограничиться нахождением только суммы весов контуров и суммы произведений весов всех пар K0HTyp0B(S^CiCj), некасающися друг друга (неимевщих общих вершин), так как суммы произведений весов трех,четырех и так далее некасающихся контуров незначительны и,кроме того,имеют противоположные знаки.

Второе упрощение. Показано,что можно ограничиться только поиском путей и контуров,веса которых больше заданного значения S, то есть не производить полный обход графа. Результаты исследования показали,что количество контуров и пар контуров,не имеющих общих вершин,веса которых меньше значения 10 .составляет 95-99%. от общего количества, а их вклад в формирование своих сумм и в конечном итоге определителя составляет менее ZZ. Поэтому можно ограничиться поиском контуров,веса которых больше значения 10~4.

Произведенная модификация метода позволила резко сократить затраты вычислительных ресурсов. Так для ВС, описанной графом из 32 состояний,время расчета показателей надежности сократилось с 4 часов до 2 минут,а требуемый объем ОП с 12 Мб до 150 Кб.

Сопоставительное сравнение результатов расчета показателей средней наработки до первого отказа и средней наработки на отказ, полученных при строгой реализации топологического полумарковского метода и при его модификации .свидетельствует о том,что относительная погрешность в результатах составила 0,0006-0,007. Сравнение с результатами, полученными путем реиения системы дифференциальных уравнений, доказывает,что привносимая погрешность находится в допустимых пределах.

Разработанный инженерный топологический полумарковский метод расчета показателей надежности ВС отличается от известных тем,что: пригоден для анализа ВС,поведение которых описывается не только марковским,но и полумарковским случайным процессом; позволяет рассчитывать показатели надежности ВС со значительно большим числом состояний,чем это возможно с помощью других методов; прост в освоении и не требует значительных затрат вычислительных ресурсов; модульный принцип построения программного обеспечения позволяет использовать отдельные модули для расчета достоверности работы функциональных частей и структур ВС.

В третьем разделе изложены методика и математические модели анализа показателей безотказности и готовности ВС с A3.

Методика основана на использовании топологического полумарковского метода определения показателей надежности и включает: описание процесса функционирования ВС и определение критерии отказа, введение и обоснование предположений,построение графа состояний, получение аналитических соотношений для количественной оценки показателей надежности.

В разработанных моделях,в отличие от известных, учитываются особенности функционирования ЛВС при реализации в них активной защиты: зависимость вероятности успешной адаптации ВС к отказам от параметров A3; возможности существования скрытого отказа ВМ; адаптации систем к отказам в зависимости от имеющегося резерва времени; эффективности встроенных средств контроля составных ВМ .

При построении моделей был применен следующий подход. Параллельная вычислительная система с A3 содержит m основных и к дополнительных ВМ. Относительно любого из основных вычислительных модулей, назовем его выделенным,рассматриваются все возможные работоспособные состояния системы. Выделенный ВМ в совокупности с к дополнительными ВМ,к которым он имеет доступ.составляют выделенную подсистему. Так как всю ВС можно разбить на такие однотипные подсистемы,то достаточно построить модель одной из- них при условии, что доступ к дополнительным ВМ имеют кроме выделенного еще и другие основные ВМ,и что дополнительные ЕМ,в свою очередь,могут быть недоступны из-за своих отказов или из-за отказов невыделенных ВМ, которые успешно и своевременно были замещэны на резервные. Кроме того,принято,что поведение системы описывается полумарковским случайным процессом. Предполагается, что в течение времени существования скрытого отказа одного ВМ,отказы других отсутствуют, интенсивности отказов ВМ не зависят от их состояния.

На основании графа состояний и использования топологического

полумарковского метода определения показателей надежности получены аналитические выражения:

среднего времени до первого отказа Ьск и вероятности безотказной работы Рск(Ч вычислительной системы;

среднего времени между отказами ВС Тек, среднего времени восстановления Твск и коэффициента готовности системы Кгс.

Для упрощения пользованием полученных аналитических соотношений найдены рекуррентные формулы определения весов разложения графа.

Полученные аналитические выражения позволяют определять показатели безотказности и готовности при произвольных распределениях обнаруженных и скрытых отказов,восстановлений в условиях полумарковского процесса поведения ВС во времени и являются общими для ВС с любым уровнем АЗ ( к=Т7т) и с любой дисциплиной АЗ.

В четвертом разделе приведены результаты исследования показателей надежности параллельных ВС с активной защитой.

Исследование уровней готовности и безотказности проводилось на основе теоретических положений третьего раздела с применением разработанного инженерного метода расчета надежности вычислительных систем. Расчет производился для различных значений параметров активной защиты (уровня и дисциплин АЗ, длительности такта АЗ), эффективности встроенных средств контроля составных ВМ, имеющегося резерва времени и возможности существования скрытого отказа. В результате анализа проведенного исследования установлено: при заданном значении Тд допустимого времени в перерыве работы системы повышение надежности ВС с АЗ зависит от Т длительности такта АЗ. При значении Тд-1с уменьшение длительности такта на 5мс приводит к такому же эффекту, что и повышение эффективности собственных средств контроля ВМ от уровня =0,6 до у =0,8 (рис.1). Желаемый уровень готовности достигается при Т <40 мс. Учитывая, что быстродействие ПВС превышает десятки миллионов операций в секунду, то в течение 40 мс выполняются задачи объемом в десятки и сотни тысяч команд. Поэтому возможно уменьшить длительность такта в десятки и сотни раз и, следоватнльно, в такое же количество раз увеличить количество тактов размесдемых в заданном интервале времени Тд. Это позволяет полнее использовать временную избыточность для обнаружения отказавшего ВМ и использовать ВМ с малоэффективным аппаратурным контролем или даже отказаться от его применения;

применение концепции.активной аавдггы в ПВС позволяет добиться уровней надежности близких к предельно возможным, но с

АО 50 60 70

Рис. i

---- ÍW

--A4

Т(ИС)

i 2

6 К

Рис.2

30 20

■Í0 0

\ m=8

K=4 с

^ -

4

75

50

25 0

0,6 0,7 0,8 0,9 У

Рис.3

/ ¡P-- 0,8 m=8

\ л-

V. -s. /

-

JO"

iD

Рис. k

k

меньшей кратностью резервирований рис. 2). Достаточно ограничиться двухуровневой активной защитой(к=2).

Для оценки эффективности применения концепции активной защиты в параллельных ВС выполнен сравнительный анализ надежности ЛВС с АЗ и ПВС со структурным резервированием.

На рис. 3 показаны результаты сравнительного анализа готовности. Анализ графических зависимостей "Н* -КгАз /Кгк/т от вероятности у правильного обнаружения отказов и от числа дополнительных ВМ (к) при т=8 позволяет сделать следующие выводы:

при одинаковой кратности резервирования применение активной защиты позволяет в десятки раз повысить готовность ПВС;

выигрыш в готовности выше, если применяются развитые дисциплины АЗ(Д4). Расчеты показывает, что применение развитых дисциплин в сочетании с одноуровневой АЗ обеспечивает преимущество перед ПВС со структурным резервированием большей кратности;

выигрыш в готовности сохраняется и в том случае, если в ПВС с развитыми дисциплинами АЗ низкая эффективность встроенных средств контроля, а в ПВС со структурным резервированием вероятность правильного обнаружения отказов достигает уровня у =0,95.

Результаты сравнительного анализа безотказности показаны на рис. 4,где представлена зависимость "Не =0Сцъ/0ск/т (Ос -1-Рс ) от интенсивности потока отказов. Они позволяют сделать следующие выводы:

применение активной защиты особенно эффективно в случае низкой надежности составных модулей ВС(Л МО*3 ). Но и при Л ¿10~ количество устраняемых отказов в ВС с АЗ в 5... 15 раз больше;

подтверждается преимущество дисциплины Д4 перед ' дисциплиной Д1. Применение дисциплины Д4 позволяет получить такие же уровни безотказности, как и для ВС с Д1,но при значении Л ниже на порядок;

преимущество в безотказности тем больше, чем больше значение Тд допустимого времени перерыва в работе системы. При увеличении Тд в 2... 3 раза количество устраняемых отказов возрастает в десятки раз.

Таким образом, сравнение эффективности применения активной защггы с эффективностью раздельного дублирования показало, что АЗ позволяет обеспечить от 4... 8 раз до десятков раз больший уровень безотказности параллельных ВС.

В пятом разделе предложены структуры параллельных вычислительных систем с активной защитой от сбоев и отказов составных ВМ.

Реализация концепции АЗ в ПВС осуществлена путем введения различных видов избыточности (информационной,временной и струк-

турной) и динамической реконфигурации. При этом информационное резервирование используется для формирования контрольных точек с целью восстановления вычислительного процесса,временное резервирование -для сравнения выходных наборов параллельно.работающих ВМ и реконфигурации ВС,структурное резервирование -для резервирования ВМ. Динамическая реконфигурация проводится с целью : периодического контроля модулей ВС;классификации ошибок на сбой или отказ, и в случае,последнего, определение отказавшего ВМ;локализации отказавшего ЕМ .

Рассматриваемые вычислительные системы содержат однотипные вычислительные модули. Активная защита формируется с помощью вычислительной среды (основные модули),защитной среды (дополнительные модули),коммутационного поля и управляющего органа.

Время выполнения задачи в ВС разбивается на N тактов контроля, каждый из которых состоит интервала непосредственного выполнения задачи ВМ и интервала контроля и реконфигурации ВС.

Для ВС,в которой реализована АЗ с повторным счетом,с переназначением, неприоритетным контролем, одним избыточным ВМ на т основных, принцип работы заключается в следующем.

В каждом такте назначается пара параллельно работающих вычислительных модулей,причем функции контролирующего ВМ выполняют последовательно все ш+1 ВМ .входящие в ВС. В 1-ом такте парой взаимопроверяемых ВМ будет ВМ^ и ВМ^ . В конце такта на интервале контроля и реконфигурации производится контроль сравнением выходных наборов данных ВМ. При их совпадении на следующий (1+1)-й такт выполнения задачи происходит реконфигурация системы - образуется очередная пара параллельно работающих ВМ (ВМ[+1 и ВМ^+г).

В случае несовпадения результатов работы в I - том такте у пары взаимопроверяемых ВМ (ВМ[ и ВМ^), в (1+1)-ом такте для них назначается повторный счет,что позволяет узтранить сбойную ошибку или установить факт отказа одного из пары ВМ,в случае повторного несовпадения результатов. Определение отказавшего ВМ,его локализация производится в следующем и+2)-ом такте, для чего назначается следующая пара взаимопроверяемых ВМ (ВМ^ч-! и ВМ{+2).По результатам сравнения выходных наборов параллельно работающих ЕМ определяется отказавший ЕМ. В случае,если результаты вновь не совпали,то отказавшим считается и+1)-й ВМ, при совпадении результатов -1-Й ВМ. В дальнейшем отказавший ЕМ исключается из рабочей конфигурации системы. Решение задач продолжается без снижения производительности ВС. При атом контроль работоспособности системы осуществляется только встроенными средствами контроля ЕМ. После восстановления от-

казавшего ВМ система вновь функционирует в режиме резервирования.

Разработанные архитектуры ПВС с активной завдтой позволяют не только фиксировать ошибки,но и классифицировать ошибки на сбой и отказ,определять отказавший ЕМ за три такта,если применяется процедура повторного счета или за два такта-без применения повторного счета,подвергать повышенному контролю ВМ, которые выполняют приоритетные задачи или работают с пониженным ресурсом надежности. Достоинством разработанных систем является: низкая кратность резервирования; обнаружение ошибок и выявление отказавших ВМ производится в процессе функционирования ВС в режиме реального времени при непосредственной реализации предписанного алгоритма.

Предложенные технические решения защищены 5 авторскими свидетельствами.

3. ЗАКЛШЕНИЕ ПО РАБОТЕ

В диссертационной работе предложено новое решение актуальной научно-технической задачи обоснования и разработки предложений по обеспечению отказоустойчивости параллельных ВС реального времени.

Основные результаты исследования состоят в следующем:

1. Разработан инженерный топологический полумарковский метод, который позволяет рассчитывать стационарные показатели надежности и достоверности работы вычислительных систем,а также первые два момента времени пребывания системы в фиксированном множестве состояний.

В отличие от известных .метод позволяет рассчитывать показатели надежности ВС,описываемых произвольными графами состояний, что существенно расширяет возможности анализа надежности ВС;метод прост в освоении и не требует значительных затрат вычислительных ресурсов.

2. Разработанная методика анализа надежности параллельных вычислительных систем с активной защитой учитывает особенности данных систем и позволяет при проектировании ВС получать количественные оценки показателей надежности,тем самым определять перспективные структуры отказоустойчивых вычислительных систем.

3. Разработанный комплекс математических моделей анализа показателей безотказности и готовности ПВС с активной защитой позволяет рассчитывать эти характеристики при произвольных распределениях времени адаптации системы к ним. Предложенные модели отличаются от известных тем,что они учитывают длительность реакции системы на локализацию отказавшего ВМ и восстановление вычисли-

тельного процесса,а также возможность решить эту задачу в условиях заданных временных ограничений и реальных характеристик средств контроля работоспособности БЫ.

4. Результаты моделирования ПВС с активной защитой свидетельствуют о том,что для обеспечения высоких уровней надежности в данных системах можно ограничиться двухуровневой активной защитой. Это достигается за счет высокого быстродействия ПВС, т. к. можно в десятки и сотни раз уменьшить длительность такта активной защиты и,следовательно, во столько же раз увеличить количество тактов,размещаемых в заданном интервале допустимого времени в перерыве работа Уровень надежности ПВС с активной защитой существенно не зависит от надежности встроенных средств контроля составных вычислительных модулей,и поэтому можно использовать ВМ с ограниченной или низкой эффективностью собственных среств контроля.

5. Разработаны экономичные и эффективные научно-технические решения по построению отказоустойчивых ПВС .позволяющие при ограниченной или низкой достоверности встроенных средств контроля составных ВМ и в условиях незначительного резерва времени своевременно обнаруживать и устранять отказы и сбои ВМ.

В отличие от известных структур отказоустойчивых ВС,предложенные решения по построению отказоустойчивых систем позволяют при меньших аппаратурных и временных затратах не только обнаруживать, но классифицировать ошибку на сбой или отказ,выявлять и исключать из рабочей реконфигурации отказавший вычислительный модуль. При этом разработанные структуры ВС характеризуются низкой кратностью резервирования (не более 2),обнаружение ошибок и выявление отказавших ВМ производится непосредсвенно при выполнении вычислительной системой управляющих программ.

6. Швизна,полезность,существенные отличия и практическая осуществимость разработанных технических решений по обеспечению отказоустойчивости ПВС подтверждены 5 авторскими свидетельствами на изобретения.

Перечень основных публикаций по теме диссертации:

1. А. с. 1378775 от 31.07.86г. ЫКИ Ш5 К10/00. Резервированная вычислительная система/И. Б. Щубинский.Е И. Иванов. -12с.

2. А. с. 1494763 от 7. 04. 87г. МКИ Ю5 К10/00. Устройство для управления реконфигурацией резервированной вычислительной системы/В. И. Иванов, И. К Щубинский. -16с.

3. А. с. 1524720 от 19.10. 87г. МКИ Ю5 К10/00. Резервированная

- 15 -

вычислительная система/И. R Щубинский, В. И. Иванов и др. -20с.

4. А. с. 1544050 от 7. 07. 87г. МКИ Ю5 К10/00. Устройство для управления реконфигурацией резервированной вычислительной системы/И. Б. Щубинский,а И. Иванов, С. А. Бобонец.Э. А. Евсеенко. -20с.

5. А. с. 1579443 от 20.10.88г. МКИ Ю5 К10/00. Резервированная вычислительная система/И. Б. ЩуСинский,Н. Т. Санников, Е И. Иванов. -12с.

6. Иванов В. И. Пэвышение надежности вычислительных комплексов с использованием активной защиты//0тчет о НИР "Дулька-1".-JL: ПВУРЭ, 1988. -С. 133-142.

7. Иванов R И. Исследование вопросов обеспечения надежности и устойчивости функционирования комплексов вычислительных средств //Отчет о НИР "Квантр". -JL : ПВУРЭ, 1988. -С. 72-88.

8. Иванов а И. Организация вычислительной системы с одноуровневой активной защитой//Надежность и диагностирование ЭВМ и микропроцессорных систем. -JL : Знание, 1989. -С. 71-74.

9. Иванов а И. Применение метода активной защиты от отказов для повышения достоверности результатов вычислений//Отчет о НИР "Цулька-2".-JL : ПВУРЭ, 1989. -С. 21-27.

10. Иванов а И. Модифицированный топологический полумарковский метод расчета надежности вычислительных систем//Надеж-ность ЭВМ, вычислительных сетей в процессе их разработки и эксплуатации. -Л.: Знание,1990. -С. 14-16.

11. Иванов а И., Соловьев Ц. а Автоматизация процесса построения и расчета матриц интенсивностей переходов для определения надежности параллельных вычислительных систем//Проблемы повышения отказоустойчивости многопроцессорных вычислительных систем. -Л.: ПВУРЭ, 1990.-С. 62-67.

12. Павлюченко Л. а , Щубинский И. а , Иванов а И. Алгоритм расчета достоверности функциональных структур//Отчет о НИР "Мо-дель-1". -Л.: ПВУРЭ, 1983. -С. 12-44.

13. Щубинский И. Б. , Иванов а И. , Ганичев И. а О целесообразности увеличения кратности резервирования многопроцессорных вычислительных систем// Исследование возможностей повышения эффективности микропроцессорных ВС.-Л.: ПВУРЭ, 1984.-С. 65-70.

14. Щубинский И. Б. .Иванов а И. Инженерный топологический полумарковский метод расчета надежности сложных вычислительных систем//Тез. докл. 1 научно-техн. конф. ПВУРЭ ПВО. -Л. 1988.

15. Щубинский И. а, Иванов а И. Метод обеспечения надежности многоканальных аналого-цифровых систем//Пути рационального построения и эффективного использования комплексов вычислительных средств. -Л.: ПВУРЭ, 1985. -С. 72-77.

16. Щубинский И. Е .Иванов В. И. .Еобонец С. А. Параллельная вычислительная система с одноуровневой активной защитой//Тез. докл. 1 научно-техн. конф. ПВУРЭ ПВО. -Л. 1988.

17. Щубинский И. Е , Иванов Е И. Модульная вычислительная система с одноуровневой активной защитой от отказов//Специальная радиоэлектроника. Надежность РЭА, вып. 4. -1989. -С. 28-30.

18. Щубинский И. Б., Иванов Е И., Майоров Д. Д., Угоренко Л. Ч. Активные отказоустойчивые модульные вычислительные системы с оптимальным управлением//Тез. докл. 1 научио-техн. конф. ПВУРЗ. -Л. 1988.

19. Щубинский И. Е , Михайлин Е П., Иванов Е И., Маляре кий Н. М. Методика и алгоритм расчета надежности ' функциональных структур ЭВМ единой серии. -М.: Специальная радиоэлектроника. Надежность РЭА, вып. 11. 1984.-С. 67-68.

20. Щубинский И. Е .Мельников Ю. Е .Иванов Е И. Активная защита от отказов вычислительных систем//Исследование возможностей повышения эффективности микропроцессорных ВС.-Л.: ПВУРЭ, 1984. -С. 71-77.

Цросим принять участие в работе специализированного Совета К 063. 50.07 или прислать отзыв на автореферат в двух экземплярах с заверенными подписями по адресу: 194018, Санкт-Петербург, К-18, Институтский пер. ,5, Лесотехническая академия, ученый совет.

Надписано в печать с оригинал-макета .10.92г. Формат 60x90 1/16. Бумага оберточная. Печать офсетная. Изд. N36 Уч. изд. л. 1,0. Печ. л. 1,0. Тираж 100 экз. Заказ ход. Бесплатно. Редакционно-издательский отдел ЛГА

Подразделение оперативной полиграфии ЛТА 194018, Санкт-Петербург, Институтский пер., 3.