автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Отказоустойчивый канал связи для бортовых многомашинных систем

кандидата технических наук
Володарский, Владимир Яковлевич
город
Санкт-Петербург
год
1993
специальность ВАК РФ
05.13.13
Автореферат по информатике, вычислительной технике и управлению на тему «Отказоустойчивый канал связи для бортовых многомашинных систем»

Автореферат диссертации по теме "Отказоустойчивый канал связи для бортовых многомашинных систем"

С АНКТ -ПЕТЕРБУРГСКИЙ 'ч^ОСУДАРСТВЕНШИ ЭЛЕКТРОТЕХНИЧЕСКИЕ УНИВЕРСИТЕТ

На прзЕзх рукописи

.Володарский Влади,игр Яковлевич

ОТКАЗОУСТОЙЧИВЫЙ КАНЫ связи дет БСРГОБЫХ ШОГОШЯШагХ СИСТЕМ

Специальность: 05.13.13 - Бычислггельные машины,

комплексы, системы и сети

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург - 1593

Работа. выполнена в Уфимском" опытно-конструкторском бюр "Орбита"

Научный руководитель

доктор технических.наук профессор .ВАРШАВСКИЙ В.И.

Официальные оппоненты: '

доктор технических наук,, профессор БАРАШЕНКОВ В.В. кандидат технических'наук, Еед.пауч.сотр. ПЕСЧАНСКШ В.А.

Ведущая организация- - Уфимский авиационный институт

•Защита диссертации состоится _' 1ЭЭЗ г.'

в _ час. на ..заседании спашга.та2пропакно.го со&эта К06336.12

Сагаст-Петероургского государственного электротехнического университета по; адресу: .' • Саякт-ГТетероург, "ул. Проф. Попова, 5.

С .диссартацкей мск;о ознакомиться в 'кбдаотеке угешерситета^

Автореферат разослаз'/ ?Фе$/?С-ЛД 1983'

Учений секретарь ссзциалнзировандого совэта Балакш В.Н.

ОБЩАЯ ХД FAKTEFKCTI-liA РАБОТЫ

Актуальность темы. Эксплуатационные характеристики, живучесть и эффективность летательных аппаратов (ЛА) во мнете;.: зависят от характеристик Сортовых вычислительных систем (ЕВС). Поэтому вполне объяснимо то внимание, которое уделяется разработкам надежных отказоустойчивых БВС (ОУБВС). Так, например, новая программа МО США Pave Filiar, являющаяся по мнению специалистов наиболее прогрессивной из всех программ, осуществляемых когда-либо в области проектирования бортового электронного оборудования, предусматривает значительное повышение надежности и уровня отказоустойчивости БВС и коммуникационных средств. Ставится задача улучшения этих характеристик до тзкой степени, чтобы там, где это возможно, полностью отказаться от резервирования, электронных систем управления механическими системами. .

Следует отметить, что' отказоустойчивость - это не только средство достижения высокой надежности, но и самостоятельная характеристика. Так, одним из требовашй к БВС самолетов гражданской авиации нового поколения является обеспечение двухотказности (сохранение работоспособности после возникновения двух неисправностей в системе) при решении критичных для полета зздач.

Для многомашинных ОУБВС наиболее подходит архитектура локальной вычислительной сети (ЛВС). Проблема восстановления работоспособности после отказов-в оконечном (абонентском) оборудовании ЛВС решается достаточно просто, если к ней, кроме основных, подключены резервные абонентские системы. Наиболее уязвимым звеном с точки зрения надежности в' ЛВС является общий для всех абонентов канал связи, имеющий, как правйло, топологию линейной айны или кольца. Дефект канала может полностью парализовать ЛВС. Поэтому сн должен иметь показатели надежности и отказоустойчивости по крайней мере не хуже, чем остальное оборудование сети.

В существующих БВС с архитектурой ЛВС проблема надежности канала связи решается путем общего резервирования канала, изначально не предназначенного к работе в отказоустойчивой среде. Такой: подход неэффективен, так кзк приводит к большим затратам и нерациональному использованию оборудования и не позволяет реализовать некоторые важные для ОУБВС функщш, такие как, например, программный доступ к информации о состоянии аппаратуры канала.

Требуются нетривиальные решения, учитывающие тесную взаимо-

связь системо- и схемотехнического аспектов проблемы.

Сказанное позволяет считать актуальной тему диссертации.

Цель работы состоит в разработке принципов и приемов проектирования и в создании апларатно самовосстанавливающегсся канала связи для многомашинной ОУБЗС на основе использования уникальных самодиагностическнх свойств самосинхронной схемотехники.

Достижение поставленной цели предусматривает решение следующих задач:

- обоснование структуры и способа обеспечения отказоустойчивого функционирования;

- обоснование схемотехнической базы для реализации интерфейсного контроллера;

- исследование и создание протоколов передачи информации и их аппаратная реализация;

- разработка и аппаратная реализация алгоритмов обнаружения и локализации неисправностей и саморемонта канала связи;

- разработка алгоритмов инициализации взаимодействия объектов канального уровня;

- исследование падекности канала как подсистемы ОУБВС.

Г.'итоды исследования. Для решения указанных задач используются методы и результаты теорий вычислительных структур, параллельных процессов, апериодических (самосинхронизирующихся) автоматов, надежности, вероятностей, а также методы малинного и физического моделирования.

Научная новизна. Впервые сформулированы требования к структуре и протоколам нижних уровней взаимодействия объектов ОУБВС с архитектурой ЛВС. Предложен подход, использующий принцип самосинхронизации для построения системы (сетевого интерфейса), состоящей из самосивхроншх элементов (адаптеров канала), обменивающихся данными, кодированными самосшхронизирувдимлся кодами. Это позволяет обеспечить нечувствительность к перекосу задержек в линиях связи и функциональную самодаагностируемость. Предложена математическая модель расчета надежности реконфпгурируемого в процессе функционирования резервированного кольцевого канала с последовательно-параллельной передачей данных.

Практическая ценность. Большинство полученных научных-результатов имеют практическую направленность и ориентировано на • проектирование реальных ОУБВС и распределенных систем управления

различного функционального назначения в виде малых локальных сетей. Практическая ценность подтверждена внедрением.

Внедрение результатов работы. Диссертация выполнена в рамках научно-исследовательской и опытно-конструкторских работ ОКБ "Орбита" (г. Уфа). Изготовлена опытная партия БИС адаптера отказоустойчивого кольцевого канала связи (ОККС) для многомашинной БВС, входящей в состав интегрированного комплекса бортового оборудования. Имеется акт о внедрении.

Апробация работы. Основные положения работа докладывались на: XI Всесоюзном совещании по проблемам управления, Ташкент, 1933г.; VII Всесоюзном совещании по технической диагностике и отказоустойчивости, Саратов, 1990г.; Всесоюзном совещашш "Проблемы построения перспективных бортовых управляющих вычислительных комплексов", Владивосток, 1991г.; Всесоюзном научно-техническом семинаре "Многопроцессорные вычислительные системы", Таганрог, 1991г.; Международном семинаре "Территориальные информационные сети", Рига, 1991г.; научно-технических совещаниях ОКБ "Орбита", ЛКПО. "Электроавтоматика", ГссНШ авиационных .систем, 1938, 1989, 1990г.г.

Публикации. По теме диссертации опубликовано 10 работ. Большинство работ написано в соавторстве. Личный вклад автора является определяющим в части результатов, вынесенных на защиту.

Структура и объем работы. .Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 91 наи- . менование, и пяти приложений. Основная часть работы изложена на 133 страницах машинописного текста. Работа содержит 35 рисунков и 6 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность работы, формулируются цели и задачи исследования.

В первой, обзорной, главе рассматриваются концепции и методы построения отказоустойчивых бортовых вычислительных систем.

При многоуровневой организации отказоустойчивых систем средства восстановления работоспособности после сбоев и отказов должны присутствовать на всех уровнях: от аппаратного до прикладного математического обеспечения. Это значительно-повышает надежность и достоверность результатов. Но поскольку парирование

физических дефектов возможно только при наличии альтернативных путей обхода, основные проблемы, связанные с обеспечением отказоустойчивости,' могут быть решены только на аппаратном уровне с использованием аппаратной избыточности (резервирования).

Первые поколения ОУБВС основывались на статической аппаратной . избыточности (маскировании отказов). Было распространено тройное модульное резервирование в чистом виде или в сочетании со средствами, обеспечивающими возможность функционирования и после второго отказа.

Реализация статической избыточности проста, но требует больших затрат оборудования и не-позволяет рационально использовать всю имеющуюся вычислительную мощность системы.

Другая формы аппаратной избыточности - динамическая - будучи не общей, а селективной, свободна от названных недостатков, ¡ю ее реализация требует более, сложных подходов при проектировании г прпнл^чеш:«" уетодов обнаружения отказов, процедур восста-новл. тля. особой гшти и контроля тех элементов системы, - которые р'.'.'¡лизуэт возможности обнаружения ошибок и восстановления.

Отказоустойчивые .системы , с динамической избыточностью создаются на базе мулътикомпыотерных, архитектур, для которых аппаратная избыточность является внутренним свойством, существующим до тех пор, пока для решения задач не потребуются все наличные ресурси мультипроцессорной конфигурации. ,

С точки зрения надежности наиболее привлекательны распределенные сЕободлосвязанные многомашинные системы (ЫМС), для которых проблемы комплексирования, организации помехо- и отказоустойчивого функционирования па сути те же, что и в ЛВС. Так, задача защиты от помех решается теми же методами, что и в сетях: используются пакетная передача сообщений, помехоустойчивое кодирование, повторные передачи. При отказах линий связи могут использоваться обходные пути передачи данных.

Общие принципы, используемые в ЛВС, пригодны и для разработки ВВС. Это оправдано технически и экономически.'Технически -потому что в разработках ЛВС общего назначения накоплен большой опыт организация помехоустойчивого высокоскоростного обмена цифровой информацией между потребителями. Экономически - потому что снижаются затраты на разработку, может быть использована элементная база, имеющаяся на рынке общепромышленных, изделий.

Главным архитектурным компонентом ЛЕС является среда информационного обмена. Основными характеристиками это,", среди являются ее конфигурация (топология) и метол доступа. Из мксзкгтв? топологий для ЛВС наиболее целесообразна«! и экономически оправданная признаны кольцевая и с общей шиной.

Сравнительный анализ моноканалъкых сетей связи показывает, что кольцевые сети с передачей маркера по ряда динамических характеристик превосходят сети с топологией линейкой шины.

Проблема создания распределенных ММС и ЛВС повышенной наде-:жости упирается в проблему обеспечения надежности каналоз связи. Существует много различных способов парирования неисправностей линейных к, особенно, кольцевых моноканалов. Но эти способы эффективны для сетей с последовательной передачей данных. В то жэ время, в бортовых системах, кмеюшх ограниченную дюшу мекма-стапых связей, с успехом мсжэт быть применена нараллельно-последовательная передача, для которой проблем создания отказоустойчивых физических сред'еще >;сдут своих ресений.

Во второй главе основное внимание уделено рассмотрению различных протоколов подуровня управления доступом к среде (КАС-подуровня) канального уровня взаимодействия открытых систем (по классификации ISO и в соответствии со стандартом IEE2 802), выбору и обоснованию структуры сетевого контроллера (канальной станции) для отказоустойчивой кольцевой локальной сети, предназначенной к использованию на борту ЛА, разработке конкретного протокола доступа к каналу, для выбранной сети.

Показано, что для реализуемого на базе самосинхроннсй схемотехники отказоустойчивого канала связи бортовой ММС, наиболее подходят кольцевая топология и маркерный метод доступа- Передачу предложено осуществлять не по одной, как в большинстве известных-сетевых каналов, а по нескольким информационным линиям. При отсм увеличивается пропускная способность канала и снижается острота характерной для передачи с высокими скоростями проблемы отражения сигналов и согласования импедансов. Креме того, появляется возможность, организовав скользящее резервирование линий канала, снизить долю избыточного оборудования.

Предложенный для ОККС сетевой контроллер содергзгг четыре блока: адаптер абонента (АА), предназначенный для обеспечения стандартного сопряжения оконечного оборудования дэнеых.с кольце-

вым каналои (например, по стандарту Q-bus); самосинхронный адаптер канала (АЮ, реализующий алгоритмы управления доступом к каналу, контроля, диагностики и саморемонта; два включенных ме:кду ЛА и АК буферных запоминавшие устройства типа FIFO, предназначь шшх для временного хранения передаваемых и принимаемых сообщении. В соответствии с выполняемыми Функциями АК структурно разделен ка дну подструктуры: автомат протокола (АН) и автомат контроля и восстановления (АКБ). Канал содержит S информационных линий, одну линию квитирования и 2 резервные линии. Передача информации осуществляется самосинхронным оптимальным равновесным кодом (ОГК) "3 из 6", из 20 рабочих наборов которого 16 соответствуют 16-и наборам полубайта двоичного позиционного кода, а 4 предназначены для задания служебных символов (маркеров).

Сформулированы следующие общие требования к протоколам нижних уровней взаимодействия абонентов кольцевой ОУБВС.

т) Обеспечение трех режимов передачи: "один-одному", "один -всей", "один-некоторыи". Это позволяет эффективно использовать канал связи и освободить верхние уровни от непроизводительных потерь времени на фильтрацию "своих" сообщений.

2) Передатчик должен иметь возиохность получать подтверяде-ше о приеме переданного им сообщения кахдаи адреегтои. Информация о подтверждении приема полезна для оперативной реакции системы на отказ одного из ее узлов, а также для организации быстрой инициализации системы после включения питания или саморемонта. Для режима "один-некоторым", если он используется, например, для повышения достоверности результатов в вычислениях по мажоритарному принципу, подтверждение приема обязательно.

3) Наличие информации о состоянии аппаратуры канала связи. Эта информация должна передаваться на верхние уровни управления, где принимается решение о возможности дальнейшего использования ОУБВС для ешголнония поставленной задачи.

4) Обеспечение разноприоритетности сообщений.■Это требование продиктовано, во-первых, разноприоритетностью задач, решаемых в система, и, во-вторых, необходимостью с минимальной задержкой выдавать сообщения, информиругсдиэ о возникновении аварийных ситуаций, iura сообщений от общесистемного таймера.

Анализ стандартных протоколов показывает, что перечисленные требования выполняются ими лкяь частично.

Рассмотрены различные структуры блоков данных, v;c?!.oj:.-::-.':i;,.o реализовать протоколы, удовлетворяют,!« всем сфор?улкт:лвигнкм требованиям. Предпочтение отдано структусам, рассчитанном на адресацию теоретически неограниченного числа сби-ктоь и имущим лучыие компоновку и размещение полей. Разработаны структура кадров КАС-обслу;ашаш1Я (хранящегося в FIF01 перед выдачей в канал и принятого кз канала в FIF02) и МАС-протокола.

В заголовок предназначенного для передачи в канал кадра включено четырехразрядное поле приоритета сообщения. Поле адреса содержит суперпозшшп представленных в унитарном коде смешений кистололожний получателей относительно задатчика. Это позволяет при n-разряднсм поле адреса в режиме "один-некоторым" адресовать п абонентов в любом сочетании. Аналогичный формат имеет разметенное в концевике поле адресов станций, подтвердивших прием. В случаях, когда подтверждение приема каждым адресатом необязательно, это поле может отсутствовать. В состав принимаемого из канала кадра, включено четырехразрядное поле слова состояния, ко-торе содержит информацию о числе отказавших линий по обе стороны принимающего данное сообщение Alt.

Для МАС-протокола, ориентированного на параллельную передачу ¡юлубайтов данных, разработаны структуры трех типов кадров: свободный маркер, маркер с приоритетом, информационный кадр.

Разработан протокол маркерно-приоритетного доступа к. кольцевому каналу, удовлетворяющий следующим требованиям.

1) Простота аппаратной реализации. Это важо, потому что аппаратурой АК реализуются не только протоколы канального уровня взаимодействия, но и алгоритмы контроля и восстановления физического канала, и келательно, чтобы все предназначенное для этих целей оборудование, размещалось в одной БИС.

2) Обеспечение выхода в канал за конечное время сообщения с ыпшыальшм уровней приоритета.

3) Минимизация времени захвата канала сообщением с максимальный уровнем приоритета.

4) Обеспечение возможности переключения с режима маркер-но-приоритетного доступа на реякы маркерного доступа. Это позволяет существенно ускорить захват канала в сети, ориентированной на обмен исключительно равноприоритетныки сообщениями.

Рассмотрены такие аспекты проблемы синтеза АП как'разработ-

ка операционной структуры и выбор принципа управления ее элементами; типизация основных операций и выбор адекватного языка спецификации асинхронного процесса управления элементам; структуры /Л на основе заданных протоколов обмена; разработка способа и средств поддержи трансляции описания процесса в схему управления АЛ. В качестве языка задания параллельного асинхронного алгоритма управления принят язык помеченных сетей Петри (ПСП). Это позволило осуществить формальный непосредственный переход от за- . дания параллельного алгоритма к схеме управления. Механизм трансляции ПСП в сакосинхроннуы схему управления основан на применении породи схемного моделирования срабатываний переходов сетей Петри. Интерпретация позиций, дуг и переходов ПСП выполнена соответственно в терминах запоминающих элементов, хранящих состояние ПСП, признаковых сигналов, сигналов запроса и квитирования сакосанхроиных '-.".сков операционной структуры.

В з>:кя?гатолыюм параграфе главы описаны алгоритмы инициализации системы ка базе СККС. Проведено сравнение четырех рассмотренных. алгоритмов по сложности и Бремени выполнения.

П ттут^й главе рассматриваются вопросы структурной, логической, и схемотехнической организации средств контроля к восстановления. Исследуются проблемы реализации процедур обнаружения ошибок, поиска и парирования неисправностей.

Аппаратура ОККС реализована на базе самосинхронной схемотехники. обладающей свойством функциональной самодиагностируемо-стк относительно константных консервативных одиночных и кратных неисправностей элементов. Обнаружение и локализация неисправностей адаптеров выполняются классическими для самосинхронных устройств способами, основанными на фиксации нарушения согласованного по принципу "запрос-ответ" взаимодействия отдельных блоков устройства. При правильной работе схемы сигналы запроса и ответа должны приходить в соответствие в течение определенного критического интервала времени, который не должен превосходить предель-' но допустимое время реакции системы на отказ. Несоответствие значений сигналов запроса и ответа в течение интервала времени, превышающего критический, свидетельствует о неисправности схемы. •Диагностирующая схема состоит из сумматора по модулю 2 и элемента задержки, формирующего длительность критического интервала.

ОККС как распределенная система с децентрализованным управ- "

- у ~

лениеы не должен содержать общего диагностического оборудования и поэтому, несмотря, на самосинхронную реализация адаптеров, не может рассматриваться как единое самодиагностируемое устройство. Зто значительно усложняет локализацию неисправной линии. Причина в том, что в зависимости от типа отказа и момента его возникновения неисправная линия может бить локализована только со стороны одного из участников обмена, и возникает проблема передачи по неисправной магистрали другому участнику номера отказавшей линии с целью ее изоляции. Зта задача не может быть решена при само-с.шхронном взаимодействии участников, и локализация неисправной линии становится возможной путем организации специального синхронного или асинхронно-синхронного алгоритма взаимодействия адаптеров, направленного на адекватную локализации неисправной линии всеми адаптерами и запускаемого диагностическим сигналом неисправности любого из них.

Предложено два подхода к организации асинхронно-синхронного алгоритма локализации. Оба подхода предусматривают обмен дяагно-стирукяей информацией в виде нулевых и единичных наборов и удовлетворяют следующим двум требованиям: алгоритм локализации состоит из ряда этапов, асинхронно инициируемых сменой состояний линий канала: каждый этап выполняется синхронно за ограниченное тесло тактов, такое, чтобы синхросигналы двух взаимодействующих соседних АК не успели значительно разойтись во времени.

При первом подходе образуются пары взаимодействующих АК, реализующие (каждая самостоятельно) алгоритм локализации неисправности. Этот подход сравнительно прост в реализации, но тлеет за недостатка. Во-первых, поскольку- каядый АК включается в две изтономно взаимодействующие пары, его оборудование должно вклю-1ать два автомата локализации (АЛ) неисправности со своими генэ-¡аторами синхротактоп. Во-вторых» выход из строя хотя бы одного :з дзух АЛ, граничащих с дефектным участком, делает восстановлена этого участка практически неосуществимым. -

Отличие второго подхода от первого состоит в том, что связанные с двумя смежными участками канала АК работают нэ независимо, а согласованно (что автоматически вызывает необходимость согласованного взаимодействия всех АК в кольце). Тогда, ео-:ервых, каждый АК может содержать только один АЛ и, во-вторых, ри отказе АЛ может быть реализован режим прямой трансляции сиг-

налов через соответствующий АК, что позволит его левому и правому соседям продолжить выполнение алгоритма локализации неисправных линий на участке между ними, непосредственно взаимодействуя друг с другом. Такое решение существенно повышает надежность канала. Предложена следующая организация взаимодействия АК.

При возникновении дефекта на любом участке канала все АК Еключают свои АЛ, и*АЛ ведущего АК (передающего сообщение или назначенного с помощью системных средств) берет на себя функцию инициации этапов выполнения алгоритма локализации, посылая инициирующие кодовые наборы попеременно в одну и другую сторону по кольцу. При этом какдый следующий этап выполнения алгоритма должен инициироваться лишь после завершения выполнения всеми АЛ предыдущего этапа.

Такая организация взаимодействия АК, несмотря на некоторые сложности, возникающие при ее' реализации, легла в основу подробно представленных в диссертации алгоритмов локализации неисправностей. Локализуются все неисправности линий: на линии константа О, на линии константа 1, обрыв линии, замыкание мегщу линиями.

Рассмотрено два метода саморемонта компонентов канала, имеющих регулярную структуру, (линий и связанного с ними магистрального оборудования): метод непосредственного замещения и метод замещения посредством сдвига. Предпочтение отдано последнему- Он использует однородное коммутационное оборудование, что позволяет восстанавливать коммутатор вместе с оборудованием линий. По времени процедура саморемонта (замещения неисправной линии исправной) совмещена с поиском дефектного участка. Обнаруженная в ходе выполнения алгоритма локализации неисправность фиксируется в соответствующем триггере неисправности, управляющем коммутацией.

При отказе АК целостность кольца может быть восстановлена двумя принципиально различными способами установления транзитных связей в обход отказавшего АК. Первый способ основан на использовании проходных реле с нормально замкнутыми контактами, соединяющими одноименные линии магистралей приемника и передатчика АК. Это единственное средство восстановления целостности канала связи кольцевой сети при аварии источника питания одного из ее узлов. Но шунтирование отказавшего АК с помощью релейных-контактов приводит к удлинению и нарушению однородности линий одного из сегментов канала, и, следовательно, к ухудшению его электри-

ческях характеристик. Поэтому при исправном питании рекомендуется применять способ, основанный на организации активной трансляции сигналов через отказавший АК с использованием его собственного магистрального оборудования. Достоинством этого способа, названного "прямой трансляцией сигналов", является то, что электрические -параметры линий после выполнения процедуры саморемонта не изменяются. Нетривиальность схемного решения прямой трансляции сигналов оправдывает его подробное рассмотрение в работе.

В последнем параграфе главы приведена структура АКБ, состоящая из 10 основных блоков: двух схем связи с линиями источника и приемника сообщений, двух схем коммутации сигналов связи с источником и приемником сообщений, двух комплектов триггеров неисправности -линий источника и приемника, схемы прямой трансляции сигналов (СПТ), схемы диагностики к контроля, схемы обнаружения неисправности АК, АЛ неисправностей линий. Подробно описаны состав и назначение каждого из блоков.

Четвертая глава посвящена исследованию надежности ОККС как системы со сложной структурой резервирования. Выведены соотношения для расчета показателей надежности, проведено сравнение надежности равных по числу основных и резервных линий кольцевого канала и канала с конфигурацией линейной шины.

В качестве показатзлп, наилучшим образом характеризующего надежность ОККС, выбрана вероятность безотказной работы P(t). По сравнению с часто используемым для оценки надежности БЗО показателем "средняя наработка до отказа" (То), показатель P(t) в большей степени подходит для оценки и сравнения надежности резервированных систем, особенно таких, для которых наиболее высокий уровень надежности необходимо сохранять в течение относительно короткого отрезка времени (в авиационных системах это время полета, т.е. 1-10 часов).

На основания графического, аналитического и словесного описаний условий работоспособности построена математическая модель надежности ОККС.

Часть ОККС, а именно - линии канала с отнесенным к ним магистральным оборудованием, резервируется методом замещения со сдвигом. В общем случае при скользящем резервировании степени готовности, а следовательно и интенсивности отказов основных и резервных элементов, неодинаковы.. При этом анализ надежности

треоует рассмотрения процесса замещения отказавших элементов во времени. Если исходить из гипотезы оО экспоненциальном распределении отказов, задача эта сводится к рассмотрению марковских процессов с дискретными состояниями и непрерывным временем. Приведено решение системы дифференциальных уравнений, описывающих марковский процесс относительно вероятностей пребывания использующего скользящее резервирование фрагмента ОККС в каждом из работоспособных состояний.

Вывод соотношений для расчета полной вероятности безотказной работы ОККС проведен, исходя из следующих предпосылок.

1. ОККС считается работоспособным при условии, его целостности (замкнутости) и исправности не менее т из п включенных первоначально в канал АН. (число перешедших в режим прямой трансляции АК должно быть не более п-ш).

2. Целостность кольца может быть нарушена либо при отказе трех или более линий в одном из сегментов кольца, либо в случае отказа самодиагностируемого нерезервированного ■ оборудования (СДО) АК в сочетании с отказом типа "обрыв" СПТ того же АК.

3. Условия функционирования ОККС таковы, что интенсивности отказов основных и резервных одноименных элементов одинаковы.

Вероятность' безотказной работы ОККС - Ркс - может быть представлена произведением двух вероятностей:

Ркс = Рак-Рл = (1-Оак)(1-Ол) ,

где Оак - вероятность "разрыва" кольца из-за отказа АК;

Ол - вероятность отказа ОККС "по вине" линий канала.

При числе сегментов ОККС, равном п,

где Хоб и Хкз- интенсивности отказов СПТ типа "обрыЕ" и типа КЗ, соответственно; Я.сдо - интенсивность отказов СДО.

Вероятность Рл рассчитывается по формуле:

Рл = У (1-Опт)П ^Опт £ [ | р^,. . (1)

1^0 3=1 Е=1

где Опт - вероятность срабатывания СПТ (ложного или при отказе СДО); Р4,.„ - надежность б-того сегмента линий в З-той конфн-гуращш из бозмоеных конфигураций канала при 1 замкнутых СПТ.

Из выражения, определяющего вероятность безотказной-работы системы со скользящим нагруженным резервом, получена формула для расчета Р.,

•ijs-

" ijs

= е

где Ь - число основных, а г - резервных линий в сегменте; ^э -интенсивность отказов линий элементарной длины (соединяющих соседние АК в исходной конфигурации); число элементарных линий, составляющих линию 1;)з-того сегмента.

При достаточно больших С* (что возможно для вполне реальных п. и 1) время счета по формуле (I) становится неприемлемо большим, и тогда расчет Рл следует вести, по формуле:

22й . п-1 1 п- Ы

- \ С^(1-0пт) Опт Рс . Рси+1),

(2)

Рл

i=o

где Ро - надежность сегмента, линии которого имеют интенсивность отказов Pc(i+1) - надежность сегмента, линии которого имеют интенсивность отказов Хэ(1+1).

Выражение (2) выведено при следующем допущении: все перешедшие в режим прямой трансляции АК образуют один сегмент, каждая из линий которого составлена из 1+1-ой последовательно включенных элементарных линий. Расчет, основанный на этом допущении, цает оценку искомой вероятности снизу с хорошим приближением.'

Проведен расчет вероятности отказа ОККС (Око=1-?кс) для "колец" с различным числом основных (in) и резервных (n-m).AK при зледуюших исходных данных (соответствующих опытному образцу, изготовленному в Уфимском ОКБ "Орбита": число основных линий Ъ=7;

ягсло резервных линий г=2; Результаты таковыг

10"

\=10"6; одо.

КЗ оо

г7

И Оке (П=3) О Qsc 0Ы6) i.

t = 1ч t = 10ч t = 1ч t = 10ч

г JL_ 5 3,19-Ю"11 3,80-Ю-9 15 1.34-10~10 t^T-IO""'8

1,07'10~12 7,12-10-1 ® 14. -'2,U.10~12 1.42.10"9

1.0Т-10"12 7.12.Ю"10 13 2,14-10*"12 1,42-Ю-9

. Из приведенной таблицы видно, что наращивать число резервных АК свыше двух бессмысленно.

Выведены выражения для расчета текущей надежности ОККС -Р*(5*Д), где Б*- одно из множества Б работоспособных состояний, в котором ОККС оказался на данный (расчетный) момент времени . Б определяется тремя, векторами: вектором номеров АК, содержащих отказавшие в обрыв СПТ, вектором номеров шунтированных АК и век.' тором чисел оставшихся резервных линий в каждом сегменте. Знание текущей надежности позволяет в полете оценить степень риска при дальнейшем использовании системы и, при необходимости, изменить стратегию выполнения комплекса задач, решаемых с помощью ВВС.

Сравнение вероятностей отказа ОККС и аналогичного по числу основных и резервных линий канала с конфигурацией линейной шины продемонстрировало значительные преимущества ОККС. Так, при числе узлов, равном 10, вероятность отказа ОККС на порядок меньше вероятности отказа шины.

В заключении сформулированы основные результаты работы.

В приложениях приведены вывод выражений для расчета надежности систем с облегченным, нагруженным и ненагруженным скользящим резервом, графическое изображение и назначение выводов БИС АК, протокол испытаний макета вычислительной системы на базе ОККС, акт внедрения, список принятых сокращений.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

Данная работа представляет собой научно обоснованную техническую разработку, обеспечивающую решение важных прикладных задач. Получены следующие основные результаты.

1. Показана целесообразность построения многомашинных. ВВС с "архитектурой малой кольцевой локальной сети. Предложена структура кольцевого канала связи, обладающего при небольшом объеме избыточной аппаратуры (менее 50%) надежностью и уровнем отказоустойчивости, удовлетворяющими требованиям к БЭО современных и перспективных самолетов.

2. В соответствии с сформулированными требованиями к протоколам нижних уровней взаимодействия объектов отказоустойчивой

- кольцевой ЛВС разработаны протокол маркерно-приоритетного доступа к каналу связи и структуры блоков данных. Разработана методика перехода от. формальных спецификаций протоколов к самосинхрон-

ным схемам управления.

3. Разработаны алгоритмы локализации неисправностей аппаратуры канала связи и средства, реализующие процедуру саморемонта. Предложена структура автомата контроля и восстановления.

4. Разработаны математические модели расчета надежности исходной и.любой образовавшейся после саморемонта конфигураций ОККС, позволяющие непосредственно в полете оценить текущую (оставшуюся) надежность канала и пересмотреть, при необходимости, стратегию выполнения полетного задания.

5. Предложенные архитектура кольцевого моноканала и схемотехнические решения легли в основу изготавливаемого в настоящее время комплекта БИС сетевого контроллера. В частности, БИС АК реалЛзуется на основе несксммутированного матричного кристалла 1548ЖЗ. Первая опытная партия изготовлена Воронежским НПО "Электроника" в 1991 году.

6. Существующая элементная база позволяет изготовить канал связи предложенной-архитектуры со следующими характеристиками:

-полоса пропускания - 10 Мбит/с;

-вероятность отказа (при числе точек подключения до 10) - <10~9 за 10 часов; -потребляемая мощность на один контроллер - до 5 вт.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1) Аппаратная и структурная организация средств контроля и восстановления в самосинхронном кольцевом канале / В.И.Варшавский, В.Я.Володарский, В.Б.Мараховский и др. // Автоматика и вы-числ. техника.- 1989.- JS1.- С.61-68.

2) Аппаратная реализация протоколов отказоустойчивого сачо-синхронного кольцевого канала / В.И.Варшавский, В.Я.Володарский, В.Б.Мараховский и др. // Автоматика и вычисл. техника.- 1988.-

С.60-68.

3) ВолодарскиЗ В.Я. Отказоустойчивая бортовая вычислительная сеть на базе кольцевого интерфейса с саморемонтом // Вопр. авиац. науки и техники. Технология авиац. приборо- и агрегато-строения.- Саратов, 1989.- Вып. 1.- С.81-84.

4) Володарский В.Я., Захарин B.C., Отказоустойчивая локальная вычислительная сеть на базе самосинхронного интерфейса // Тез. докл. Н Всесоюз. совет, по пробл. упр., сенг. 1989.- Таш-

Кент, 1983.- С.234-235.

5) Володарский В.Я., Мараховский В.Б. Отказоустойчивая многомашинная вычислительная система с кольцевым каналом связи. Динамические характеристики и оценка надежности // Методы и системы техн. диагностики. Математ. методы кибернетики и их прил.: Межвуз. науч. сб.- Саратов: Изд-во Саратовского ун-та, 1990,-Выц. 14, ч. 1.— С.134-135.

6) Володарский В.Я., Михеев В.Г. Отказоустойчивый процессор бортовой ЦВМ // Вопр. авиац. науки и техники. Технология авиац. приборо- и агрегатостроения.- Саратов, 1984.- С.48-50.

7) Володарский В.Я., Пильщиков В.В., Финкельштейн Р.Л. Отказоустойчивый кольцевой какал связи // Пробл. построения перспективных бортовых упр. вычисл. комплексов: Тез. докл. Всесоюз. совещ., сент. 1991.- Владивосток, 1991.- С.76.

8) Отказоустойчивый интерфейс многопроцессорной вычислительной системы с архитектурой типа кольцевой моноканал ( Д.В.Волков, В.Я.Володарский, С.А.Карпов, В.Б.Мараховский // Территор. информац. сети (К0МПАК 91):.Тр. междунар. семинара, окт. 1991.-Рига. 1991.- С.130-132-

9) Результаты разработки отказоустойчивого кольцевого канала связи / В.Я.Володарский, В.Б.Мараховский, В.В.Пильщиков, Р.Л.Финкельштейн // Многопроцессорные вычисл. системы: Тез. докл. Всесоюз. научно-техн. семинара, сент. 1991.- Таганрог, 1991С.63-65.

10) Структурная организация и протоколы обмена■информацией отказоустойчивого самосинхрснного кольцевого канала / В.И.Варшавский, В.Я.Володарский, В.Б.Мараховский и др. // Автоматика и вычисл. техника.- 1988.- М.- С.48-55.

ПОДО. К печ. 29.12.92. Офсетная печать. Печ.л. 1,0; Тираж 100 экз. Зак. *

Формат 60«84 1/16. уч.-изд.л. 1,0. Бесплатно.

Ротапринт УППО 450009, Г.УФА, ул. 50 лет СССР