автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка и исследование методов и средств надежностного проектирования специализированных ЭВМ с комбинированным резервированием
Автореферат диссертации по теме "Разработка и исследование методов и средств надежностного проектирования специализированных ЭВМ с комбинированным резервированием"
Иван Алексеевич Климов
Оперативно-розыскная деятельность органов внутренних дел как процесс познания
(проблемы теории и практики) Автореферат
Корректор Р.Н.Склянкина
Усл.печ. л 2,2 Тираж 100 экз.
Подписан в печать 27.04.95 г.
Уч.-изд. л. 2,0
УОП ЮИ МВД РФ
'МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНЖЕНЕРНО-ФИЗИЧЕСКИЙ ИНСТИТУТ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)
На правах рукописи "Для служебного пользования" Инв. N °50с|С.П Экз. N 15/
УДК 681.322.08
ЧУКАНОВ Всеволод Озирисович
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ И СРЕДСТВ НАДЕЖНОСТНОГО ПРОЕКТИРОВАНИЯ СПЕЦИАЛИЗИРОВАННЫХ, ЭВМ С КОМБИНИРОВАННЫМ РЕЗЕРВИРОВАНИЕМ
05.13.11. - математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей 05.1*3.13. - вычислительные машины, комплексы, системы и сети
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора технических
наук
Автор:
и
) У
, / / - г
МОСКВА - 1994
/ ,
- г -
Работа выполнена в Московском государственном инкенерно-фи; чеиком институте (техническом университете).
Научный консультант: д. т.н., профессор Чернышев Ю. А.
Официальные оппоненты:
1 д. т.н. , профессор Огнев V.B. д. т.н. . профессор Першенков B.C. д. т.н. Кондраисв А.Ф.
Ведущая организация: НИЦЭВТ
. \
Зашита состоится "_" 1994 г. в __ часов__mi
на заседании диссертационного совета Д053.03.'04. в МИФИ по адре< 115109, МоскБа, Каширское шоссе, д. 31, МИЙ1, т. 323-91-67, 324-84-!
С диссертацией можно ознакомится в библиотеке ЦИ<1-М.
Автореферат разослан "_"__- ' 1994 года.
•Бросим принять участие в работе совета или прислать отзыв в i ном экземпляре, заверенный печатью организации.
Ученый секретарь ^
диссертационного совета, . Л-
д.т.н. —— ' В.Э.. Вольфенгаген
ХАРАКТЕРИСТИКА НАУЧНОГО НАПРАВЛЕНИЯ .
Качество изделий электронно-вычислительной техники, в частности сзциализировакных ЭВМ, тесно связано с их надежностью. Вопросы щежности особенно важны в тех областях, ' где нарушения в работе ЗМ могут привести к авариям, катастрофам. Высокие требования юдъявляются к специализированным ЭВМ (СЭВМ),' работающих в необс-гашваемом и обслуживаемых режимах, для которых первый отказ пришит к невыполнению задачи. Для подобных СЭВМ вопросы обеспечения щежности являются особенно важными.
Различным аспектам проблемы обеспечения надежности СЭВМ с по-)щыо структурной избыточности посвящены труды A.M. Половко. U.C. ¡рбакова, И. А. Ушакова, С.М. Доманицкого, б. В». Гнеденко, А..Д. Со-»въева, А. Л. Райкина, В. И. Левина. В. А. Ведешенкова, В.Н. Митич-ша и др. Из зарубежных ученых большой вклад в ее решение внесли AVIZIENISMC.CLUSKEY. D. P. SIEWIOREK, ' F. P.MATHUR, Т. В. SMITH, C.OGUS и'др.
В настоящее врекя для повышения надежности широко используется . практике резервирование замещением (РЗ) и постоянное резервиро-ние (ПР). Для РЗ характерно обнаружение и отключение отказавшего
подключение работоспособного резервного блока. РЗ применяется гда. когда могут быть допущены перерывы в работе для обнаружения казавшего и подключения резервного блоков. Из известных примеров жно отметить многопроцессорную систему "ILLIAC-4".
ПР характеризуется тем, что передача и прием информации ведется раллельно по нескольким каналам сразу, а исправление ошибок, зникающих из-за.отказов и сбоев, осуществляется за счет внутрен-х свойств системы, без отключения отказавших блоков. При этом правление ошибок прэисходит автоматически без перерывов в функ-онировании специальными восстанавливающими органами или органичней связей между избыточными элементами. Здесь невозможно выде-гь основной и резервный блоки.
Необходимо заметить, что ПР используется как для повышения намости бортовых СсВМ, например, в космических кораблях для исс-цования планет солнечной системы "Сатурн", так и в наземных сис-«ах.
Б настоящее время .происходит увеличение степени интеграции уменьшение стоимости, энергоемкости и габаритов компонент СЭВК Появились и нашли применение БИС и СБИС выполняющие разнообразнь функции. Разрабатываются и применяются на практике микропроцессор и микропроцессорные системы и СЭВМ, транспьютеры.
Все это приводит к тому, что шире начинают использоваться избь точлые СЭВМ кратностью резервирования порядка 4 и более. В свя; с чем остро встает вопрос о рациональном построении таких уст ройств. Кроме того, появились СЭВМ с новыми специфическими требе ваниями, для которых использование либо РЗ. либо ПР во многих слз чаях не позволяет удовлетворить требованиям к СЭВМ, а именно большие времена функционирования, конструктивные ограничения i минима чьный" уровень резервирования, непрерывность функционировал! в течение всего времени работы/ простота контроля и диагностик! Это вызвано теми недостатками, которыми обладает каждый из эт! методов. Для РЗ характерно наличие перерывов в работе для отключ* ния отказавшего и подключения резервного блока й, как правил! сложность и большая стоимость разработки методов контроля и диа] ностики. К недостаткам IIP можно' отнести неэффективность использ! вания избыточного оборудования, т.е. наличие достаточного кол] чества работоспособных блоков при отказе избыточного устройств; невозможность удовлетворить заданным требованиям на надежность д. больших времен функционирования.
Недостатки РЗ и ПР привели к поиску новых решений в облас структурной избыточности, одним из которых является комбинирова: ное резервирование (КР).
Комбинированное резервирование - это метод повышения надежное за счет введения резервного оборудования при совместном использ вании методов РЗ и ПР. КР может реализовываться в виде: гибридно резервирования, итеративного резервирования, смешанного резервир вания. Гибридное резервирование реализовано, например, в СЭ "SPACE SHUTTLE". "FTMP". Итеративное'резервирование внедрено в Н "АРГОН". Использование смешанного резервирования широко распрос ранено на практике. Оно используется, например, в цифровой систе стабилизации орбитальной космической станции "SKYLAB".
Актуальность темы. Комбинированное резервирование может эффе тивно использоваться для повышения надежности ответственных сист или отдельных устройств СЭВМ, перерывы в работе которых недог
тимы, а требования на надежность достаточно высоки. Область ис-ользования КР: бортовые СЭБМ. СЭЕМ в контурах управления техно-огическиыи процессами, наземные системы сбора п передачи ответ-твеккой информации и т.п.
.В данной работе исследуются вопросы повышения надежности СЭБМ о омбинированным резервированием, а именно вопросы анализа и синте-а СЭВМ по критерию надежности.
Иелыо работа является теоретическое обоснование, реаение и бобщение задач повышения надежности СЭВМ с КР с учетом структуры, ходного потока задач, параметров контроля, реконфигурации, восс-ановления, режимов хранения, профилактики и'работы на основе ве-ификащш проектных решений и учета требований на надежность на тадии проектирования, а также создание средств автоматизации на-,ежностного проектирования (САШ). Для достижения цели решались следующие задачи: исследование современного состояния проблем проектирования СЭЕМ КР для Формулировки основных напразлениГ! исследований к опреде-ения их места г;о относешш к известным результатам в рассматрнва-мой области;
выбор и обоснование критериев анализа; '
теоретическое обоснование и разработка аналитических, нмитацион-ых и аналитико-статистических моделей надежности с ускорением, етодов и средств, позволяющих повысить точность анализа надежнос~ и па стадиях эскизного и технического проектирования; постановка новых задач и- разработка методов синтеза СЭВМ с КР; разработка алгоритмического и программного обеспечения СШ1 для ерификации проектных рекений на этапе проектирования, оценки и остижения необходимого уровня их надежности, а также надекгостио-о синтеза.
На защиту выносятся следующие положения: теоретические основы,проектирования СЭВМ с комбинированным ре-ервированием;
новые эффективные модели и методы анализа надежности с учетом ря-а определяющих факторов;
новые методы синтеза СЭБМ с КР по критериям надежности: алгоритмическое,• программное и методологическое обеспечение про -есса проектирования СЗВМ с КР;
результаты проектирования, производства и эксплуатации 22 типог-ЭВМ с КР.
Методы исследований. . Теоретическое обоснование, разработка моделей и методов решения проектных. задач, . а "также юсисс'ледованш проводились с использованием математического, аппарата теории множеств, графов, алгоритмов, вероятности, математической статистики, комбинаторики, ЭВМ и систем, марковских цепеГ} с непрерывным и дискретным временем,~интегрального исчисления, .теории оптимизация.
Экспериментальная проверка научных,положений, выводов рекомендаций выполнена,методами моделирования на ЭВМ. натурального моделирования и решением проектных задач в.процессе внедрения и промышленной эксплуатации СЭВМ. с КР. " .'...--"■.■•' "
Научная новизна ~ заключается в создании теоретических и 'методических основ для решения задачи повышения надежностных характеристик СЭВМ с КР с учетом структуры, -входного--потока задач, параметров контроля.: реконфигурации и восстановления, режимов хране: ;ния, профилактики и работа, з тем числе: . . ' -
- в выборе и теоретическом.обосновании критериев оценки надежное™ и для учета указанных факторов; ,-
- в .новых аналитических моделях надежности СЭВМ с КР,в том числе одномагестр^льных. ■ многомагистральных и регулярных структур; .-■-.
- в новых методах ускорения аналитико-статистического моделирования; ' ■ ... - . ■, "' "■••'■'. -"
- в оригинальной имитационной модели СЭВМ с КР;.
- в новых задачах и методах синтеза для совместного выбора уровней, кратностей резервирования; параметров систем контроля, реконфигурации и ,т. д. при наличие ограничений, заданных в виде неравенств и равенств; " -- : .
- в решении задачи расстановки контрольных точек,о коррекцией'промежуточных результатов аналитико-статистическими моделями с ускорением; '". , ; - ■ , ; ; - - '■'. ■
- создании алгоритмических основ для автоматизации проектирования СЭВМ с КР; ,/ - '- ■ ; '■'•'.'; ■ .V: '
- в исследовании влияния основных факторов на надежность и основных погрешностей.'! . , . .
Научная значимость - определяется распространением научно-обоснованного процесса.проектирования СЭВМ с КР для различных классов СЭВМ, исследованием и разработкой новых методов и моделей надежностного 'проектирования, -формированием принципов и .алгоритмов
ЗАНП. "'.Таким образом результаты диссертации могут быть классифици- • эованы'как'теоритическое обобщение и решение круг ной научно-технической, проблемы, имеющей- важное народнохозяйственное значение.
Практическая ценность - определяется .возможностями 'САНП, разработанными . на основе предложенных' методов и моделей для решения проектных задач и соответствующих им алгоритмов. Применение САНП позволяет: ■ .'■ ; ■'.'.■'• .■'"'
- при существенном сокращений трудоемкости проводить анализ надеж-гости СЭВМ с, КР с учетам целого ряда факторов и оптимизировать 1роектные решения в соответствии, с результатам анализа в рамках ютода последовательных приближений;
•' существенно сократить трудоемкость синтеза СЭВМ с КР на различ-!ых уровнях (структурном. Функционально-логическом л т.д.) ■ повысить достоверность моделирования., . . .
Достоверность теоретических результатов подтверждается логичес-.ими доказательствами основных положений, рыводов и рекомендаций, х экспериментальной проверкой, а . также результатами опытной и ормышленной эксплуатации конкретных типов СЭВМ с КР (в частности, О образцов СЭВМ в НИИ "Арг.он", .'СЭВМ "АШТ" - срок эксплуатации .5 .года) ."...,■'.
.Внедрение результатов работы. Методы надежностного анализа и интеза реализованы в САНП, ориентированных на ЭВМ IBM PC. Научные гзультаты работы внедрены и использовались в научно-исследова-эльском институте "Аргон" при проектировании 16 типов СЭВМ с КР зобрава статистика по отказом 40 образцов одного типа СЭВМ в зкс-нуатации). в Государственном научно-производственном объединении \гат", во ВНИИТФА (одна из СЭВМ с.КР внедрена на Электростальоком ишностроитэльном заводе, для другой собрана статистика по отка-хм в течении 4,5 лет эксплуатации),' в "Вестерн Эмба Геофизика" Сазахстан), в Центральном научно-исследовательском институте "Ко-:та", в Опытно-коиструкторском бюро "Альфа" (г.Минск), в ГСПИ, в тбном процессе кафедры ЭВМ МИФИ - разработан и внедрен в учебный юцесс электрокнный учебник по курсу "Надежность, контроль и ди-■ностика ЭВМ", при выполнении курсовых и дрпломных проектов.
Апробация работа. Основные результаты докладывались на Вто-й Всесоюзной конференции "Проблемы надежности при проектировании стем управления (Черновицы, 1976 г.); IV Всесоюзной конференции днородные вычислительные системы и среды" (Киев, 1975 г.); на ре-
тональном научно-техническом семинаре "Надежность технических с стем" (Ростов-на-Дону, 1975 г.); на школе-семиНаре "Современное сс тояние автоматизации и теории проектирования дискретных устройстЕ (Львов, 1977 г.); Всесоюзной конференции "Математическое обеспеч« ние моделирования сложных систем" (Киев,1977 г.); VII Ленинграде кой конференции "Повышение качества и надежности промышленных H3j лий" (Ленинград.1978 г.); на семинаре "Надежность сложных техничг ких систем (Москва, МДНГЛ, 1979 г.); на научно-технических конфе; нциях и семинарах МИФИ (1977-1993 гг.);на семинаре "Современные i тоды разработки РЭА"- (Москва, МДНГП, 1974 г.); на конференции "I тоды прогнозирования надежности проектируемых РЭА к ЗВА" (Пензг ПДШ'П, 1987 г.): на III Всесоюзном совещании "Надежность и эффя тквность АСУТП и АСУП" (Суздаль, 1984 г.); на зональной конференц; "Математические и программные методы проектирования информациони и управляющих систем" (Пенза. ПДНТП, 1990 г.); на Всесоюзном нау но-тсхническом совещании "Автоматизация проектирования систем а: тематического и автоматизированного управления" (Таллин. 1976 г. ка семинаре "Вопросы обеспечения надежности сложных техническ систем на этапах разработки, производства и эксплуатации" (Москв МДНТП, 1981 г.); на республиканской конференции "Автоматизирова ное техническое проектирование электронной аппаратуры" (Кауна 1982 г.); на отраслевой научно-технической конференции "Проблем методы и опыт создания автоматизированных систем управлен связью" (Москва, 1985 г.); на Всесоюзной конференции "Повышен качества и надежности ПО ЭВМ и технических средств обучения" (Ку бышев, 1989 г.); на Всесоюзном совещании "Надежность, живучесть безопасность автоматизированных комплексов" (Суздаль. 1989 г.): 1-ой Всесоюзной конференции "Методы анализа надежности программн го обеспечения вычислительных систем реального времени на оснс моделей нечеткой логики и качественных описаний" (Киев. 1987 г. на семинаре "Проблемы обеспечения эксплуатационной надежное сложных технических систем" (Москва,- МНДТП, 1983 г.); на семиня "Вопросы проектирования микропроцессорных систем и их применен* (Киев, 1983 г.); на совещании-семинаре "Автоматизация проектироЕ ния микропроцессоров, микропроцессорных систем и СБИС" (Симфег поль. 1984 г.); на Всесоюзной конференции "Современные пробле информатики, вычислительной техники и автоматизации" (Коске ВДНХ. 1988 г.); на семинаре "Методы экспериментальной оценки i
дежности технических систем" (Еовороссийск. 1983 г.); на конференции "Оценка и обеспечение длительной работоспособности изделий электронной; техники в радиоэлектронной аппаратуре народнохозяйственного назначения" (Севастополь. 1981 г.); на республиканской конференции "Машинные методы технического проектирований электронно-вычислительной аппаратуры" (Каунас. 1983г.); на совещании-семинаре "Актуальные проблемы"' автоматизации проектирования ЭВМ (Симферополь, 1993 г.); на Всесоюзной"школе-семинаре "Диагностика микроэлектронной аппаратуры" (Харьков, 1990 г); на постоянно действующем семинара "Надежность и качество функционирования систем" (филиал семинара по проблемам надежности АН СССР) (Москва. МИИТ, 1981 г.); на научном семинаре ИЛУ (Москва, 1988 г.). '
Публикации по теме диссертации. По теме диссертации опубликовано 88 научных работ,. из них 45 является печатными, в том числе статьи в научно-технических.журналах, тезисы .докладов, препринт, алгоритмы и программы 'в ГФАП, отчеты по научно-исследовательским работам. в которых автор был научным руководителем.
'Структура и объем диссертации., Диссертация состоит из.введения, семи глав, заключения, списка литературы из' 130 наименований и приложения. Общий объем - 293 страницы, в том числе 47 рисунков и 28'таблиц,
ОСНОВНОЕ СОДЕРЖАНИЕ РА5ЙЫ. "
Из методов комбинированного резервирования можно выделить -гибридное резервирование (ГР) (мажоритарное ядро с резервом), параллельно-гибридное резервирование (ПГР) (несколько однородных мажоритарных ядер и общий скользящий резерв). итеративное резервирование (ИР) (методы резервирования вложены один в другой).
Для анализа надежности СЭВМ с. КР можно использовать аппарат полумарковских процессов, марковских процессов, теоретико-вероятностный метод. Это шалитические методы анализа надежности.
К их. числу также относятся: методы коэффициентов структур "<о - !^тод минимальных сечений. Расчеты с использованием метода коэффициента структуры дают верхнею оценку функции надежности структуры, они имеют хорошуэ точность, малый объем вычислений. Этот метод позволяет легко проанализировать влияние структур : на надежность интегральных схем, что весьма важно при оценке раз-
личных вариантов структур. ; • -'
Метод минимальных сечений дает нижнюю границу надежности систс мы, которая тем точнее, Ччем ближе надежность составляющих ее элс ментов к единице.
В зависимости от сложности устройства, от точности, которе предъявляется к оценке его надежности, в одних случаях достаточ! бывает применить аналитические методы оценки кадехнооти,- - в друп: случаях необходимо использовать метод имитационного - (статистичес кого) моделирования. -'
Сочетание аналитических моделей и имитационных дает, больше класс аналитико-статисткческих моделей, которые успешно применяют ся на практике. • .
В данной работе разработаны модели надежности СЭВМ с КР, учить вакщие основные факторы: .
1. Структура устройств. - '
2. Входной поток .задач. . •
3. .Параметры качества контроля и реконфигурации (вероятностны и временные характеристики).
4. Режимы хранения, профилактики и функционирования.
5. Отказы, сбои.
Анализ литературы показал, что указанные факторы недостаточн полно учитываются в существующих моделях, а в ряде случаев вообц не учитываются..
В работе предложено множество моделей надежности для разны этапов проектирования, отличающих сложностью и точностью, решен основные задачи надежностного синтеза, которые недостаточно преде тавлены в литературе. . ■ ... "
В настоящее время используются два основных метода обеспечени заданных требований к надежности СЭВМ:- повышение надежности под систем СЭВМ за счет введения в них структурной избыточнооти-резер вирования; введение реконфигурации - использование аппаратных программных механизмов исключения отказавшего узла и выдолнени его функций другими узлами. Предполагается, что подсистема .СЭВ представляет собой узел с КР. -
Обобщенная логическая схема надежности СЭВМ *,представляется виде графа И узлов. Отказ одного из узлев С ЭВМ представляет собо нарушение передачи информации через этот узел и ведет к необходи мости реконфигурации СЭВМ за некоторый заданный интервал Л^ завк
/
вдй от режима работы системы и требований к ее функциональной ззотказностк. Введем основные характеристики'реконфигурации.СЭВ'! вероятности Ш) реконфигурации СЭВМ га Л1 при отказе 1-го ул-1 (1=1,Ю. Каждый узел состоит из . (15+Ю блоков, •]? из которых обязуют мажоритарное ядро и работают на восстанавливающий орган ;0) - мажоритарный элемент. М блоков находятся в резерве, и при гказе одного из блоков ядра на его место подключается один из М ззервных блоков с помощью комму^тора К, который называют рекон-1гуратором узла.. Каждый блок состоит из и типов процессоров (мик-шроцессоров. процессоров-на СБИС, БИС или'матричных БИС). П^ -шло процессоров ,3-го типа (3=1. ш)., В "каждом блоке .кроме основных юцессоров 3-го . типа имеется 1с, резервных, которые подключаются в 1учае отказа по скользящему принципу,- В каждом блоке процессоры )гут соединятся на основе шинной -организации. В этом случае к ждой шине подключается свое ЗУ, при.изменении значений Е. М, п3,
получим различные типы резервирования.
Определим теперь работоспособность СЭВМ за время I как работу !3 отказов или с отказами не более, чем (И-Ь) узлов с реконфигу-щией СЭВМ за время ДЬ, тогда общее теоретико-вероятностное вкра-!ние функции надежности СЭВМ примет следующий.вид:
г.,ЛЬ).
где; Рс - вероятность, того, что не менее Ь узлов СЭВМ работос-собны в течении времени Ь; Ь - минимально допустимое число рабо-способньк узлов: Р! - функция надежности 1-го узла.
Разработаны три группы методов моделирования надежности избы-чных перестраиваемых структур с КР (избыточных узлов СЭВМ). Пер-я группа методов основана на аналитических оценках наделзюсти рсстраиваемых СЭВМ: теоретико-вероятностный метод, метод путей и чении. метод .маркодских и полумэрковских процессов и т.д. В стности. для ^восстанавливаемого узла с КР, 'содержащего (КьМ) избыточных блоков, каждый из которых содержит В элементов, раз-ботан ряд моделей надежности, основашшх^на различных по времени трудоемкости способах оценки вероятности функционально безотказ-й работы узла за время I: •
i
с ■ -
pcr»*) b(r*m)-1 1 в (r»w) __
P(t)=l- I P5(t) 0,(t) 2 " S^At),
где: 1 - минимальное число элементов узла, отказ которых может привести к временной неработоспособности, т.е. к необходимости реконфигурации; Рэ(t), dg(t) -соответственно, вероятность безотказной работы и отказа за время t одного узла, для простоты все элемента узла полагаются равнонадежными; Sj 3(At) - вероятность неперестройки узла за заданное Бремя At в случае 3-ой отказовой ситуации, определяемая . быстродействием контроля, возможностью потери информации и т.д. Под 3-ой отказовой ситуацией понимается определенная совокупность 1 элементов узла, -отказавших за время t.
Вторая группа методов - аналитико-статистические .методы моделирования обеспечивают получение оценки P(t) с погрешностью от 5 до 15% за приемлемое время.
Третий мэгод чисто статистического моделирования, реализованный в форме системы иммитационного надежностного моделирования "СИМ", позволяет вести прогнозирование надежности многопроцессорных вы-' числителей с учетом большего числа факторов по сравнению с " предыдущими методами. .В частности, он позволяет учесть: тип резервирования (горячее или холодное); тип мажорирования (аппаратно или программно реализованое);• тип контроля (непрерывный, лериодичес-кий, встроенный, на основе сравнения, тестовый, алгоритмический); •целенаправленную реакцию на сбои и отказы, заключающуюся в локализации отказавших вычислителей и замене их на -работоспособные, в перераспределении, если это необходимо, задач между вычислителями и возобновлении вычислений с некоторой контрольной точки; ремонт отказавших вычислителей. .--. .
Рассмотрим вопросы разработки . аналитической модели надежности высоконадежных устройств с KP с учетом структуры и качества контроля. ' - Определим функционально безотказную работу устройства как работу без ошибок.» работу с ошибками, обнаруживаемыми или,исправляемыми системой контроля (CK). В качестзе основного критерия функционально безотказной работы невосстанавливаемого устройства выберем вероятность функционально .безотказной работы (ВФВР) за некоторое время i. ' . ' .
Показано,,» что при определенных допущениях'ВФЕР устройства монет цгь записана как .■.-.'■■.
Рвфвр <с,> ■
где: К(ь) - коэффициент качества (КК) устройства с контролем; ', :. .РцЦ) - вероятность правильного Функционирования неконтро-ируемой.части оборудования. • ; • . .
Сформулируем теорему..
Теорема 1. Вероятность безотказной работ^ устройства с КР крат-остью В, размером минимальных сечений И, вычисленная для логичес-ой схемы надежности "б,," - Р(бт), стремится'к вероятности безот-азяой работы, определенной для логической схемы."б" - Р(б). при
Пт Р(бт)=Р(б") • •
г:-»-О
Пусть: ЧкцШ - вероятность "отказа . элементов, входящих в -ое минимальное сечение (¿=1,АЛ);
0.й^ - вероятность пропуска ошибок системой контроля. • Сформулируем теорему: ■
Теорема 2: Для устройства с КР нижняя граница вероятности функ-юналько безотказной работы за время Ь определяется выражением:
"А »
' Рвфбр> П Г5-ак0 СЬ) :
3 = 1
■ Для достаточно широкого класса-устройств с КР, с числом элемен-1В~15-100 суммарная погрешность составила (по вероятности функци-шьнслч) отказа): , . '
а) для метода минимальных сечений - конкретной структурно-логи-?схой схемы устройства - 5-1 ОХ; • "
. б) для приближенных структурных логических схем надежности ->-20%. ' . .'•"'."'. " , . - В работе приводятся1аналитические комплексные додели надежности •ВМ с КР с учетом характеристик контроля и временных соотношений ■жду моментами появления- ошибок, их обнаружения системой контроля появления на выходе вычислительной.системы. -'Одной из важнейших задач, ■ возникающих при надежностном проекта-вании СЭВМ с КРс восстановлением, является задача оценки ее го-вности. При оценке готовности системы должны учитываться наибо-е существенные параметры ее безотказности, контроле- и ремонтоп-годности. • • ' ' ■
Разработан метод определения коэффициента готовности избыточной
■ восстанавливаемой системы б КР, состоящей из" В неизбыточных бло-
■ ков. какдьй из которых характеризуется.интенсивностью'Отказов X.
Особенностями данного метода является то, что, во-иервых, он позволяет оценить выигрыш в надежности системы за счет введения е нее режима профилактических работ и. - во-вторых, дает возможность учесть частичное восстановление системы в процессе профилактики.
В СЭВМ с КР резервирование может вводиться•как в отдельные узль (подсистемы), так и на уровне СЭВМ в целом. ...
Метод реконфигурации. Надежность СЭВМ может.обеспечиваться путем перераспределения функций иеязу узлами. Для СЭВМ. работающих'в реальном времени, важной характеристикой является величина Б(Ди -вероятность реконфигурации СЗВМ за время при появлении отказавшего узла. ■ • ■ ' . ' . .
Получены общие теоретико-вероятностные выражения вероятности функционально безотказной работы СЭВМ за время I.
Меюд восстановления. Для обеспечения . работоспособности СЭВМ может ярлмонятьск также, метод восстановления (ремонта) отказывающих узлов, при котором СЭВМ не рек.онфигурируетоя, как в предыдущем случае, а происходит-выведение отказавшего узла в режим ремонта. При этом, за счет избыточности, СЭВМ продолжает оставаться работоспособной. • ■■ '
Выведены общее теоретико-вероятностное .выражение коэффициента готовности СЭВМ. '
Проведен анализ надежности, одномагистральных структур с учетом периодов хранения, готовности и работы. Рассмотрены СЭВМ о КР для ' обработки данных, состоящие из трех основных функциональных блоков: а) устройства ввода/вывода информации, б) шины, в) центрального обработчика данных. Центральный обработчик (СРИ) представляет собой резервированную структуру из п вычислительных модулей (ВМ), которая работоспособна при наличии не менее, чем (п-р) исправных модулей, где р - пороговое значение■числа неисправных ВМ в систе-'ке. Пока число неисправных ВМ меньше или равно р, система считается работоспособной. 'Представленная СЭВЫ может находиться в трех режимах: хранения, готовности и работы (выполнения задачи ). При любом из режимов состояние блоков системы может быть проконтролировано одним из видов тестового или аппаратного контроля. . .
- i5 -
" Рассмотрено несколько альтернативных архитектур построения системы и обеспечения ее надежности. Разработаны аналитических мода• лей надежности СЭВМ различных архитектур.
Модели надежности созданы для СЭБМ, работающих в трех режимах. Модели учитывают: наличие периодической профилактики в режиме хранения. возможность' изменения общей структуры СЭВМ при переходе от одного режима к другому, менее жесткие требования к работоспособности СЭВМ( например, возможность необнарукения неисправных ЕМ на ранних этапах), а таете ряд других Факторов.
Исследования по .разработанным для СЗВ!4 с К? аналитическим моделям показали, что основной вклад в ненадежность системы вносит период хранения! " -
Рассмотрен анализ надежности многомагистральных структур. Рассмотрена многомагистральная СЭВМ с КР из if процессоров с R рабочими процессорами и (N-R) процессорами, находящимися в "горячем" резерве. Система построена по М-канальному принципу', т.е. еодзчж: '.'. магистралей, по каждой из которых передается информация для К/й Элоков (процессоров). Введем.-индекс 1 - число исправных магистра-пей в системе ( число работавших каналов). Тогда минимальное количество исправных магистралей,- при котором система может работать травильно, определится из условия: • _ R И
/ ' . В качестве примера рассмотрена модель надежности 16-процессор-1бй вычислительной системы, " работающей по принципу "5 из 16".
Рассмотрена СЭВМ' о КР, которая представляет собой вычислитель-до сеть и имеет в своём составе от нескольких тысяч до нескольких 1есятков тысяч транспьютеров, ' который в дальнейшем будем называть ^числительными модуляяК(ВМ). В состав-СЭВМ входит несколько десятков корневых-узлов -(типа IBM PC), т.е. рабочих мест нользовато-1Я через которые происходит ввод/вывод. Каждый ВМ в исправном состоянии связан с четырьмя другими Вй. Реиающее поле из всех ВИ гз '.ачестве пространственного эквивалента представляется тором. Конс-груктивно,все ВМ помещаются в нескольких стойках (секциях). / Операционная система СЭЕМ при отсутствие отказов и сбоев В'Д збесночивает выделение необходимого количества ресурсов (числа ВМ) утя каждого пользователя и организацию соответствующего решающего юля. Очевидно, что даже в отсутствии отказов и сбоев невозможно
организовать вычислителышй процесс таким образом, чтобы в каждый момент времени были задействованы все ВН Иными словами коэффициент использования ресурсов такого рола изделий всегда меньше 1.
Яалежкостньв свойства СЭШ в процессе функционирования достаточно полно представляются показателями: 1. коэффициент полезного технического использования, который определяется как отношение суммы отрезков времени для каждого вя, в течение которых он ревел различные задачи без повторения отдельных участков. или шпиком ьоей . задачи, к общей длительности времени применения изметя по назначению. Z.Jfc)- недостоверность ^уккциовированйя за время V .
Разработана методика сценки нахезшоста. Предлагается проводить числедноо моделирование показателей надежности следуводеи образок: -1. Модель надежности задается, .в виде цепи пли набора цепей с дискретным времоием 'л еоотзетс'вушш -матрицами переходанх вероятное гей .•.-".2. Вычисление численных значений показателей надежности ■ осуществляется путем -обработки по соответствующим алгоритма!,Г матриц переходных вероятностей. • -
Приведем выражения для соответствующих -.вероятностей переходов между состояниями дискретной цепи.- '
Значения коэффициентов полезного использования и-недостоверности функционирования могут быть получены путем решения' системы линейных уравнений, вида: . /
»•»г. . '
где: F - матрица, составленная из значений вероятностей переходов. X - корни системы уравнений. '.-.-.
Разработаны средства анализа и повышения надежности СБИС.на ос-, нове комбинированного резервирования/- Появление н развитие нопог класса вычислительных устройств СБИС и устройств на СБИС - привело к новым формулировкам традиционных задач надежностного проектирования: задачи анализа надежности проектируемого устройства я задачи синтеза его надежностной структуру.;. • -'.•• Рассмотрены-следующие задачи анализа: а)' оценка надежности ге-пзбыточных СВИС с учетом технологических факторов и параметров режима работы,- б) .построение моделей надшшиги резервированных (из- ' бКТОЧНЫХ) СВИС С К!'. '
Решена задача синтеза надежностной структуры СБИС с точки spe-
мия выбора резервируемых: блоков и элементов СВИС ( определю«« уровня резервирования), выбора способов их реийрвпрсваиия, о так-к поиска рациональных значений других паракстрои СБИС, котора- шгут варьироваться в процессе проектирования.
Основной задачей работы'являлась разработка алгоритма и струн туры программного комплекса;явтоматизировашюго изде^осгного про -ектироваппя СБИС, который позволял бы ре<доь сфориулировашя? задачи надежностного анализа и синтеза..
Проведало шшационаое моделирование на^озпостя сп^шкшкипо -ванных ЭВМ с комбинированным резервированием, оап-з'-яс и,лея метода имитационного модеотрования состоит в том, что многократно «^производится некоторая формализованная' схема, янляюшг-зоя в г.дг?оч случае формальным дагемятичвекик описанием процесса фупгщН'Н'араг'Шия реальней схемы и в другом случае выетупшия н качество такого рода математической модели, вероятностные характеристиками которой адекватны ргэеяияи задач математического аагшта.
Постановка задачи расчета надггиости кзбиточких систем, работа-ощвх по принципу КР с учетом структуры и кчч&стьа контроля, была формулирована ранее..
Рассмотрен алгоритм статистического моделирования для устроИе-гва с КР. • '
Существенным недостатком метода статистического' коделпрования ря оценки- надежности СЭВМ с КР при большой структурной пзбьтсч-юсти системы и высокой надезкпости элементов является знзчителыше ¡атраты машинного времени. Основное затраты времени при атом палате на моделирование состояний элементов при большом их количестве I больном числе реализаций процесса Функциспкрованпя системы и на ¡зшявяый анализ .реализации этого процесса для определения уровня работоспособности СЭБМ.
На практике применяется ряд способов повьшояим эффективности юделирувдих алгоритмов, обеспечиваадх снижонко одной «ли обоих тазанкых составлявших затрат мышиного средени. Основу их о,оставляют следующие принципы:
1. • Ускорение процедуры одделировяодя реализаций 'процесса Фун--' кциочмрсвания СЭВ!.!;
2. Повышение "ипФормацкониоге" содержания реализаций ¡¡раасса'
Функционирования СЭЕИ; •
рассмотрен ароцехе расчета набожности, он с.-осгокт па чсигрс-х тапав..
Известные методы расчёта объединяются в две группы. Одни ускоряют и упрощают вычисления на втором этапе (преобразуют логическую схему надежности), другие предназначены для расчётов но неизмененной схеме (это теоретико-вероятностные методы, метод статистических испытаний). • : ,• . -
Предложена классификаций методов, построение^ по признаку принадлежности к этим двум группам.
Примером метода структурных коэффициентов может служить метод " ¿", который упоминался выше. Получение сечений и путей также применяется на втором этапе расчета надежности.
Бо вторую группу включены аналитические (теоретико-вероятностные) методы расчёта надёжности и статистическое моделирование.. Методы статистических испытаний в свой очередь распадаются на подгруппа:
- метод, в котором моделируются только состояния системы, вхлючаил;йе не менее к отказов; -
- групповое . моделирование; -. J
и другие.
Первые два метода получены совмещением аналитических расчетов и статистических испытаний имитационной модели.
Данная классификация даёт возможность определить место методов ускорения,* описанных далее, во всем многообразии методов расчета надежности. • ■
Предложен метод ускоренного эналитико-статистического моделирования на основе минимальных сечений. С использованием группового мпюда и метода минимальных сечений разработан следующий метод расчета надёжности СЭВИ с KP.
Пусть h - гипотеза исправной работы системы. Тогда P(h/Hi) -вероятность исправной работы системы, если известно, что отказало 1 элементов. Следовательно, вероятность безотказной работы системы при отказе 1 элементов равна:
PUnH£)«p(HOP(k/Hi)
В данном алгоритме поиск минимальных сечений производится ' не перебором всех возможных состояний, ке с помощью приближенных ана-/дпическдас формул, а статистически.
С ппяощьв тчк.-»го алгоритма можно оценить структурные параметры нослсдуемого устройства. 'Например, наиболее вероятное количество
отказавших элементов, приводящих к отказу системы.
Аналитико-статистический- алгоритм позволяет уменьшить количество испытаний И имитационной модели по сравнению с методами полного перебора состояний системы, алгоритмического поиска минимальных сечений для систем с большим количеством элементов при условии, что требуемый уровень точности достигается.
Разработан комплексный метод ускоренного аналитако-сгатисткчео-лого моделирования. Комплексный метод получения оценки Рвфбр основан .на комбинации известных, способов ускорения статистических испытаний с целью повышения эффективности алгоритма вкяпитико-ста-тистического моделирования СЭВМ с КР с такими параметрами:
1) малая вероятность отказа;
2) большое количество элементов.
Именно в этой области время моделирования сильно возрастает.
Основу алгоритма составляет моделирование только состояний с КЖо отказами; Это позволяет не рассматривать -те реализации, в которых система заведомо неисправна, а только вычислить вероятность появления. В той части алгоритма, .где моделирование отказов элементов производится по безусловны!! распределениям, возможно применение группового моделирования ( определение случайных номеров отказавших элементов), которое эффективно для систем с большим количеством элементов, для повышения точности оценки Рвфбр (а значит и уменьшения времени, необходимого для достижения заданного уровня точности) в области малых вероятностей отказа в алгоритме применяется эквивалентные преобразования, то есть уменьшение надежности элементов системы.
Коэффициент ускорения полученного метода по сравнению. со статистическим моделированием складывается из коэффициентов ускорения гех способов уменьшения, времени моделирования, которые были применены при разработке метода.
'Создана система имитационного надежностного моделирования ("СНМ") специализированных ЭВМ с комбинированным резервированием. "СНМ" СЭВМ с КР представляет собой систему имитационного нздек-юстного моделирования. Система позволяет проводить анализ надежностных характеристик проектируемых многопроцессорных струк-гур с резервированием 'и восстановлением. При этом система ориенти-эевана как на многошинные, так и на конвейерные многопроцессорные структуры.
В "Ш" при" реализаций механизма моделирования'основной упор сделан на ускорение времени моделирования". -Вместе с этим ; особое, ышшаииэ также уделено как «озио. более точному имитированию, процессов, протекающих в системе. •....В данной системе вычисляются следующие показатели надежности;. -
1. Показатели безотказности:
1.1. Вероятность отказа (сбоя).
1.2. Среднее время работы между отказами (сбоями, .ошибками).
"'"1.3. Среднее ррсия наработки на отказ -(сбой, ошибку).
?.. Показатели достоверности: ' • •-•'..
?Л. Достоверность правильной информации по сбоям.
Р.. 1. Достоверность правильной информации по отказам. - .
?,Л. Достоверность правильной-информации, по ошибкам. В данной системе введены три вида критериев отказа системы по задачам: , ■
1. Отказ системы наступает тогда, если хотя бы один из основных пакетов задач решается неверно. -
2. Согласно 2-иу критерию отказ системы наступит, если неправильно решается аварийный пакет задач.
3. По третье;.:/ критерию пользователем задается список - пакетов (которые могут быть как основными, так и аварийными), которые должны решаться. Если хоте бы один из них решается неверно, то наступает отказ системы. | '
С помощь» разработанной системы исследовался ряд конкретных избыточных СЗВМ. При этом для систем, содержащих порядка 50 элементов, при обработке пакета в 10 задач, для количества испытаний пакета 1роо время моделирования составляет около'30 минут. Аналкзи-русалжъ снеге;,",и до. 256 процессоров.
Р. работе решены задачи надежностного синтеза структур.. специализированных ЭВМ с комбинированным резервированием. •Разработан ко-' год определения параметров специализированных ЭВМ с комбинированным резервированием на основе сведения, к системе уравнений. Расс мотрим задачу оптимального резервирования для случая, когда необходимо определить параметры устройств СЭВИ с КР (уровни,кратности резервирования на разных уровнях вложшия для ИР, параметры систем контроля и т.д. ) и обеспечить при этом требования технического задание по нескольким'критериям (вероятность безотказной, функцио-
нально безотказной работы, вероятность решения пакета задач, сред-'нее время безотказной работы и т.д.) и ограничениям (объем оборудования, габаритные характеристики, рассеиваемая мощность л т.д.), з&данных в виде равенств.
•Пусть , . - вектор искомых параметров;
^ (V,, ... ,У„)Де1)Ч, -функционалы, отражающие зависимость критериев от искомых- параметров;
... ~ функционалы. отража;с:цие зависимость
Ограничений от искомых параметров;
Л.' - количество критериев; (Ж-Я) - количество ограничений.
В общем случае задача формулируется следующим образом.: Найти такие£^. чтобы обеспечить параметры {с (заданная вероятность безотказной. . функционально безотказной работы, заданная вероятность решения пакета задач за заданное время и. т.д.. а также заданные объем оборудования, вес, габариты и т.д.) из технического задания, т.е. необходимо решить систему уравнений :
Эта система, вообще говоря, несовместна при!п>п, и для неизвестных величин ищутся наиболее вероятные значения. Наиболее вероятные значения неизвестных можно определить при условии, если сумма квадратов отклонений будет наименьшей.
Наиболее эффективным методом .является метод Пауэла, который при некоторых условиях ( в том числе ка выпуклость функции) позволяет найти оптимум заЛиагов.В данной работе этот метод использовался для решения поставленной задачи. Рассмотрим модификацию метода с ориентацией на реализации его на ЭВМ.. При больших значениях^мно-жество разбивается на 2 группы - первичные переменные и вторичные
| ; ^ - первичные;
переменные
3 С е ^ + ** -вторичные.
Разбиение .может определяться важностью параметров при надежностно!.! проектировании. ' .
Если выполняется ряд условий',- алгоритм дает оптимальное значение. В противном случае - дает приближенное значение, но позволяет ' гибко варьировать временем решения на-ЭВМ, что важно при итеративной характере надежностного'проектирования.
Предложен метод выбора уровней и кратностей итеративного резер-' вирования для нескольких уровней вложения.Рассмотрим случай. когда для каждого устройства СЭВМ с ИР и для каждого уровня вложения необходимо определить вектор ^ у 3 ^ ^ , ^ £ )
Кб- ^У-д. - где-.Г - количество устройств СЭВМ с КР, ' -количество уровней вложения ¿•_го устройства. При этом имеется один критерий, например, вероятность безотказной работы и несколь-, ко технико-экономических ограничений (Т\Э.П.). - количество.-резервных блоков К-го уровня вложения:^" уровень резервирования К-го уровня вложения. Математически задача сводится к задаче ой-' типизации нелинейной функции при нелинейных ограничениях.
Для решения поставленной, задачи разработан алгоритм на основе градиентного метода и усеченного сканирования, который■ позволяет гибко варьировать временем решения и точность» решения.
Идея метода сводится к следующему - процесс решения разбивается на шагов, на каждом шаге определяется номер устройства, увеличение объема оборудования которого на величинудб-дает максимальный выигрыш в надежности СЭВМ. Определение У; и Ч: производится на основе усеченного сканирования.
При использовании данного метода важным моментом является выбор к. этот параметр определяет обьем вычислений и точность. Величину перебора для распределения оборудования можно определить (•все оборудование добавляется к устройству Ь ):
где : Ч^ - объем перебора для вычисления ^ , ^ ^ ; <£> - объем перебора для определения »лау .
При выполнении ряда условий данный алгоритм сходится к точному решению.
Решена задачи выбора контрольных точек в специализированных ЭВМ с комбинированным резервированием. В процессе проектирования СЭВМ со сланными видами избыточности встает ряд задач надежностного
синтеза их структуры, решаемых как на основе оптимизации лиуъ безотказности системыл'ак. и с учетом характеристик ее контролепригодности. Одной из вазшейших и актуальнейших задач по иопыыенин контроле- и ремонтопригодности вычислительных устройств является задача определения контролирует« параметров или внутренних точек ■ устройства. ■ ■
Разработанные аналитические и аналитико-статистические модели надежности СЭВМ с 1СР с учетом структуры и качества контроля использованы при решении задачи выбора контролируемых выходов иг-бы точной системы. Задача формулируется следующим образом : необходимо определить множество контролируемых точек внутри структуры как -дого из В блоков СЭВМ с КР таким образом, чтобы надежность СЗВМ, выраженная в виде . была бы максимальной Въ (Ьг}"5" •
В основе разработанного метода расстановки контрольных точек в блоках избыточной системы лежат сочетание градиентного метода с усеченным сканированием. При этом усеченное сканирование происходит . по внутренним выходам элемента блока системы при расстановке очередной контрольной точки с учетом конструктивных ограничений ■ и важности правильного функционирования различных частей схемы. Движение по градиенту осуществляется при каждом шаге работы алгоритма при расстанозке очередной контрольной точки внутри блока. соответствующей максимальному значению Л Р«^ - приращения выбранного надежностного критерия. Наиболее целесообразно применение аналитических моделей (на основе метода минимальных сечений или приближенных моделей "¿" и
Как уже отмечалось, недостатком аналитических моделей надежности при решении задач оптимизации надежностной структуры СЭВМ является их недостаточная точность при. анализе слокных структур большой размерности. В то лее чремя использование в оптимизирующих процедурах одних лишь статистических г-гаНелей приводит к резкому увеличению времени решения задачи. В качестве наиболее целесообразного варианта построения процедуры решения задачи выбора контрольных точек СЭВМ с КР преддцкено сочетание аналитических и акалити-ко-статистически^ модвлей;> При этом в многократно повторяющейся процедуре сканирования по разданным 'внутренним выходам системы используются лриблпзг-лшые аналитические модели надежности (на основе минимальных сеченш 4 "¿у. • Окончательный вариант устапоз:<и
очередной контроль» ; точки на каедом шаге работы работы алгоритма
оценивается и корректируется с помощь^ аналитико-статкстическопо моделирования. ', ;
Для автоматизации надепюегного проектирования СЭБ!<Гс Кр. разра-" Оотаны средства автоматизированного надеаностногб проектирования-"CAHÍ1". Создано 5 программных Г'родуктоВ:'"САШ+", "СНЫ", "Аналити-. ка", "Статистика", "Синтез", ориентированных на ЭВМ типа.IBM. PC.'
Система автоматизированного надежностного ;; проектирования "САЩ1+" предназначена для решения задач анализа надежности и синтеза отказоустойчивых СБИС, СЭВМ и систем, в которых отказоусгой-; чивость достигается применением широкого класса методов комбинированного резервирования и контроля. "САНП+" позволяет решать,различные задачи, возникающий на основных этапах'инженерного "проектирования изделий электронно-вычислительной техники, начиная от этапа эскизного проекта и кончая этапом технического проекта. В состав "САШ+" входят два функционально законченных пакета прикладных программ:"?езерв" и "Контроль", а также "ШФО "-подсистема информационного обеспечения решения задач. - . -.--'-.■'
Программа "САНП+" внедрена в учебный процесс;каф.ЭВМ МИФИ. ■ На ' базе этой системы разработан электронный учебник'по курсу '"Надежность, контроль и диагностика ЭВМ", который включает лабораторный практикум (5 лабораторных работ), тренажер для их изучения,' средства автоматизированного контроля успеваемости. ' .
Система надежностного моделирования "СШ"Г предназначена . для анализа надежности СЭВМ с КР,' описанных'ранее. Разработано 4 версии системы , - на специализированных языках моделирования GPSS-и М-1. а также на алгоритмических языках Фортран-4 и Паскаль. .
Методы статистического и акалитико-стагистического моделирования надежности программно реализованы.на IBM PC (язык Си)" в виде программного кмлтехса "СТАТИСТИКА*. . - _ •
Показано детальное применение"разработанной методики для надежностного проектирования специализированной ЭВМ "СБ5580" и ее модификаций с комбинированным резервированием. СЭВМ "СБ5580" используется для управления связью. Среди мнсзсества требований 'к изделию СБ5530 выделим следующие: ..
- СЭВМ должна быть резервирована таким образом, чтобы сохранить свою работоспособность при минимум 2-х любых отказах, элементов;
- СБ5530 не восстанавливаемая.
Рассмотрено повышение надежности специализированных ЭВМ "ЦИКЛОП"' и "ЦИКЛОП - 2" на основе итеративного резервирования. СЗВМ "ЦИКЛОП" входит в состав вычислительной системы "Селар" и предназначена для обработки видеоинформации. СЭВМ была создана в НИИ "Аргон" в интересах целого ряда предприятий. & том числе для НПО "Геофизика". В настоящее время СЭВМ выпускается серийно.
Это СЭВМ с итеративным резервированием, где на внешен и внутреннем уровнях используется скользящее резервирование, количество уровней вложения равно 2. СЭВМ "Циклои-2" является мультипроцессорной вычислительной системой для цифровой обработки сигналов.
Это система с итеративным резервированием с 3-я уровнями вложения. На внешнем первом уровне - МР(3), на втором - ГР(3,1), на третьем - ГР(3,1) или СР(3,1). Мажорирование осуществляется аппаратно-программным способом.
'.. Для экспериментальной оценки надежности СЭВМ "Аргон - 16" использовались данные о неисправностях и наработках в эксплуатации. .
По данным НИИ "Аргон" исследовались 40 экземпляров' СЭВМ "Ар-гон-16" в эксплуатации, при этом отказов избыточных СЭВМ не произошло.
В целом методика использовалась при проектировании и внедрении 16 модификаций СЗВМ с КР в НИИ "Аргон;*.
Проведено исследование надежностных характеристик информационно-управляющей ЭВМ с комбинированным резервированием.Данная информационно-управляющая ЭВМ с КР входит в состав автоматизированных систем неразруыавдего контроля ТВЭЛов. была разработана, внедрена и функционирует, на нескольких заводах, в частности на Электрос-тальском машиностроительном заводе. В настоящее время находится в промышленной эксплуатации.
Рассматриваемая информационно-управляющая ЭВМ представляет собой систему централизованного сбора и обработки информации.
'Информационно-управляющая ЭВМ была введена в промышленную эксплуатацию и эксплуатировалась в течение 4,5 лет. Собранная статистика зафиксированных отказов приведена в работе. Анализ результатов подтверждают адекватность поведения системы в период эксплуа- , тации теоретической модели.
- 26 - . ;.7, ;"•:;•
Основные результаты работа . - ' "' , : ' / :
В диссертации решена крупная, научная проблема, имеющая важ ное народнохозяйственное значение, актуальность которой опре деляется перспективами научно-технического прогресса. В диссер тации с-единых научно-методических позиций решены вопросы методологии создания специализированных ЭВМ.с комбинированным резервиро вакием. Прикладные аспекты рассматриваются, применительно к различным областям использования СЗВМ с КР. Разработанные модели надеж поста, методы синтеза, средства автоматизации обеспечивают созда ]:ие высоконадежных отказоустойчивых СЭВМ с КР для различного, целевого назначения.. ' "■ , . - ;-'. ".' - ' ,.' ;
1. На основе проведенного всестороннего системного анализа по казано, что увеличение степени интеграции - появление СБЦС, матричных БИС, микропроцессоров, транспьютеров, уменьшение стоимосп и инергоемкостя интегральных схем, -непрерывное увеличение требований к надежности СЭВМ, недостатки РЗи ПР привели к появлению ] широкому использованию в народном хозяйстве СЗВМ с КР, работавши; в необслуживаемое и обслуживаемом режимах.'.'. -'.--'
2. Проведен анализ и впервые дана классификация моделей надежности СЭВМ с КР в зависимости от способов введения избыточности .1 методов анализа надежности.' .....
3. Разработана новая обобщенная модель надежности . СЭВМ с КР. использование которой упрощает процедуру анализа надежности, резке уменьшает количество моделей и уменьшает трудоемкость ■ вычислений.
4. Предложены оригинальные аналитические модели надежности устройств с КР с учетом структуры и качества контроля на основе^коэф-Фнциентов структур. "¿" и ''¿^ а также минимальны* сечений, модел1 надежности устройств с КР с учетом типов отказов и временных-соотношений' мекду момента".« их возникновения, модель, 'учитывающая частичное'восстановление. при профилактике и полноту профилактического контроля.
5. Предложены новые аналитические модели надежности -одномагист-раяьных и многотгистралькых'структур с КР с учетом периодов хранении, готовности и работы. Пол.;чиш оригинальные модели надежности гранспыотергагх СЭШ на основе -марковских процессоров с дискретны;.? временем.
6. На основе анализа обоснована необходимость применения гмста-деонного моделирования при анализе надежности для учета целого ря~ ia факторов (входного потока задач, процедур контроля, рслнфпгу->ации ремонта, . отказов и сбоев и т.д.). Разработан« и реализованы га ЭВМ-два оригинальных метода ускоренного çnammto-cтгистачйс-:ого моделирования С ЭВМ с КР. Создана и -внедрена з промышленность ■истема надезшоотного имитационного моделирования "СНИ". , 7. Поставлена и решена новая задача совместного определения араметров - СЭВМ с КР(уровней, кратностей, параметров сип-геи онтроля. реконфигурации и т.д.) при наличии нескольких иадежнрот-ых- критериев и технико-экономических ограничений заданных в вида авенств, поставлена и решена новая задача совместного выбора ровней и кратностей итеративного резервирования для нескольких ровней вложения по критерию надежности при ограничениях па технн-о-экономические показатели. - Решена задача выбора контрольных то-эк . в устройствах СЭЕМ с КР с использованием разработанных аналн-яческих моделей надежности.
8. Созданы средства,автоматизированного надежностного проокти-эвания СЭВМ с КР, которые состоят из 5 программных продуктов.
9. Разработанная методика надежностного проектировании внедре-ï и использовалась в НИИ "Аргон" при проектировании, макетироса-ш, опытной и промышленной эксплуатации бортовых СЭВМ с КР в ин--. фесах различных заказов МОРФ космического, авиационного, хорального, ракетного и подвижного наземного назначения, всего было сработано, испытано, 'прошло опытную и промышленную эксплуатацию
i типов > СЭВМ с КР. Методика внедрена и использовалась в ;П0"АГАТ", в ВНИИТФА - система внедрена-на нескольких заводах, в естерн Эмба Геофизика". (Казахстан), в ЦНИИ "Комета", в ОКБ "Ллъ-" (г.Минск), в ГСПЙ. Таете результаты работы использовались в ебном процессе каф. ЭВМ МИФИ.
'10. Проведено исследование теоретических и экспериментальных, лученных на основе данных сб отказах з эксплуатации, характерис-к надежности 2-х СЭВМ с КР. Подтверждена адекватность поведения ВЫ в эксплуатации теоретическим' моделям..
Основные работы опубликованные по теме диссертации:
1. Александрович А.Е., Чернышев D.A., Чуканов В. 0. Решение задачи расстановки мажоритарных элементов в произвольной многооперационной системе. М.: ГФАП СССР, Алгоритмы и программы, информационный бюллетень, 1977, No 5-6 (19-20). с.19-20.
2. Чуканов В. О. Анализ и синтез высоконадежных устройств с пе-. рестраиваемой структурой. - В. кн.: Повышение качества и надежности промышленных изделий. Материалы VII Ленинградской конференций. Л.: 1978, с. 18-19.
3. Аббакумов И. С., Чернышев ¡O.A., Чуканов В. 0. 0 задаче обеспечения резервными блоками вычислительной системы со скользящим ■резервированием. - Автоматика и вычислительная техника. Рига: Зи-натне. 1976, No 4, с. 31-32. '
4. Аббакумов И.С., Чернышев Ю.А., Чуканов В.О. Решение задачи синтеза вычислительной системы со скользящим резервированием.' г В кн.: Инженерно-математические- методы в физике и кибернетике. М.: Атомиздат, 1977. вып. 6, с. 63-65. е
5. Чернышев Ю. А., Аббакумов И. С., -Чуканов В.О. 0 выборе способов резервирования блоков вычислительной системы. - Там же, С. 84-87.
6. Аббакумов И. С., Чернышев Ю. А., Чуканов В.О. Об одном алгоритме оптимизации параметров вычислительной системы со скользящим резервированием. - Известия ВУЗов. Приборостроение, т. 20/ 1977. No 11, с. 117-122.
7. Александрович А.Е., Чернышев Ю.А., Чуканов В.О. Решение задач;? анализа надежности произвольной многооперационной мажоритарной структуры методом минимальных сечений.' М.: ГФАП СССР, Алгоритмы и программы, информационный бюллетень, 1977, Но 4 (18), с.27.
8. Аббакумов И. С., Александрович А. Е., Чернышев 10. А., Чуканов В.0. Решение задачи выбора способов резервирования блоков вычислительной системы. - Там же, 1977, fío 5-6 (19-20) % с. 19.
9. Чернышев Ю. А., Чуканов В.О.Надежностный синтез систем управления с активным резервированием,' - В кн.: Проблемы надежности при проектировании системы управления. Тезисы докладов второй Всесоюзной конференции. Киев: 1976, выпуск 2, с.43-44.
10. Чернышев Ю.А., Чуканов В.О., Аббакумов И.С. Об одной задаче надежностного синтеза вычислительной системы со -скользящим резер-
вированием. - В кн.: Однородные вычислительные системы и среды. Материалы IV Всесоюзной конференции. Киев: Нзукова Думка, 1975, ч. 3, с. 60-61.
И. Чернышев Ю. А.. Чуканов В. 0., Аббакумов И. С. Распределение избыточного оборудования в вычислительных системах со скользящим резервированием. - Там же, с. 61-62.
12. Александрович А. Е., Чернышев Ю. А., Чуканов В. 0. Решение оптимальных задач синтеза дискетных устройств повышенной надежности. - В кн.: Современное состояние автоматизации и теории проектирования дискретных устройств и систем. Материалы школы семинара. Киев: 1977, с. 23. •
13. Аббакумов И. С., Александрович А.Е., Чернышев Ю.А., Чуканов В. 0. Программное обеспечение задач надежностного проектирования цифровых структур. - В кн.: Математическое обеспечение моделирования сложных систем. 'Тезисы докладов Всесоюзной конференции. Киев: 1977, 4.2, с. 126-127.
14. Чернышев Ю.А., Чуканов В. 0. Надежностное проектирование устройств СЦВМ с комбинированным резервированием. - В кн.: Надежность сложных технических систем. Материалы семинара. И.: МДНТП, 1979; с.35-40.
15. Власов Ф.С., Райков O.A., Чуканов В.0. Некоторые вопросы резервирования цифровых устройств СЦВМ на микропроцессорах. - Там же, с. 182-184.
16. Чуканов В.0. Анализ надежности вычислительных систем с итеративным резервированием. - Деп. в ВИНИТИ, 26.08.85. Но 63 35-85, с.11.
17. Александрович А. Е.,: Чернышев Ю. А., Чуканов В.0. Решение задачи анализа надежности устройств с комбинированным резервированием с учетом структуры и. качества контроля. - В кн.: Вопросы надежности и технического диагностирования вычислительных устройств. Сборник трудов. М.: Энергоатоыиздат, 1986, с.8-13.
18. Власов Ф.С., Хапов B.C., Чуканов В. 0. Система надежностного моделирования отказоустойчивых многопроцессорных вычислителей - В кн.: Методы прогнозирования надеяшости проектируемых РЭА и ЭЕА. Тезисы докладов. Пенза: ПДНТП, 1987, с.9-10.
19. Александрович А.Е.. Власов Ф. С., Хапов В. С., Чуканов В. 0. Анализ надежности специализированных ЭВМ с комбинированным резервированием в локальных сетях с реконфигурацией. - В кн.: ЭВМ и ло-
кальные сети в автоматизированных системах. - Сборник трудов. М.: Знергоатомиздат. 1990, с. 102-107. - ' '-t
20. Александрович А.Е.. Белькан Л.Б., Ханов B.C., Чуканов В.0.
^ Процедуры повышения надежности локальной вычислительной сети реального времени. - Там же, с.98-102. "
21. Аббакумов И. С., Черкьшев D. А., Чуканов В. 0. Некоторые вопросы выбора оптимальных мест включений мажоритарных элементов. - В кн.: Современные методы разработки РЭА. - Материалы семинара. М.: МДНТП. 1974. с.92-96. . V
22. Александрович А.-Е.,' Чуканов В.О. Метод ускоренного аналити-ко-статистического моделирования надежности АСУ с комбинированным резервированием. - В кн.: Надежность и эффективность АСУТП и АСУП. Тезисы докладов III Всесоюзного совещания. Суздаль: 1984. с.33-34.
23. Александрович А.Е., Чуканов Б.О. Оценка показателей готовности сложных восстанавливаемых систем с учетом параметров профилактики. - В кн.: Вопросы надежности и технического диагностирования вычислительных устройств. Сборник трудов. М.: Знергоатомиздат. 1986, с.14-19. . -
24. Александрович А.Е., Павлов И. В., Чуканов В.О. Анализ отказоустойчивости многорежимных мультипроцессорных АСУТП. - В . кн.: Математические и программные методы проектирования информационных и управляющих систем. - Тезисы докладов зональной конференции. Пенза: ПДНТП, 1990, с. 60-61. ....■•25. Самойлова Л,В., Хапов B.C., Чуканов Б.0. Система надежностного моделирования для избыточных управляющих-систем. - Там же, с. 58-59. .
26. Чернышев Ю. А.. Чуканов В.0.: Повышение надежности изделий электронной техники на основе комбинированного резервирования. -Электронная промышленность, 1982, вып.2 (108), с. 37-39.
27. Александрович А.-Е., Чернышев Ю.iL, Чуканов В.О. Оценка качества контроля устройств с комбинированным резервированием. Известия ВУЗ. Ы.: Приборостроение, 1986, т. 29. No 6, с. 87-93.
28. Александрович А.Е., Чуканов В.О. Теоретические и практические вопросы надежностного проектирования специализированных вычислительных систем с комбинированным резервированием. - М.: Препринт /ЙИФЙ. 047-87, 1987, 24 с.
29. Лабораторный практикум по курсу "Надежность, контроль и диагностика ЭВМ". /Аббакумов И. С., Александрович А, Е., Чуканов В.О.
и др. Под редакцией Чуканова В.О. М. : МИФИ. 1907, 88 с.
30. Федоров В.Ю., Чуканоз В.О. Решение задачи диагностирования микропроцессорных систем методами сетей Петри. - В кк. : Разработка методов и средств технической диагностики микропроцессор»г< систем и устройств. - Сборник трудов. И.: Онергоатомиздат. 1990. с.25-27.
31. Федоров В. ¡0., Чуканов В.О. Анализ'отказоустойчивости с. пиарных систем расширениями сетей Петри. . - Автоматика и телсмехакик;;, 1992, îîo 2, с. 144-156.
32. Федоров B.D., Чуканов В.О. йитегриропаннкй пакет аоделгро-вакия ■ сетей Петри, с отказами-. - Управляющий систг.ж к машин, 1992. îîo 3/4, с. 97-100.
33. Александрович А.Е., Чершврз D.А., Чу.чанов В.О. Автоматизация надежностного проектирования систем автоматического управления с активным резервированием. - В кн.: Автоматкзастя.про^ктироеашш систем автоматического jî "автоматизированного управления. Теска; докладов Всесоюзного научно-технического совещания. Таллин: 1У73, С. 15—1*7.
31. Александрович А. Е., Чернышев Ю. Л., Чуканов В.о. и др. Методические указания к практическому занятию по курсу "Надежность ЭВМ".'М. : МИФИ. 1930, 20 с.
35. Чуканов В.О. О рациональном построении вычислительных систем с комбинированным резервированием. - В кн.: Вопросы обеспечения надежности сложных технических систем на этапах разработки, производства и эксплуатации. - Тезисы докладов семинара МДНТП. м.': МДИТП.'1981, с. 13.
• 36. Александрович А.Е., Чуканов В.О. Структурный подход к оценке качества контроля .устройств с комбинированным резервированием. - Там же, с. 2.
37. Александрович А,Е., Чуканов В.О. Автоматизация выбора структурных и вероятностных параметров систем контроля и диагностики резервированных устройств. - В кн.: Автоматизированное техническое проектирование электронной аппаратуры. Тезисы докладов республиканской конференции. Каунас: 1932. с.149-150.
38. Чуканов В.0. Комплексный подход к оценке надежности бычис- ' лителььых систем с контролен. - Деп. в ВШШ'ГИ, 26.08.85, По 6334-85, 8 С. - .
39. Чуканов В.О. Обеспечение надеэюстк специализированных ЭРЫ для систем управления связью. - В кн. : Проблемы, мзтиды и опыт
создания автоматизированных систем управления связью. Тезисы докладов отраслевой научно-технической конференции. М.: ЦООНТИ "ЭКОС", 1985. 19 с.
40. Чуканов В. 0. Расстановка контрольных точек в цифровых устройствах ЭВМ. - Лабораторная работа. М.: МИФИ. 1986. 20 с.
41. Хапов B.C., Чернышев Ю.А., Чуканов В.О. Система надежностного моделирования для проектирования отказоустойчивых многопроцессорных систем. - В кн.: Повышение качества и надежности ПО ЭВМ и технических средств обучения. Тезисы докладов Всесоюзной научно-технической конференции. Куйбышев: КИИ. 1989, с.280-281. ■
42. Власов Ф.С., Хапов B.C., Чуканов В. О. и др. Надежностное моделирование специализированных отказоустойчивых многопроцессорных комплексов. - В кн.: Надежность, живучесть и безопасность автоматизированных комплексов. Тезисы докладов IV Всесоюзного совещания. Суздаль: 1988. с. 159.
43. Функциональное диагностирование процессора ЭВМ. /Завьялов В. А., Зиборова М.Э., Чуканов В.О. "и др. Под редакцией Чуканова В. 0. М.: МИФИ, 1990, 120 с. .
44. Александрович А.Е., Чернышев>Ю. А., Чуканов В.О. Решение задачи оптимального резервирования блоков ЭВМ. - Лабораторная работа." И.: МИФИ, 1990, 20 с,
. 45. Александрович А.Е., . Чуканоз В.О. Аналитическая модель надежности восстанавливаемой вычислительной системы реального времени с неопределенным классом неисправностей. - В ин.: Методы анализа. надежности программного обеспечения вычислительных систем реального времени на основе моделей нечеткой логики и качественных описаний. Тезисы докладов. Киев: КНИГА, 1937. 18 с.
Подписано к печати Н-Ф-И . Заказ И И 1/& Типография МИФИ,, Каширское шоссе, дом 31.
Тираж {ООэкз.
-
Похожие работы
- Разработка методов и средств обеспечения и анализа надежности отказоустойчивых вычислительных систем
- Разработка моделей и алгоритмов для прогнозирования показателей надежности класса самовосстанавливающихся отказоустойчивых вычислительных систем
- Разработка модулярных специализированных процессоров с минимальной аппаратурной избыточностью вычислительных трактов
- Разработка методов синтеза информационно-управляющих систем специального назначения со структурным резервированием
- Методы обеспечения надежности изделий микроэлектроники на основе принципов теории управления качеством
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность