автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка стартовой операционной системы ВК "Эльбрус Б" для проверки устройств

кандидата технических наук
Мукин, Александр Николаевич
город
Москва
год
1991
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка стартовой операционной системы ВК "Эльбрус Б" для проверки устройств»

Автореферат диссертации по теме "Разработка стартовой операционной системы ВК "Эльбрус Б" для проверки устройств"

ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ИНСТИТУТ ТОЧНОЙ МЕХАНИКИ И ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ ИМЕНИ С.А.ЛЕБЕДЕВА АН СССР

Для служебного пользования

(1 7 6

ЭКЗ №_

МУКИН Александр Николаевич

УДК 681.3.066:681.3.01

РАЗРАБОТКА СТАРТОВОЙ ОПЕРАЦИОННОЙ СИСТЕМЫ ВК"ЭЛЬБРУС Б"ДЛЯ ПРОВЕРКИ УСТРОЙСТВ

05.13.11 - Математическое и программное обеспечение вычислительных машин,комплексов и систем

АВТОРЕФЕРАТ

Диссертации на соискание ученой степени кандидата технических наук

Москва - 1991

Инв.М» 22'ДСП' от 06.03.1991 г.

Работа выполнена в Институте точной механики и вычислительной техники им. С.А.Лебедева АН СССР Научный руководитель - кандидат физико-математических

наук, старший научный сотрудник

A.Ю.Бяков

Официальные оппоненты - доктор технических наук

С.В.Семенихин кандидат технических наук

B.И.Емельянов

Ведущее предприятие - Институт атомной энергии

им. И.В.Курчатова

Защита состоится ""/I/" ОКТЯО^Я 1дд1 года в "16" часов на заседании специализированного совета Д 115.02.01 при Институте точной механики и вычислительной техники им. С.А.Лебедева АН СССР по адресу: 117333 Москва, Ленинский проспект, 51, Актовый зал.

С диссертацией можно ознакомиться в библиотеке ИТМ и ВТ АН СССР.

Автореферат разослан . . . . 1991 года.

Ученый секретарь совета к.ф.-м.н.,с.н.с.

_ Б.М.Улановский

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Разработка и промышленное освоение новых поколений ЭВМ различных классов ставят перед разработчиками и производителями ЭВМ ряд новых и сложных проблем. В частности, проблемы комплексного тестирования ЭВМ в различных режимах в процессе их изготовления, наладки и эксплуатации приобрели на современном этапе особую актуальность в связи с существенным расширением Функций и усложнением режимов работы ЭВМ.

Попытка решить этот вопрос с соблюдением старых принципов построения автономных тестов приводит к резкому возрастанию как общего времени проверки, так и объема информации, которую должна обрабатывать ремонтная бригада при поиске неисправностей ЭВМ.

Перебор различных вариантов решения возникшей проблемы приводит к необходимости организации комплексной проверки оборудования, к переходу на мультипрограммный режим ■фохождения тестов под управлением программы, которой Фисущи все основные Функции операционой системы.

Эта операционная система была названа стартовой, так :ак она начинает выполнение своих Функций по поиску не-1справн0стей с самого ' первого момента своей работы, ешаемая в диссертации проблема создания эффективной и не-ольшой по объему стартовой операционной системы прохожде-ия тестовых задач является важной и актуальной в научном практическом плане.

Цель работы и основные задачи исследования.

Диссертация посвящена исследованию проблем организации работы ВК, целесообразности разбиения его на уровни, приведению инженерных тестов к виду, аналогичному математическим пользовательским программам, организации диалога в работе тестовых программ, включению элементов живучести в разработанную систему.

Основные требования, предъявляемые при создании стартовой операционной системы, включают в себя:

обеспечение полной проверки всех аппаратных средств вычислительного комплекса; надежность функционирования;

гибкость и адаптируемость системы к различным режимам работы;

удобство эксплуатации системы; сбор и частичную обработку статистики сбоев; вывод информации в виде, удобном для восприятия человеком.

Перечисленные требования определили те научные пробле -мы и направления, по которым необходимо было провести ис -следования при разработке систем прохождения тестовых задач:

найти решение и создать базовые средства в рамках стартовой операционной системы по организации диалога; предоставить пользователям возможность управления режимом прохождения тестовых задач;

найти простые алгоритмы распределения ресурсов между задачами;

обеспечить постепенное нарастание сложности проверки работы контролируемого вычислительного комплекса; обеспечить максимальное приближение режимов контроля к реальному режиму работы вычислительного комплекса.

Научная новизна. Основными элементами научной новизны являются, во-первых, комплексный подход к решению вопроса автоматизации управления прохождением тестовых задач; во-вторых, мультипрограммный режим прохождения тестовых программ, рассчитанных на постепенное наращивание сложности создаваемого режима работы вычислительного комплекса; в-третьих, создание сервиса по управлению выполнением тестовых задач и выдаче результатов их работы.

С учетом этого научной новизной обладают: принципы организации прохождения тестовых задач на вычислительных комплексах;

диалоговый режим работы каждого счетного канала, созданного для тестовой задачи контроля работы того или иного устройства;

вывод накопленной информации по работе контролируемого устройства на экран дисплея или печать - индивидуально по каждому проверяемому устройству;

постепенное нарастание сложности проверки всего вычислительного комплекса до предельных нагрузок с тщательной Фиксацией всех отклонений в работе каждого из проверяемых устройств;

открытость системы с целью создания дополнительной возможности наращивания средств контроля оборудования.

Практическая ценность. Созданная стартовая операционная система внедрена и успешно применяется при наладке и ре-монтно - восстановительных работах на ВК "Эльбрус Б". Поскольку работа стартовой операционной системы в 1987 г. была проверена с помощью интерпретирующей системы, то в дальнейшем она начала Фиксировать неисправности аппаратуры с первых дней своей работы в процессе наладки опытного образца ВК "Эльбрус Б". Дальнейшая работа проводилась с целью достижения большей точности диагностики и живучести системы.

Опыт и методы реализации стартовой операционной системы могут использоваться при создании аналогичных средств для других вычислительных комплексов,.

Личный вклад автора. Автор проделал все этапы исследования, проектирования и реализации стартовой операционной системы; произвел проверку правильности ее функционирования с помощью интерпретирующей системы; написал и отладил все программы ведения диалога, редактирования, распределения ресурсов, упрятывания и восстановления; написал все драйверы системы и все тестовые задачи с отладкой их на интерпретаторе и на "живой" аппаратуре.

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались: на конференциях молодых ученых и специалистов ИТМ и ВТ

/Москва, 1981,1983,1985 гг./; на семинаре пользователей ЭВМ БЭСМ-6 /Горький, 1986 г./; на семинаре МВТУ, 1985 г.;

использовалась при приемо-сдаточных испытаниях вычислительного комплекса"Эльбрус Б"

Публикации. По теме диссертации опубликовано 10 печатных забот.

Объем и структура диссертации. Диссертация состоит из »ведения, пяти глав, заключения и списка литературы. >бщий объем диссертации 122 страницы. Список литературы 1ключает 45 наименований. Диссертация содержит 10 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Введение посвящено постановке задачи и основным пробле-ам, возникающим при органиации прохождения тестовых адач. Описываются условия, в рамках которых приходится ешать поставленную задачу.

В первой главе диссертации рассматриваются комплексные роблемы, возникающие при организации вычислительных про-гссов; выделяются различные уровни вычислительного ком -лекса, за который принимаются все программно-аппаратные редства, используемые для ведения вычислительного про-гсса.

Отмечается, что этот вычислительный комплекс можно раз-1ть на уровни, каждый из которых выполняет свои собствен-1е задачи и Функции:

первый уровень вычислительного комплекса - физический-обеспечивает физические средства ведения вычислений; второй уровень вычислительного комплекса - ядро операционной системы - создает виртуальные машины, выделяет необходимые ресурсы, связывает выполняемые программы с

физическими носителями информации;

третий уровень вычислительного комплекса - файловая система - связывает виртуальные понятия с физическими, вырабатывает необходимые координаты для выполнения Физических обменов;

четвертый уровень вычислительного комплекса - мониторы, сервисные системы - облегчают и упрощают процесс написания и отладки программ;

пятый уровень - задачи пользователей - определяют общий ход вычислительного процесса.

Отмечается, что целесообразно использовать, как можно раньше, языки высокого уровня, т.к. использование только при написании программ ядра ОС ассемблера и единой процедуры передачи параметров между программами всех уровней и при написании тестовых задач, контролирующие работу аппаратуры, обеспечивает однотипную связь на всех уровнях вычислительного комплекса, а также проверку правильности работы этих программ средствами программного интерпретатора.

Вторая глава посвящена вопросу организации работы стартовой операционной системы с передачей ей части функций контроля вычислительного комплекса.

Совмещение контрольных функций первого и второго уровней вызвано тем, что при проверке аппаратных средств почти все исполнительные блоки тестов и операционной системы дублируются, что позволяет использовать их при проверке аппаратных средств в режиме работы, совпадающем с режимом работы реальных программ пользователей.

Придание статуса пользовательских задач инженерным тестам позволяет перейти к тестированию виртуальных машин, создаваемых ядром ОС; использовать возможности,имеющиеся у стартовой операционной системы, а именно: мультипрограммный режим работы и аппарат событий для интенсификации общей проверки работоспособности ВК.

Интенсификация проверки оборудования достигается за счет мультипрограммного режима прохождения инженерных тестовых задач, что позволяет производить совмещение проверки оперативной памяти или арифметического устройства с проверкой внешних запоминающих устройств.

Необходимость выполнения вышеперечисленных требований определяет следующий состав стартовой операционной системы, достаточный для организации прохождения тестовых задач:

блок запуска задач в решение;

блок переключения задач;

блок обработки прерываний;

блок опроса внешних запоминающих устройств;

блок распределения ресурсов оперативной памяти;

блок драйверов или блок обмена;

блок первичной настройки системы;

блок завершения задачи.

В третьей главе описываются необходимые изменения в структуре инженерных тестов и режиме их работы, преобразующие их в тестовые задачи, которые приобретают возможность выполнять своя контрольные функции в режиме мультипрограммного режима работ.

Стартовая операционая система при наличии в ее составе аппарата событий, системы разделения времени и исполнительных программ управления работ внешних запоминающих устройств и дисплеев может выполнять роль операционной системы, управляющей прохождением инженерных тестов, оформленных как тестовые задачи, т.е. быть операционной системой тестов.

Проверка оборудования с помощью операционной системы тестов позволяет сократить общий объем тестов, сделать проверку оборудования приближенной к реальным условиям эксплуатации вычислительного комплекса.

Наличие сервисных программ в составе операционной системы тестов, предоставляемых каждой тестовой задаче, позволяет использовать их для более тщательной обработки сбойных ситуаций и выдачи более подробной информации о сбоях в работе проверяемого устройства.

Мультипрограммный режим прохождения тестовых задач позволяет сократить общее время проверки оборудования, производить его контроль в реальных условиях работы.

Отмечается, что в ряде тестовых задач имеются случаи проверок, требующие специального режима прохождения тестовых задач. Это проверка некоторых режимов устройства управления, а также полная проверка оперативной памяти, которая требует свободной машины для обеспечения контроля всей оперативной памяти,

В четвертой главе разбираются вопросы организации прохождения тестовых задач в мультипрограммном режиме работ. В этом режиме работа операционной системы заключается в

- В -

синхронизации /совмещении/ работ на процессоре нескольких одновременно функционирующих программ. При этом счет различных задач характеризуется некоторыми особенностями в зависимости от режима организации работы каждой конкретной тестовой задачи,

Поскольку единственным каналом, по которому можно производить инициализацию и диалоговую работу, является канал связи с дисплеем, то дисплеи выбраны как основа для ведения любых работ на ВК.

Инициатива по организации работы принадлежит пользователю. Для этого ему достаточно нажать на любом из свободах дисплеев клавишу "ввод". При этом стартовая ОС выползет следующую последовательность действий: после получения сигнала внешнего прерывания от дисплея запрашивает его номер;

по номеру терминала ОС определяет свободен терминал или привязан к задаче;

если терминал свободен, то запрашивается номер счетного канала и этот номер записывается в управляющую строку терминала;

этот номер в дальнейшем будет определять внутренний номер задачи, для которой очищаются рабочие поля управляющих таблиц задачи и таблицы приписки листов задачи; запрашивается рабочий лист, по номеру которого формируется код установки регистра приписки первого листа; заносится код приписки нулевого листа задачи начального диалога и текстов тестовых программ;

в таблицу задачи записываются адреса рабочего и аварийного входов программы "Диалог", а также номер связанного

с ней дисплея;

заносится признак готовности к работе в шкалу работающи> задач, тем самым вводится в решение вновь созданная тестовая задача с задачей начального диалога.

Терминальная задача "Диалог" готова к работе.

Каждая терминальная задача управляет работой только одного терминала. Многотерминальность создается за счет большого количества счетных каналов. В настоящее время их может быть до 64.

Программа "Диалог" обеспечивает проверку работоспособ ности аппаратных средств, создание и редактирование файлов запуск в решение задач, написанных с учетом элементов прог раммирования в кодах ВК "Эльбрус Б" (третий режим).

В диссертации описываются основные директивы программы начального диалога и разделы паспорта, необходимые для Формирования дополнительных задач тестовых проверок, что позволяет наращивать возможности по проверке оборудования. Основные тестовые задачи используют стандартные ресурсы , выделяемые по умолчанию на начальный период работы для всех задач.

Описываются принципы организации обмена.

В случае принятой заявки на обмен с быстрым устройством программа обмена: закрывает задачу;

преобразует виртуальные имена ВЗУ в физические; заявка переписывается в очередь на выполнение; опрашивает физический канал, если он занят, заявка ожидает его освобождения;

Формирует Физический обмен с устройством, если канал свободен, а в случае записи дополнительно производит формирование контрольной суммы и других служебных слов; переходит на ожидание конца обмена - этим завершается первая часть обмена; до завершения обмена вычислительный комплекс может быть использован для других работ; производит контроль считанной информации по концу обмена;

открывает задачу.

В случае опроса дисплея: закрывается задача; передаются данные о дисплее; открывается задача.

В случае приема с дисплея: закрывается задача;

процессор переходит на выполнение других работ; по сигналу запроса от дисплея считывается информация; открывается задача.

При выдаче на дисплей или печать: закрывается задача; передаются данные на устройство; открывается задача.

Завершение работы каждой тестовой задачи производится процедурой окончания счета задачи.

Завершение счета задач производится в случаях, когда: истекло время счета, указанное в паспорте; произошло обращение в лист памяти для записи, но этот лист закрыт по записи;

количество выводимого материала на печатающее устройство не умещается на заказанном количестве бумаги; в задаче появился экстракод конца задачи; задача вышла на аварийный режим работы.

В пятой главе разбираются вопросы надежности и живучести ВК, которые впервыебыли реализованы на многопроцессорных ВК.

Многопроцессорные вычислительные комплексы , вычислительные сети машин заставляют по-новому взглянуть на аппаратуру и на программную и аппаратную организацию вычислений; по-новому ставят вопрос рационального использования вычислительных ресурсов для решения как одиночных задач, так и пакетов, требуют исследования принципов работоспособности систем параллельного и псевдопараллельного действий.

Если работоспособность однопроцессорных ЭВМ последовательной обработки в основном характеризуется показателями надежности: наработкой на отказ, бессбойной работой и рядом других аналогичных показателей, то многопроцессорные вычислительные комплексы способны обеспечить постоян -ную и непрерывную работу лишь с некоторой потерей произ -водительности.

Разбираются вопросы организации надежного и живучего вычислительного комплекса.

Устойчивость к отказам и сбоям - необходимое свойство живучей вычислительной системы, но одного его недостаточно для создания живучей вычислительной системы. Отказоустойчивость в системе позволяет как бы использовать работу более надежных узлов для повторного запуска менее надежных уст-

юйств, с тем чтобы получить более достоверные результаты ли восстановить цикл работы сбойного устройства, тем самым лучшая общие показатели надежности работы.

Если отказоустойчивая система возвращается к своему редыдущему состоянию, то живучая система не обязательно олжна вернуться к прежнему состоянию, а с учетом анализа итуации несколько изменяет свою структуру, с тем чтобы ыполнить поставленную задачу, несмотря на сбои и отказы тдельных устройств. Таким образом, живучесть характеризу-тся более сложной системой организации работ, эта система ктивно, с перестройкой своей структуры противостоит воздей-твиям среды.

Вопросы живучести заставляют по-новому решать вопросы бщей надежности вычислительного комплекса. Неоспоримые реимущества в надежности работы параллельно работающих стройств требуют искать возможность организации парал -ельных или альтернативных процессов везде, где это воз-ожно организовать. Однако следует отметить, что при пере-оде на новые принципы организации работ вычислительного эмплекса мы должны с некоторым опережением перестроить организацию проверочных процедур. В диссертации делает* попытка отказаться от сложившейся практики контроля 5орудования на уровне ЭВМ 1-го поколения с последова -гльной организацией работ и перейти к подготовке работы 1вучих вычислительных комплексов, подготавливая аппарат-1е средства к работе в составе сложных вычислительных эмплексов и к решению задач со временем решения, значи-гльно превосходящим время наработки на отказ.

В диссертации описываются требования, предъявляемые к живучим системам. Приводятся некоторые сравнения параметров и понятий надежности и живучести простых и сложных вычислительных систем, сферы применения тех или иных характеристик работоспособности аппаратно-программных комплексов.

Формируются требования к аппаратным средствам с целью повышения живучести всей системы.

В случае открытой стартовой операционной системы ее живучесть проявляется в способности адаптироваться к имеющемуся составу оборудования, в обеспечении контроля работоспособности оборудования за счет возможности ввода дополнительных контрольных задач без каких-либо изменений в самой стартовой операционной системе.

В заключении диссертации отмечается, что предлагаемая стартовая операционная система:

обеспечивает контроль работоспособности апаратуры; может быть нижним уровнем программных средств; обеспечивает необходимую проверку работоспособности нижнего уровня программных средств;

создает необходимые предпосылки живучести вычислительного комплекса.

ЗАКЛЮЧЕНИЕ

Основные результаты диссертации состоят в следующем:

1. Разработаны принципы разбиения программно-аппаратного вычислительного комплекса на уровни по видам выполняемых работ. Это дало возможность разработать стартовую операционную систему, которая обеспечивает:

непрерывный контроль работоспособности центрального процессора с помощью встроенного теста проверки работоспособности устройства управления и арифметического устройства;

ведение диалога через дисплеи с пользователями; Формирование тестовых задач и автоматизацию всего процесса прохождения сформированных задач, настроенных на условия конкретного применения;

выдачу всей информации о сбоях в работе аппаратных средств тестовыми задачами для дальнейшей обработки.

2. Реализованы средства совмещения различных режимов контроля работоспособности вычислительного комплекса, предоставлен сервис по организации работы тестовых задач.

3. Разработанные тестовые задачи собирают, обрабатывают и выдают статистическую информацию о работе проверяемых устройств независимо от работы других задач. Выдача информации производится на дисплей или печать.

4. Обеспечение средств по организации постепенного усложнения режима контроля проверяемого вычислительного ком -плекса от простых режимов до предельных нагрузок.

Все результаты, составляющие основное содержание диссертации, получены автором самостоятельно.

На защиту выносится разработка стартовой операционн< системы для ВК "Эльбрус Б", которая обеспечивает: мультипрограммный режим прохождения тестов; непрерывный контроль центрального процессора одновременн< с проверкой внешних запоминающих устройств; одновременную проверку различных внешних устройств с незав! симым режимом проверки каждого устройства, накоплением c6oi ной информации и выдачей ее на дисплей или печать.

Основные результаты по теме диссертации опубликованы ] следующих работах:

1. Операционная система тестов. /А.Н.Мукин. В сб.Конференци! молодых специалистов и членов НТОРЕС им. А.С.Попова. Тезиа докладов. Секция 11, ИТМ и ВТ. 1987./2 стр.

2. Отладка интерпретатора И-86 инженерными тестами/А.Н.Муки! В сб. Конференция молодых специалистов и членов НТОРЕС им А.С.Попова. Тезисы докладов. Секция 11.ИТМ и ВТ, 1987./1 ст]

3. Распределенные сети коллективного пользования. /Н.Е.Балакирев, С.В,Ляпин,А.Н.Мукин,С.В.Миронов. В сб.Вопросы конструирования базового и прикладного математического обеспечения СКП ЭВМ МГУ, М., Изд. МГУ, 1983./ 5 стр.

4. Исследование организации двухуровневой памяти /А.Н.Мукин В сб.Конференция молодых специалистов и членов НТОРЕС им А.С.Попе за. Тезисы докладов, Секция 11, ИТМ и ВТ, 1987./2 с-

5. Сравнительные оценки производительности различных ЭВМ /Мукин А.Н. В сб. Повышение эффективности использования ЭВМ большой производительности. УНЦ АН СССР, 1982 г./ 3 стр

6. Программно-аппаратная реализация подключения 29-мгб дисков к ЭВМ БЭСМ-6 /Зельдинова С.А., Мукин А.Н. В сб. Повышение эффективности использования ЭВМ большой производительности. УНЦ АН СССР. 1982 г., 4 стр./