автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Методы и программные средства повышения надежности сетевых информационно-управляющих систем на основе реконфигурации ресурсов вычислительных устройств

доктора технических наук
Мельник, Эдуард Всеволодович
город
Таганрог
год
2014
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Методы и программные средства повышения надежности сетевых информационно-управляющих систем на основе реконфигурации ресурсов вычислительных устройств»

Автореферат диссертации по теме "Методы и программные средства повышения надежности сетевых информационно-управляющих систем на основе реконфигурации ресурсов вычислительных устройств"

На правах рукописи

Мельник Эдуард Всеволодович

МЕТОДЫ И ПРОГРАММНЫЕ СРЕДСТВА ПОВЫШЕНИЯ НАДЕЖНОСТИ СЕТЕВЫХ ИНФОРМАЦИОННО-УПРАВЛЯЮЩИХ СИСТЕМ НА ОСНОВЕ РЕКОНФИГУРАЦИИ РЕСУРСОВ ВЫЧИСЛИТЕЛЬНЫХ УСТРОЙСТВ

Специальности:

05.13.11 —Математическое и программное обеспечение ЭВМ, комплексов, систем и сетей

05.13.05 - Элементы и устройства вычислительной техники и систем управления

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук

6 НОЯ 2014

Таганрог - 2014

005554194

Работа выполнена в Научно-исследовательском институте многопроцессорных вычислительных систем имени А.В.Каляева и кафедре интеллектуальных и многопроцессорных систем федерального государственного автономного учреждения высшего профессионального образования «Южный федеральный университет».

Научный консультант: Каляев Игорь Анатольевич,

член-корреспондент РАН, доктор технических наук, профессор.

Официальные оппоненты: Бархоткин Вячеслав Александрович,

доктор технических наук, профессор, НИИ вычислительных средств и систем управления федерального государственного автономного образовательного учреждения высшего

профессионального образования «Национальный исследовательский университет «МИЭТ» (г. Москва), директор;

Камаев Валерий Анатольевич,

доктор технических наук, профессор, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Волгоградский государственный технический университет» (г. Волгоград), заведующий кафедрой;

Павский Валерий Алексеевич,

доктор технических наук, профессор, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский технологический институт пищевой промышленности» (г. Кемерово), заведующий кафедрой Ведущая организация: федеральное государственное бюджетное

образовательное учреждение высшего

профессионального образования «Юго-Западный государственный университет» (г. Курск).

Защита диссертации состоится «12» декабря 2014 г. в 1422 на заседании диссертационного совета Д 212.208.24 при Южном федеральном университете по адресу: 347928, г.Таганрог, ул.Чехова, 2, корпус «И», комн. 347.

С диссертацией можно ознакомиться в зональной научной библиотеке ЮФУ по адресу: г.Ростов-на-Дону, ул.Пушкинская, 148 или на сайте http://hub.sfedu.ru/diss/.

Общая характеристика работы

Актуальность темы исследования.

В настоящее время сетевые информационно-управляющие системы (СИУС), структурно представляющие собой множество полностью равноправных вычислительных элементов - процессорных узлов (ПУ), объединенных в единую систему управления с помощью сетевого канала связи, находят все более широкое применение при создании сложных мехатронных объектов (МО) мобильного и критического применения (транспортные средства, объекты энергетики, космические аппараты и т.п.). Потенциально СИУС обладают целым рядом преимуществ, в том числе высоким быстродействием, достигаемым за счет возможности распараллеливания вычислительного процесса между множеством ПУ, а также высокими надежностью и отказоустойчивостью, достигаемыми за счет возможности перераспределения задач между ПУ в случае отказа некоторых из них.

Степень разработанности темы.

В современных СИУС все эти потенциальные преимущества используются не в полной мере. Существующие в настоящее время СИУС (в частности СИУС интегрированной модульной авионики) имеют, как правило, так называемую федеративную архитектуру, когда за каждым ПУ, входящим в состав системы, жестко закрепляется набор решаемых подзадач и этот набор остается неизменным на весь период эксплуатации СИУС. Такое жесткое закрепление делает систему отказонеустойчивой, поскольку выход из строя любого ПУ приводит к выходу из строя СИУС в целом. Обеспечение требуемой надежности и отказоустойчивости при этом достигается за счет введения в состав СИУС дополнительных резервных ПУ, служащих для замены выходящих из строя ПУ. При этом число парируемых отказов определяется числом резервных ПУ в составе СИУС. Очевидно, что данный способ приводит к существенному увеличению массогабаритных, энергетических и стоимостных характеристик СИУС, что далеко не всегда допустимо, особенно в случае бортового применения системы.

В то же время, надежность и отказоустойчивость СИУС могут быть повышены практически без дополнительных аппаратурных затрат. Действительно, поскольку все ПУ, входящие в состав системы, равноправны, то в случае отказа любого из них подзадачи, решаемые отказавшим ПУ, могут быть перераспределены (переразмещены) на работоспособные ПУ без потери функциональных возможностей СИУС в целом. Для этого необходимо, во-первых, чтобы каждый ПУ, входящий в состав такой СИУС, обладал некоторым резервом производительности, позволяющим ему решать дополнительный набор подзадач за отведенное время, а во-вторых, чтобы СИУС обладала возможностью динамической реконфигурации вычислительных ресурсов (т.е. возможностью переразмещения подзадач по работоспособным ПУ) в случае возникновения отказов отдельных ПУ.

Поэтому проблема разработки методов, алгоритмов и программных средств повышения надежности сетевых информационно-управляющих систем на основе резервирования производительности ПУ и динамической реконфигурации их вычислительных ресурсов при возникновении отказов отдельных элементов является актуальной.

Цель и задачи исследования.

Целью диссертационной работы является повышение надежности сетевых информационно-управляющих систем при сохранении номенклатуры реализуемых функций, а также массогабаритных и энергетических характеристик.

Актуальная научная проблема, решению которой посвящена диссертация -разработка теоретических основ повышения надежности СИУС за счет резервирования производительности и динамической реконфигурации ресурсов вычислительного устройства при возникновении отказов отдельных элементов (процессорных узлов).

Решение сформулированной выше научной проблемы обусловливает необходимость решения следующих частных задач:

- проведения анализа существующих способов организации и обеспечения надежности ИУС современных мехатронных объектов и исследования эффективности их применения при создании СИУС МО;

- разработки нового способа повышения надежности вычислительного устройства СИУС за счет резервирования производительности и перераспределения ресурсов процессорных узлов;

-разработки метода повышения надежности вычислительного устройства СИУС за счет равномерного распределения нагрузки между процессорными узлами;

- разработки методов реконфигурации (перераспределения) вычислительных ресурсов СИУС при возникновении отказов отдельных элементов;

-разработки методов и алгоритмов децентрализованного диспетчирования работы СИУС с помощью множества локальных диспетчеров;

- разработки алгоритмов размещения подзадач задачи управления по множеству работоспособных ПУ с помощью множества локальных диспетчеров;

-разработки унифицированных программных средств локального диспетчера;

- разработки программной модели СИУС и исследования с ее помощью работоспособности и эффективности предложенных в диссертации методов и алгоритмов;

- практической реализации и использования разработанных методов, алгоритмов и программных средств при создании СИУС для мехатронных объектов мобильного и критического применения.

Объект исследования - методы и средства повышения надежности информационно-управляющих систем мехатронных объектов мобильного и критического применения.

Методы исследований основаны на использовании теории управления, теории надежности, теории вероятности, теории многопроцессорных вычислительных систем, комплексов и сетей, теории мультиагентного взаимодействия, теории планирования эксперимента.

Научная новизна работы.

Научная новизна заключается в применении принципиально нового подхода к проблеме повышения надежности вычислительного устройства (ВУ) СИУС, основанного на резервировании производительности отдельных процессорных узлов и динамическом перераспределении (реконфигурации) их вычислительных ресурсов при возникновении отказов с помощью децентрализованного диспетчера.

В частности, в работе получены следующие основные научные результаты.

1. Новый способ повышения надежности вычислительного устройства СИУС, отличающийся использованием резерва производительности отдельных процессорных узлов и перераспределением (реконфигурацией) их вычислительных ресурсов при возникновении отказов.

2. Метод повышения надежности вычислительного устройства СИУС за счет выравнивания вычислительной нагрузки между отдельными процессорными узлами при проведении процедуры реконфигурации, отличающийся учетом отклонения нагрузки отдельных ПУ от среднего значения при проведении данной процедуры.

3. Доказательство утверждения о преимуществе использования в СИУС предложенного способа резервирования производительности в сочетании с методом выравнивания нагрузки по сравнению со способом структурного скользящего резервирования.

4. Метод децентрализованного диспетчирования работы вычислительного устройства СИУС с помощью множества локальных диспетчеров, физически реализуемых на отдельных процессорных узлах, отличающийся использованием принципов мультиагентного взаимодействия между ними при выполнении процедуры реконфигурации вычислительных ресурсов СИУС.

5. Алгоритмы размещения подзадач задачи управления по работоспособным процессорным узлам при возникновении отказов с помощью множества локальных диспетчеров, отличающиеся учетом условия выравнивания вычислительной нагрузки между ними.

6. Структура программных средств локального диспетчера процессорного узла, отличающаяся введением блоков диагностики состояния ПУ и управления размещением, реализующих процедуру децентрализованного диспетчирования в соответствии разработанными методами и

алгоритмами динамической реконфигурации вычислительных ресурсов СИУС при возникновении отказов элементов.

Новизна полученных результатов подтверждается отсутствием аналогичных результатов в открытых доступных источниках.

Теоретическая и практическая значимость.

Применение способа резервирования производительности процессорных узлов и реконфигурации их вычислительных ресурсов при возникновении отказов позволяет, с одной стороны, существенно повысить надежность и живучесть вычислительного устройства СИУС, а с другой стороны, повысить его быстродействие (т.е. сократить время решения задачи управления) при сохранении массогабаритных и стоимостных характеристик. Кроме того, применение программных средств локального диспетчера позволяет существенно снизить трудоемкость разработки функциональных программ, реализующих подзадачи общей задачи управления мехатронным объектом.

В частности, за счет использования разработанных в диссертационной работе методов и программных средств

- гамма-процентная наработка на отказ прототипа СИУС машины перегрузочной атомного реактора увеличена на 56%, а ее эксплуатационные затраты в течение срока эксплуатации снижены на 16%;

- гамма-процентная наработка на отказ СИУС авиационного комплекса дальнего радиолокационного обнаружения (ДРЛО) увеличена на 21%, а при использовании метода выравнивания вычислительной нагрузки — до 30%;

- время решения задачи управления в СИУС авиационного комплекса ДРЛО снижено на 25%;

- трудоемкость создания функциональных программ для СИУС авиационного комплекса ДРЛО снижена на 20-40%.

Положения, выносимые на защиту.

1. Резервирование производительности и реконфигурация ресурсов процессорных узлов при возникновении отказов обеспечивает повышение надежности вычислительного устройства СИУС при сохранении заданного уровня аппаратурных, энергетических и стоимостных затрат.

2. Выравнивание вычислительной нагрузки между процессорными узлами ВУ СИУС при проведении процедуры реконфигурации позволяет повысить его надежность.

3. Реконфигурация вычислительного устройства СИУС при возникновении отказов с помощью децентрализованного диспетчера позволяет сохранить заданный уровень вероятности его безотказной работы без увеличения массогабаритных и стоимостных характеристик.

Результаты, выносимые на защиту:

• способ повышения надежности вычислительного устройства СИУС, отличающийся использованием резерва производительности отдельных процессорных узлов и перераспределением (реконфигурацией) их вычислительных ресурсов при возникновении отказов;

• метод повышения надежности вычислительного устройства СИУС за счет выравнивания вычислительной нагрузки процессорных узлов, отличающийся учетом отклонения нагрузки отдельных процессорных узлов от среднего значения при проведении процедуры реконфигурации;

• метод децентрализованного диспетчирования работы вычислительного устройства СИУС с помощью множества локальных диспетчеров, отличающийся использованием принципов мультиагентного взаимодействия между ними при выполнении процедуры реконфигурации вычислительных ресурсов СИУС;

• алгоритмы работы локальных диспетчеров, в том числе при решении задачи размещения подзадач задачи управления по работоспособным процессорным узлам, отличающиеся учетом условия выравнивания вычислительной нагрузки между ними;

• структурная организация программных средств локального диспетчера процессорного узла, отличающаяся введением блоков диагностики состояния ПУ и управления размещением, отвечающих за мониторинг текущего состояния ПУ и реконфигурацию вычислительных ресурсов СИУС при возникновении отказов.

Степень достоверности и апробация результатов.

Достоверность и обоснованность научных исследований подтверждается теоретическим обоснованием, основанным на использовании классического математического аппарата, и практически полным совпадением теоретических результатов с результатами испытаний прототипов информационно-управляющих систем.

Реализация результатов работы. Основные результаты диссертационных исследований были использованы в следующих работах.

1. НИР "Разработка аппаратно-программных средств повышенной надежности для модернизированной машины перегрузочной энергоблоков АЭС с реактором типа ВВЭР на основе технологии многопроцессорных вычислительных систем с программируемой архитектурой" в рамках межотраслевой научно-технической программы сотрудничества Минобразования и Минатома России по направлению «Научно-инновационное сотрудничество» (НИИ МВС ТРТУ, г/б № 524306, шифр "Мезонин", № ГР 01.0.40 001165), 2003 г.

2. ОКР "Разработка и изготовление комплекса технических средств системы управления машины перегрузочной энергоблока №1 Волгодонской АЭС" (НИИ МВС ТРТУ, х/д 524232, шифр «Контроль»), 2002-2005 гг.

3. НИР «Разработка теоретических основ построения децентрализованных мультиагентных систем поиска и обработки информации в телекоммуникационных и компьютерных сетях на базе принципов коллективного принятия решений» (НИИ МВСТРТУ, г/б 556139, шифр «Агент», №ГР 0120.0511688), 2005-2008 гг.

4. НИР «Создание методов и алгоритмов построения распределенных вычислительных систем без централизации функций управления» в рамках ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники на 2002-2006 годы» (НИИ МВС ТРТУ, шифр «Децентрализация», №ГР 0120.0603027), 2005-2006 гг.

5. НИР «Разработка технологии организации отказоустойчивых распределенных вычислений в системах реального времени на основе мультиагентного взаимодействия» в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы» (НИИ МВС ЮФУ, г/к 02.514.11.4003, шифр «Децентрализация 2», №ГР 01.2.007 06420), 2007 г.

6. НИР «Разработка методов и средств повышения безопасности и эффективности функционирования распределенных информационно-управляющих систем сложных технических объектов» в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы» (НИИ МВС ЮФУ, г/к 02.514.11.4085, шифр «Децентрализация 3», №ГР 01200852907), 2008-2009 гг.

7. НИР «Разработка методов и алгоритмов повышения надежности и эффективности бортовых информационно-управляющих систем» (НИИ МВС ЮФУ, г/б 302/23153, шифр «Агент 2», №ГР 01201263488), 2012-2014 гг.

8. НИР «Разработка методов и алгоритмов децентрализованной обработки информации и управления в многопроцессорных вычислительно-управляющих системах сложных, распределенных объектов на основе принципов мультиагентного взаимодействия» (грант РФФИ №05-08-33501 а, шифр «Поиск»), 2005-2007 гг.

9. НИР «Разработка методов и алгоритмов децентрализованного распределения ресурсов в ОЯГО-структурах» (грант РФФИ №08-07-00249а, шифр «Поиск 2»), 2008-2010 гг.

10. НИР «Разработка научных основ создания сетецентрических информационно-управляющих систем» (грант РФФИ №11-07-00542а, шифр «Сети», № ГР01201164291), 2011-2013 гг.

11. НИР «Исследования по формированию облика программно-аппаратных средств для построения современных авиационных распределенных информационно-диагностических и управляющих систем» (НИИ МВС ЮФУ, х/д 302/25211, шифр «ИМА конструктор - МВС», №ГР01201274298), 2012 г.

12. СЧ ОКР «Разработка программных средств организации вычислительного процесса на базе мультиагентного диспетчера» (НИИ МВС ЮФУ, х/д 593220, шифр «Премьер - ОВП ФПО»), 2009 - 2017 гг.

Апробация работы. Основные результаты диссертационной работы были представлены на

-Всероссийской научно-технической конференции с международным участием «Компьютерные технологии в инженерной и управленческой деятельности», г. Таганрог, 2002 г.;

- Международной научно-технической конференции «СуперЭВМ и многопроцессорные вычислительные системы», 26-30 июня 2002, Таганрог;

- Первой научной молодежной школе «Интеллектуальные мехатронные робототехнические системы», п.Кацивели, Украина, 2002 г.;

- Международной научно-технической конференции «Интеллектуальные и многопроцессорные системы - 2003», с.Дивноморское, 2003 г.;

- Международной научно-технической конференции «Искусственный интеллект. Интеллектуальные и многопроцессорные системы», п.Кацивели, Украина, 2004 г.;

- Международной научно-технической конференции «Интеллектуальные и многопроцессорные системы - 2005», с.Дивноморское, 2005 г.;

- Седьмой Международной научно-технической конференции «Искусственный интеллект. Интеллектуальные и многопроцессорные системы -2006», с. Кацивели, Украина, 2006 г.;

- Международной научно-практической конференции «Прогресс транспортных средств - 2009». г.Волгоград, 2009 г.;

- Международной научно-технической конференции «Суперкомпьютерные технологии: разработка, программирование, применение» (СКТ-2010), с. Дивноморское, 2010 г.;

- 4-й Всероссийской мультиконференции по проблемам управления (МКПУ— 2011), с.Дивноморское, 2011 г.;

- Международной научно-практической конференции «Теория активных систем», 14-16 ноября 2011 г., Москва;

- 2-й Всероссийской научно-технической конференции «Суперкомпьютерные технологии» (СКТ-2012), с. Дивноморское, 2012 г.;

- 1-м Международном симпозиуме «Гибридные и синергетические интеллектуальные системы: теория и практика», г.Калининград, 2012 г.;

- 7-й Всероссийской научно-практической конференции «Перспективные системы и задачи управления», п.Домбай, 2012 г.;

- III Международной конференции «Инфокоммуникационные и вычислительные технологии и системы», г.Улан-Удэ, 2010 г.

Авторство, новизна и полезность принципиальных технических решений защищены 2 патентами РФ на полезную модель и 6 свидетельствами об официальной регистрации программ на ЭВМ.

Из работ, выполненных в составе коллектива авторов, в диссертации использованы результаты, полученные автором лично.

Публикации.

Научные и практические результаты диссертации отражены в 75 публикациях. Основные результаты диссертации опубликованы в 24 работах в рецензируемых научных изданиях, из которых 1 монография (авторский вклад 50%); 15 статей общим объемом 118 стр. (авторский вклад 40%) в ведущих научных журналах и изданиях (14 в журналах, включенных в перечень ВАК); 2 патента РФ на полезную модель (авторский вклад 50%); 6 свидетельств об официальной регистрации программ на ЭВМ (авторский вклад 19%).

Кроме того, результаты диссертации отражены в 2 коллективных монографиях (авторский вклад 3,5%); 12 зарегистрированных отчетах о НИР общим объемом 1900 стр., из них 550 стр. авторских; 37 тезисах докладов и статьях в сборниках трудов конференций общим объемом 159 стр. (авторский вклад 40%).

Внедрение результатов. Результаты работы были внедрены и используются в следующих организациях: ОАО «Концерн «Вега» (г.Москва), ОАО «ВНИИАМ» (г.Москва), ФГУП «ГосНИИАС» (г.Москва), НИИ многопроцессорных вычислительных систем ЮФУ (г. Таганрог).

Основное содержание работы

Структура и объём диссертации. Диссертация состоит из введения, шести глав, заключения, списка литературы и приложений.

Содержание работы изложено на 265 страницах, работа содержит 120 рисунков и 12 таблиц, список используемой литературы из 153 наименований.

Во введении обоснована актуальность темы, сформулирована цель и основные задачи исследования.

В первой главе исследованы принципы организации и особенности функционирования современных ИУС мехатронных объектов (МО).

Проведен анализ мехатронных объектов различного назначения, выделен класс МО мобильного и критического применения, к которым предъявляются повышенные требования по надежности и отказоустойчивости функционирования, массогабаритным размерам и энергопотреблению. Показано, что основную роль в обеспечении надежности и безопасности функционирования мехатронного объекта играет его информационно-управляющая система, функции которой заключаются в решении задачи управления МО. При этом сама задача управления может быть представлена в виде графа С(д,Х), где 2 - множество вершин, каждая из которых соответствует некоторой функциональной подзадаче, решаемой МО, Х- множество дуг, определяющее информационные связи между подзадачами. Каждая вершина (подзадача) характеризуется некоторой трудоемкостью (вычислительной сложностью), а каждая дуга х^^еХ (информационная связь) - объемом передаваемых данных за один цикл вычислений. Показано, что граф X) удобно представлять в ярусно-параллельной форме, где каждый ярус включает в себя некоторое подмножество операционных вершин (подзадач), реализация которых может осуществляться параллельно.

Считается, что ИУС работоспособна, если задача управления МО решается за время, не превышающее максимально допустимое время Гц\ При этом в случае отказа какого-либо элемента отказ всей ИУС не фиксируется, если вычислительный процесс удается восстановить за время, не превышающее максимально допустимое время восстановления вычислительного процесса ГБвп3-

На основе анализа особенностей функционирования ИУС МО сформулированы предъявляемые к ним требования, в число которых входят требования по быстродействию (т.е. решению задачи управления МО за допустимое время Гц1), требования по надежности (т.е. обеспечению вероятности безотказной работы не ниже Рмик и гамма-процентной наработки на отказ (времени, за которое вероятность безотказной работы станет менее Рккн) не ниже /у ми„) и стоимостные требования (т.е. стоимость не выше Стах)-

Исходя из сформулированных требований, проведен качественный анализ существующих способов организации ИУС и показано, что наиболее эффективным способом с точки зрения критериев быстродействия, надежности и стоимости является распределенная сетевая организация вычислительного устройства ИУС с

сетевым цифровым интерфейсом. При этом подразумевается, что в состав СИУС входит некоторое множество однотипных вычислительных элементов (процессорных узлов), объединенных друг с другом, а также с информационными и исполнительными устройствами МО с помощью некоторой коммутационной сети (КС). Для того чтобы СИУС удовлетворяла сформулированным выше требованиям, необходимо, в первую очередь, обеспечить высокое быстродействие и надежность вычислительного устройства СИУС. Поэтому дальнейшие исследования, проводимые в диссертационной работе, связаны именно с вычислительной частью СИУС, в то время как вопросы, связанные с обеспечением надежности коммутационной среды (КС), выходят за рамки настоящего исследования.

В первой главе диссертации также проведены исследования различных способов распараллеливания вычислительного процесса в вычислительном устройстве СИУС, позволяющих существенно повысить его быстродействие. Рассмотрены параллельный и конвейерный способы организации вычислительного процесса в СИУС и показано, что параллельный способ целесообразно применять в случае, когда пропускная способность КС является ограничивающим фактором для достижения требуемого быстродействия, а конвейерный - в случае, когда пропускная способность КС не вносит существенного вклада в общее время решения задачи управления.

Далее проведен анализ известных методов повышения надежности на основе различных способов резервирования (структурного, функционального, нагрузочного и временного) с точки зрения возможности и эффективности их использования при создании вычислительного устройства СИУС. Показано, что среди перечисленных способов резервирования наиболее эффективным является структурный способ скользящего резервирования (рисунок 1), который позволяет полностью восстановить работу СИУС в случае отказа отдельных компонентов.

Однако реализация способа скользящего резервирования требует введения в состав СИУС дополнительного оборудования (резервных ПУ) и, как следствие, приводит к возрастанию ее массогабаритных, энергетических и стоимостных характеристик, что при создании бортовых СИУС мехатронных объектов мобильного и критического применения зачастую является недопустимым.

Поэтому сделан вывод о необходимости и актуальности разработки методов и средств, позволяющих обеспечить требуемый уровень надежности СИУС без введения в ее состав дополнительного оборудования.

ПУ,

с

ПУ,

ПУ;

ПУ

н

Резерв

ПУ,

Р1

ПУ

РВ

Коммутационная среда

Рисунок 1 - Структура СИУС со скользящим резервированием ПУ

Во второй главе предложен новый способ повышения надежности ВУ СИУС, основная идея которого заключается в создании некоторого резерва производительности в каждом ПУ, входящем в состав СИУС, и переразмещении подзадач задачи управления МО на работоспособные ПУ при возникновении отказов (рисунок 2).

ПУ, ПУ, ПУ, ПУ„

ш.

14

15

\ Резерв

производительности

Размещение подзадач по ПУ до момента возникновения отказа

ПУ, Г1У. ПУ, ПУ,,

9

с

10

г

11

14

15

Размещение подзадач по ПУ после реконфигурации

Рисунок 2 - СИУС с резервом производительности

При этом необходимый резерв производительности Д (в процентах) в каждом ПУ при заданном количестве парируемых отказов определяется следующим выражением:

А*— 100% N

где ТУ- число ПУ в СИУС;

В - число парируемых отказов.

Получено выражение вероятности безотказной работы ВУ СИУС при использовании способа резервирования производительности:

к=О

где Рпу - вероятность безотказной работы одного ПУ.

Проведено сравнение предлагаемого способа резервирования производительности и известного способа структурного скользящего резервирования и показано, что предлагаемый способ при равных аппаратурных затратах на реализацию вычислительного устройства СИУС позволяет:

- обеспечить требуемые характеристики надежности ВУ СИУС без введения в состав ВУ СИУС дополнительных ПУ;

- при равном числе парируемых отказов обеспечить лучшие характеристики надежности и энергопотребления ВУ СИУС (рисунок 3);

■ обеспечить более высокое быстродействие ВУ СИУС, поскольку все работоспособные в текущий момент времени вычислительные ресурсы будут задействованы в решении задачи управления.

Скользящее резервирование ({Н + В) ПУ на базе tntei Соте В - 530)

В - число парируемых отказов р- вероятность безотказной работы IV- потребляемая мощность

Способ резервирования производительности (Н ПУ на базе Iniel Согв ¡5 - 661>

В

Способ резервирования производительности (НПУ на базе Ш!е1 Соте ¡5 - 750)

Рисунок 3 - Сравнение скользящего резервирования и резервирования производительности

Исследован случай использования смешанного резервирования, сочетающего способ резервирования производительности ПУ и способ структурного скользящего резервирования ПУ. При этом требуемый уровень надежности достигается как за счет избыточной производительности отдельных ПУ, так и за счет введения в состав СИУС дополнительных резервных устройств. Показано, что данный способ резервирования целесообразно применять в случае ограниченного диапазона доступных производительностей ПУ и в случае ограниченных возможностей по перераспределению подзадач между ними (если трудоемкость подзадач достаточно велика по сравнению с производительностью ПУ).

Способ резервирования производительности ПУ подразумевает проведение процедуры реконфигурации (переразмещения подзадач задачи управления МО по ПУ) при возникновении отказов отдельных процессорных узлов. В диссертации разработан метод выравнивания нагрузки ПУ вычислительного устройства СИУС, предполагающий равномерное распределение вычислительной нагрузки между ПУ в процессе реконфигурации, и показано, что его использование позволит дополнительно повысить вероятность безотказной работы СИУС в целом. Это связано с нелинейным увеличением интенсивности отказов отдельных ПУ в зависимости от температуры их нагрева, которая в свою очередь зависит от вычислительной нагрузки ПУ:

дг

Я = Я0 ■ 21,1,

где Ло - интенсивность отказов ПУ при работе без нагрузки;

АТ-разность температур ПУ без нагрузки и с текущей нагрузкой.

Получено общее выражение вероятности безотказной работы ВУ СИУС при наличии в ее составе ПУ с различным уровнем вычислительной нагрузки:

1=0 у=0 *=0

п - Рп,ус:ГР:-'(\- р. ус^р^а - р. /

_ при / + У + к < В,

0 при г + У + к > В; р =(Р )к(АТ-' - вероятность безотказной работы ПУ с повышенной вычислительной нагрузкой;

р _ (РПу)н'"т-> - вероятность безотказной работы ПУ с пониженной вычислительной нагрузкой;

.НАГ} г

Рпу ~ ' пуа' _ вероятность безотказной работы ПУ с усредненной нагрузкой;

р^^ _ вероятность безотказной работы ПУ без нагрузки;

цх) = 2^> - коэффициент изменения интенсивности отказов в зависимости от температуры;

ДГ - разность температур ПУ с усредненной нагрузкой и ПУ без нагрузки; д Т - разность температур ПУ с повышенной и усредненной нагрузкой;

дТ - разность температур ПУ с пониженной и усредненной нагрузкой;

дг _ число ПУ с повышенной нагрузкой;

дг - ЧИСЛО ПУ с пониженной нагрузкой;

N - число ПУ с усредненной нагрузкой.

р

На основе анализа полученного выражения показано, что: - в большинстве случаев равномерное распределение нагрузки позволяет повысить вероятность безотказной работы ВУ СИУС (ис^ючение - СИУС в которых допустимое число отказов В близко к N (№=2, В=1; №=5, 6=4; ЛМ1, В-Ю и

Т П'))' - максимальное значение разности гамма-процентной наработки на отказ с выравниванием и без выравнивания нагрузки достигается при В-М2+1, т.е.

А/ =1 -Г -*тах при 5 = N/2 + 1.

ГУ '"Р г

где /ур- гамма-процентная наработка на отказ при реализации выравнивания нагрузки;

¡у ир - гамма-процентная наработка на отказ без реализации выравнивания нагрузки;

- применение метода выравнивания нагрузки ПУ позволяет увеличить гамма-процентную наработку на отказ до 28% по сравнению со случаем неравномерной нагрузки. На рисунке 4 приведен пример зависимости достигаемого эффекта от числа парируемых отказов В при N=7, Рит=0,999, л=0,00001 1/ч;

- при увеличении ДГ+, Л+, ДТ. и N. увеличивается эффект от применения выравнивания нагрузки.

Проведено сравнение нового способа резервирования в сочетании с методом выравнивания нагрузки и способа скользящего резервирования. Сформулировано следующее утверждение: при равных аппаратных затратах применение резервирования производительности в сочетании с выравниванием нагрузки процессорных узлов в вычислительном устройстве СИУС повышает вероятность его безотказной работы по сравнению со случаем использования скользящего резервирования. Для доказательства утверждения введена лемма о том, что в вычислительном устройстве, состоящем из N ПУ, выравнивание вычислительной нагрузки позволяет повысить вероятность его безотказной работы. Сначала лемма доказана для N=2. Далее на основе метода математической индукции ее справедливость доказана для общего случая. Поскольку скользящее резервирование предполагает наличие в составе вычислительного устройства СИУС основных и резервных процессорных узлов с разной нагрузкой, то такое устройство будет обладать меньшей вероятностью безотказной работы по сравнению с ВУ с равномерной нагрузкой ПУ.

Был проведен анализ различных конфигураций вычислительного устройства СИУС, в результате которого было показано, что при использовании резервирования производительности в сочетании с выравниванием нагрузки гамма-процентная наработка на отказ данного устройства может быть значительно повышена.

Третья глава диссертации посвящена исследованиям методов и алгоритмов диспетчирования работы ВУ СИУС при выполнении процедуры реконфигурации.

Показано, что для обеспечения процедуры реконфигурации в состав ВУ СИУС должен входить некоторый диспетчер, функции которого заключаются в мониторинге работоспособности отдельных ПУ и перераспределения подзадач задачи управления при выходе их из строя некоторых из них. Рассмотрены способы организации такого диспетчера ВУ СИУС. Показано, что наиболее очевидным способом реализации диспетчера является добавление в систему дополнительного ПУ, реализующего функции диспетчирования (рисунок 5, а). Однако данный способ приводит, во-первых, к увеличению массогабаритных характеристик СИУС, а во-вторых, к существенному снижению вероятности ее безотказной работы, т.к. отказ диспетчера приводит к отказу всей СИУС в целом.

Рис. 4. - Зависимость увеличения гамма-процентной наработки на отказ при использовании метода выравнивания нагрузки ПУ

Поэтому в диссертации предложен метод организации децентрализованного диспетчирования работы ВУ СИУС с помощью множества локальных диспетчеров (ЛД), физически реализуемых на отдельных ПУ и совместно участвующих в процессе диспетчирования ресурсов ВУ СИУС на принципах мультиагентного взаимодействия (рисунок 5, б). Данный подход лишен перечисленных выше недостатков, поскольку не требует ввода в состав СИУС дополнительных устройств.

Рис. 5. Организация диспетчирования с выделенным и распределенным

диспетчером

Рассмотрены особенности функционирования ВУ СИУС, использующего такой распределенный диспетчер, при различных способах организации вычислительного процесса. Для каждого способа построены временные диаграммы работы ВУ СИУС и получены временные оценки восстановления вычислительного

процесса в ВУ СИУ С при возникновении отказов с помощью децентрализованного диспетчера

На основе проведенного анализа выделены основные режимы функционирования локального диспетчера, а именно режим тестирования, режим реконфигурации и режим решения задачи управления функции, и определены основные функции, реализуемые ЛД в различных режимах.

Режим тестирования.

1° Диагностирование работоспособности «своего» ПУ.

2° Пересылка сообщения о работоспособности «своего» ПУ всем остальным ПУ, входящим в состав СИУС.

3° Получение сообщений от локальных диспетчеров других ПУ, подтверждающих их работоспособность.

4° В случае если хотя бы один из основных ПУ, задействованных в решении задачи, не подтвердил свою работоспособность, то перейти в режим реконфигурации.

5° Если же все основные ПУ подтвердили свою работоспособность, то переход в режим решения задачи управления.

Режим реконфигурации.

1 "Участие в процедуре перераспределения (размещения) операционных вершин графа по работоспособным ПУ.

2° По завершении процедуры перераспределения (размещения) переход в режим решения задачи управления.

Режим решения задачи управления.

1° Получение от других ПУ и внешних информационных источников исходных данных, необходимых для решения множества подзадач, закрепленных за «своим» ПУ.

2° Решение подзадач множества.

3° Передача данных, полученных в результате решения подзадач множества, на другие ПУ или на внешние исполнительные устройства соответствии с топологией связей вершин графа.

4° Переход в режим тестирования.

В третьей главе также разработаны подробные алгоритмы работы ЛД в режимах тестирования и решения задачи управления.

Из перечисленных выше режимов функционирования ЛД наиболее сложным в реализации является режим реконфигурации, т.к. он требует решения оптимизационной задачи размещения подзадач задачи управления МО на работоспособные ПУ с учетом необходимости выравнивания нагрузки между ними. Разработке алгоритмов функционирования ЛД в режиме реконфигурации посвящена четвертая глава диссертации.

В этой главе дана формальная постановка задачи размещения подзадач задачи управления МО по ПУ СИУС. Исходными данными являются: число вершин графа задачи управления (Л/=|6|); вычислительная сложность всех подзадач (К={ К,};

;=1,А/); объемы передаваемых между ними данных (»'={М:}=\М.Щ): количество {К) и производительность (5Пу) отдельных ПУ СИУС; пропускная способность ее коммутационной сети (У).

Необходимо найти такое распределение подзадач по ПУ СИУС, чтобы при этом выполнялись следующие условия:

X

1' 1

Т„ < Г; д.о =

N

—-< ; Т,*> < '

где Треш - время решения задачи управления;

Граз - время решения задачи размещения подзадач задачи управления на ПУ СИУС;

Гц3 - ограничение времени цикла решения задачи управления;

АОдоп - максимально допустимое отклонение нагрузки ПУ от среднего значения;

Гввп3 - время восстановления вычислительного процесса в ВУ СИУС (время

реконфигурации).

При этом показано, что значение Греш может быть получено с помощью следующего выражения:

т;ш = пшх(Т„ш (чГ) + т^(дГ,чк));

Трсш(дГ')'= + )) + Т(як>), 1 =

Трсш(дГ2) = »¿(Т^чГ^ + Т^дГ.яГ1)) + Т(дГ ),< = 1,2,..,М„2;

) = Ш1Х(Т^(ЧГ) + Тт(дГ,чП) + Т(ч: Л ' = 1,2,...,;

мах^Т^ц)) + Т^)) + Т(), У = 1,2,...,А/,; = + У = 1,2,...,М0,

где ) - абсолютное время решения /-ой подзадачиу'-го яруса задачи

управления МО;

) ~ время решения подзадачи д/ на ПУ;

Т (<?/', <у/ ) - время передачи данных от подзадачи (/'-1)-го яруса к подзадачеу'-го яруса графа С(2,Л);

Т (д0 >ч') ~~ вРемя передачи данных от информационных (сенсорных) устройств МО к У-й подзадаче яруса 1;

Т (чК Х у Чк ) ~ вРемя передачи команд управления от /-й подзадачи яруса К-\

к исполнительным устройствам МО;

М^ - число вершин (подзадач) нау'-ом ярусе графа;

ЛГ+1 - число ярусов в графе.

Проведены исследования известных подходов к решению задачи размещения и показано, что существующие методы не могут быть применены при решении сформулированной выше задачи, поскольку не учитывают необходимость одновременного удовлетворения критериям сохранения заданного времени решения задачи управления и минимизации разброса вычислительной нагрузки на отдельных ПУ.

Поэтому с учетом приведенных исходных данных и ограничений разработан ряд алгоритмов размещения при различных способах организации вычислительного процесса в ВУ СИУС, обеспечивающих получение допустимого размещения и ориентированных на параллельную реализацию с помощью множества локальных диспетчеров. Получены оценки времени Траз решения задачи размещения, получаемого при использовании предложенных алгоритмов, с помощью которых можно осуществлять выбор того или иного алгоритма в зависимости от условий эксплуатации и способа организации вычислительного процесса в ВУ СИУС (таблица 1).

Таблица 1 - Оценочные характеристики алгоритмов размещения

Алгоритм размещения Время размещения (7"раз) Качество размещения

Параллельный способ организации вычислительного процесса

Поярусное размещение (М ^ М Т +Т, +1.5ЫТ °\2-ЛГ " ) высокое

Частичное размещение Мй(Т+2МТп) среднее

Имитация отжига 500 МоТв высокое

Конвейерный способ организации вычислительного процесса

Поярусное размещение с разбиением граничных ярусов (\ + ^-)Мот; + вмтп N высокое

В таблице обозначено: Тп - время передачи данных; Тв - время вычисления Треш и АО; Гв"-время вычисления по формуле

Г =

реш

IV..

Г Мк

IX

_

У,с

+

X

уеО!^.

я:

у,

• + •

В качестве примера приведен алгоритм частичного размещения.

1. При обнаружении отказа I ПУ, задействованных в решении задачи <7(2,Л?, сформировать список 2Р закрепленных за ними вершин, требующих переразмещения на Ы-Ь работоспособных ПУ. Отсортировать вершины списка в зависимости от номера их яруса в графе С((),Х).

2. /=1.

3. Выбрать вершину д, из списка {?р и определить значение Т?1Ш'(д,) времени ее решения на ПУ/(/е[1 ;Л-1]).

4. Сообщить значение Треш!(д,) всем остальным ЛД/ (/=1,...у-1^+1,Л-Л).

5. Принять от других ЛД/ значения Трсш'(а{)

6. Среди всех полученных значений Греш (<7,) (¿/=1 ,N-1) выбрать минимальное значение Треш'(д^). Закрепить вершину д, за ПУ;.

7. М+\, если /<|2р |, то перейти к п.З, иначе

8. Определить значение Грсш времени решения всей задачи 0(<2уХ). Если 7"р.ц,>7"рсц13, то останов СИУС, иначе

9. Каждый из ЛД(/-1Д-/,) рассчитывает и анализирует значение АОр если /Ю)<АОлоп, то переход к п.11.

10. Пока 7раз<Гввп3 ЛД ПУ с повышенной нагрузкой анализируют возможность передачи части нагрузки на ЛД с самой низкой нагрузкой, ЛД ПУ с пониженной нагрузкой анализируют возможность передачи части нагрузки на ЛД с самой высокой нагрузкой; в случае если это позволяет уменьшить АО, выполняется передача подзадач.

11. Переход в режим решения задачи управления МО.

Пятая глава диссертации посвящена разработке и исследованию программных средств (ПС) локального диспетчера (ЛД), реализующих предложенные в предыдущих главах методы и алгоритмы децентрализованного диспетчирования работы вычислительного устройства СИУС и его реконфигурации при возникновении отказов компонентов. Предложена модифицированная структура программных средств локального диспетчера (рисунок 6), состоящая из следующих модулей и блоков:

- модуля хранения файлов конфигурации (МХФК) с данными о параметрах вычислительного устройства СИУС и решаемой задачи управления;

- модуля хранения заданий (МХЗ), в котором хранятся исполняемые файлы всех подзадач (заданий) задачи управления;

- модуля хранения промежуточных данных (МХД), необходимых для перезапуска заданий при реконфигурации;

-сетевого блока (СБ), отвечающего за организацию информационного обмена между ПС ЛД, а также между отдельными заданиями, реализуемыми на различных процессорных узлах;

-блока управления информационным обменом (БУИО), выполняющего формирование таблиц передачи данных при информационном обмене между заданиями;

-блока контроля запуска заданий (БКЗЗ), выполняющего запуск заданий, закрепленных в соответствии с текущим размещением за «своим» ПУ, а также отслеживание их работы;

- блока работы с конфигурационными данными (БРКД), осуществляющего при запуске считывание этих данных из МХФК и последующую их передачу другим блокам;

- блока работы с модулем хранения данных (БРМХД), выполняющего прием и выполнение запросов на сохранение и считывание промежуточных данных, а также восстановление данных в МХД путем их копирования с других ПУ.

Кроме того, в состав программных средств локального диспетчера введены:

- блок управления размещением (БУР), реализующий совместно с ПС ЛД других процессорных узлов алгоритм размещения заданий по работоспособным узлам при реконфигурации;

-блок диагностики состояния (БДС) процессорного узла, выполняющий функции диагностики работоспособности и нагрузки «своего» ПУ, формирование и отправку другим ПУ «диагностического» сообщения о его состоянии. Кроме того, данный модуль служит для приема и анализа «диагностических» сообщений от других ПУ, обнаружения отказов в их работе и формирования сигнала о необходимости реконфигурации;

Ввод в состав программных средств локального диспетчера БУР и БДС связан с необходимостью выполнения процедуры перераспределения заданий между работоспособными ПУ (при использовании резервирования производительности) в случае отказа, а также учетом дополнительных параметров (нагрузка, температура) при определении необходимости реконфигурации и ее выполнении.

При этом ПС ЛД реализуют следующие основные функции:

- диагностику состояния «своего» ПУ и обмен диагностической информацией с другими ЛД;

- обнаружение отказавших ПУ, принятие решения о необходимости реконфигурации ВУ СИУС, передачу сообщения о необходимости реконфигурации всем другим ЛД и прием от них ответных сообщений;

- участие в процедуре реконфигурации совместно с другими ЛД в соответствии с выбранным алгоритмом размещения подзадач по работоспособным ПУ;

- запуск на «своем» ПУ программ решения закрепленных за ним в результате переразмещения подзадач;

- организацию обмена данными между связными подзадачами, реализуемыми

на различных ПУ.

Данные о запущенных процессах от ОС

___ПУ,

ПС лд

мхз

БКЗЗ

МХФК

БРКД

Данные о состоянии оборудования от ОС

БДС

МХД

БРМХД

БУР

* БУИО

СБ

*

Коммутационная сеть

II

ПУ,

ПУ,

ПУк [

Рисунок 6 - Структура ПС ЛД

Тестирование ПС ЛД с помощью аппаратного макета СИУС (8 ПУ на базе процессоров Intel Core2Duo 2,4 ГГц, ОЗУ 2 Гбайт и 2 сетевых канала связи GigabitEthernet, ОС Windows и QNX) на задачах (2-30 подзадач трудоемкостью 108 - 5*10® операций, темп передачи данных - до 50МБ/с) показало, что:

- затраты производительности ПУ на обеспечение работы ПС ЛД, составляют не более 7%;

- затраты оперативной памяти ПУ, требуемой для организации работы ПС ЛД, не превышают 4%;

-время задержки передачи информации для пакетов размером 100 - 20000 байт составляет 0,2 — 1 мс;

- время реконфигурации системы и восстановления вычислительного

процесса составляет приблизительно 2 с. Для отработки и исследования работоспособности и эффективности функционирования разработанных ПС ЛД, а также методов и алгоритмов функционирования СИУС в целом была создана ее программная модель (рисунок 7). С помощью данной программной модели проведено экспериментальное исследование работы ПС ЛД при различных конфигурациях СИУС и различных сценариях ее функционирования.

Рисунок 7 - Экранная форма программной модели

Исследования с использованием программной модели показали работоспособность разработанных методов и алгоритмов. При этом разница в результатах моделирования, полученных на программной модели и аппаратном макете СИУС, составляет не более 15 %, что подтверждает их достоверность.

В шестой главе приведены результаты практической реализации и использования разработанных в диссертации методов, алгоритмов и программных средств в СИУС мехатронных объектов мобильного и критического применения, к которым предъявляются повышенные требования по надежности и отказоустойчивости функционирования, в частности таких как машина перегрузочная ядерного реактора АЭС (рисунок 8, а) и авиационный комплекс дальнего радиолокационного обнаружения (рисунок 8, б).

Рассмотрены особенности функционирования данных мехатронных объектов, описаны структура и комплекс задач, решаемых их СИУС, показаны преимущества применения разработанных в диссертации методов и программных средств при их создании, в частности:

- в СИУС машины перегрузочной число гарантированно парируемых отказов было увеличено с 1 до 5, гамма-процентная наработка на отказ увеличена на 56%, а эксплуатационные расходы уменьшены на 16% за период эксплуатации;

- в СИУС авиационного комплекса гамма-процентная наработка увеличена на 21% по сравнению со структурным резервированием (до 30% при использовании выравнивания нагрузки), а трудоемкость разработки функциональных программ уменьшена на 20-40% за счет упрощения транспортных модулей и процедуры интеграции ПО.

а) б)

Рисунок 8 - Примеры мехатронных объектов, в СИУС которых внедрены результаты диссертационной работы

Также в шестой главе проведено исследование особенностей применения разработанных методов и алгоритмов реконфигурации в авиационных СИУС интегрированной модульной электроники. На основе проведенного исследования осуществлена модификация разработанных методов и алгоритмов распределенного диспетчирования и реконфигурации с учетом требований стандартов АШМС 653 и АИЫС 664.

Заключение диссертации содержит основные выводы и результаты, полученные в процессе выполнения диссертационной работы, а также рекомендации по проведению дальнейших исследований.

Заключение

В диссертации решена актуальная научная проблема разработки методов и программных средств повышения надежности СИУС при сохранении заданного уровня их массогабаритных, энергетических и стоимостных характеристик на основе нового способа резервирования производительности ПУ и динамической реконфигурации вычислительных ресурсов при возникновении отказов компонентов.

Полученные в диссертационной работе результаты использованы при создании высоконадежных СИУС мехатронных объектов мобильного и критического применения, что позволило существенно повысить их вероятность безотказной работы и гамма-процентную наработку на отказ без дополнительных аппаратных затрат, а также снизить трудоемкость разработки функционального программного обеспечения.

Список работ, опубликованных автором по теме диссертации

Монография.

Мельник Э.В. Децентрализованные системы компьютерного управления: монография / И.А.Каляев, Э.В. Мельник. - Ростов н/Д: Изд-во ЮНЦ РАН, 2011196 с.

Вклад автора: анализ существующих и разработка новых способов резервирования ИУС, разработка методов и алгоритмов распределенного диспетчирования работы таких систем, разработка и исследование эффективности программных средств, реализующих новые методы и алгоритмы.

Публикации в рецензируемых изданиях.

1. Мельник, Э.В. Система повышенной надежности для управления технологическим процессом перегрузки ядерного топлива/В.В.Коробкин, Э.В.Мельник, Л.Ж.Усачев, В.В.Волков // Известия ТРТУ. Тематический выпуск. Материалы Всерос. НТК с международным участием «Компьютерные технологии в инженерной и управленческой деятельности». - 2002 - №2. — С. 143-146.

2. Мельник, Э.В. Отказоустойчивый управляющий вычислительный комплекс машины перегрузочной атомного реактора типа ВВЭР/И.А.Каляев, В.В.Коробкин, Э.В.Мельник, И.В.Малахов //Мехатроника, автоматизация, управление. - 2003. -№3. -С.143-146.

3. Мельник, Э.В. Метод организации распределенных вычислений в управляющих системах/Э.В.Мельник, С.А.Ховансков, И.В.Блуишвили //Мехатроника, автоматизация, управление. - 2003. -№4. - С.36-40.

4. Мельник, Э.В. Об одном подходе к организации поиска информации в сети Интернет/Э.В.Мельник, В.В.Иванов, К.В.Погорелов// Известия ТРТУ. - 2005. -№10.-С. 120-123.

5. Мельник, Э.В. Интеллектуальные многопроцессорные системы/И.А.Каляев, Э.В.Мельник // Вестник компьютерных и информационных технологий. — 2007. - №1. - С.2-9.

6. Мельник, Э.В. Мультиагентная среда организации распределенных вычислений/Э.В.Мельник, И.В.Блуишвили, И.С.Пуха // Известия ТРТУ. - Вып. 16. -2006. - С.25-30.

7. Мельник, Э.В. Планирование эксперимента при исследовании новых методов и алгоритмов организации распределенных вычислений/Э.В.Мельник, Г.В.Горелова, С.А.Радченко, А.И.Каляев // Вестник компьютерных и информационных технологий. - 2007 - №10. - С.49-56.

8. Мельник, Э.В. Метод мультиагентного распределения ресурсов в интеллектуальных многопроцессорных вычислительных системах/И.А.Каляев, Э.В.Мельник // Вестник ЮНЦ РАН. - 2007. - №4. - С. 37-46.

9. Мельник, Э.В. Алгоритм коллективного улучшения плана в задачах распределения ресурсов многопроцессорных информационно-управляющих систем/В.А.Гандурин, С.Г.Капустян, Э.В.Мельник // Вестник компьютерных и информационных технологий. — 2007. — №12. — С.40-50.

10. Мельник, Э.В. Технология организации отказоустойчивого функционирования распределенных информационно-управляющих систем сложных технических объектов/С.Г.Капустян, Э.В.Мельник // Вестник компьютерных и информационных технологий. -2010 - №4. — С.33-41.

11. Мельник, Э.В. Эффект выравнивания вычислительной нагрузки процессорных устройств в высоконадежных распределенных информационно-управляющих системах/Г.В.Горелова, Э.В.Мельник //Мехатроника, автоматизация, управление. — 2012 - С. 29-35.

12. Мельник, Э.В. Имитационное моделирование вариантов резервирования в распределенных информационно-управляющих системах с децентрализованной организацией/Э.В.Мельник, Г.В.Горелова// Известия ЮФУ Сер. Технические науки.

- 2013. -№3. - С. 184-193.

13. Мельник, Э.В. Принципы организации децентрализованных сетецентрических информационно-управляющих систем/Э.В.Мельник, Д.Я.Иванов //Вестник компьютерных и информационных технологий. - 2013. -№4. - С.25-30.

14. Мельник, Э.В. Задача реконфигурирования распределенных информационно-управляющих систем: модель и метод решения/А.Б.Клименко, В.В.Клименко, Э.В.Мельник // В мире научных открытий. Математика, механика, информатика. - Красноярск: Изд-во «Научно-инновационный центр». - 2013. - №6.

- С.245-260.

15. Мельник, Э.В. Организация распределенной обработки данных с применением принципов децентрализованного управления коллективом мобильных

роботов/ И.А.Каляев, Э.В.Мельник, В.В.Волков, Ли Джилин // Искусственный интеллект. -Донецк: Наука \ освгга - 2002. - №4. - С. 554—559.

Личный вклад автора в публикации в рецензируемых изданиях.

1. Разработка алгоритмов, обеспечивающих снижение вероятности выдачи несанкционированной команды.

2. Разработка структуры программного обеспечения, обеспечивающей децентрализованную организацию вычислительного процесса.

3. Разработка модифицированных принципов коллективного принятия решений для децентрализованной организации распределения вычислительной нагрузки в распределенных системах.

4. Разработка метода децентрализованной организации взаимодействия поисковых агентов при считывании и анализе информации в глобальных сетях.

5. Мулътиагентная реализация нового метода распределения ресурсов, исследование его эффективности.

6. Разработка способа децентрализованного диспетчирования работы распределенной среды (системы).

7. Моделирование работы распределенной вычислительной системы при исследовании новых методов и алгоритмов децентрализованной организации распределенных вычислений.

8. Исследование проблем организации параллельной обработки информации, разработка децентрализованной реализации мультиагентного алгоритма распределения вычислительной нагрузки и проведение исследования его эффективности.

9. Формальная постановка задачи распределения ресурсов распределенной ИУС и разработка децентрализованной реализации ее решения.

10. Разработка технологии проектирования программных средств для отказоустойчивых ИУС с децентрализованным диспетчированием с использованием программных моделей и программных библиотек, исследование эффективности данной технологии.

11. Разработка метода выравнивания вычислительной нагрузки и обоснование его эффективности.

12. Разработка способа резервирования производительности и его моделир ование.

13. Разработка общих принципов децентрализованной организации диспетчирования сетецентрических систем с помощью локальных диспетчеров, проведение имитационного моделирования.

14. Формальная постановка задачи реконфигурации распределенной ИУС и адаптация алгоритма имитации отжига для данной постановки.

15. Разработка номенклатуры функций и структуры программного агента для децентрализованного решения задачи распределения вычислений.

Коллективные монографии.

1. Мельник, Э.В. Интеллектуальные распределенные мультисенсорные мониторинговые системы сбора информации, контроля, диагностики и управления для объектов морской, авиационной и ракетно-космической техники с использованием автономных режимов функционирования, цифровых и беспроводных технологий / В.Н.Котов, Э.В.Мельник / Морская, авиационная и ракетно-космическая техничка, радиотехника, автоматика и управление: состояние и перспективы развития в Южном федеральном университете: монография / Алексюнин Е.С. [и др.]. - Ростов-на-Дону: Изд-во Южного федерального университета, 2011. - Гл. 12. - С. 278-298.

2. Мельник, Э. В. Распределенные многопроцессорные информационно-управляющие системы мехатронных и робототехнических устройств и комплексов / И.А.Каляев, С.Г.Капустян, Э.В.Мельник, А.И.Каляев / Научно-образовательные центры Южного федерального университета в области информационных и телекоммуникационных технологий, устройств и систем: результаты научных исследований в 2010 - 2011 годах: монография / Е.С.Абрамов [и др.]. - Ростов-на-Дону: Изд-во Южного федерального университета, 2012. - Гл.З. — С. 165-220.

Личный вклад автора.

1. Разработка концепции построения распределенных систем управления на основе интеллектуальных датчиков без использования централизованного вычислителя.

2. Анализ существующих и разработка нового способа резервирования ИУС, разработка методов и алгоритмов распределенного диспетчирования работы таких систем, разработка программных средств, реализующих новые методы и алгоритмы, и исследование их эффективности.

Патенты на полезные модели.

1. Распределенная информационно-управляющая система на основе интеллектуальных датчиков: п. м. 89257 Российская Федерация : МПК С06Р15/00 С05В13/00 / В.Н.Котов, Э.В.Мельник, И.П.Щербинин, Я.С.Коровин; заявитель и патентообладатель ФГАОУ ВПО «Южный федеральный университет». -№2009134431/22; заявл. 14.09.2009; опубл. 27.11.2009, Бюл.№33. -2 с.: ил.

2. Система обнаружения повреждений трубопровода: п. м. 97534 Российская Федерация : МПК С01Ы29/00/ Э.В.Мельник, Я.С.Коровин; заявитель и патентообладатель Общество с ограниченной ответственностью «Нейросетевые технологии» - №2010116072/28; заявл. 22.04.2010; опубл. 10.09.2010, Бюл.№25. - 2 с.: ил.

Свидетельства о регистрации программ для ЭВМ.

1. Библиотека имитационной программной модели: свидетельство о гос. регистрации прогр. для ЭВМ № 2008614268 Российская Федерация/ Э.В.Мельник, А.В.Пирский, И.С.Пуха; правообладатель ФГАОУ ВПО «Южный федеральный университет» (НИИ многопроцессорных вычислительных систем ЮФУ). -Зарегистрировано в Реестре программ для ЭВМ 05.09.2008.

2. Программная система распределенного децентрализованного поиска и анализа информации в сети Internet: свидетельство о гос. регистрации прогр. для ЭВМ № 2008614267 Российская Федерация / Э.В.Мельник, К.В.Погорелов; правообладатель ФГАОУ ВПО «Южный федеральный университет» (НИИ многопроцессорных вычислительных систем ЮФУ). - Зарегистрировано в Реестре программ для ЭВМ 05.09.2008.

3. Имитатор программных средств организации вычислительного процесса в децентрализованной отказоустойчивой вычислительной системе: свидетельство о гос. регистрации прогр. для ЭВМ № 2008614265 Российская Федерация / Э.В.Мельник, С. А.Семенистый, А.И.Каляев; правообладатель ФГАОУ ВПО «Южный федеральный университет» (НИИ многопроцессорных вычислительных систем ЮФУ). - Зарегистрировано в Реестре программ для ЭВМ 05.09.2008.

4. Средства отладки и тестирования программных средств организации вычислительного процесса: свидетельство о гос. регистрации прогр. для ЭВМ № 2010612545 Российская Федерация / Э.В.Мельник, Д.С.Кныш; правообладатель ФГАОУ ВПО «Южный федеральный университет». - Зарегистрировано в Реестре программ для ЭВМ 14.04.2010.

5. Программный комплекс системы управления мостового крана для высокорисковых производств : свидетельство о гос. регистрации прогр. для ЭВМ № 2012616974 Российская Федерация / В.В.Коробкин, А.Н.Перчиц, А.И.Серогодский, Э.В.Мельник, И.С.Пуха; правообладатель ФГАОУ ВПО «Южный федеральный университет». - Зарегистрировано в Реестре программ для ЭВМ 03.08.2012.

6. Программная модель для исследования эффективности новых методов и алгоритмов реконфигурации и восстановления РИУС : свидетельство о гос. регистрации прогр. для ЭВМ № 2014611613 Российская Федерация / Э.В.Мельник, М.Ю.Ольшанский, А.Ю.Таранов, К.В.Погорелов, Д.В.Альбицкий; правообладатели: ФГУП «Государственный научно-исследовательский институт авиационных систем», ФГАОУ ВПО «Южный федеральный университет». - Зарегистрировано в Реестре программ для ЭВМ 06.02.2014; опубл. 20.03.2014.

JIP №020565 от 23 июня 1997 г. Подписано к печати 04.09.2014 г. Формат 60x84"". Бумага офсетная. Печать офсетная. Усл. п л.-1,85. Уч-изд. л.-1,65.

Заказ _Тираж 150 экз._

Отпечатано в Секторе обеспечения полиграфической продукции кампуса в г. Таганроге отдела полиграфической корпоративной и сувенирной продукции ИПК КИБИ МЕДИА ЦЕНТРА ЮФУ ГСП 17А, Таганрог, 28, Энгельса, 1, тел. (8634)371717