автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка методики проектирования систем автоматизации процессов делопроизводства с использованием объектно-ориентированных технологий
Автореферат диссертации по теме "Разработка методики проектирования систем автоматизации процессов делопроизводства с использованием объектно-ориентированных технологий"
На правах рукописи
САМАРСКИЙ ДМИТРИЙ АНАТОЛЬЕВИЧ
МЕТОДИКА ПРОЕКТИРОВАНИЯ СИСТЕМ АВТОМАТИЗАЦИИ ПРОЦЕССОВ ДЕЛОПРОИЗВОДСТВА С ИСПОЛЬЗОВАНИЕМ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ ТЕХНОЛОГИЙ
Специальность 05.13.01 - Системный анализ, управление и обработка
информации
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Москва - 2004
Работа выполнена в Московском государственном техническом университете им. Н.Э. Баумана.
Научный руководитель кандидат технических наук, доцент
Иванов Игорь Потапович.
Официальные оппоненты доктор технических наук, проф.
Ретинская Ирина Владимировна
кандидат технических наук, доцент Троицкий Игорь Иванович
Ведущая организация Вычислительный центр им.
A.A. Дородницина РАН
Защита состоится " " 2005 года в на заседании диссертационного совета Д 212.146.04 при Московском государственном университете леса по адресу: 141005, г. Мытищи-5, Московская область, МГУЛ
С диссертацией можно ознакомиться в библиотеке Московского государственного университета леса.
Автореферат разослан"_"_2005 года.
кандидат технических наук, доцент Тарасенко Павел Алексеевич
bzh
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. В связи с тем, что гетерогенные компьютерные среды стали на сегодняшний день реальностью для многих организаций, повышаются требования к интеграции разнородных приложений в рамках единой корпоративной информационной системы (КИС), которая автоматизирует деятельность предприятия и функционирует в распределенной среде с поддержкой широкого диапазона платформ и сетей. Информация и инструменты управления информацией (программные продукты различного функционального назначения) приобрели статус информационных ресурсов и концентрируются в рамках КИС. К подобному классу систем относятся и системы атгоматизаиии процессов лелппро-изводства (САПД). Современные тенденции значительного роста объемов документооборота, необходимого для принятия управленческих решений, приводит к тому, что приходится получать, обрабатывать и хранить документы в большем количестве, чем раньше. Только своевременное получение необходимых данных и их анализ позволяют принять правильное решение. Традиционные методы работы с документами становятся при этом малоэффективными. Несомненно, что необходимым элементом организации коллективной работы с документами является единая корпоративная САПД в центре и на местах. В соответствии с ГОСТ Р51 141-98 ("Делопроизводство и архивное дело") под термином делопроизводство понимается отрасль деятельности, обеспечивающая документирование и организацию работы с официальными документами. В свою очередь использование единого информационного пространства на основе компьютерных сетей со скоростными каналами связи способно решить проблему взаимодействия всех структурных подразделений крупного территориально распределенного предприятия, имеющего многоуровневую структуру управления и сложные документопотоки.
Реализация САПД масштаба корпорации возможна при создании и последующем соблюдении международных стандартов на взаимодействие между собой ее отдельных компонентов. При этом статичность интерфейсов компонентов, предоставляющих в САПД набор сервисов, достигается путем применения методологий объектно-ориентированного анализа и проектирования, распределенных объектно-ориентированных технологий (Common Object Request Broker Architecture (CORBA), Distributed Common Object Model (DCOM), Enterprise Java-Beans (EJB)) на различных этапах создания САПД.
Однако, создание САПД связано со значительными материальными затратами, что определяет необходимость количественного обоснования принимаемых технических решений и требует рассмотрения широкого круга задач анализа и синтеза архитектуры САПД и ее компонентов. Поэтому в последние годы в связи с широким развертыванием практических работ в области проектирования САПД как у нас в стране, так и за рубежом особенно актуальными становятся проблемы поиска оптимальных решений на различных этапах проектирования и эксплуатации САПД, а также моделирования процессов их функционирования в составе сетей ЭВМ. Однако имеющиеся по данной тематике работы в значительной степени разрознены и отражают, как правило, отдельные частные аспекты указанной проблематики. В связи с этим назрела необходимость в обобщении в рамках единой методики комплекса подходов и методов, позволяющих решать вопросы проектирования архитектуры САПД и проведения количественной оценки различных аспектов их функционирования, что подчеркивает актуальность проводимых в диссер-
тационной работе исследований.
■>ОС. ИДЦИОНЛЛЬ БИБЛИОТЕКА СНстср&рг
оэ пщ>Уёш*
Целью диссертационной работы является разработка методики проектирования и анализа параметров функционирования САПД, ориентированных на использование объектно-ориентированных технологий.
Достижением этой цели является решение следующих основных задач:
1. Исследование принципов построения САПД с использованием объектно-ориентированных технологий.
2. Разработка формализованной модели расчетов параметров функционирования выделенного класса систем автоматизации, ориентированных на использование объектно-ориентированных технологий.
3 Решение задачи по проектированию архитектуры САПД в рамках представленной формализованной модели расчетов с использованием нейросетевого подхода.
4. Исследование параметров функционирования САПД с использованием аппарата теории систем массового обслуживания для оценки показателей эффективности данного класса систем автоматизации.
Научная новизна. В диссертационной работе получены и выносятся на защиту следующие научные результаты:
1 Предложена формализованная модель расчета основных параметров функционирования САПД, реализованная на основе объединения нейросетевых технологий и теории систем массового обслуживания
2. Разработан метод проектирования архитектуры САПД в условиях неопределенности на основе использования нейросетевого подхода, позволяющий повысить качество принимаемых архитектурных решений.
Практическая ценность диссертационной работы заключается в следующем:
1. Разработана и представлена методика проектирования САПД, построенных с использованием объектно-ориентированной технологии CORBA (Common Object Request Broker Architecture), позволяющая снизить трудоемкость их создания и обеспечить требуемое качество реализуемых функций.
2. Полученные результаты доведены до уровня практического использования и применялись, в частности, для решения задачи проектирования архитектуры и исследования параметров функционирования САПД "Делопроизводства-М" Аппарата Правительства Российской Федерации.
Внедрение. Результаты диссертационной работы в виде рекомендаций по методам построения САПД с использованием объектно-ориентированной технологии CORBA, а также методам оценки и повышения производительности АСОУ использовались при разработке и внедрении САПД "Делопроизводстсо-М" Аппарата Правительства Российской Федерации
Достоверность результатов. Достоверность полученных в настоящей диссертационной работе исследований подтверждена сравнением экспериментальных данных с результатами аналитического моделирования, показавшим адекватность полученного в рамках представленной двухуровневой модели расчетов
варианта проектного решения, а также положительным результатом внедрения САПД "Делопроизводство-М" Аппарата Правительства Российской Федерации.
Апробация работы. Содержание отдельных разделов и диссертационной работы в целом было изложено на Всероссийской научно-технической конференции, научных семинарах и заседаниях кафедр Систем обработки информации и Высокопроизводительных компьютерных систем и технологий МГТУ им. Н.Э.Баумана.
Публикации. Основные результаты диссертационной работы опубликованы в 5 печатных работах.
Структура работы. Диссертационная работа состоит из введения, четырех глав и заключения, изложенных на 170 страницах, содержит 49 таблиц и 28 рисунков, список литературы из 45 наименований и приложений.
СОДЕРЖАНИЕ РАБОТЫ
В первой главе диссертационной работы рассматривались вопросы проектирования САПД с использованием объектно-ориентированных технологий. САПД позволяет организовать работу с документами, как с традиционными бумажными документами, реализуя функции ввода, хранения документов в электронном виде, поиска документов по любым критериям, в том числе, и по тексту документа, управления правами доступа к документам и функциям системы, аудита работы пользователей с документами и т.д. В работе отмечается, что САПД должна состоять из набора взаимодействующих друг с другом программных компонент, функционирующих в рамках единой системы. В идеале интеграция программных компонент в САПД должна быть максимально простой, то есть подчиняться принципу "Plug and Play". Однако при разработке САПД, часто не уделяют должного внимания этапам анализа предметной области, разработке и проектированию архитектуры системы, что в результате выражается в нежизнеспособности проектов создания систем автоматизации. За свой короткий жизненный цикл такие системы получили название "сгорающих систем" (stovepipe systems). Характерные черты таких систем (Например, САПД "Делопроизводства" Высшего Арбитражного суда, САПД "Контроль" Главного Контрольного управления, САПД "Дело" Аппарата Правительства Российской Федерации): монолитность, закрытость, трудоемкость внесения изменений, дорогостоящая поддержка, отсутствие документации.
Кроме указанных недостатков можно отметить еще один неоспоримый факт существующих реализаций САПД. Он связан с тем, что в своем стремлении универсализировать построение систем автоматизации данного класса ряд компаний не учитывают особенности организации процессов делопроизводства, присущие отдельным организациям, что не позволяет их достаточно полно использовать или не использовать вообще в целях автоматизации процессов делопроизводства, принятых в организации. Кроме того, часто система становится "сгорающей" из-за способа ее разработки. Это выражается в том, что разработка ведется исключительно для внутренних потребностей подразделения, не предусматривая взаимодействия с внешними системами. Архитектуры таких САПД являются замкнуто-собственными (ad-hoc architecture). Подобные архитектурные решения затрудняют расширение системы, требуют существенной модификации объединяемых компонент САПД, что резко увеличивает стоимость разработки и сроков реализации. Хорошо спроектированная система является ключевым моментом обеспечения адаптируемости данной системы и снижения затрат на ее модернизацию, а
следовательно и снижения стоимости САПД в целом. В качестве же основных документов на разработку выделенного класса систем автоматизации, как правило, выступают Техническое задание на разработку САПД и Инструкция по организации процессов делопроизводства, принятых на предприятии, что создает предпосылки для разработки методик проектирования САПД, которые позволяют упорядочить процесс их создания, сделав его более эффективным и избежать вышеуказанных недостатков при проектировании и разработке данного класса систем автоматизации.
В работе выполнен анализ существующих методов построения САПД. Приведен сравнительный анализ достоинств и недостатков каждого метода, оценена возможность их применения при решении задачи проектирования САПД. На сего-Дг.Яшпий день СущсСТВуЮТ ДВа ОСнОВмых нидхидс) к рЗзрйбш ке I 1|ЛЛ раммных <_И1.-тем, различие между которыми обусловлено критериями декомпозиции. Это структурный и объектно-ориентированный подходы. Применение традиционного структурного подхода к разработке САПД приводит к тому, что сложность разработки таких систем нарастает лавинообразно: незначительные изменения функциональных характеристик, затрагивающих самый верхний уровень в программной логике системы, влекут за собой необходимость перестройки нижних уровней, то есть практически к проведению анализа и проектирования заново. В случае использования структурных методологий получаются трудно модифицируемые системы При использовании объектно-ориентированного подхода к разработке приложений, компоненты выступают в роли мини-приложений, скомпонованных и готовых к использованию. Модификация или расширение приложения сводится просто к замене одного из составляющих его компонентов новой версией Повторное применение готовых программных модулей - это путь к созданию лучшего программного обеспечения за короткий отрезок времени. Именно этот подход и реализуется в рамках использования объектно-ориентированных технологий СОМ, ССЖВА и □В.
Под проектированием архитектуры САПД понимается выделение базовых компонент, разработка их интерфейсов, а также определение правил и принципов их взаимодействия. Хорошо спроектированная система является ключевым моментом обеспечения адаптируемости данной системы и снижения затрат на ее модер-
"З^ягё;?
Рис. 1 Архитектура САПД
низацию, а следовательно и снижения стоимости САПД в целом. Рассматривая САПД как совокупность взаимодействующих компонентов, можно распределить их по следующим уровням (см. Рис. 1):
На базовом уровне предлагаемой архитектуры САПД лежит слой аппаратно-программного обеспечения сети ЭВМ. Сеть ЭВМ можно определить, как совокупность территориально распределенных ЭВМ, объединенных с помощью каналов передачи данных и устройств расширения в единую систему и включающую систему вычислительных средств (СВС), в состав которой могут входить ЭВМ различных классов, разнесенных на значительные расстояния, и необходимые для того, чтобы обеспечить высокую оперативность в облуживании пользовательских запросов с сохранением надлежащего уровня надежности функционирования системы. В этом случае говорят о распределенной СВС как основном эле^е^е сети ЭВМ. Другим важным элементом сети ЭВМ является система передачи данных (СПД), позволяющая организовать совместное функционирование вычислительных средств сети. На сегодняшний день при организации высокоскоростных сетей ЭВМ САПД (Например, 100 Мбит сети - сети FDDI, Fast Ethernet и lQOVG-AnyLAN, а также 1 Гбит-сеть GegaBit Ethernet) обычно для передачи основного трафика используются скоростные магистрали. Магистрали позволяют подключить сервера приложений, баз данных и пользовательские ЭВМ, которым требуется высокая скорость, малые задержки в передачи больших объемов информации, что соответствует основным требованиям "Технического задания" на разработку САПД.
В работе проведен анализ существующих способов организации взаимодействия компонентов САПД, реализующих модель предметной области. При проектировании архитектуры САПД в ее основу можно заложить три принципиально отличных способа взаимодействия распределенных компонент: вертикальный, горизонтальный и гибридный. В работе показано, что на сегодняшний день наиболее предпочтительным подходом к созданию САПД является использование гибридного способа организации взаимодействия компонентов САПД, который в свою очередь соответствует распределенной одноранговой архитектуре САПД. Согласно этой архитектуре, распределенные компоненты САПД могут выступать как в роли клиента, так и в роли сервера по отношению друг к другу, совместно решая те или иные задачи. Такой подход минимизирует дублирование приложений и позволяет добиться оптимального баланса загрузки приложений и аппаратных средств, и, следовательно, приводит к эффективному использованию информационных ресурсов САПД в целом.
Для обеспечения взаимодействия компонентов САПД, реализующих модель предметной области, на основе использования распределенной одноранговой архитектуры, необходимо создать среду взаимодействия распределенных компонент - промежуточный программный уровень (Middleware), основной целью которой становится реализация механизма, обеспечивающего возможность прозрачного взаимодействия компонентов в рамках САПД. В работе показано, что не все продукты уровня Middleware могут использоваться в качестве среды взаимодействия компонентов крупной САПД. Это связано с тем, что одним из основных требований к крупной САПД является использование программных продуктов и технологий, удовлетворяющих международным и промышленным стандартам в области открытых информационных систем. Кроме того, при разработке САПД необходимо обеспечить ее функционирование в распределенной среде с поддержкой широкого диапазона сетей и платформ. В связи с этим далее в работе выполнен анализ существующих технологических решений по построению САПД с использованием объектно-ориентированных технологий COM, CORBA, ЕЗВ. С технологией нераз-
рывно связаны инструментальные средства, используемые на различных стадиях разработки.
Успех эффективного использования промежуточного программного обеспечения зависит от поддерживаемого им уровня взаимодействия компонент САПД. Чем выше уровень взаимодействия, тем проще разработчикам определять интерфейсы компонент, осуществлять их проектирование, реализовывать протоколы их взаимодействия. Но построение САПД — не только организация вызовов удаленных методов компонентов. Необходимо искать эффективные решения таких проблем, как развертывание, обеспечение защиты, управление транзакциями и координированное использование разделяемых ресурсов - обеспечение баланса загрузки, поддержка асинхронных коммуникаций и т.п. К настоящему моменту существует ряд технологий (CORSA, DCOI4, EJE л др.), которые реализую' среды взаимодействия, соответствующие 6-7 уровню модели OSI. Каждая из них уже стала стандартом де-факто, правильное использование которого облегчает процесс построения САПД, функционирующих в гетерогенных средах.
Проведенные в работе исследования позволяет сделать вывод, что с точки зрения готовности решения задач корпоративного масштаба, наиболее предпочтительным решением на сегодняшний день является построения САПД на базе технологии CORBA. На самом базовом уровне компонентная инфраструктура CORBA представляет объектную шину - ORB, которая позволяет компонентам САПД взаимодействовать, невзирая на разницу в адресных пространствах, языках, операционных систем и сетевых инфраструктур. На следующем уровне эта инфраструктура расширяет и позволяет создавать "суперинтеллектуальные" прикладные объекты САПД за счет использование объектных служб CORBA, к числу которых можно отнести сервисы безопасности, транзакций, долговременного хранения и т.п. Конечная цель состоит в том, чтобы позволить создавать прикладные объекты, которые ведут себя как бизнес-объекты, моделируя своих двойников из реального мира, и сотрудничают на семантическом уровне для выполнения требуемой задачи. На основе проведенного в первой главе работы исследования можно сделать вывод о том, что использование распределенной одноранговой архитектуры системы и объектно-ориентированной технологии CORBA позволяет построить масштабируемую и отказоустойчивую САПД корпоративного масштаба.
Во второй главе представлен подход к проектированию и анализу параметров функционирования САПД с использованием двухуровневой модели расчетов, на основе которого в работе предлагается методика проектирования выделенного класса систем автоматизации. Основными этапами методики являются следующие:
1. Анализ предметной области (выявление информационных потребностей объекта автоматизации)
2. Проектирование САПД
2.1. Проектирование архитектуры САПД
2.2. Выбор технологии создания САПД
2.3. Выбор показателей эффективности функционирования САПД
3. Анализ параметров функционирования САПД в рамках двухуровневой модели расчетов
3.1. Моделирование на уровне узла сети
3.1.1. Выбор архитектуры вычислительных узлов САПД
3.2. Моделирование на уровне сети
3.2.1 Выбор архитектуры вычислительной сети САПД
3.2.2. Анализ параметров функционирования вычислительной сети САПД
4. Разработка САПД
4.1. Проектирование структуры БД
4.2. Обеспечение параллелизма в работе пользователей
4.3. Обеспечение масштабируемости
4.4. Обеспечение отказоустойчивости
4.5. Управление ресурсами серверов приложений
4.6. и т.д.
5. Определение и анализ полученного варианта проектного решения
САПД, как и любые сложные системы, предназначены для выполнения некоторого, обычно достаточно четко ограниченного набора работ, имеют вполне определенные цели и задачи по организации работы пользователей с документами и предназначены для удовлетворения потребностей пользователей в информационно-вычислительных работах (ИВР). При этом понятие ИВР может трактоваться достаточно широко и включает реализацию процедур сбора, обработки, накапливания и выдачи пользователям необходимой информации о хранящихся в системе документах и т.д. В этой связи качество функционирования таких систем оценивается с помощью показателей эффективности, т.е. характеристик, определяющих степень приспособленности системы к решению возложенных на I нее задач. Функционирование САПД связано с реализацией совокупности взаимо-
действующих процессов передачи и обработки информации по хранящимся в системе документам, т.е. определяется совокупностью взаимодействующих информационных процессов (ИП). Категория ИП в настоящей работе определяется формальным образом в виде последовательности этапов передачи и обработки информации на средствах сети ЭВМ, инициируемой при реализации заявки пользователя на выполнение запрашиваемых от сети ИВР, связанных с обработкой запросов над отдельным документом или некоторой совокупностью документов. Например, в качестве подобных ИП могут рассматриваться операции регистрации документа, модификация реквизитов документа в его регистрационной карточке, модификация текста документа и т.п
Для сложных систем, как САПД, практически невозможно выделить единственный показатель эффективности, позволяющий охарактеризовать все интересующие аспекты функционирования системы. В этой связи необходимо рассматривать некоторую совокупность показателей, каждый из которых характеризует степень достижения системой некоторой частной цели. При этом частные цели и соответствующие показатели эффективности должны быть согласованы в системном плане, т.е. достижение частной цели должно способствовать выполнению основной задачи системы. В деятельности пользователей САПД могут быть выделены достаточно четко разграниченные периоды, связанные со спецификой выполняемых ими функциональных обязанностей и составляющие в совокупности набор ИП, реализуемых в системе. Такими периодами могут являться, например, сбор, обработка и накапливание информации, характеризующей состояние отдельных документов, хранящихся в системе; проведение некоторой совокупности расчетов на базе накопленной информации; формирование на основе полученной в результате расчетов отчетности и выдача ее пользователям системы В описанной ситуации в качестве основного, или главного показателя эффективности, достаточно точно выражающего целевое назначение системы может выступать среднее время цикла обработки заявки пользователя в системе - Тц В качестве вспомогательных
показателей могут использоваться пропускная способность системы - Л, среднее время реакции системы на запрос пользователя -
Математическое моделирование ИП САПД в составе сети ЭВМ на основе предложенной пятиуровневой архитектуры данного класса систем автома!изации, как это следует из предыдущего изложения, в общем случае требует взаимосвязанного описания большого числа взаимодействующих процессов передачи и обработки информации ресурсами САПД. Единая математическая модель, построенная с учетом детального описания всех ИП в САПД, была бы весьма громоздкой и трудно обозримой, а получение числовых значений показателей эффективности с помощью такой модели может оказаться чрезвычайно трудоемкой или даже практически неразрешимой задачей. В этой связи наиболее естественным путем преодоления указанных трудностей яипяетгя гп^дэнир мнпгпупоЕ"ево" системы взаимосвязанных моделей ИП в САПД. При таком подходе решение любой достаточно сложной задачи моделирования может быть достигнуто итеративным путем в результате последовательного уточнения значений параметров САПД и ее структурных компонентов с помощью расчетов на системе моделей. В настоящей научной работе была предложена двухуровневая модель расчетов параметров функционирования САПД, ориентированных на использование объектно-ориентированной технологии ССЖВА (см. Рис. 2).
Рис. 2 Двухуровневая модель расчета параметров САПД
Указанный подход предполагает общие методы формализации и моделирования ИП для различных уровней представления САПД: уровня сети, где отдельные ЭВМ являются ресурсами системы и уровня узла сети, где в качестве ресурсов выступают устройства ЭВМ. При этом на каждом уровне модели расчета представляется возможным решение задач статической и динамической оптимизации ИП. Задачи статической оптимизации связаны с оптимизацией структурно-временных характеристик ИП для различных уровней их представления, определяющих число и взаимосвязи этапов ИП (структуру ИП) и временные оценки этапов. Задачи динамической оптимизации относятся к взаимодействию ИП с известными структурно-временными характеристиками и связаны с оптимальной организацией управления ИП в динамике их протекания.
На уровне сети задача статической оптимизации сводится к задаче по выбору архитектуры САПД, для решения которой в настоящей диссертационной работе использовался аппарат теории нейронных сетей. В связи с тем, что решение задачи проектирование архитектуры САПД происходит в условиях недостоверной, неполной и нечеткой информации, то для решения подобного рода задач естественно использовать методы, позволяющие работать с неопределенностью. Как известно, для решения таких задач традиционно применяются два основных подхода. Первый, основанный на правилах (ги1ес!-Ьазес1) характерен для экспертных систем. Он базируется на описании предметной области в виде набора правил (аксиом). При этом подходе, однако, необходимо заранее знать весь набор законо-
мерностей, описывающих предметную область. При использовании другого подхода, основанного на примерах (case-base), надо лишь иметь достаточное количество примеров для настройки адаптивной системы с заранее заданной степенью достоверности. Искусственные нейронные сети представляют собой классический пример использования такого подхода. Исследованию и практическому применению этого подхода для решения практических задач посвящены работы Васильева В.И., Галушкина А.И., Горбаня А.Н., Омату С., Заде Л., Гольдберга Д., Фоминых И.Б. и др.
Математическое описание взаимодействия совокупности ИП в сети - задача динамической оптимизации - в настоящей научной работе было получено посредством использования модели Джексона в рамках теории систем массового обслуживания и в соответствии с используемой моделью время пребывания в системах массового обслуживания (СМО), в качестве которых выступают сеть, коммуникационное оборудование, сервера приложений и баз данных, и образующих сеть массового обслуживания (сеть МО) с постоянной интенсивностью обслуживания составляет:
t,(n) - г, +4,{п) т,=т,+п, (и~1) г(,/ = 1 M,
где
п - населенность сети;
N - общее число заявок в сеги; | M - общее число СМО в сети;
т, - среднее время обслуживания в i -ом СМО;
q,(n) - средняя длина очереди в /-й СМО сети S(N) в момент поступления
новой заявки;
и,(и-1) - среднее число заявок i-й СМО сети S(jV-i).
В результате можно получить следующие выражения для расчета показателей эффективности работы сети МО:
м
TH(N) = YJe, t,(N)- среднего времени цикла;
1-1
N
Л(Л/) =--пропускная способность системы,
ТЦ(М)
i,ÀN) = Tu{N)-Tn - среднего времени реакции.
где
е, - частота посещений i -й СМО заявкой за цикл обработки;
т„ - время обработки заявки на серверах приложений и баз данных.
На уровне узла сети основу для сравнения различных типов ЭВМ между собой дают стандартные методики измерения производительности. К числу таких v стандартных методик на сегодняшний день относятся MIPS, MFLOPS, SPEC, ко-
торые и использовались для решения задач статической и динамической оптимизации на уровне узла сети по выбору архитектур серверов приложений и баз данных. Проектирование САПД - это построение OLTP-систем обработки документов, характеризующие большим количеством изменений документов в базе данных. Множество пользователей подобного класса систем автоматизации одновременно обращаются к документам, хранящимся в базе данных, выполняя их чтение, добавление, удаление или изменение. Причем несколько пользователей могут одновременно работать с одним и тем же документом. Многие специалисты в области информационных технологий считают результаты теста SPEC TPC-C объеюивной
и надежной характеристикой быстродействия реально существующих OLTP-систем, а поэтому для решения задачи по выбору архитектуры серверов приложений и баз данных САПД на данном уровне применялись результаты теста SPEC TPC-C. В качестве основного показателей эффективности использовалась пропускная способность узла сети - л
Таким образом, представленная во второй главе настоящей научной работы двухуровневая итеративная модель расчетов параметров функционирования САПД позволяет провести проектирование архитектуры САПД и сделать расчеты основных параметров эффективности, являющихся функционалами от процесса функционирования рассматриваемого класса систем автоматизации (см. Рис. 3).
I _ __
Модель уроама ума вычислительной сет
Рис. 3 Методы решения задач проектирования и анализа параметров функционирования САПД в рамках представленной двухуровневой
модели расчета
В третьей главе проводилась демонстрация применения представленного в рабоге подхода к проектированию и анализу параметров функционирования САПД с использованием двухуровневой модели расчетов на примере САПД "Дело-производство-М" Аппарата Правительства Российской Федерации, функционирующей в распределенной среде с поддержкой широкого диапазона платформ и сетей. Использование нейросетевого подхода позволяет решить следующую основную задачу исследования:
• выбор первоначальной архитектуры САПД в условиях неточной и неполной информации о требуемой конфигурации;
• определение степени влияния исходных параметров САПД на выбор архитектуры с целью корректировки первоначальных требований к этим параметрам.
Решение основной задачи проектирования формируется на основе решений полученных в результате работы нейронных сетей, использующихся для решения отдельных ее подзадач. В качестве частных задач проектирования архитектуры САПД на уровне сети рассматриваются следующие:
• выбор ранга сети;
• выбор топологии сети;
• выбор среды передачи данных;
• выбор технологии создания САПД.
Для решения основных задач исследования использовалась методика А.И. Галушкина, которая успешно применялась для решения многих задач и доказала свою эффективность. В рамках решения каждой частной задачи строилась соответствующая нейронная сеть персептронного типа с использованием программного пакета Statistica, выбиралась ее модель, устанавливались взаимосвязи между параметрами проектируемой САПД и параметрами нейронной сети.
В процессе функционирования каждой нейронные сети формировался выходной сигнал Y в соответствии с входным сигналом X, реализующий некоторую функцию g-.Y-x(X) Вид функции % определяется значениями синаптических весов. Обозначим через G множество всех возможных функций g соответствующих заданной архитектуре сети. Пусть решение некоторой частной задачи иссле-
ЛПРЯНИЯ РОЪ фуни-цма - : F--(Y), 32ДЭННЗЯ ПЗрЗМИ ВХОДНЫХ И BUXOfliibiX ДЗпло.л
(X\Yl), где£ = 1 N. Расхождение между тем, что даст сеть, и тем, что для данного учебного набора должно быть получено на самом деле, составляет ошибку, которая может использоваться для корректировки весов. Обозначим через г функцию ошибки обобщения, показывающая для каждой из функций g степень близости к г. Решить каждую частную задачу исследования по проектированию архитектуры САПД с помощью нейронной сети заданной архитектуры - значит построить функциюgе С, подобрав параметры нейронов таким образом, чтобы [ функционал качества обращался в оптимум для всех пар(xt,Yk). Таким образом,
каждая частная задача исследования определяется совокупностью пяти компонент:
<- X,Y,r,G,E>
Обучение состоит в поиске функции д, оптимальной по/7.
N М
1-1 J 1
где
N- набор обучающих данных; м - множество выходов каждой нейронной сети; г - реальное значение выхода j на х-ом обучающем множестве; уи - желаемое значение выхода j на i-ом обучающем множестве.
Количество нейронов в выходном слое зависело от количества вариантов решения конкретной частной задачи. Например, в случае решения задачи по выбору ранга сети число нейронов в выходном слое равно трем, каждый нейрон связан с одним из трех классов сетей: одноранговая сеть, сеть с выделенным сервером, комбинированная сеть. При этом максимальный уровень сигнала среди всех выходных нейронов трактовался как соо гветствующее решение отдельной частной задачи - стратегия "победитель забирает все", а разность между максимальным • уровнем и вторым по величине - как достоверность решения. Входными парамет-
рами для нейронной сети, определяющие число нейронов во входном слое, являются такие характеристики, как число пользователей САПД, требования к отказоустойчивости САПД, скорость передачи данных, возможность стыковки с другими КИС, требования к секретности информации САПД, возможность динамической реконфигурации САПД и т.д. Количество входных параметров может быть легко изменено путем удаления или добавления новых нейронов во входной спой, а также изменением соответствующей кодировки исходных данных. Для обучения каждой нейронной сети использовался метод сопряжения градиентов, который рекомен-
дуется использовать в большинстве случаев по причине того, что обучение происходит значительно быстрее, чем в методе обратного распространения и других современных алгоритмах обучения второго порядка. По окончанию процесса обучения работа каждой нейронной сети проверялась на тестовом наборе данных, т.е. осуществлялась проверка адекватности проведенного процесса обучения нейронных сетей на обучающем и контрольном наборах данных с заданной ошибкой обобщения и получение варианта проектного решения по выбору архитектуры САПД Аппарата Правительства Российской Федерации в соответствии с Техническим заданием на разработку данной системы автоматизации.
В соответствии с основными требованиями на разработку САПД Аппарата Правительства Российской Федерации и на основе использования нейросетевого подхода предлагается при прорктиргтянии эруитеи-гупу САПД использовать объ ектно-ориентированную технологию ССЖВА, а в основу архитектуры системы автоматизации заложить сеть с выделенным сервером, топологии типа звезда на основе оптоволокна ЮОВаэе-РХ (см. Рис. 4).
Рис. 4 Архитектура САПД "Делопроизводство-М"
Корректировка первоначальных требований к САПД, например, в области увеличения стоимости позволяет получить более гибкое, масштабируемое и отказоустойчивое решение по проектированию САПД на основе комбинированной сети, топологии типа кольцо-звезда и среды передачи данных FDDI.
В соответствии с полученным вариантом проектного решения серверная часть САПД "Делопроизводства-М" представляет собой распределенный по двум аппаратным (специально оборудованные помещения 2-16 и Ц-01) кластер на базе серверной операционной системы Windows 2000 Advanced Server - центральный комплекс, подключенный к отказоустойчивым коммуникационным средствам локальной сети Резиденции Правительства РФ. Сервера приложений соединяются с центральным комплексом посредством локальной сети, что позволяет осуществить их размещение в любом удобном помещении Резиденции Правительства Каждый из территориально распределенных узлов кластера включает в свой состав:
1. высокопроизводительный сервер - непосредственный элемент кластера.
2. коммуникационное устройство дисковой подсистемы - для непосредственной связи сервера и дисковой подсистемы.
3. дисковый RAID массив - для непосредственного хранения разделяемых внутри кластера данных.
4. систему резервного копирования - используется для архивирования критической информации. В связи со спецификой использования, устанавливается только в одной из стоек
Результаты проведенного аналитического моделирования, которое было подтверждено результатами имитационного моделирования с использованием программного продукта Rational PerfomanceStudio, на уровне сети показывают, что полученный с использованием нейросетевого подхода вариант проектного решения по выбору архитектуры САПД является приемлемым, а значения показателей эффективности удовлетворяют требованиям, определенным в рамках Тех-имиесого задания на разработку САПД Аппарата ПрзЕгГтельсгеа Российской Фе дерации. Таким образом, нейросетевой подход позволяет решать задачи проецирования архитектуры САПД в условиях неопределенности.
В четвертой главе рассматривались вопросы построения масштабируемых и отказоустойчивых САПД с использованием объектно-ориентированной технологии CORBA на примере САПД "Делопроизводство-М" Аппарате Правительства Российской Федерации, учитывая полученный вариант проектного решения. Современная САПД представляет собой тесное переплетение различных информационных технологий, предлагаемых сегодня на рынке, как на аппаратном, так и программном уровнях. Поскольку на данный момент спецификация CORBA не предлагает стандартизованной поддержки разработки масштабируемых и отказоустойчивых систем, то все бремя ложится на плечи разработчика системы автоматизации При этом необходимо обеспечить приемлемый компромисс между производительностью и отказоустойчивостью - при стремлении к созданию системы с вероятностью сбоя 0,01%, необходимо сделать так, чтобы механизмы отказоустойчивости значительно не влияли на производительность в 99,9% случаев. Искусство создания САПД состоит в сбалансированной интеграции технологии CORBA и соответствующих программных и аппаратных средств. В связи с этим в работе рассматривались подходы, и вырабатывалась методика, которая бы позволила объединить различные компоненты системы автоматизации "Делопроизводство-М" в действительно надежное и масштабируемое решение (см Рис. 5).
Рис. 5 Схема взаимодействия программных компонент САПД "Делопроизводство-М"
Для того чтобы разработать действительно масштабируемую и отказоустойчивую систему, необходимо решить следующие задачи:
Обеспечить параллелизм в работе пользователей системы. Необходимо обеспечить работу как с одним пользователем, так и одновременно с 10 тыс. пользователей, совместно использующие как 10, так 10 мил. документов, размещенных на разных серверах приложений.
Преодолеть ограниченное количество ресурсов серверов приложений. При разработке САПД необходимо учитывать ограничения на количество процессоров, памяти, соединений TCP/IP и потоков. Для сохранения ресурсов убедиться в том, что они регулярно или освобождаются, или повторно используются.
Обеспечить балами загрузки серверов приложений Распределение нагрузки между несколькими серверами приложений САПД, комбинируя репликацию и разделение.
Обеспечить отказоустойчивость. Использование разделение и репликации компонентов САПД для ограничения ущерба из-за сбоя одного из серверов приложений.
Для обеспечения параллелизма в работе пользователей в рассматриваемой САПД используется концепция сеансов редактирования, основанная на механизме оптимистического управления параллелизмом поверх пессимистического управления транзакциями базы данных с помощью отделения сеансов от транзакций базы данных и использования образца расширенного пула исполнителей. Этот механизм предполагает использование транзакций, управляемых сервером приложений. На серверах приложений существует всегда только одна рабочая версия документа, пользователи могут параллельно работать с одним и тем же документом. Только в том случае, если все пользователи, прошедшие через срэнс входа работы с определенным документом (CORBA-объектом), вызвали соответствующий сеанс выхода, все изменения подтверждаются и переносятся в исходную базу. При этом вносить изменения в состояние CORBA-объекта с последующим их подтверждением в базе данных может только один из клиентов. Всем остальные клиентам данный объект доступен только в режиме чтения. На время работы с документом все изменения в состоянии объекта кэшируются на сервере приложений. Подобная организация параллельной работы с объектами на серверах положения также положительным образом сказывается и на трафике работы сети, поскольку при каждом обновлении состояния объекта не происходит обновление содержимого исходной базы данных и, кроме того, в случаи проведения подобных обновлений все клиенты, которые параллельно работают с данным объектом получают все изменения в виде сообщения, передаваемого асинхронно с использованием службы событий.
В рамках задачи управления ресурсами серверов приложений необходимо искать приемлемые решения проблем управления памятью, потоками и соединениями. Важной особенностью архитектуры САПД "Делопроизводства-М" является использование расширение образца пула сервантов, основанного на выделении общего и частного пулов сервантов CORBA-объектов. Общий пул сервантов содержит серванты, доступ к которым предоставляется нескольким клиентам, частный пул сервантов клиента содержит сервантов доступные только определенному клиенту. Для управления пулом сервантов используется менеджер или фабрика объектов. Использование пула сервантов позволяет решить две основные за-
дачи управления памятью на серверах приложений - избавиться от нехватки ресурсов и уменьшить использование памяти. Использование триггеров явного вызова и закрытия соединения в совокупности с политикой вытеснения основанной на аренде объектов позволяет решить две указанных выше задачи надлежащим образов. Как клиенты, так и сервера приложения в САПД "Делопроизводство-М" имеют многопоточную архитектуру. Со стороны клиента основной поток используется для организации взаимодействия с интерфейсом пользователя, а дочерний для выполнения вызова методов серверных объектов. Сервера приложения также являются многопоточными и используют модель пула потоков для организации управления потоками, позволяющей обеспечить максимальную производительность но обслуживанию запросов клиентов за счет того, что более активным клиентам выделяется больше потоков на сервере, чем менее активным. Кроме того, репликация серверов приложений в сочетании с управлением закрытий соединений, как со стороны клиентов, так и со стороны серверов приложений способствует разрешению проблемы ограниченного количества соединений и обеспечивает надежное функционирование системы "Делопроизводство-М".
Можно выделить три основных аспекта выравнивания нагрузки: политика обнаружения, политика миграции и управление состоянием. Политика обнаружения позволяет выбрать механизм, с использованием которого будет осуществляться выбор целевого сервера. Для определения того, как часто будет происходить выбор целевого сервера, используется политика миграции В системе "Делопроизводство-М" используется политика обнаружения, основанная на нагрузке, и ориентирована на использование модели селектора. Клиенты взаимодействуют с селектором один раз в течение всего сеанса, чтобы получить первоначальную объектную ссылку на один из активных серверов приложений и вся последующая работа осуществляется непосредственно с ним. Политика миграции основана на сеансах работы пользователей, что позволяется обеспечить приемлемый уровень эффективности в использовании серверов приложений за счет минимального переключения между активными серверами в рамках сеансов работы пользователей. Серверы в рамках одной группы репликации делегируют свои решения по выравниванию нагрузки селектору, отвечающему за сбор и поддержание сведений о нагрузке и статистике производительности всех серверов группы.
Для обеспечения отказоустойчивости серверов приложений в системе делопроизводства "Делопроизводство-М" используется модифицированная горячая репликация. При данном варианте репликации все сервера приложений обрабатывают запросы пользователей системы параллельно. В случае сбоя в работе одного из серверов приложений, запуск нового сервера приложений осуществляется селектором с использованием агента активизации OAD брокера объектных запросов Inprise VisiBroker 4.5. В случае сбоя в работе селектора его повторный запуск осуществляет одним из серверов приложений с использованием агента активизации. Поскольку все активизированные сервера приложений регистрируются в службе именования в момент своего запуска, то на время сбоя в работе селектора клиенты пытаются разрешить имя сервера с помощью службы именования в соответствии с политикой обнаружения основанной на нагрузке. В связи с тем, что база данных сама по себе представляет одну точку сбоя, осуществляется и ее репликация. В основе сервера баз данных заложен высоконадежный кластер на базе операционной системы Windows 2000 Advanced Server. Таким образом, для обеспечения надлежащего уровня отказоустойчивости системы "Делопроизводство-М" осуществляется репликация, как серверов приложения, так и баз данных.
В заключении диссертации сформулированы основные выводы и результаты, полученные автором, намечен ряд перспективных направлений дальнейших исследований.
Основные выводы по работе.
1. В результате исследования принципов построения САПД наиболее предпочтительным подходом к проектированию данного класса систем автоматизации является использование распределенной одноранговой архитектуры и объектно-ориентированной технологии CORBA, которые позволяют построить масштабируемую и отказоустойчивую САПД корпоративного масштаба.
2. Разработанная двухуровневая итеративная модель рл-чешв позволяет решить основные задачи исследования, связанные с проектированием архитектуры и анализом параметров функционирования САПД.
3. С использованием нейросетевого подхода предложено решение задачи проектирования архитектуры САПД. Достоверность полученных результатов подтверждена результатами аналитического моделирования.
4. С использованием аппарата теории систем массового обслуживания проведена оценка показателей эффективности функционирования САПД.
5 На основе проведенных исследований предложена методика проектирования и анализа параметров функционирования САПД с использованием объектно-ориентированной технологии CORBA.
6. Результаты проведенных в настоящей диссертационной работе исследований доведены до уровня, позволяющего непосредственное их использование при проектировании САПД.
Основные результаты диссертационной работы опубликованы в пяти печатных изданиях:
1. Иванов И.П., Самарский Д.А. Принципы построения систем управления делопроизводством с использованием технологии CORBA // Вестник МГТУ. Приборостроение. - 2002. - №2. - С. 95 - 111.
2. Ревунков Г.И, Самарский Д.А., Постников В.М. Исследование систем распределенной обработки данных, построенных с использованием компонентных технологий (СОМ- и COBRA- технологии) // Интеллектуальные технологии и системы. - 2000. - №2. - С. 40 - 47.
3. Ревунков Г.И., Самарский Д.А. Исследование методов построения систем распределенной обработки данных с использованием объектных технологий // Интеллектуальные технологии и системы. - 2001. - №1. - С. 69 - 84.
4. Углов A.B., Самарский Д.А. Исследование естественно-языкового описание предметной области АСОИУ // Интеллектуальные технологии и системы. - 1998. - №1. - С. 246 - 267.
5- Иванов И.П., Самарский Д.А. Развитие опорной системы интегрированной с высокоскоростными телекоммуникационными каналами // Телематика - 2003: Труды 10-й Всероссийской НМК. - Санкт-Петербург, - 2003.- С. 244-245.
Подписано к печати 25 01 05 Зак 16 Объем 1.0 и л Тир 100 Типография МГТУ им Н Э Баумана
1 X Ш 1 J Wlvtiri i^Wll/J
2QQ6-4 2085 -168
-
Похожие работы
- Методика проектирования систем автоматизации процессов делопроизводства с использованием объектно-ориентированных технологий
- Проектирование систем автоматизации делопроизводства
- Информационная технология делопроизводства в Аппарате Правительства РФ с учетом реформирования структуры государственных органов
- Методы проектирования компьютерных обучающих систем для образовательной сферы
- Разработка автоматизированной системы построения информационных моделей процессов управления пневмосистемами на базе объектно-ориентированного подхода
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность