автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота

доктора технических наук
Гудов, Александр Михайлович
город
Кемерово
год
2013
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота»

Автореферат диссертации по теме "Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота"

На правах рукописи

Гудов Александр Михайлович

ПРОГРАММНО-ТЕХНОЛОГИЧЕСКИЙ КОМПЛЕКС ДЛЯ РАЗВИТИЯ ИНФОРМАЦИОННОЙ СРЕДЫ ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ НА ОСНОВЕ СИСТЕМЫ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА

Специальность 05.13.17 - Теоретические основы информатики

Автореферат диссертации на соискание ученой степени доктора технических наук

4 АПР 2013

Новосибирск — 2013

005051493

005051493

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Кемеровский государственный

университет»

Научный консультант: Доктор физико-математических наук, профессор

Афанасьев Константин Евгеньевич

Официальные оппоненты: Барахнин Владимир Борисович, доктор технических наук, доцент, Федеральное государственное бюджетное учреждение науки Институт вычислительных технологий Сибирского отделения Российской академии наук, старший научный сотрудник

Змеев Олег Алексеевич, доктор физико-математических наук, профессор, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Национальный исследовательский Томский государственный университет», заведующий кафедрой программной инженерии

Павский Валерий Алексеевич, доктор технических наук, профессор, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский технологический институт пищевой промышленности», заведующий кафедрой высшей математики

Ведущая организация: Федеральное государственное бюджетное обра-

зовательное учреждение высшего профессионального образования «Новосибирский национальный исследовательский государственный университет», г. Новосибирск

Защита состоится «23» мая 2013 г. в 15 часов 00 минут на заседании диссертационного совета Д.219.005.02 при Федеральном государственном образовательном бюджетном учреждении высшего профессионального образования «Сибирский государственный университет телекоммуникаций и информатики» по адресу 630102, г. Новосибирск, ул. Кирова, 86, ауд. 625.

С диссертацией можно ознакомиться в библиотеке ФГОБУ ВПО «Сибирский государственный университет телекоммуникаций и информатики».

Автореферат разослан <Хб> 2013 г.

Учёный секретарь диссертационного совета Д.219.005.02,

кандидат технических наук, доцент /¿/Т) И.И. Резван

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования характеризуется необходимостью выявления и изучения факторов, влияющих на развитие теоретических и технологических возможностей создания и эффективного функционирования корпоративных информационных сред, эксплуатации и модификации информационных систем (ИС) в условиях быстро изменяющегося информационного общества.

В силу индивидуальности ряда проблем, сложившихся подходов, наличия технических и технологических апробированных решений большинство организаций создают свое информационное пространство, зачастую используя несовместимые подходы, что влечет за собой дополнительные затраты на разработку собственных систем при отсутствии гарантий достижения поставленных целей. Эти проблемы обусловлены широтой спектра решаемых задач, частой несовместимостью используемых платформ, техническим несовершенством, недокументированностыо решений, отсутствием четкой политики со стороны управляющих и контролирующих организаций и т.д.

Большинство исследователей отмечают, что в составе единой информационной среды (ЕИС) можно выделить следующие относительно независимые составляющие: техническая инфраструктура (организационные структуры информатизации, коммуникационная сеть, центры высокопроизводительных вычислений, центры коллективного пользования и т.д.), функциональные подсистемы (подсистемы интегрированной автоматизированной информационной системы, обеспечивающие решения задач информатизации в зависимости от поставленных целей на основе управленческих и математических моделей), информационные ресурсы. Первая составляющая отличается долговременным характером своего становления, и затраты на ее создание настолько велики, что полная или частичная модернизация становится практически невозможной. Вторая и третья составляющие изменчивы по своей природе, относятся к прикладной области и в значительной степени зависят от специфики задач, решаемых конкретными организациями. В настоящее время проводятся исследования, актуальными из которых являются разработка и обоснование технологических решений для создания повторно используемых программных средств на основе общепринятых стандартов открытых систем (Open Systems, OS) и сервисно-ориентированной архитектуры (Service-Oriented Architecture,SOA).

Современные тенденции развития теоретических и технологических аспектов для создания таких систем отражаются в работах Ю.И. Шокина, A.M. Федотова, В.А. Серебрякова, А.Н. Бездушного, А.Н. Тихонова, А.Д. Иванникова, В.П. Кулагина, C.B. Мальцевой, В.М. Васильева, М.А. Гуриева, А.И. Башмакова, И.Г. Игнатовой и других. Среди работ зарубежных авторов можно отметить работы A. Tanenbaum (Э. Таненба-ум), M. van Steen (M. ван Стин), В. Neumann (Б. Ньюман), G. Blair (Г. Блэйр), G. Pierre (Г. Пьер), H. Nwana (X. Ивана), D. Ndumu (Д. Ндуму), J. Wu (Дж. By), A. Clark (Э. Кларк), R. Wyle (Р. Уайл) и др.

На данный момент тесная интеграция различных автоматизированных систем, которые уже функционируют в организации, в единое информационное пространство является одним из активно развивающихся направлений ИТ-отрасли. Современные исследования показывают, что большое количество используемых ИС для решения разных задач с определенного момента начинает негативно влиять на состояние процессов информатизации. Данное явление обусловлено, прежде всего, необходимостью поддержания множества интерфейсов, связывающих различные ИС между собой. Иногда создание связующих компонентов представляется весьма сложной задачей из-

за отсутствия изначально заложенных в систему механизмов интеграции или проблем, связанных с использованием «унаследованных» систем.

Одним из подходов для решения перечисленных проблем может служить создание платформы, позволяющей выступить в качестве связующего звена, объединяющего ИС в одно информационное пространство с минимальными «переделками». Анализ доступных публикаций показывает, что наибольшая эффективность такого объединения достигается в том случае, если платформа будет поддерживать несколько способов интеграции, а также стандарты OS и SOA. Такая платформа должна относиться к классу сервис ориентированного ПО (программный слой, предоставляющий набор сервисов по организации и использованию распределенных информационных ресурсов, таких как приложения и данные, находящихся в сфере ответственности разных владельцев, для достижения желаемых результатов потребителем, которым может быть конечный пользователь или другое приложение). Основное назначение SOA заключается в способности управлять ростом масштабируемых систем предприятий, подготовленностью систем к размещению в Интернете и использованию сервисов, а также сокращение затрат при интеграции разрозненных систем в единое пространство. Инфраструктура SOA позволяет системам быть подвижными и быстрее реагирующими на изменения, чем монолитные системы с экспоненциально растущим числом дву-связных интерфейсов. Таким образом, SOA предоставляет прочный фундамент при реализации систем для адаптивного и изменяемого бизнеса.

На рынке интеграционных программных платформ сервис ориентированного ПО существует несколько промышленных решений: IBM WebSphere (около 20 продуктов), Microsoft Windows Server, BizTalk Server и Ofiice SharePoint Server, Oracle Fusion Middleware llg, SAP Net Weaver (однако, по мнению аналитиков компании Forrester Research, только продукты компании IBM поддерживают инфраструктуру SOA). Стоимость полного пакета программных решений достигает $200 - $500 тыс. Кроме того, во многих открытых источниках отмечается, что крупные российские компании испытывают непреодолимые трудности с лицензированием и приобретением такого ПО, а предприятия малого и среднего бизнеса (в том числе и образовательные учреждения) совсем не могут позволить себе вложения в реализацию проектов на базе данного ПО.

Таким образом, актуальной является научно-техническая проблема разработки и теоретического обоснования технологических основ создания и развития ЕИС на основе интеграции информационных систем и ресурсов организации (в т.ч. образовательного учреждения) на базе сервис ориентированной архитектуры.

Цель работы - разработка, теоретическое обоснование и реализация принципов и технологических подходов к созданию и развитию единой информационной среды организации на основе сервис ориентированного программного обеспечения. Задачи исследования:

1. Анализ существующих подходов к созданию информационной среды организации, с точки зрения использования сервис ориентированного ПО, для интеграции элементов среды с целью выявления недостатков и возможных подходов к решению проблемы.

2. Обоснование принципов и технологических решений для создания и развития ЕИС организации на основе сервис ориентированного ПО.

3. Разработка комплекса моделей, обеспечивающих функционирование единой информационной среды и поддержку информационно-ориентированного, сервисно-ориентированного и процессно-ориентированного принципов интеграции.

4. Разработка теоретических оценок эффективности внедрения ЕИС в практику организации.

5. Реализация программно-технологического комплекса (ПТК) в виде набора программно-технологических средств, обеспечивающих создание единой информационной среды организации на базе сервис ориентированной архитектуры.

6. Внедрение ПТК и анализ результатов внедрения с использованием разработанных оценок.

К объектам исследования относятся: эталонная модель сервис ориентированной архитектуры, информационные системы, методы интеграции ИС, объекты, обрабатываемые и предоставляемые в ИС, электронные документы, документопотоки, процессы движения и управления ЭД.

Предмет исследования: процессы создания информационной среды, математические и информационные модели, модели структур данных, алгоритмы и технологические решения, используемые для интеграции элементов ЕИС.

Методы исследования определяются сущностью теоретических и практических проблем: методы моделирования, системный анализ, элементы методов оптимизации, элементы теории нейронных сетей, методы извлечения данных из текстов, методы создания онтологий, методы функционального и объектно-ориентированного проектирования, методы разработки и анализа требований к программным системам, методы тестирования программных средств.

Область исследования. Содержание диссертации соответствует паспорту специальности 05.13.17 «Теоретические основы информатики» (технические науки) по следующим областям исследований: п.2 «Исследование информационных структур, разработка и анализ моделей информационных процессов и структур», п.6 «Разработка методов, языков и моделей человекомашинного общения; разработка методов и моделей распознавания, понимания и синтеза речи, принципов и методов извлечения данных из текстов на естественном языке», п. 12 «Разработка математических, логических, семиотических и лингвистических моделей и методов взаимодействия информационных процессов, в том числе на базе специализированных вычислительных систем», п. 14 «Разработка теоретических основ создания программных систем для новых информационных технологий», п. 15 «Исследования и разработка требований к программно-техническим средствам современных телекоммуникационных систем на базе вычислительной техники».

Научная новизна. Решена важная научно-техническая проблема разработки и теоретического обоснования технологических подходов к созданию и развитию ЕИС на основе сервис ориентированного ПО, а именно:

1. Конкретизирована модель, описывающая процессы создания и развития ЕИС, отличительной особенностью которой является выделение основных «каркасных» элементов для обеспечения процесса интеграции информационных объектов. Модель поддерживает: декомпозицию на контекстные модели элементов среды на различных этапах развития ЕИС; общее описание объектов интеграции и видов деятельности посредством онтологических моделей, основные концепции 80А -обозримость, взаимодействие и реальный эффект.

2. Построена модель интеграции ИС, опирающаяся на информационно-ориентированный, сервисно-ориентированный и процессно-ориентированный принципы интеграции на основе сервис ориентированного ПО. В модели используются: ЭД в качестве основного объекта для обмена информации между прикладными системами, система электронного документооборота (СЭД) как основа реали-

зации процессно-ориентированного принципа интеграции, обладающая рядом дополнительных свойств; система портального ядра, построенная на принципах БОА и осуществляющая технологическое обеспечение принципов интеграции.

3. Разработаны алгоритмы генерации метаданных ЭД, отличительной особенностью которых является использование аппарата нейронных сетей, обеспечивающие механизм автоматического извлечения метаданных.

4. Разработана вычислительная процедура, отличительной чертой которой является использование принципа динамического программирования для решения задачи оптимального распределения ЭД в системе распределенных хранилищ.

5. Предложен метод тестирования распределенных информационных систем, учитывающий особенности приложений, построенных на основе использования сервис ориентированного ПО.

6. Предложена модель оценки эффективности использования ЕИС на основе упрощенного локального подхода, учитывающая предложенные технологические решения и позволяющая оценить результаты внедрения ПТК.

7. Построен профиль стандартов как основа реализации программно-технологического комплекса, отличительной особенностью которого является соответствие национальному профилю взаимодействия открытых систем России и поддержка профиля организации. Профиль учитывает предложенные подходы для создания ЕИС на базе сервис ориентированного ПО.

Основные положения, выносимые на защиту:

1. Информационная модель интеграции, опирающаяся на информационно-ориентированный, сервисно-ориентированный и процессно-ориентированный принципы интеграции, позволяет «встраивать» разрабатываемые и унаследованные информационные системы в единую информационную среду.

2. Алгоритмы извлечения метаданных электронного документа на основе аппарата нейронных сетей позволяют в автоматическом режиме регистрировать ЭД в системе электронного документооборота.

3. Процедура для получения оптимального, с точки зрения стоимости документопо-токов, распределения ЭД в системе распределенных хранилищ, позволяет наилучшим способом определить место хранения нового ЭД на основе текущего распределения документов в хранилище.

4. Метод тестирования распределенных информационных систем, учитывающий особенности сервис-ориентированной архитектуры, позволяет упростить процесс тестирования и аттестации распределенных приложений.

5. Разработанные и внедренные элементы ЕИС повышают эффективность выполнения бизнес-процессов в образовательном учреждении на 26%.

6. Построенный профиль стандартов прикладного уровня для реализации программно-технологического комплекса учитывает предложенные подходы для создания ЕИС на базе сервис ориентированного ПО.

Практическая значимость результатов работы заключается в разработанных

подходах, моделях и методах, составляющих основу ЕИС. Они могут быть использованы:

— при проектировании и разработке элементов ЕИС;

— при интеграции разрозненных ИС и информационных ресурсов в ЕИС;

— при построении сложных систем, обладающих схожим функционалом, и систем, обеспечивающих автоматизацию деятельности организации;

— при тестировании ИС, построенных на основе принципов SOA;

— при обучении студентов и повышении квалификации специалистов в области создания сложных ИС на основе портальных технологий.

Созданные программные средства внедрены в Кемеровском государственном университете и его филиалах, полученные теоретические результаты использованы в учебном процессе на математическом факультете.

Основные этапы работы выполнены в рамках реализации следующих проектов: госконтракт № 4828 Министерства образования и науки РФ в рамках федеральной программы «Развитие научного потенциала высшей школы» (2005 - 2006 год); госконтракт № 12/10 Администрации Кемеровской области на выполнение работ по мероприятию «Создание областного реестра информационных ресурсов, баз данных научно-технической информации, информации учебного назначения и электронных средств обучения в учреждениях НПО, СПО, ВПО, ДПО» (2006 год); госконтракт № 4256 Министерства образования и науки РФ «Создание типового информационно-вычислительного портала для организации учебной и научной деятельности ВУЗа» в рамках аналитической ведомственной целевой программы «Развитие научного потенциала высшей школы (2006-2008 годы)» (2006-2007 годы); грант Ученого Совета КемГУ «Система электронного документооборота ВУЗа».

Обоснованность и достоверность научных положений, полученных результатов, выводов и рекомендаций обеспечиваются применением проверенных методов исследования, корректностью использованного математического аппарата и подтверждаются реализацией комплекса программно-технологических средств и созданием на его основе ЕИС в Кемеровском государственном университете (2004-2011). Отдельные элементы ПТК были внедрены: в Беловском институте-филиале КемГУ (2008), Анжеро-Судженском филиале КемГУ (2006-2010), Новокузнецком институте (филиале) КемГУ (2010), Кемеровском сельскохозяйственном институте (2010).

Апробация результатов. Основные результаты диссертации представлялись на международных и всероссийских конференциях: «Телематика» (Санкт-Петербург, 2004, 2005, 2006, 2010), «Computer Science and Information Technologies (CSIT'2004)» (Budapest, Hungary, 2004), «Новые информационные технологии в университетском образовании» (Кемерово 2006), «Вычислительные и информационные технологии в науке, технике и образовании» (Павлодар, 2006), «El-Pub» (Новосибирск, 2003, 2008), «Risk and efficiency in economy practice: 17th GBU International Conference on control, development and applied informatics in business and economic» (Brasov, Romania, 2010), «Информационные технологи и математическое моделирование» (Анжеро-Судженск, 2006-2010гг.), «Единая образовательная информационная среда: проблемы и пути развития» (Томск, 2006 - 2010, Омск, 2009); «Инновационные недра Кузбасса. IT-технологии», «Недра Кузбасса. Инновации», «Информационные недра Кузбасса» (Кемерово, 2005 - 2007гг.), «Системы автоматизации в образовании, науке и производстве» (Новокузнецк, 2005 - 2009), «Распределённые информационно-вычислительные ресурсы» (Новосибирск, 2005, 2008), «Информационная среда вуза XXI века» (Москва-Петрозаводск, 2007 - 2009); докладывались на научных семинарах в Кемеровском государственном университете, Томском государственном университете, Сибирском государственном индустриальном университете (г. Новокузнецк), Сибирском государственном университете телекоммуникаций и информатики (г. Новосибирск), Институте вычислительных технологий СО РАН (г. Новосибирск).

Публикации. По теме диссертации опубликовано 106 работ, в том числе 2 монографии (19,5/9,05), 8 статей в изданиях, рекомендуемых ВАК для предоставления ос-

новных результатов диссертации (6,52/4,26), 6 статей в научных журналах (2,08/1,67), 4 статьи в зарубежных журналах и сборниках (2,76/2,13), 32 публикации в трудах и материалах конференций (12,75/8,65), получено 3 свидетельства об официальной регистрации программ в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам. (В скобках первым указан общий объём публикаций в печатных листах, через разделитель - объём, принадлежащий лично автору.)

Личный вклад автора заключается: в разработке содержательных идей, методов и алгоритмов решения поставленных задач; разработке информационных объектов и моделей; совместной разработке методов выбора элементов архитектуры ЕИС, методов автоматического определения метаданных; научном руководстве при создании всех программных и технологических элементов ЕИС; создании отдельных программных систем и подсистем; руководстве реализацией и проектированием всех элементов ЕИС. Из печатных работ, опубликованных диссертантом в соавторстве, в диссертацию вошли только те результаты, которые автором получены лично или при его непосредственном научном руководстве на всех этапах (от постановки задач, моделирования и до реализации ПТК).

Структура и объём работы. Диссертационная работа состоит из введения, шести глав, заключения и списка литературы. Общий объём работы составляет 234 страницы основного текста, включая 75 иллюстраций, 17 таблиц, библиографический список из 258 литературных источников, 5 приложений.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертационной работы, приводится ее краткая характеристика, определяется направление исследований, формулируются цель работы и основные задачи исследования, а также основные положения, выносимые на защиту.

В первой главе «Методические основы создания информационной среды» рассматривается методология разработки ЕИС организации, выявляются основные факторы создания среды. Показано, что информационная среда организации, как правило, создается в неоднородной программной среде, поскольку уже имеются системы, решающие конкретные или специфичные задачи, которые зачастую не совместимы между собой по описанию и способам хранения данных или набору предоставляемых сервисов.

В первую очередь, будем говорить о технологической среде, которую можно представить через взаимодействие элементов: модели бизнес-процессов; сеть передачи данных; интегрированная аналитическая информационная система (ИАИС); система электронного документооборота (СЭД); интегрированная база данных; информационные ресурсы. Взаимная увязка указанных подсистем и органическое объединение в единую систему достигаются на основе организационной, функциональной, технической, программной и информационно-лингвистической совместимости.

Выявлены общие подходы к интеграции отдельных ИС и ресурсов в корпоративные системы. Рассмотрены наиболее близкие с точки зрения использования методов для интеграции приложений технологические подходы: 1) сервисная шина предприятия (Enterprise Service Bus, ESB) - подход к построению распределённых корпоративных информационных систем, включающий в себя промежуточное ПО, которое обеспечивает взаимосвязь между различными приложениями по различным протоколам взаимодействия; 2) сервис-ориентированная архитектура (Service-Oriented

Architecture, SOA) - модульный подход к разработке программного обеспечения, основанный на использовании сервисов (служб) со стандартизированными интерфейсами.

Проведен сравнительный анализ промышленных и свободных реализаций SOA на базе ESB. Показано, что основными элементами интеграции на базе корпоративной шины являются: описание процессов, XML-сообщения (XML-файлы), описание сервисов, каталоги сервисов.

С другой стороны, на рынке ПО уже давно существуют системы электронного документооборота, реализующие технологию рабочих процессов (Workflow, WF) и обеспечивающие интеграцию между ИС предприятия на уровне описания и управления бизнес-процессами. Основным элементом интеграции для таких систем служат: электронный документ, интегрированная БД документов, бизнес-процесс, каталоги сервисов. В 2010 г. в России принят национальный стандарт ГОСТ Р 3898-2010 «Системы электронного документооборота. Взаимодействие систем управления документами. Требования к электронному сообщению», который устанавливает формат, состав и содержание электронного сообщения, обеспечивающего информационное взаимодействие систем управления документами. В основе этого взаимодействия, как и в составе технологии ESB, лежит электронное XML-сообщение, описывающее ЭД, доставляемый от одной СЭД к другой.

Использование ЭД для интеграции и обмена информацией между прикладными системами (не только между СЭД) позволяет существенно расширить функциональные возможности интеграционной платформы на базе СЭД, поскольку она уже настроена на работу с электронными документами и обладает набором сервисов для поиска, генерации и обработки документов. Описание ЭД в виде стандартизованного XML-сообщения позволит взаимодействовать СЭД со специализированными системами на базе SOA. Однако такая система должна обладать рядом дополнительных свойств, осуществляющих информационное обеспечение информационно-ориентированного, сервисно-ориентированного и процессно-ориентированного принципов интеграции, присущих системам управления бизнес-процессами.

Таблица 1 - Сравнительные характеристики ESB-техиологай и предлагаемого в работе подхода

Наименования критерия ЕБВ Предлагаемый подход

Единый формат описания данных + +

Обмен данными между HC сообщения ЭД

Поддержка языка описания БП ВРМЬ Диалект BPML

Поддержка SOA + +

Масштабирование + +

Набор интерфейсов для описания ИС и данных Создается для каждой ИС Создается для каждой ИС

Набор интерфейсов для создания приложений пользователя Свой для каждой ИС Единый

Согласование форматов межсистемных сообщений + +

Поддержка языка XML + +

Поддержка индустриальных стандартов + +

Уровень затрат на внедрение высокий низкий

Проведенный анализ существующих на рынке ПО систем электронного документооборота (как систем сервис-ориентированного ПО) показал, что ни одна из рассмотренных систем не может быть использована в качестве данной платформы так, чтобы в полной мере обеспечить все принципы интеграции. Результаты исследования позволили сделать вывод о целесообразности разработки и реализации сервис-ориентированного подхода с использованием ЭД в качестве основного элемента обме-

на данными между приложениями. В таблице 1 приводятся сравнительные характеристики двух подходов к созданию ЕИС организации.

Сформулированы общие требования, которым должны удовлетворять модели, позволяющие создавать сервис ориентированное ПО, предоставляющее сервисы для поддержки процесса интеграции с другими ИС. Сформулированы задачи диссертационного исследования.

Вторая глава «Моделирование предметной области» посвящена разработке моделей объектов предметной области и описанию концепции создания ЕИС. Рассмотрены различные подходы для изучения таких сложных систем. Для описания ЕИС выбран подход, который рассматривает систему как множество взаимосвязанных элементов, представляющих собой определенную целостность.

Под системой будем понимать множество объектов вместе с отношениями между ними и их атрибутами. Под моделью системы будем понимать математическую абстракцию, служащую для описания объектов и их взаимодействия. Определим понятие единой информационной среды некоторой организации как программно-телекоммуникационную среду, обеспечивающую едиными технологическими средствами информационную поддержку всех видов деятельности организации. Введенные определения конкретизируют понятия, данные Р. Фейджином и Г. Фриманом. Для разработки технологий проектирования подобных систем будем использовать принципы: декларативности представления, иерархичности, поэтапной реализации, интеграции решения задач.

В качестве основного объекта системы, предназначенного для обеспечения взаимодействия прикладных систем, будем использовать понятие электронного документа, определение которого в предлагаемой работе разработано на основе ГОСТа Р 51141-98 «Делопроизводство и архивное дело. Термины и определения», закона РФ N 24-ФЗ от 20.02.1995 «Об информации, информатизации и защите информации», закона РФ от 10.01.2002 N 1-ФЗ «Об электронно-цифровой подписи» и ГОСТа Р ИСО 9000-2001: «Системы менеджмента качества. Основные положения и словарь».

Под Электронным документом (ЭД) будем понимать информационную пару Содержимое, метаданные>: с/, = (С11, Мг] обрабатываемую в ЕИС и циркулирующую в ней, где С, - содержимое ЭД, Ма — метаданные ЭД. Под содержимым понимается

информационное наполнение ЭД, которое представляется в виде вложенного файла или набора файлов произвольного типа и размера, а также в виде ЭД или набора электронных документов. Метаданные - описание ЭД, однозначно его идентифицирующее, где отражаются как его статические, так и динамические характеристики.

Ещё одним ключевым объектом будущей системы является понятие бизнес-процесса (БП). Для его определения введем понятия задания, функции и процесса.

Заданием называется множество: ?,=<(?,, а, я, М,>, где действие (а) — элементарное действие, автоматически выполняемое системой и возвращающее определённый результат; объект (О,) - информационный объект, описанный и обрабатываемый в системе; исполнитель (л) - пользователь системы или «внешняя» ИС; М, - метаданные задания. Функцией называется пара /,=<а, М/>,. Прогрессом называется множество: Р1=<Р, /, г, Мр> с заданным регламентом выполнения элементов этого множества, где / - связанные с одним ЭД задания. Процесс связан с конкретным ЭД и описывает его маршрутизацию. Маршрутом ЭД (г) называется последовательность связанных с ним заданий с определенным регламентом их выполнения. Маршруты ЭД подразделяются на статические (регламент выполнения заданий неизменен) и динамические

(регламент выполнения заданий может быть изменён, а также могут быть удалены имеющиеся или добавлены новые задания). Под бизнес-процессом будем понимать множество: В = (Р,Р,Т,Мв), с заданным регламентом выполнения элементов этого множества, где Р - процессы, Р - функции, Т - задания, Мв - метаданные бизнес-процесса. Бизнес-процесс направлен на достижение определенной цели.

На основе стандартов построена классификация ЭД (Таблица 2).

Таблица 2 - Классификация документа

Описание определяющего признака Значение признака

Способ фиксации информации Электронный

Содержание Согласно ГОСТ Р 51141-98

Наименование Согласно ГОСТ Р 51141-98

Вид Индивидуальные, трафаретные

Степень сложности Простой, составной

Место составления Внутренние, внешние

Срок исполнения Срочные, несрочные

Степень гласности Открытые, ограниченного доступа

Назначение Оригинал, черновик, копия

Срок хранения Постоянные, временные, долговременные, разовые

Род деятельности Согласно ГОСТ Р / ИСО 15489

Регулярность выхода Периодические, непериодические

Функция Информационная, коммуникативная, управленческая

Емкость Полнота, актуальность

Мерность записи Двумерный (объем, формат)

Субъект восприятия Машиночитаемый

Источник/получатель Организация, СЭД, ИС, внешний

Степень обязательности Информационные, директивные

Механизм управления Локальный, СУБП, скрипт, сервис, другой

Типологическая классификация Согласно ГОСТ Р / ИСО 15489

Символом «*» отмечены дополнительно введенные категории классификации документа.

В качестве семантической модели построены онтологические модели информационных объектов, описывающие спецификацию структуры определенной проблемной области: ориентированная на решение задачи интеграции данных и приложений онтология «Электронный документ» и предметно-ориентированная онтология «Организация».

Онтология «Электронный документ» построена на базе методологии ГОЕР5 как терминосистема в виде словаря с концептуальным входом и фиксированными информационными связями между его единицами. Структуру термина ЭД в онтологии через другие термины можно описать следующим образом: ££>=< Д С, Б, Т, Р, Р, В, К>, где Б - электронный документ, включающий в себя два класса метаданные и содержательная часть (тело); С - класс элементов, необходимых для описания основных классов; 8 - множество связанных различными отношениями документов, описывающих некоторые сущности (в частности ИС); Т - задание; Б - функция; Р - процесс; В - бизнес-процесс; Я - маршрут электронного документа.

Структура онтологии «Организация» выглядит аналогичным образом: 11=<А, В, С, Д Е, Р, О, где А - класс «Персона»; В - класс «Адрес»; С - класс «Тип_данных»; Б -класс «Деятельность»; Е - класс «Управление»; Б - класс «Подразделение»; О - класс «Должность». Для реализации на прикладном уровне построены словари, отражающие специфику образовательной организации (университет).

Разработана концепция создания информационной среды организации как совокупности технических и программных средств, реализующих идеи и методы автома-

тизации. В Концепции учитываются объективные факторы, оказывающие существенное влияние на стратегию реализации системы.

Предложена структура информационной среды организации. Информационная система строится с применением послойного принципа и соблюдением концепции сервис ориентированных систем. Среди преимуществ такого подхода следует отметить возможность внесения изменений в отдельные программные компоненты (сервисы), расположенные в одном слое, без необходимости коренных переделок на других слоях, а также независимое развитие ИТ и ПО.

Третья глава «Моделирование информационных объектов и процессов интеграции» посвящена разработке моделей описания основных информационных объектов ЕИС и процессов интеграции на их основе. Для создания ЕИС выбран процессный подход в качестве элемента функционального описания видов деятельности (как это принято во многих распространенных СЭД) и элемента интеграции ИС с определением доступа к ресурсам на основе ролевого подхода. Таким образом, участниками ЕИС могут выступать пользователи ИС, сами ИС в контексте соответствующих БП.

Конкретизируя общий подход, изложенный в работах И.Г. Игнатовой, представим концептуальную модель развития ЕИС как:

IA=<I, Q1, Oed, Ou, О, S, R, BP, Q2, Md, H, t>, (1)

где: I — приходящие и исходящие из/во внешнего(ее) окружения(е) информационные потоки; Q1 - ограничения, определяемые на этапе создания концептуальной модели деятельности организации; Oei) - ориентированная на задачу онтологическая модель; Ои — предметно-ориентированная онтологическая модель; О — множество классов информационных объектов среды; S - множество классов субъектов информационной среды; R — множество отношений между компонентами <0, S, ВР> с учетом ограничений <Q1, Q2>; BP - множество классов БП; Q2 - множество ограничений, налагаемых на компоненты <0, S, R, ВР> в процессе жизненного цикла информационной среды; Md - множество моделей компонентов среды, получаемых на выделенных подмножествах О, S, R, ВР с учетом ограничений Q1 и Q2; Н - множество оценок (характеристик), полученных в результате анализа функционирования; t - время «жизни» информационной среды.

На основе онтологической модели Oed выделены следующие информационные объекты, выполняющие основную роль в процессе интеграции компонент информационной среды: 0=<D, В, Р, Т, F, М, Rt>, где D — множество классов электронных документов; В - множество бизнес-процессов с соответствующими регламентами их выполнения; Р — множество процессов; Т - множество заданий, связывающих процессы, функции и ЭД; F - множество функций (элементарных действий), производимых системой для выполнения Р; М — набор метаданных для каждого объекта; Rt - множество маршрутов ЭД (каждому документу может соответствовать несколько маршрутов, но каждый маршрут соответствует только одному документу или контейнеру ЭД).

Множество субъектов S = (U,G,Ro) представляет собой множество участников i/={i/'|i=ü7}, набор групп G = {G*|vt/'e{G'|i=i^},/=i7} и набор ролей Ro = |äo7 13G* ^jU' —>Ro\k = UKj = Tj,l = ¡71}, приписанных участникам и/или группам.

На множестве R между компонентами системы с учетом ограничений (Q\,Q2) выделены группы отношений: Д'=(0',0'); R2 = (o\S'); R3 =(S',S*); R" = (0',Д"); R5=(5,',S"); R6=(ß",ßm).

Множество классов бизнес-процессов ВР организации выражаются через представление в виде моделей В' = (0a,,0u,R\tJ}, в' еВР, где соответствующий БП может

быть получен путем отображения пространства бизнес-процессов на пространство моделей <р: BPxQ MJ для определенного момента г' жизненного цикла ЕИС.

Множество моделей Md выражаются следующим образом: Ш' = (й (ß, 0, CK, S*, R'j, //"где <p(B,Q) - модель соответствующего класса БП; O'j -подмножество объектов системы, участвующих в БП; S* - множество субъектов БП; Я) - множество отношений между элементами БП; Н" - набор характеристик модели, соответствующий ограничениям Q.

Множество оценочных характеристик Я=й'иЯг, где Я1 представляет собой набор характеристик модели, соответствующих налагаемым ограничениям на отношение между объектами и субъектами информационной среды, а Н2 представляет собой оценочные характеристики, которые определяются во время функционирования ЕИС, например, на основании разработанной модели качества.

Таким образом, на макро-уровне получена модель (1), описывающая процессы создания и развития ЕИС и позволяющая: декомпозировать ее на необходимое количество контекстных моделей элементов среды на различных этапах развития общей системы; опираться на общее описание объектов и видов деятельности посредством онтологических моделей; выделять основные «каркасные» элементы для обеспечения процесса интеграции информационных объектов. На основе онтологической модели Oed формализованы понятия основных объектов системы: ЭД, БП, процесс, функция, маршрут. Для каждого из объектов построена модель описания на основе стандарта ГОСТ Р 7.0.10-2010 (ISO 15836-2003) «Дублинское ядро».

Модель отношений информационных объектов в ЕИС формально представлена

как: Rl={(fj(mf)KJt,(m'))czpt(m''),dl)-, ,cd),Dirk); R] = [т< с' :[>/ ji

л;=(/Г',ц.}); Л2 ^i/V'V, (»O); R;=((Oed,Ou,{t,},{Pt},Rl),B'); R?=(R\B'); r6 где fj(jnf) - функция системы, заданная своими метаданными; ti(m') -

задание, определенное через свои метаданные; рк(т") - процесс; UJ(m") - пользователь среды, которому назначено некоторое задание; dl(md,cd) - ЭД, определенный через метаданные и содержимое; Dirk - контейнер (папка), содержащий документы; В' -конкретный бизнес-процесс; ВР - пространство бизнес-процессов, выполняемых в организации.

Для реализации эффективной защиты введены понятия пользователя, роли, права. Пользователь — объект среды, имеющий доступ к её функционалу и идентифицирующийся своей учётной записью. Право — это правило, определяющее разрешённое над объектом или классом объектов действие пользователя, группе пользователей или ИС. Роль - совокупность прав (или других ролей). Тогда модель взаимодействия пользователя с объектами среды может быть представлена следующим образом:

R42 =[о; tUOjK^.B' ,{Д}. ЙШ.Ь nl=ioi,Rolj:^Right'JuJ^Roliy R;=(U\G!);

Л,1 = (/io/,,AS""); Rl =(йо/е,Д'); где объект О,- (экземпляр класса объектов О) может содержать в себе другие объекты; каждому объекту О,- может быть назначена совокуп-

ность прав и/или ролей; набор ролей назначается пользователю и1 и/или группе пользователей С?" и/или информационной системе .

Модель (1) поддерживает ключевые концепции 80А: «обозримость» (способность потребителя видеть сервис) через описание элементов О, Б, К; «взаимодействие» (проявление использования сервиса) через элементы Б, Т, Б, Р; «эффект» (результат взаимодействия) через изменение состояния объектов среды.

Согласно разработанной концепции создания информационной среды, в соответствии с моделью (1) и моделями информационных объектов построена модель процесса интеграции ИС с использованием трех принципов интеграции:

— Информационно-ориентированный - основан на использовании одной и той же информации двумя и более системами. Для обеспечения работы со своей информацией у каждой системы имеется набор открытых сервисов. Данный принцип реализуется на уровнях интеграции приложений.

— Сервисно-ориентированный - основан на использовании стандартизованного описания формата передачи данных, которые хранятся в единой БД ПО промежуточного слоя, и имеется набор сервисов для работы с ними. Данный принцип реализуется на уровнях интеграции данных, платформ и на уровне использования стандартов интеграции.

— Процессно-ориентированный — основан на возможности присоединения к внутренним прикладным процессам каждой ИС таким образом, чтобы не просто использовать их функции, а создать новый бизнес-процесс, который бы связал эти ИС. Данный принцип реализуется на уровнях интеграции БП, платформ и на уровне использования стандартов обмена данными.

При этом ни один из принципов не является универсальным, и не существует общего способа решения задачи интеграции ИС. В зависимости от ситуации наиболее удачными решениями оказываются различные сочетания этих принципов.

Проведённый анализ существующих на рынке сервис ориентированных СЭД показал, что ни одна из рассмотренных систем не может быть использована в качестве объединяющей платформы так, чтобы в полной мере обеспечить все три принципа интеграции. Результаты анализа существующих подходов к интеграции ИС позволили ввести понятие процесса интеграции ИС как объединения ИС, связывающего множество документов и отношений в данных системах. Под информационной системой понимается множество связанных различными отношениями документов, описывающих некоторые сущности (объекты, факты или понятия). Обязательным атрибутом ИС является наличие хранилища, в котором находятся метаданные и/или содержимое документов.

Для описания функций системы, а также существующих в ней потоков данных построен комплекс функциональных моделей в нотациях ШЕБО и ГОЕБЗ.

В модели процесса информационно-ориентированной интеграции применяется подход, заключающийся в использовании единой базы данных для хранения информации всех действующих и разрабатываемых ИС (рисунок 1), в связи с чем в составе ПО разработан интерфейс, предоставляющий возможность управления данными в зависимости от назначенных другим ИС прав. Предусмотрен также механизм, позволяющий использовать интерфейсы других ИС для доступа к их данным. Данная модель обеспечивается вводом в функциональную модель СЭД блоков импорта, экспорта и управления доступом.

Запрашиваемое действие + идентификатор ИС

Идентификатор ИС

команды ♦ данные

Проверка • наличия прав 1

Права ИС БД СЭД

5 1

Запросы к данным СЭД Данные СЭД

Действие разрешено?

Л

т

Рисунок 1 — Модель процесса информационно-ориентированной интеграции

Рисунок 2 - Модель процесса сервисно-ориентированной интеграции

В основу модели процесса сервисно-ориентированной интеграции положено понятие ЭД как объекта, способного содержать различную информацию как в структурированном, так и в слабоструктурированном виде (содержимое), снабжённого стандартизованным описанием (метаданными), что позволяет использовать ЭД в качестве контейнера данных произвольного типа и размера (рисунок 2). Кроме того, система промежуточного слоя обладает набором сервисов, позволяющих каждой зарегистрированной в ней ИС работать с этими ЭД.

В основу модели процесса процессно-ориентированной интеграции положено понятие БП и функциональных блоков управления и доступа к БП (рисунок 3).

Интеграция осуществляется на основе создания типовых БП, осуществляющих связь между ИС и передачу ЭД из одной ИС в другую. Предусмотрено создание индивидуальных БП, способных в ходе выполнения обеспечивать передачу ЭД в ИС или получение ЭД из них. Для эффективной реализации интеграции в СЭД разработан механизм создания БП на основе представления ХМЬ-структуры их описания.

Полученные модели соответствуют эталонной модели сервис ориентированной архитектуры (спецификация комиссии версии 1.0 от 2.08.2006).

Рисунок 3 - Модель процесса процесспо-ориентироеапной интеграции

В четвертой главе «Моделирование жизненного цикла ЭД» определено понятие жизненного цикла (ЖЦ) ЭД, представлены модели и алгоритмы, поддерживающие основные этапы ЖЦ ЭД.

На основании стандартов, используемых в системах управления документами, выделяются следующие основные этапы ЖЦ документа: создание (рождение), становление (работа), публикация (размещение в системе), архивирование (размещение в архиве системы), уничтожение документа. В соответствии с построенными моделями в работе определены следующие этапы ЖЦ:

— создание ЭД (в ручном или автоматическом режиме) - определение множества метаданных документа вместе с его содержимым;

— становление — групповая или индивидуальная работа с ЭД, выполняемая на уровне СЭД с использованием механизмов маршрутизации и выполнения заданий;

— публикация — размещение ЭД в системе хранилищ или информационных ресурсах (сайты, порталы, файловая система), выполнение заданий (поручений), связанных с документом, без возможности изменения метаданных и содержимого;

— архивирование - размещение документа в системе информационных хранилищ с обеспечением поиска по метаданным и/или его содержимому, поддержка возможности извлечения из системы хранилищ;

— уничтожение — удаление документа из системы хранилищ.

Главной проблемой для обеспечения механизма интеграции ИС на основе ЭД является создание и регистрация в системе новых документов. В связи с тем, что поиск и управление документами осуществляется через работу с метаданными, их определение становится существенной проблемой в СЭД. На основании исследований был разработан алгоритм автоматического извлечения метаданных по тексту документа (рисунок 4), согласно которому процесс определения метаданных документа разбивается на несколько этапов:

1. Выделение зон документа. Под зоной документа понимается часть текста документа, имеющая единую структуру и семантическое значение.

2. Определение типов зон документа. Каждая зона имеет определённый тип, характеризующий её содержимое и множество метаданных, которые можно определить в зоне данного типа.

3. Определение класса документа. Выполнение данного этапа основывается на понятиях матрицы и шаблона документа. Класс электронного документа определяется путём соотнесения матрицы электронного документа и доступных шаблонов. Если

найден единственный шаблон, соответствующий ему класс становится итоговым. В противном случае поиск класса осуществляется непосредственно по всему тексту документа.

4. Последовательное определение метаданных в каждой зоне документа. В случае существования шаблона документа, в нём указан набор зон, а также набор метаданных в каждой зоне. Извлечение значений метаданных осуществляется в соответствии с этим шаблоном на следующем «проходе» по документу. В случае определения только класса ЭД, метаданные извлекаются по содержимому документа.

На 2-4 этапах используется математический аппарат нейронных сетей (НС) Кохонена и применяемый для решения задач классификации образов путем определения расстояний от объекта до ядра класса документов. При использовании данного метода первоначально определяются: ядра классов С, вектор входных параметров х и величина ¿1, характеризующая расстояние от х до С.

А

У

Извлечение

всему документу

Зоны определены?

Определение

• С

{ Извлечение

метаданных

Л

исунок 4 - Алгоритм автоматического определения метаданных

В качестве ядра класса нейронной сети используется вектор С = (с,...с,,{5,,...,/„}), где параметры С[,...,с, определяют атрибуты текста в электронном документе или потоке ввода: с,,...,с(_2 - атрибуты форматирования документа; с,_, - символ в начале строки; с, - символ в конце строки; {.?,,...,.$„}- ключевые слова; - ключевые фразы.

В соответствии с разработанным алгоритмом на вход НС подаётся вектор входных параметров х(с1/,...,с;',л:1,...,хп), где с\ - атрибуты текста /-ой зоны, соответствующие компонентам вектора С; х1 - слова в выбранной зоне документа. Определение зон документа производится одновременно с разбором параметров.

Введем функцию д(а,Ь) = |о' афЬ- При определении типа зоны задача определения

минимального расстояния |с/(х,С)| = |х,С| от вектора входных параметров до ядра класса сводится к поиску:

т / . ^

1 - Л 1 " ^ V А 2 п-т и А 1+т

1 /=1 п м *=1 П м V ,

где 1 — количество атрибутов форматирования текста в ЭД, п — количество слов, весо-

3

вые коэффициенты удовлетворяют условию У\д, =1.

/-1

При определении класса документа задача поиска с{ сводится к нахождению:

► тах,

(2)

где N - количество зон шаблона класса, 2, - тип /-ой зоны документа, г'- тип г-ой зоны шаблона документа. В результате определения максимального расстояния определяется наиболее близкий к документу шаблон. В том случае, если выбрано несколько шаблонов с одинаковым максимальным расстоянием, весь документ рассматривается как одна зона, и поиск наименования осуществляется непосредственно по всему тексту документа или входного потока данных. Для каждого класса документов в шаблоне указан набор зон, а для каждой зоны определён перечень классов метаданных т1,...,тп, которые могут быть определены в зоне.

В случае определения метаданных в зоне на слой нейронов подается вектор х = (х,,...,х„), а ядро класса имеет следующий вид:

С = (к, г, {5,,..., 5У}, {/;,..., /,}, {*„ ...,/„}) (4)

где к — определяющий признак класса, г - позиция признака в тексте, {«,,...,$„} - ключевые слова, {/,...,/,} — ключевые фразы, {/,,...,/„} - шаблоны, соответствующие синтаксису регулярных выражений, ч' - количество шаблонов.

Вектор для определения расстояния от экземпляра документа, представляемого вектором х, до ядра класса С определяется как:

= (5)

где:

— с/1 - величина, обозначающая присутствие в документе определяющего признака, отнесенная к числу слов зоны документа:

с11=^-±3(к,х1). (6)

" м

— с12 — величина, соответствующая расстоянию между позицией определяющего при-

знака в документе и позициеи определяющего признака из ядра класса:

/ 1-1

1 " -

и ы

тах(/,т")

(7)

— с?з — величина, определяющая количество слов зоны документа, совпавших со словами из ядра класса:

=-££%•*<)• (8)

и ы, Ы1

— </4— величина, определяющая количество фраз зоны документа, совпавших с фразами из ядра класса:

1 п-т и й-т

" ¿=; Ы1 V, М

(9)

с1} - величина, определяющая количество слов, соответствующих регулярным выражениям из ядра класса:

(Ю)

Пы

*=1

где р1 - количество слов в А: регулярном выражении, тШсЬ(а,Ь) - функция, значение которой равно 1, если фраза Ъ соответствует регулярному выражению а, и 0 - в противном случае.

Для эффективного извлечения метаданных в метод включена функция обучения, суть которой состоит в добавлении новых ядер классов (автоматическое обучение), а также в модернизации и добавлении шаблонов администратором (обучение с учителем). , ,

Приведённая выше математическая модель позволяет успешно* определять значения метаданных из ЭД, однако к ее недостаткам можно отнести тот факт, что для решения поставленной задачи необходимо выполнить несколько «проходов» по документу, что приводит к достаточному объему вычислений.

Рисунок 5 - Структура НС «Неокогнитрон» для решения задачи автоматического определения метаданных

Для построения другой методики используется НС «Неокогнитрон» (К. Фукуши-ма), представляющая собой многослойную самоорганизующуюся НС, состоящую из множества нейронов, сгруппированных в плоскости - двумерные массивы (рисунок 5). Нейрон одного слоя получает сигналы от ограниченного числа нейронов предыдущего слоя и посылает выходные сигналы ограниченному числу нейронов следующего слоя. Слои Си, Я14, С12 определяют класс, а слои Бц, Бн, Сп - метаданные

в зонах документа.

На вход НС подаётся множество А =/2, Т}, где 2— матрица атрибутов форматирования текста документа, а Т — матрица распределения слов по зонам. Каждой плоскости нейронов соответствует набор ключевых слов, характерных для зон определённого типа = , где р- номер плоскости; ^"-у'-ос ключевое словор-ой плос-

кости; к — количество ключевых слов для данной плоскости.

Выходные сигналы и-го нейрона р-ой плоскости соответствующего слоя последовательно вычисляются по формулам:

к т ;=1 ¡=\

' £ Р 4

Ща (">Р) = <Р

1 +

.-л

«Я + Р* и

"яз (,п>р) = <р

1++ил

1 + ЬУ

— .Е-!*-.

Д=1 з

«сп("> р) = тах (ит(к, р)),

*-м,л+1

usu(»,p) = <p

( //-l'en

1 + ZZa£ih,+/)''c ц(п + '.Л

'-0 J-1_

2(nm,p) = Y^L

1 + ftv

и ¡=1 ы

и ,4(;тт,р) - tp{1 + + aill<nJnm>P) + a,i>s,Jnm,p) [ ,

524 ' 1 1 + èv

где çz>(a-)=

А% X > О 0,х<0'

tj -}-ое слово /-ой зоны документа, подающееся на j'-ый вход ней-

рона; sni - i-ое ключевое слово для и-ой строки р-ой плоскости соответствующего слоя, - весовой коэффициент k-o'û входной связи для нейронов из р-ой плоскости; Рк - количество плоскостей в соответствующем слое; N — количество слоев; Ъ - весовой коэффициент тормозящего нейрона; - набор ключевых фраз (/-ая ключевая фраза для г'-го значения метаданного р-ой плоскости); at - весовой коэффициент А:-ой входной связи. Сложный слой C2j выполняет выбор победившего нейрона из слоя S24. Выходной сигнал С-нейрона возвращает номер входной связи с максимальным значением слоев S2i, S22, S23.

Таким образом, построена математическая модель, обладающая следующими достоинствами: определение метаданных за один проход по документу; обучение с учителем и без учителя; многослойная структура модели позволяет легко добавлять новые компоненты. Решение о применимости результата того или иного подхода осуществляется на этапе извлечения метаданных обоими способами.

Достоверность автоматического извлечения метаданных в период тестовой эксплуатации при занесении документов в СЭД составила 94% для структурированных (например, распоряжение, приказ, заявление) и 76% для слабоструктурированных (например, отчет в свободной форме, техническое задание) документов.

Другая проблема, связанная с обеспечением этапа публикации и архивирования ЖЦ ЭД, заключается в обеспечении оптимального распределения ЭД в системе информационных хранилищ. Предложено решение проблемы на основе задачи оптимизации стоимости документопотоков с использованием «архитектурного» подхода -анализ использования различных архитектурных решений при размещении ЭД, в котором экономический критерий (Бессонов C.B.) объединен с другим важным критерием — временем передачи информации.

Определим интегральный экономический критерий как сумму гДе sv - стоимость хранения информации; Smmi„ - стоимость получения данных из ИС; Smp - стоимость получения данных пользователем из информационных хранилищ. Другой критерий выразим через стоимость передачи ЭД пользователю и за счёт введения дополнительного ограничения на максимально возможный временной интервал, в течение которого пользователь может ожидать ЭД по своему запросу. Полная постановка задачи оптимизации в этом случае будет выглядеть следующим образом:

Л П, д Г '

КМ,С) = со^^(т^+с^) + а>2Ът^Ь Ы^У +

/=! 1=1 >1

(И)

при следующих ограничениях:

N

+<*) = /}, (12)

ы

ЛГ

<=1 7=1 >'=1

«И^М ;(14)

¿¿¿[К^Г )2 + «V, (у^ + ^ ) ■+ ('У*/4 )' ] * / = шп

¿>=1; (15)

1=1

1 ,Мк.еН1 [1, С*еЯ,.

где =|о ; ^ =|0 с* ; м} - *"ое метаданное с?.;С* - *-ое содержи-

мое с= {л/*,С*} -_/-ый электронный документ; Я, - /'-ая БД; и, - количество документов в //,; - число хранилищ ЭД; О, - общий объем /-го хранилища; - объём м) ЭД (1] в //,; V," - объём ЭД сГ в Н.; Qi - частота запросов к н,; - частота обращений к метаданным документа, т^ - частота обращения к содержимому ЭД; Я, -

пропускная способность канала связи, по которому передаются электронные документы между пользователем и Я,; 7} - максимально допустимое время ожидания сЛ в

Я,; /, - г'-ая информационная система; ^ — частота запросов к /, Ъ - число информационных систем; Т! - максимально допустимое время ожидания пользователем ] из I,; - частота запросов к I,; /и™ - частота обращения к метаданным документа в ИС за единицу времени; цс - частота обращений к содержимому документа; - количество электронных документов в ; Л,' - пропускная способность канала связи, по которому передаются документы из I,; г, - количество копий с/ ; - стоимость хранения единицы информации в Н, на определённый период времени; я? - стоимость получения единицы информации пользователю из Я,; ^ - стоимость получения единицы информации от /¡; щ,ы2,а>} - весовые коэффициенты, позволяющие управлять вкладом каждой стоимости в итоговое значение целевой функции. Матрицы М — / = 1,^,7 = 1,^1 и С = |с,у| / = 1,уУ,У = 1,яу| составляют набор переменных задачи. Определяемые элементами данных матриц объемы метаданных й содержания

у, = Н\ ^0,г' = 1,Л^,/ = 1,иу.| и К" = |у"| Усу ^ 0,г = = 1,л| являются известными значениями для каждого конкретного документа.

Для решения задачи необходимо найти такие коэффициенты выражения (11), при которых значение /(М,С) становится минимальным для данного набора значений матриц М и С, при ограничениях объема памяти, числа копий и времени получения электронных документов, задаваемых выражениями (12) - (15).

Возможны несколько вариантов выбора архитектуры информационных хранилищ и взаимодействующих с ними информационных систем:

1. Метаданные и содержимое документа расположены в разных хранилищах. Прикладные ИС поддерживают свою БД документов и обмениваются друг с другом только через общую БД (модель процесса процессно-ориентированной интеграции). В данном случае необходимо решать задачу (11)-(15).

2. Метаданные и содержимое документа расположены в разных хранилищах. Прикладные ИС поддерживают одну и ту же БД, обмениваясь между собой ссылками на общие документы (модель процесса сервисно-ориентированной интеграции). В таком случае задача преобразуется к виду:

N

2>,=0, l<rj<2N; ^<о„ (17)

3. Метаданные и содержимое документа расположены в одном хранилище. Прикладные ИС поддерживают ту же БД, используют прямые запросы к данным (модель процесса информационно-ориентированной интеграции). Для данного случая задача трансформируется в следующий вид:

= min (18)

УК j 1

±{mJ+Cj) = r, r> 1 ±Ь.<0; (19)

j-i j=t Ук >i

Для решения задачи оптимизации была построена численная процедура, использующая принцип динамического программирования, где задача (11)-(14) заменяется последовательностью задач:

Fi = min фк {pj), 7 = 1,...,« (20)

к

Ha>j=Pi> P;=0,l,...,min{2*,r,}, b^<0^i = l,...^\rvmu+^cy<rmn(T,TkJI). (21) w где

Таким образом, для к=1 (третий случай) получаем: = тт^(ру) = т\п(аити + /?,/•,,);

»«./,+£,/;<о,; тч+су=Р)> + )-Т- в этом случае возможны

У Л

только два варианта распределения ЭД: нельзя разместить ни одной копии документа

Pj = 0 или разместить в единственном хранилище одну копию документа OV=cv=1; Pj =2). Тогда: $(0) = 0; ^(2) = {«,,+£,}; F, = тт$(^) = тт{а,;+Д;}.

1

Для второго случая (к=2) получаем: F( = min ф2(р}) = min ^(avmtJ + ßuc&);

i=i

"htfj+CijtjZO,; >n2jv'2j +c2jv"2j < 02; '¿mv+ct = Pj; ä T-

i~l (=1 i£iKi Для k=3 (первый случай) возможны несколько вариантов: нельзя разместить ни одной копии документа pj = 0; разместить метаданные в одном хранилище, а содержимое в другом р} = 2 (тч =(1,0); cyj =(0,1); m2J=(0,1); c2j =(1,0)); целиком разместить документ в каком-либо одном хранилище pj = 2 (iHjj =(1,0); с|у =(1,0); m2j =(0,1); c2J =(0,1)); целиком разместить документ в каждом из хранилищ Pj =4 (ти =1, ctJ = 1, m2j = 1, c2j =1). Суммируя, приходим к виду: &(0) = 0, ф2(2): ту =(1,0,1,0); с,. =(0,1,1,0); т2] = (0,1,0,1); c2J =(1,0,0,1);

й(2>={«,,+&,}; ¿2(2)={«2,+Д,}; tiw={<*2j+Aj};

F2 = min ф{ (р, ) = min [ф'г (2) I i = Ü4} •

Легко обобщить вышеизложенные рассуждения для любого числа хранилищ (k=N). Учитывая, что все коэффициенты ау и ßt] - положительные вещественные

числа, тц и c;j - векторы размерности состоящие из значений {0;1}, то среди

всех локальных оптимумов найдется глобальный оптимум F*, который будет являться решением нашей задачи. Таким образом, решение задачи:

F' = min^/ = min фк min фк (phi)) ;/ = l,..,w; i = l,..,N-l (22)

с условиями (21) будет приближенным решением задачи (11)-(14). Данная задача похожа на задачу о размещении предметов с разными весами в многомерном рюкзаке.

Рисунок б - Алгоритм работы вычислительной процедуры

Значения параметров для тестовых расчетов выбирались так, чтобы оценить влияние только выбранной архитектуры на размещение информационных хранилищ в соответствии с описанными выше вариантами архитектурных решений. Численный алгоритм работы процедуры показан на рисунке б.

Результаты расчетов (рисунок 7) показали, что значение целевой функции ведет себя практически одинаково для первых двух вариантов архитектурных решений (рисунок 7, Случай 1 и Случай 2). Для третьего варианта (рисунок 7, Случай 3) минимальное значение стоимости документопотоков резко возрастает после превышения порогового значения количества ЭД (500 в данном варианте расчета). Такие же результаты были получены при увеличении количества документов до 100 ООО, а коли-

При реализации системы первоначально было размещено около 60 тысяч документов по трем хранилищам системы. Далее было добавлено специальное хранилище для архивации документов, циркулирующих в ЕИС. В период тестовой эксплуатации в информационные хранилища размещалось дополнительно около 400 000 документов.

Пятая глава «Модели процессов создания и тестирования распределенных программных систем». В соответствии с идеологией открытых систем разработана структура программного комплекса, которая учитывает особенности построенных моделей и позволяет реализовать набор программных приложений. Структурно разрабатываемую программную систему предложено рассматривать как взаимодействие между компонентами на четырех уровнях (рисунок 8), соответствующих уровням абстрактной модели IMS (IMS Abstract Framework - IAF):

1. Приложения — набор прикладных программных систем, функциональность которых определяется набором прикладных сервисов, обеспечивающих взаимодействие с БД электронных документов, справочниками (через специализированную систему «Справочники»), дополнительными данными «внешних» систем, набором прикладных ИС, обменивающихся данными на основе ЭД.

2. Прикладные сервисы - набор сервисов, предоставляемых прикладным системам,

которые используют эти услуги на нижнем уровне: набор подсистем СЭД и система обработки поручений. Данный уровень обеспечивает взаимодействие программных приложений, выполняющих определенные (прикладные) функции. Для удобства реализации процессно-ориентированной интеграции разработан язык KemsuBPDL (диалект языка BPML), позволяющий формализовать элементы бизнес-процесса и организовать взаимодействие между ними, обла-

дающии средствами поддержки вложенных процессов, предоставляющий возможности для описания ветвлений и циклов.

3. Общие сервисы - набор сервисов, не имеющих жесткой привязки к предметной области и предоставляющие услуги широкому кругу прикладных систем: СЭД, система справочников, маршрутизация ЭД, система управления БП (СУБП), обеспечивающих разграничение доступа пользователей и ИС к элементам среды, интеграцию приложений и другие необходимые функции.

4. Инфраструктура - набор общесистемных сервисов, обеспечивающих взаимодействие сервисов вышележащих уровней на основе механизма обмена электронными документами: система защиты; библиотека java-icnaccoB (KemsuWEB), реализующая портальные функции по обработке xml-шаблонов для генерации и предоставления html-документа; СУБД; серверы приложений, обеспечивающих обработку результатов sql-запросов и специализированных скриптов.

Такая многоуровневая организация соответствует принципам OSE/RM и OSI/RM, а также принципам сервисно-ориентированной архитектуры.

/Инфраструктурах / ибщиесервисыЧ

Прииладия« ИС

I I процессы \

V_У

Рисунок 8 - Уровни реализации информационной среды в соответствии с моделью процесса интеграции ИС

Сформулированы общие требования, которым должны удовлетворять модели, позволяющие создавать программные приложения на основе предложенных подходов.

Модели должны обеспечивать возможность:

— работы со структурированными и слабо структурированными данными;

— совместного использования одной и той же информации за счёт предоставления сервисов по работе со специализированными данными;

— интеграции ИС за счёт использования стандартизованного описания формата данных и наличия у систем специфицированных сервисов работы с этим форматом;

— объединения внутренних прикладных процессов ИС за счёт создания и обработки специализированных БП;

— автоматического определения метаданных из содержимого текстового документа и описания, представленного в ХМЬ-формате, для регистрации ЭД в хранилище и создания справочников на основе онтологических моделей;

— управления документами на основе единого описания;

— маршрутизации движения ЭД;

— управления БП, включая моделирование, выполнение и мониторинг БП;

— реализации удобных средств навигации и организации доступа пользователей к информации через единый интерфейс пользователя;

— безопасного хранения и передачи информации;

— настройки ИС на выбранную архитектуру;

— ручной или автоматической генерации необходимых справочников;

— агрегирования данных для обеспечения аналитической оперативной обработки информации в хранилищах данных.

Реализация вышеизложенных требований проведена в рамках сервис ориентированной архитектуры. Разработан комплекс моделей для создания пакета программ «KemsuWEB», который обеспечивает единую среду для создания приложений в среде Internet/Intranet, предоставляющих сервисы, удовлетворяющие различные потребности разработчика в операциях с БД, в защите информации, в управлении ходом выполнения приложения.

Разработан комплекс моделей системы защиты, включающей подсистему «Разграничение доступа» (проверка привилегий при выполнении конкретного действия с объектом информационной среды в зависимости от роли пользователя) и подсистему «Управление защитой» (управление защищаемыми объектами, правами и пользователями). Система поддерживает протокол LDAP 3.0.

Разработан комплекс функциональных моделей СЭД — центральной системы, обеспечивающей поддержку процессов интеграции информационных ресурсов и ИС.

На основе стандарта ГОСТ Р 7.0.10-2010 разработаны: модель хранения метаданных объектов информационной среды, предназначенная для организации информационных хранилищ, баз данных ЭД, справочников и онтологий; модель хранения объектов СЭД на основе моделей, предложенных в Главах 3-4.

Разработан комплекс моделей, позволяющих создавать хранилище данных (ХД) со специализированными функциями на основе описания метаданных. Вне ХД метаданные хранятся в виде XML файлов. Подсистема метаданных обеспечивает инвариантность ХД относительно обслуживаемых ИС, позволяет восстанавливать выбранные данные в требуемую ИС, накапливать информацию из ИС и использовать её для построения отчётов. ХД может использоваться автономно.

Проведен анализ построенных моделей на соответствие предъявленным общим требованиям к моделям ЕИС. Результаты анализа позволяют сделать заключение об адекватности построенных моделей задачам, решаемым в рамках ЕИС. Каждое требование подтверждено соответствующим набором информационных объектов и набором технологических решений, обеспечивающих его выполнение.

В рамках ПТК использована созданная методика «прозрачной журнализации» для тестирования реализованных компонент ЕИС, суть которой заключается в следующем. Поскольку центральным звеном для создания пользовательских интерфейсов в нашей структуре является пакет KemsuWEB, а шаблоны всех страниц и форм WEB-приложения содержатся в XML-файлах, то нетрудно в исходном коде шаблона расставить текстовые метки специальным образом. Далее, при выполнении исходного кода, метки вместе с фрагментами кода и значениями соответствующих переменных помещаются в специальную таблицу — журнал активности.

Каждая запись представляет собой элемент графа структуры тестируемого приложения. Набор записей можно отобразить с помощью графа. Для демонстрации методики представлен фрагмент графа структуры {Рисунок 9) абстрактного приложения

регистрации пользователя в ИС и соответствующий ему набор записей в журнале активности (таблица 3).

*t*S'ff names'SSPereonftOSt" vafcje=— op«"eq">

Г

r_NAMe«»nb«p «FIRST_NA*£W&nbsp ffMlDIX£ ■BfeMORGANSATimM'briStfCnWfebrititCOUMroY»

Рисунок 9 - Модель процесса процессно-ориентированной интеграции

В первой строке таблицы проверяется состояние авторизации пользователя (рисунок 9, узел 1). Если значение переменной $$Регеоп/ГО$$ не определено, то пользователь не прошел регистрацию в системе и ему необходимо заполнить свои данные при помощи специальной формы (рисунок 9, узел 4). Если пользователь получил свои данные для авторизации (логин и пароль), ввел их в соответствующие поля формы и начал процесс авторизации, его параметры передаются в специальный файл «ins_person.htm» (узел 2), где происходит проверка его учетных данных (узел 3, строки 2 и 3 в таблице 3). Значения передаваемых параметров и результат процесса авторизации помещаются в столбец 6 таблицы 3. Эти данные в последующем могут служить для автоматической генерации тестовых сценариев при проведении повторного или более детального тестирования. В случае успешной проверки учетной записи пользователь переходит на свой рабочий стол и продолжает работу с системой. Если попытка авторизации прошла неудачно, пользователь остается в пределах текущей формы.

№ п/п Имя модуля (компонента) Метка узла Метка след. узла Действие/предикат Значение предиката Возвращаемое значение Комментарий

1 !ittp://conferenc е. kemsu.ru/conf 'reg/index.htm [1] [2] If name="$$Person/ID$$" value="" op="eq" true Значение Person/ID = null

2 ittp://conferenc a.kemsu.ru/ conf 'reg/index.htm [2] [3] conf/{ {conferenceAlias} }/reg/ins_person.htm Значения передаваемых параметров Передача управления форме

3 ittp://conferenc г.kemsu.ru/conf 'reg/index.htm [3] :onf/{ {conferenceAlias} }/reg/chk.htm Значения передаваемых параметров Значение выходных параметров Передача управления форме

4 ittp://conferenc e.kemsu.ru/conf /reg/index.htm [1] И] WLAST NAM£## ##FIRST NAME## ^MIDDLE NAME## MtoRGANISATION## ##CITY## WCOUNTRY## Значения переменных Откуда вернулись Вывод в XML-файл

Если пользователь начал процесс регистрации в системе (узел 4) посредством специальной формы, то его параметры помещаются в столбец 5 таблицы (переменные #ЬА8Т_ЫАМЕ##, ##рт8Т_ЫАМЕ##, ##МТББЬЕ_ЫАМЕ##, ##01ШАМ8АТЮЫ##, ##С1ТУ##, ##С01МТЯУ##) и могут быть использованы для проведения дальнейшего детального тестирования.

После выполнения необходимых тестовых сценариев имеется: структура проверяемого модуля (компонента) системы, набор значений передаваемых/принимаемых переменных, набор сообщений системы (помещаются в последнее поле в случае возникновения проблемных ситуаций). На основании этих данных можно провести анализ покрытия структуры приложения, который дает возможность оценить эффективность теста (с использованием специализированных инструментов тестирования) и провести наблюдение за путями выполнения кода. Простейший алгоритм использования метода «Прозрачной журнализации» графически представлен на рисуноке 10.

Рисунок 10 - Простейший алгоритм метода «прозрачной журнализации»

Шестая глава «Реализация и внедрение программно-технологического комплекса» посвящена описанию реализации ЕИС согласно предложенным моделям и методам. При создании ПТК разработан профиль ЕИС, основанный на использовании стандартов БОА и ОС. Определена его взаимосвязь с другими необходимыми профилями для реализации ЕИС (рисунок 11). Профиль ЖЦ определяет две основных группы: общесистемные стандарты и технологические стандарты. Набор стандартов должен уточняться при создании или модификации информационных систем и программных средств, используемых в организации. Профиль организации определяет нормативную базу бизнес-процессов, обеспечивающих все виды деятельности. Набор стандартов и нормативных документов должен детализироваться при создании ЕИС в организации. Профиль ЕИС является профилем конкретного применения и описывает требования, нормы и правила, использованные при создании и развитии ЕИС на основе предлагаемых подходов. Профиль взаимодействия открытых систем (ВОС) России (Р 50.1.02220000) определяет набор базовых и функциональных стандартов, применяемых для

Рисунок 11 - Взаимосвязь профилей

работы различных типов распределенных сетей связи и передачи данных по этим сетям на основе эталонной модели OSI/RM.

Необходимо также учитывать общие требования (согласно концепции открытых систем и стандартов обеспечения качества сложных информационных средств), предъявляемые непосредственно к информационным системам, входящим в состав ПТК: масштабируемость; мобильность; интероперабельность (соблюдение определенных правил или привлечение дополнительных программных средств, обеспечивающих возможность взаимодействия независимо разработанных программных модулей, подсистем или функционально завершенных программных систем); доступность программного и аппаратного обеспечения для развития и реструктуризации; модульность; повторное использование кода; набор справочников для хранения важных, часто повторяющихся данных; функциональная пригодность (способность ИС обеспечивать решение задач, удовлетворяющих установленные потребности пользователей при использовании в составе программного комплекса в заданных условиях); надежность (вероятность работы всех программных элементов без отказов в течение определенного периода времени); удобство использования (возможность комфортной эксплуатации ИС и управления данными); удобство поддержки программных элементов (с привлечением специалистов и силами пользователей ИС); минимизация требований к рабочему месту пользователя.

В результате была выбрана четырёхзвенная архитектура системы с централизованным управлением электронными документами и данными, доступом к системе через приложения, реализующие необходимый набор сервисов. Для хранения документов выбраны: реляционная БД, предназначенная для хранения метаданных, и БД, ориентированная на работу с документами произвольного типа. В качестве клиентов могут выступать приложения или стандартный WEB-браузер (последнее позволяет минимизировать системные требования к персональному компьютеру пользователя, снизить расходы на установку дополнительного программного обеспечения и обучение пользователей работе с ним). Выбор такой архитектуры позволит уменьшить расходы на создание и эксплуатацию среды, увеличить эффективность поддержки системы за счёт «мгновенной» доступности всех исправлений, вносимых в систему.

Для оценки эффективности внедрения элементов разработанного ПТК предложена модель на основе использования упрощенного локального подхода, учитывающего используемые технологические решения. Среди факторов, определяющих эффективность функционирования распределенных систем, выделены: готовность, надежность, целостность и управляемость. Коэффициенты эффективности определены исходя из возможности влияния основных факторов жизненного цикла ИС на ее функционирование в информационной среде и используемых нами технологических решений: количество обращений пользователей в IT-службу, повлекших за собой изменение в программном коде, относительно общего количества обращений: Erj=(Eril Erl):, коэффициент времени 100% обработки запросов, поступивших в систему, к общему времени работы системы за промежуток времени: 7}=(71/Г2) ; коэффициент отказоустойчивости j-й компоненты системы за время эксплуатации системы: Яу = / N (N -общее число компонентов системы); коэффициент объема обработанных документов с использованием j-ii ИС: F, =((Vt-V„)/Vb) (Vs - объем документов, обработанный с использованием ИС за определенный период (один рабочий день), Vb — объем документов, обработанный без использования ИС (принимается за базовый)); коэффициент

времени обработки одной заявки с использованием у-ой системы т/ =((Ts-Tb)/Tb)J (Ts-

время обработки одной заявки с использованием ИС, Ть — время обработки одной заявки «вручную»); коэффициент управляемости системы при настройках на новую конфигурацию ={Тс 1ТШр). (Тс - время, затраченное на конфигурирование системы,

T¡mp - время, затраченное на ввод системы в эксплуатацию); коэффициент управляемости системы при вводе начальных данных r¡¡ ={т,, ITlmp), (Td - время на ввод начальных

данных в систему); коэффициент удобства изучения системы конечным пользователем а/ = (7¡ / Т„„ )J. (Tj - время изучения интерфейса системы, Тт,„ - общее время эксплуатации системы); коэффициент удобства выполнения типовой операции пользователем /? = («т7^! )j {Т0р ~ время выполнения типовой операции в системе, Тп,гк - общее

время работы в рамках одного сеанса, пт — количество выполненных типовых операций в рамках одного сеанса, NT — нормативный показатель); коэффициент стоимости владения компьютерным и телекоммуникационным оборудованием Ка ~Dal D (Dc, -средства, затраченные на приобретение и установку компьютерного и телекоммуникационного оборудования, D - общий уровень затрат на увеличения основных фондов университета); коэффициент стоимости владения программным обеспечением Klf=Dsf/D (Dsf— стоимость приобретения и лицензирования внешнего ПО); коэффициент стоимости разработки ПО Krln, = / Dx (Díln, - стоимость средств, затраченных на разработку типовой системы, Dsc - затраты на заработную плату специалистов, разрабатывающих и обслуживающих информационные системы).

На основе мультипликативного подхода составлены оценочные комплексы, характеризующие группы показателей эффективности: факторы готовности ИС выполнять свои функции F] = ijTjÁj; факторы производительности при обработке документов и

заявок Fj = tjVjTj; факторы управляемости системы Ff = l\er¡¡; факторы удобства использования системы F* = zjajfij ; факторы стоимости владения программно-аппаратными средствами F5 = ^KctK,fKd!t.; фактор сопровождаемости системы Er¡.

На основании оценочных комплексов составлена оценка эффективности F использования информационной среды через учет оценки ее компонентов с использованием аддитивного метода:

^=■тг ÍM+W?++ stf+s>Erj). (23)

iV J-]

где TV — количество систем в рамках информационной среды, ^<5, = 1.

к

В качестве программной реализации сервера приложений было выбрано ПО Apache Tomcat, предназначенное для выполнения функций WEB-сервера и сервера приложений. Шаблоны, реализующие интерфейс программных систем уровня портальных приложений, общесистемных приложений и некоторых рабочих ИС расположены на сервере приложений и представлены в виде набора XML-файлов.

В качестве ПО, реализующего работу со специализированными базами данных и хранилищем данных, использована объектно-реляционная СУБД ORACLE 10G R2. Данный выбор более оптимален по сравнению с выбором двух (реляционной и объектной) СУБД, так как позволяет снизить затраты на администрирование и обслуживание БД. При реализации уровня бизнес-логики приложения использованы программные пакеты на языке PL/SQL и классы, написанные на языке JAVA.

Для хранения неизменных значений используется специальная ИС справочников, объединяющая с помощью единого системного интерфейса различные справочники, каждый из которых имеет древовидную структуру: на первом уровне располагаются разделы, на втором - подразделы или возможные значения элементов.

На уровне инфраструктуры реализовано: пакет «КетвиХУЕВ»; интерфейс информационных систем, поддерживаемый пакетом КетвиХУЕВ; язык скриптов КегшиХУЕВ, обеспечивающий гибкий механизм описания шаблонов интерфейса; система защиты, предоставляющая интерфейсы для управления учетными записями пользователей, ролями, группами и ограничениями. Данные программные компоненты позволяют организовать разработку новых ИС и их взаимодействие на базе 80А.

На уровне общих сервисов разработаны: СЭД; интерфейс СЭД с учётом рекомендаций, представленных в стандартах и публикациях, включая требования к визуальным атрибутам отображаемой информации, сопровождению пользователя, структуре, внешнему виду, соответствию решаемым пользователем задачам, легкости управления, соответствию ожиданиям пользователя, устойчивости к ошибкам, пригодности к индивидуализации, легкости изучения; ИС справочников, предоставляющая два типа интерфейса для управления и использования общих справочников: \УЕВ-интерфейс пользователя на основе технологических решений пакета «КетБиШЕВ» и программный интерфейс для ИС в виде пакета программных модулей; две базовые подсистемы СЭД: система управления бизнес-процессами (СУБП) и система движения электронных документов. Данное программное обеспечение предоставляет набор сервисов для обеспечения взаимодействия ИС в соответствии с моделью процесса интеграции (Глава 3).

На уровне прикладных сервисов и уровне приложений реализовано и запущено в эксплуатацию около 20 информационных систем, решающих практические задачи автоматизации бизнес процессов учреждения высшего образования (депозитарий электронных образовательных ресурсов; система автоматизации деятельности деканатов ВУЗа «Деканат»; система информационного обеспечения учебного процесса; система информационного обеспечения проведения научных мероприятий «Сервер конференций» и др.). Вышеуказанные ИС объединены интерфейсом пользователя на базе пакета «Кегши\УЕВ», системой электронного документооборота, системой защиты и системой справочников. Системы используют общую БД электронных документов, общие справочники и хранилище данных. Кроме этого реализованы: БД ЭД; БД прикладных ИС; БД справочников. Данные БД разработаны с использованием одних технологий и обеспечиваются многослойной системой вызова программных интерфейсов для доступа к данным на уровне СУБД. Дополнительно реализовано хранилище данных (ХД), включающее следующие компоненты: \¥ЕВ-приложение под управлением пакета «КешвиШЕВ», приложение для получения аналитических отчетов, база гиперкубов данных. ХД обеспечивает управление загрузкой/выгрузкой данных на основании ХМЬ-файла с описанием структур данных.

Анализ результатов выполнения требований, определенных в настоящей главе, показал, что построенная ЕИС удовлетворяет всем предъявленным к ней требованиям, а реализованный функционал в полной мере соответствует построенным моделям.

Для расчета интегрального показателя эффективности внедрения используются данные (таблица 5), полученные в КемГУ при поэтапном внедрении элементов информационной среды за три года. Поскольку в течение рассматриваемого периода количество элементов среды постоянно менялось, для окончательных вычислений ис-

пользуются усредненные данные. Значения показателей были измерены в процессе руководства группой разработчиков, а также получены из открытых источников.

Таблица 5 - Средние значения показателей эффективности, рассчитанные по реальным данным для'КемГУ

N11/11 Фактор 2008 2009 2010 Среднее значение

1. 0,320 0,047 0,046 0,138

2. 0,917 0.934 0,949 0,933

3. IX 1,0 0,5 0,32 0,607

4. 0,250 0.282 0,315 0,282

5. 0,9 0.925 0.94 0,922

6. 0,180 0,081 0,036 0,099

7. 0,278 0,312 0,082 0,224

8. 0,110 0,031 0,008 0,047

9. Ел 0,36 0.342 0,314 0,339

10. к„ 0,013 0.013 0,019 0,015

11. х>? 0,01 0,08 0,017 0,036

12. 0,0082 0,0079 0,0087 0,0083

Предполагая, что все коэффициенты 8к в (23) равны между собой, на основании вычисленных значений оценочных комплексов получаем величину комплексного показателя эффективности: ^ = 0,264 (26,4 %). Несмотря на то, что предложенная модель опирается на получение только количественных оценок эффективности в достаточно узкой области использования информационных технологий и лишь вскользь учитывает финансовые показатели организации, полученные оценки достаточно хорошо согласуются с общепринятыми показателями (20 — 45 %).

В заключении приводятся основные результаты, полученные в диссертации, на основании проведенных исследований формулируются выводы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. В диссертационной работе решена научная проблема, имеющая большое практическое значение для создания ЕИС организации, повышения эффективности создания среды на основе интеграции существующих ИС и информационных ресурсов на базе реализации концепций открытых систем и вОА. Предложен подход к созданию и развитию информационных технологий, позволивший обосновать возможность интеграции ресурсов и ИС на базе использования ЭД в качестве основного объекта, обеспечивающего взаимодействие между ИС.

2. Предложена модель, описывающая процессы создания и развития ЕИС на макроуровне и учитывающая построенные онтологические модели информационных объектов, описывающих спецификацию структуры определенной проблемной области: ориентированная на решение задачи интеграции данных и приложений онтология «Электронный документ» и предметно-ориентированная онтология «Организация (Университет)». В рамках модели формализованы понятия основных объектов системы; построены модели отношений информационных объектов и взаимодействия пользователя с объектами среды. Такой подход позволяет: деком-

позировать макромодель на необходимое количество контекстных моделей элементов среды на различных этапах развития общей системы; опираться на общее описание объектов и видов деятельности посредством онтологических моделей; выделять основные «каркасные» элементы для обеспечения процесса интеграции информационных объектов.

3. Предложена модель процесса интеграции ИС, опирающаяся на информационно-ориентированный, сервисно-ориентированный и процессно-ориентированный принципы интеграции. Показано, что интеграция ИС достигается на основе использования сервис ориентированного ПО, в качестве которого предложено использовать две системы: обладающую рядом дополнительных свойств СЭД как основу реализации процессно-ориентированного принципа интеграции, а также систему портального ядра, осуществляющую технологическое обеспечение необходимых сервисов. Данный технологический подход позволяет создать единую информационную среду на базе сервис-ориентированной архитектуры, интегрировать «унаследованные» и новые ИС, поэтапно создавать и внедрять элементы среды.

4. Для обеспечения жизненного цикла ЭД в ЕИС разработаны математические модели и алгоритмы автоматического извлечения метаданных ЭД на базе аппарата нейронных сетей. Разработана методика и численная процедура решения задачи оптимизации стоимости документопотоков, обеспечивающая оптимальное распределение ЭД в системе распределенных хранилищ. Данные методики позволили реализовать многозвенную архитектуру с централизованным управлением ЭД и доступом к системе через технологии сервис-ориентированной архитектуры, позволяющую строить и развивать гибкую систему элементов среды.

5. Предложен подход к тестированию \\^еЬ-приложений, что позволяет сократить затраты на аттестацию сложных распределенных программных систем, созданных на основе сервис-ориентированной архитектуры.

6. Разработан профиль стандартов ЕИС, обеспечивающий нормативной базой процесс разработки и функционирования единой информационной среды. Реализован ПТК, обеспечивающий разработку новых ИС на базе \УЕВ-технологий, защиту приложений и разграничение доступа пользователей, взаимодействие ИС в соответствии с моделью процесса интеграции, управление БП, движение ЭД, совместное использование данных. Результаты внедрения, рассчитанные с помощью специально разработанной модели оценки эффективности использования ИС на основе упрощенного локального подхода, учитывающего используемые технологические решения, показали, что эффективность использования информационных технологий в деятельности образовательного учреждения повысилась на 26 %.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Монографии

1. Проблемы и типовые решения создания информационной структуры регионального образовательного комплекса / К. Е. Афанасьев, А. М. Гудов, Ю. А. Захаров, Б. П. Невзоров, И. В. Третьякова. - Кемерово: Изд-во КемГУ, 2001. - 108с.

2. К. Е. Афанасьев, А. М. Гудов Информационные технологии в численных расчетах. - Кемерово: Изд-во КемГУ, 2001. - 204с.

Статьи в изданиях, рекомендованных ВАК РФ

3. Гудов А. М. Опыт внедрения информационных технологий в управление университетским комплексом / К. Б. Афанасьев, А. М. Гудов // Вестник Воронежского Государственного университета. — 2004. - № 2. - С. 5-15.

4. Гудов А. М. Информационные и математические модели, заложенные в систему электронного документооборота КемГУ / А. М. Гудов, С. Ю. Завозкин // Вестник Новосибирского государственного университета. Серия: Информационные технологии в образовании". - 2005.- Т. 2, вып. 1,. — С. 68 — 73.

5. Гудов А. М. Об одной модели оптимизации документопотоков, реализуемой при создании системы электронного документооборота / А. М. Гудов, С. Ю. Завозкин // Вычислительные технологии. - 2006. — Т. 11. — С. 53 — 65

6. Гудов А. М. Метод «Прозрачной журнализации» для организации процесса тестирования web-ориентированных информационных систем // Вестник Томского государственного университета. Серия: Управление, вычислительная техника и информатика. - 2009. - № 2(7). - С. 85-94.

7. Гудов А. М. Организационно-методические и технологические основы информационного обеспечения учебного процесса в условиях регионального университетского комплекса / К. Е. Афанасьев, А. М. Гудов, С. Ю. Попов // Открытое и дистанционное образование. - 2010. - Вып. 1(37). - С. 5-9.

8. Гудов А. М. Структура системы дистанционного обучения регионального университетского комплекса / К. Е. Афанасьев, А. М. Гудов, С. Ю. Попов // Открытое и дистанционное образование. - 2010. - Вып. 4(40). - С. 45-52.

9. Гудов А. М. Выбор архитектуры распределенных информационных хранилищ на основе решения задачи оптимизации стоимости документопотоков / А. М. Гудов, В. В. Мешечкин, С. Ю. Завозкин // Вестник Кемеровского государственного университета. - 2011,- Вып. 3(47). - С. 13-21.

Ю.Гудов А. М. Решение задачи оптимального распределения электронных документов в системе информационных хранилищ на основе минимизации стоимости документопотоков / А. М. Гудов, В. В. Мешечкин // Информатизация образования и науки. -2012. -№ 1(13).-С. 11-21.

Статьи, опубликованные в научных изданиях

11.Гудов А. М. Создание интегрированной аналитической системы управления Кемеровским госуниверситетом / К. Е. Афанасьев, А. М. Гудов, И. В. Третьякова // Теоретические и прикладные вопросы современных информационных технологий: Сб. тр. - Улан-Удэ. - 2000. - С. 22-40.

12.Gudov A. Development of the Information System of the University Management on the Basis of Web-technologies /К. E. Afanasiev, A. M. Gudov// Proceedings of the Workshop Computer Science and Information Technologies (CSIT'2004), Budapest, Hungary, October 17-19. - 2004. - V. 2. - P. 123-128.

13.Гудов A. M. Основные аспекты разработки системы электронного документооборота вуза / А. М. Гудов, С. Ю. Завозкин // Вестник Кемеровского государственного университета. Серия математика. - 2004. - Вып. 1 (17). - С.129-137.

14.Гудов А. М. Создание компонента автоматического определения метаданных документа для системы электронного документооборота / А. М. Гудов, С. Ю. Завозкин, А. С. Меньшиков // Вестник Томского государственного университета. Приложение: Информационные технологии и математическое моделирование-2005. -2006.-№ 16-С. 19-24.

15.Гудов А. М. Один из подходов формирования системы информатизации в вузе / А. М. Гудов, К. Е. Афанасьев // Информационные технологии в высшем образовании -2006. - Т.З, вып.1. - С.9-24.

16. Гудов А. М. Этапы становления центра НИТ в Кемеровской области / К. Е. Афанасьев, А. М. Гудов // Информационные технологии в высшем образовании - 2006. -Т.З, вып.2. - С.50-65.

17.Гудов А. М. Некоторые математические и информационные модели, используемые при построении информационной среды ВУЗа / К. Е. Афанасьев, А. М. Гудов // Вестник Томского государственного университета. Приложение: Информационные технологии и математическое моделирование-2005. - 2006. - № 16. - С.5-14.

18.Гудов А. М. Интеграция распределенных приложений при помощи системы электронного документооборота / А. М. Гудов, С. Ю. Завозкин // Вычислительные и информационные технологии в науке, технике и образовании: Тр. Международной конференции. - Павлодар, 2006. - С. 442-451.

19.Гудов А. М. Процессно-ориентированная интеграция приложений при помощи системы электронного документооборота / А. М. Гудов, С. Ю. Завозкин // Вестник Томского государственного университета. Приложение. Материалы международных, всероссийских и региональных научных конференций, симпозиумов, школ, проводимых в ТГУ. - 2006. - № 19. - С.20-27.

20.Гудов А. М. Модель комплексной интеграции информационных систем на основе системы промежуточного слоя / А. М. Гудов, С. Ю. Завозкин // Вычислительные технологии. - 2008. - Т. 13: Спец. Вып. 5: Избранные доклады VI Международной научно-практической конференции "Информационные технологии и математическое моделирование", 9-10 ноября 2007 г., Анжеро-Судженск, Россия. - С. 33-38.

21.Gudov А. М. Task of optimization of documente flow to choose the system of structure of distributed data warehouses / A. M Gudov, V. V. Meshechkin // Risk and effíciency in economy practice. Proceedings of the 17th GBU International Conference on control, development and applied informatics in business and economic, Brasov, Romania, October 27, 2010 (CDAIBE'10). Bucharest: Editure Didactica si Pedagógica Publishing House, 2010.-P.225-231.

Свидетельства об официальной регистрации программ для ЭВМ

22.Сервер конференций КемГУ: свидетельство об официальной регистрации программы для ЭВМ / К. Е. Афанасьев, А. М. Гудов, Е. А. Ростовцев; правообладатель Кемеровский государственный университет. - 2006612843; 10.08.2006.

23.Информационная автоматизированная система «Деканат»: свидетельство об официальной регистрации программы для ЭВМ. / А. М. Гудов, Е. А. Ростовцев, С. Ю. Завозкин, Т. С. Рейн; правообладатель ГОУ ВРО «Кемеровский государственный университет». - 2006613140; 06.09.2006.

24.Информационно-вычислительный портал КемГУ: свидетельство об официальной регистрации базы данных /К. Е. Афанасьев, А. М. Гудов, А. В. Демидов, С. В. Овчинников, Е. А. Ростовцев, С. Н. Трофимов; правообладатель ГОУ ВПО «Кемеровский государственный университет». - 2007620401; 15.04.2008.

Гудов Александр Михайлович

Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота

Автореферат диссертации на соискание ученой степени доктора технических наук

Подписано в печать «21 » февраля 2013 г.

Формат бумаги 60x84 1/16. Усл.печ. л. 2.25. Тираж 100 экз. Заказ № 26840. Издательство ГОУ ВПО «Кемеровский государственный университет», 650043, г. Кемерово, ул. Красная, 6.

Текст работы Гудов, Александр Михайлович, диссертация по теме Теоретические основы информатики

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный

университет»

На правах рукописи

05201351050

Гудов Александр Михайлович

ПРОГРАММНО-ТЕХНОЛОГИЧЕСКИЙ КОМПЛЕКС ДЛЯ РАЗВИТИЯ ИНФОРМАЦИОННОЙ СРЕДЫ ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ НА ОСНОВЕ СИСТЕМЫ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА

Специальность 05.13.17 - Теоретические основы информатики

Диссертация на соискание учёной степени доктора технических наук

Научный консультант: доктор физико-математических наук

К.Е. Афанасьев

Кемерово - 2013

Оглавление

ВВЕДЕНИЕ..............................................................................................................4

ГЛАВА 1. МЕТОДИЧЕСКИЕ ОСНОВЫ СОЗДАНИЯ

ИНФОРМАЦИОННОЙ СРЕДЫ.........................................................................12

§ 1. Основные факторы создания ЕИС..............................................................12

§ 2. Интеграция приложений..............................................................................15

§ 3. Онтологии в информационных системах...................................................37

§4. Задачи исследования.....................................................................................41

§ 5. Выводы по главе...........................................................................................42

ГЛАВА 2. МОДЕЛИРОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ........................44

§ 1. Концепция создания ЕИС организации.....................................................47

§ 2. Онтологическая модель предметной области...........................................55

§ 3. Выводы по главе...........................................................................................73

ГЛАВА 3. МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННЫХ ОБЪЕКТОВ И

ПРОЦЕССОВ ИНТЕГРАЦИИ............................................................................74

§ 1. Макромодель информационной среды.......................................................74

§ 2. Модели информационных объектов...........................................................77

§ 3. Модель процесса интеграции ИС................................................................96

§ 4. Выводы по главе...........................................................................................98

ГЛАВА 4. МОДЕЛИРОВАНИЕ ЖИЗНЕННОГО ЦИКЛА ЭД....................101

§ 1. Модель жизненного цикла электронного документа.............................101

§ 2. Модель автоматического извлечения метаданных.................................103

§ 3. Модель выбора архитектуры информационных хранилищ...................120

§ 4. Выводы по главе.........................................................................................139

ГЛАВА 5. МОДЕЛИ ПРОЦЕССОВ СОЗДАНИЯ И ТЕСТИРОВАНИЯ

СЕРВИС ОРИЕНТИРОВАННЫХ ПРОГРАММНЫХ СИСТЕМ.................141

§ 1. Модель архитектуры...................................................................................141

§ 2. Требования к моделям................................................................................143

§ 3. Модель пакета «Кетзи\¥ЕВ»....................................................................146

2

§ 4. Модель системы защиты............................................................................148

§ 5. Модели системы электронного документооборота................................152

§ 6. Модель структуры метаданных.................................................................160

§ 7. Модели структуры данных СЭД...............................................................163

§ 8. Модель хранилища данных.......................................................................168

§ 9. Модель системы справочников.................................................................171

§10. Соответствие моделей предъявленным требованиям.........................175

§11. Метод тестирования портальных приложений...................................178

§ 12. Выводы по главе.....................................................................................187

ГЛАВА 6. РЕАЛИЗАЦИЯ И ВНЕДРЕНИЕ ПРОГРАММНО-

ТЕХНОЛОГИЧЕСКОГО КОМПЛЕКСА.........................................................189

§ 1. Профиль стандартов ЕИС..........................................................................189

§ 2. Выбор архитектуры среды.........................................................................194

§ 3. Средства реализации..................................................................................198

§ 4. Программная реализация уровня портальных приложений..................199

§ 5. Программная реализация уровня общесистемных приложений...........203

§ 6. Программная реализация уровня прикладных ИС.................................208

§ 7. Программная реализация уровня информационных хранилищ............215

§ 8. Анализ ПТК на соответствие предъявленным требованиям.................219

§ 9. Внедрение программно-технологического комплекса...........................221

§ 10. Выводы по главе.....................................................................................227

ЗАКЛЮЧЕНИЕ...................................................................................................231

СПИСОК ЛИТЕРАТУРЫ..................................................................................234

ПРИЛОЖЕНИЯ...................................................................................................259

Приложение 1. Язык разработки интерфейса пользователя «KemsuWEB» 259

Приложение 2. Описание языка управления процессами KemsuBPDL.......261

Приложение 3. Основные модели хранилища данных...................................266

Приложение 4. Иерархия типов документов...................................................272

Приложение 5. Документы, подтверждающие внедрение элементов ЕИС. 273

Введение

Актуальность исследования характеризуется необходимостью выявления и изучения факторов, влияющих на развитие теоретических и технологических возможностей создания и эффективного функционирования корпоративных информационных сред, эксплуатации и модификации информационных систем (ИС) в условиях быстро изменяющегося информационного общества.

В силу индивидуальности ряда проблем, сложившихся подходов, наличия технических и технологических апробированных решений большинство организаций создают свое информационное пространство, зачастую используя несовместимые подходы, что влечет за собой дополнительные затраты на разработку собственных систем при отсутствии гарантий достижения поставленных целей. Данные проблемы обусловлены широтой спектра решаемых задач, частой несовместимостью используемых платформ, техническим несовершенством, недокументированностью решений, отсутствием четкой политики со стороны управляющих и контролирующих организаций и т.д.

Большинство исследователей отмечают, что в составе единой информационной среды (ЕИС) можно выделить следующие относительно независимые составляющие: техническая инфраструктура (организационные структуры информатизации, коммуникационная сеть, центры высокопроизводительных вычислений, центры коллективного пользования и т.д.), функциональные подсистемы (подсистемы интегрированной автоматизированной информационной системы, обеспечивающие решения задач информатизации в зависимости от поставленных целей на основе управленческих и математических моделей), информационные ресурсы. Первая составляющая отличается долговременным характером своего становления, и затраты на ее создание настолько велики, что полная или частичная модернизация становится практически невозможной. Вторая и третья составляющие изменчивы по своей природе, относятся к прикладной области и в значительной степени зависят от специфики задач, решаемых конкретными организациями. В настоящее время проводятся исследования, актуальными из которых являются разработка и обоснование технологических решений для создания повторно используемых программных средств на основе общепринятых стандартов открытых систем

(Open Systems, OS) и сервис ориентированной архитектуры (Service Oriented Architecture, S О A).

Современные тенденции развития теоретических и технологических аспектов для создания таких систем отражаются в работах Ю.И. Шокина, A.M. Федотова, В.А. Серебрякова, А.Н. Бездушного, А.Н. Тихонова, А.Д. Иванникова, В.П. Кулагина, C.B. Мальцевой, В.М. Васильева, М.А. Гуриева, А.И. Башмакова, И.Г. Игнатовой и других исследователей. Среди работ зарубежных авторов можно отметить работы A. Tanenbaum (Э. Таненбаум), M. van Steen (M. ван Стин), В. Neumann (Б. Ньюман), G. Blair (Г. Блэйр), G. Pierre (Г. Пьер), H. Nwana (X. Ивана), D. Ndumu (Д. Ндуму), J. Wu (Дж. By), A. Clark (Э. Кларк), R. Wyle (Р. Уайл) и др.

На данный момент тесная интеграция различных автоматизированных систем, которые уже функционируют в организации, в единое информационное пространство является одним из активно развивающихся направлений ИТ-отрасли. Современные исследования показывают, что большое количество используемых ИС для решения разных задач с определенного момента начинают негативно влиять на состояние процессов информатизации. Данное явление обусловлено, прежде всего, необходимостью поддержания множества интерфейсов, связывающих различные ИС между собой. Иногда создание связующих компонентов представляется весьма сложной задачей из-за отсутствия изначально заложенных в систему механизмов интеграции или проблем, связанных с использованием «унаследованных» систем.

Одним из подходов для решения перечисленных проблем может служить создание платформы, позволяющей выступить в качестве связующего звена, объединяющего ИС в одно информационное пространство с минимальными «переделками». Анализ доступных публикаций показывает, что наибольшая эффективность такого объединения достигается в том случае, если платформа будет опираться на архитектуру «сервисной шины предприятия», поддерживать несколько способов интеграции, а так же стандарты OS и SOA. Очевидно, что такая платформа должна относиться к классу ПО промежуточного слоя (программный слой, играющий роль посредника в коммуникациях высокого уровня и устраняющий возможную несовместимость между коммуникационными протоколами, языками запросов к базе данных, приложениями, операционными системами и т.д.).

На рынке интеграционных программных платформ ПО промежуточного слоя существует несколько промышленных решений: IBM WebSphere (около 20 продуктов), Microsoft Windows Server, BizTalk Server и Ofiice SharePoint Server, Oracle Fusion Middleware llg, SAP NetWeaver (однако, по мнению аналитиков компании Forrester Research только продукты компании IBM поддерживают инфраструктуру SOA). Стоимость полного пакета программных решений достигает $200 - $500 тыс. Кроме того, во многих открытых источниках отмечается, что крупные российские компании испытывают непреодолимые трудности с лицензированием и приобретением такого ПО, а предприятия малого и среднего бизнеса совсем не могут позволить себе вложения в реализацию проектов на базе данного ПО.

Таким образом, актуальной является научно-техническая проблема разработки и теоретического обоснования технологических основ создания и развития ЕИС на основе различных подходов к интеграции, объединяющих информационные системы и ресурсы организации в единую систему.

Цель работы - разработка, теоретическое обоснование и реализация принципов и технологических подходов к созданию и развитию единой информационной среды организации на основе программного обеспечения промежуточного слоя.

В рамках реализации поставленной цели выделены следующие задачи исследования:

1. Анализ существующих подходов к созданию информационной среды организации с точки зрения использования ПО промежуточного слоя для интеграции элементов среды с целью выявления недостатков и возможных подходов к решению проблемы.

2. Обоснование принципов и технологических решений для создания и развития ЕИС организации на основе ПО промежуточного слоя.

3. Разработка комплекса моделей, обеспечивающих функционирование единой информационной среды и поддержку информационно-ориентированного, сервисно-ориентированного и процессно-ориентированного принципов интеграции.

4. Разработка теоретических оценок эффективности внедрения ЕИС в практику организации.

5. Реализация программно-технологического комплекса (ПТК) в виде набора программных и технологических средств, обеспечивающих создание единой информационной среды организации.

6. Внедрение программно-технологического комплекса и анализ его результатов с использованием разработанных оценок.

К объектам исследования относятся: информационные системы, методы интеграции ИС, объекты, обрабатываемые и предоставляемые в ИС, электронные документы, документопотоки, процессы движения и управления ЭД.

Предмет исследования: процессы создания информационной среды, математические и информационные модели, модели структур данных, алгоритмы и технологические решения, используемые для интеграции элементов ЕИС.

Методы исследования определяются сущностью теоретических и практических проблем. В процессе исследования используются: методы моделирования, структурный системный анализ, элементы методов оптимизации, элементы теории нейронных сетей, методы извлечения данных из текстов, методы создания онтологий, методы функционального проектирования, методы объектно-ориентированного проектирования, методы разработки и анализа требований к программным средствам, методы тестирования программных средств.

Область исследования. Содержание диссертации соответствует паспорту специальности 05.13.17 «Теоретические основы информатики» (технические науки) по следующим областям исследований: п.2 «Исследование информационных структур, разработка и анализ моделей информационных процессов и структур», п.5 «Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений», п.6 «Разработка методов, языков и моделей человекомашинного общения; разработка методов и моделей распознавания, понимания и синтеза речи, принципов и методов извлечения данных из текстов на естественном языке», п. 9 «Разработка новых интернет- технологий, включая средства поиска, анализа и фильтрации информации, средства приобретения знаний и создания онтологии, средства интеллектуализации бизнес-процессов», п. 14 «Разработка теоретических основ создания программных систем для новых информационных технологий», п. 15 «Исследования и разработка требований к программно-техническим

средствам современных телекоммуникационных систем на базе вычислительной техники».

Научная новизна. Решена важная научно-техническая проблема разработки и теоретического обоснования технологических подходов к созданию и развитию ЕИС на основе ПО промежуточного слоя, а именно:

1. Предложена модель, описывающая процессы создания и развития ЕИС, отличительной особенностью которой является выделение основных «каркасных» элементов для обеспечения процесса интеграции информационных объектов. Модель поддерживает: декомпозицию на контекстные модели элементов среды на различных этапах развития ЕИС; общее описание объектов интеграции и видов деятельности посредством онтологических моделей, основные концепции БОА - обозримость, взаимодействие и реальный эффект.

2. Построена модель интеграции ИС, опирающаяся на информационно-ориентированный, сервисно-ориентированный и процессно-ориентированный принципы интеграции на основе сервис ориентированного ПО. В модели используются: ЭД в качестве основного объекта для обмена информации между прикладными системами, система электронного документооборота (СЭД) как основа реализации процессно-ориентированного принципа интеграции, обладающая рядом дополнительных свойств; система портального ядра, построенную на принципах 80А и осуществляющую технологическое обеспечение принципов интеграции.

3. Разработаны алгоритмы генерации метаданных ЭД, отличительными особенностями которых является использование аппарата нейронных сетей, обеспечивающие механизм автоматического извлечения метаданных.

4. Разработана вычислительная процедура, отличительной чертой которой является использование принципа динамического программирования для решения задачи оптимального распределения ЭД в системе распределенных хранилищ.

5. Предложен метод тестирования распределенных информационных систем, учитывающий особенности приложений, построенных на основе использования сервис ориентированного ПО.

6. Предложена модель оценки эффективности использования ЕИС на основе упрощенного локального подхода, учитывающего используемые технологические решения, позволяющая оценить результаты внедрения программно-технологического комплекса.

7. Построен профиль стандартов как основа реализации программно-технологического комплекса, отличительной особенностью которого является соответствие национальному профилю взаимодействия открытых систем России и поддержка профиля организации, учитывающий предложенные подходы для создания ЕИС на базе сервис ориентированного ПО.

На защиту выносятся:

1. Математические и информационные модели, описывающие процессы создания и развития ЕИС на базе сервис ориентированного ПО.

2. Информационная модель интеграции ИС, опирающаяся на информационно-ориентированный, сервисно-ориентированный и процессно-ориентированный принципы интеграции.

3. Математические модели и алгоритмы автоматического извлечения метаданных электронного документа на основе аппарата нейронных сетей.

4. Вычислительная процедура для получения оптимального с точки зрения стоимости документопотоков распределения ЭД в системе распределенных хранилищ.

5. Метод тестирования распределенных информационных систем, учитывающий особенности сервис ориентированной архитектуры.

6. Теоретические и экспериментальные результаты оценки эффективности внедрения элементов ЕИС в образовательном учреждении.

7. Профиль стандарт