автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Технология интеграции данных в гетерогенных корпоративных программных комплексах

доктора технических наук
Зыков, Сергей Викторович
город
Уфа
год
2012
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Технология интеграции данных в гетерогенных корпоративных программных комплексах»

Автореферат диссертации по теме "Технология интеграции данных в гетерогенных корпоративных программных комплексах"



На правах рукописи

ЗЫКОВ Сергей Викторович

ТЕХНОЛОГИЯ ИНТЕГРАЦИИ ДАННЫХ В ГЕТЕРОГЕННЫХ КОРПОРАТИВНЫХ ПРОГРАММНЫХ КОМПЛЕКСАХ

Специальность: 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук

Уфа-2012

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Национальном исследовательском ядерном университете «Московский инженерно-физический институт»

Научный консультант доктор технических наук, профессор

Вольфенгаген Вячеслав Эрнстович

Научно-исследовательский ядерный университет «Московский инженерно-физический институт», кафедра кибернетики

Официальные оппоненты доктор технических наук, профессор

Павлов Сергей Владимирович

Уфимский государственный авиационный технический университет, кафедра геоинформационных систем

доктор технических наук, профессор Райкоа Александр Николаевич 4 Российская академия государственной службы при Президенте РФ, кафедра информационных технологий в управлении

доктор технических наук, профессор Саксопов Евгепий Александрович Московский государственный институт электроники и математики (МИЭМ), кафедра вычислительных систем и сетей

Ведущая организация Институт проблем управления РАН,

г. Москва

Защита состоится «_»_2012 г. в_часов

на заседании диссертационного совета Д-212.288.07 Уфимского государственного авиационного технического университета по адресу: 450000, г. Уфа, ул. К. Маркса, 12 С диссертацией можно ознакомиться в библиотеке университета Автореферат разослан «_»__ 2012 г.

Ученый секретарь диссертационного совета д-р техн. наук, проф.

/'/б* С. С. Валеев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы

К настоящему времени вследствие ускоренного развития информационных технологий в корпорациях - крупных, территориально (а зачастую - глобально) распределенных организациях с едиными производственными задачами и ресурсами - накоплены и продолжают быстро расти весьма значительные (достигающие петабайт, т.е. 101 байт) объемы данных. Унификация представления таких данных и манипулирование ими представляет собой существенную проблему в силу гетерогенности объединяющих их информационных систем (ИС), образующих корпоративные программные комплексы (КПК). Специфика гетерогенности проявляется как в архитектурном многообразии компонент КПК (файл-сервер, клиент-сервер, Интернет, «унаследованные» и др.), так и в различной степени структурированности образующих их объектов данных (реляционные таблицы, аудио-, видео- и фотоинформация, отсканированные документы, фрагменты офисных приложений и т.п.). КПК состоят из распределенных компонент - программных систем, которые объединяются посредством Интернет-порталов. Варианты среды взаимодействия программных систем включают как глобально открытый Интернет, так и внутрикорпоративный Ин-транет.

При этом, традиционно применяемые методологии проектирования КПК (Microsoft MSF, ШМ RUP, Oracle CDM и др.) ориентированы преимущественно на инструментальные средства конкретных производителей (Microsoft Visual Studio, ШМ Rational, Oracle Designer и т.д.) с трудно формализуемой семантикой и в этой связи не позволяют обеспечить в должной степени эффективного проектирования гетерогенных программных комплексов.

В настоящее время научные исследования подходов к интеграции крупных распределенных гетерогенных программных систем поддерживаются рядом международных и федеральных целевых программ: «Электронная Россия» (РФ), Network of the Future (EC), Future Internet Design (CILIA), «Глобальная инициатива по политике Интернет» (ООН), «Информация для всех» (ЮНЕСКО) и др. Только ежегодные расходы на НИОКР по первым двум программам в последние годы составили в нашей стране свыше 400 млн. рублей ', а в ЕС -около 100 млн. евро2.

Прогрессирующее влияние информационных технологий на функционирование и развитие корпораций требует разработки технологической основы построения гетерогенных КПК на основе интеграции данных, поддерживающей весь жизненный цикл их проектирования - от математической модели до программной реализации.

1 Поданным Управления Информатизации Москвы: http://ul.moe.ru/ru/pc/news/lndcx.php7id18s654

' По данным компании NTT httpe://www.rtt-review.Jp/archlve/nfflechnical php?contents°ntr200S05sf2.html

Проблема разработки и унификации такой комплексной интеграционной технологии, включающей как математические модели, так и программно-инструментальные средства для поддержки гетерогенных КПК, непосредственно связана с производственно-экономической эффективностью корпораций. Хотя эта проблема находится в центре внимания круппейших компаний-разработчиков программного обеспечения (ПО) и ведущих научных коллективов, она еще далека от удовлетворительного решения. Рассматриваемая проблема объединяет следующие взаимосвязанные аспекты:

- трудности управления обработкой большими, быстро растущими объемами данных в гетерогенных КПК, во многом обусловленные недостаточно формализуемой семантикой языковых и инструментальных средств проектирования ПО (в т.ч. на основе языка ЦМЬ);

- сложность интеграции теоретически перспективных математических моделей данных с узконаправленными, эмпирическими программно-инструментальными средствами, поддерживающими «промышленные» методологии проектирования КПК, приводящая к неадекватным срокам, стоимости или эксплуатационным характеристикам внедрения;

- недостаточная унификация моделей, методов и программных средств для представления и управления контентом - гетерогенными данными и метаданными - компонент КПК.

Отмеченные технологические проблемы проектирования гетерогенных КПК носят принципиальный характер, дто. неоднократно отмечалось в работах таких отечественных исследователей, как АЛЕршов, А.А.Ляпуцов, В.М.Глушков, Г.И.Марчук, И.А.Мизин, Э.Х.Тыугу, Л.Т.Кузин, Г.С.Поспелов, Д.А.Поспелов, С.С.Лавров, В.Л.Арлазаров, И.В.Романовский, В.В.Липаев, Л.Н.Сумароков, Е.Л.Ющенко, А.С.Нариньяни, В.Э.Вольфенгаген, Б.А.1Цукин, В.М.Ветошкин, Г.В.Рыбина, А.Н.Терехов, А.Н.Райков, Е.А.Саксонов, Л.А.Калиниченко, А.С.Клещев, В.А.Серебряков, С.Д.Кузнецов и др.

Среди зарубежных исследователей рассматриваемую проблематику разрабатывали Э.Кодц, К.Дейт, Д.Мейер, Х.Дарвен, Дж.Ульман, Дж.Уидом, П.Чен, Э.Дейкстра, Д.Скотг, Ч.Хоар, М.Стоунбрейкер, Д.Девитт, ПГарсиа-Молина, Д.Флореску, Й.Камбаяши, К.Стрейчи, Н.Руссопулос, Дж.Хиндли, М.Гордон, Л.Карделли, П.Лендин, Д.Тернер, ДжЛ.юс, С.Пейтон-Джоунс, П.-Л.Юорьен, Дж.Рейнолдс, К.Баркер, Р.Снодграсс, С.Абитебуль, Г.Плоткин, Р.Милнер, М.Броди и др.

В этих условиях весьма существенной проблемой становится разработка функционально полной, «сквозной» технологической схемы интеграции данных в гетерогенных КПК, поддержанной многоуровневыми моделями данных и инструментальными средствами.

Систематический анализ трудов перечисленных исследователей привел к формированию основных положений и проведению комплекса исследований по созданию технологии интеграции данных в гетерогенных КПК, представляющей собой крупную научную проблему с важным народнохозяйственным значением.

Цель и задачи исследований

Целью работы является разработка технологии интеграции данных в гетерогенных КПК, направленной на повышение эффективности (в смысле сокращения сроков и снижения стоимости) проектирования, реализации и последующего расширения программных систем рассматриваемого класса и масштаба.

Для достижения поставленной цели в работе необходимо решить следующие задачи:

1. Создание концептуальной схемы технологии интеграции данных в гетерогенных КПК с реинжинирингом.

2. Построение математических объектных моделей для представления, интеграции (на базе семантических сетей с фреймовой визуализацией) и манипулирования контентом (на основе абстрактной машины) гетерогенных КПК.

3. Создание семантически ориентированного инструментально-технологического программного комплекса, поддерживающего интегрированное представление (ИС ConceptModeller) и манипулирование контентом (ИС управления контентом) КПК.

4. Реализация, внедрение и апробация прототипов и полномасштабных КПК.

Необходимость разработки перечисленных моделей и поддерживающих их инструментальных средств вызывается, в частности, такими специфическими характеристиками КПК, как их гетерогенность и различная степень структурированности их компонент, которым не в полной мере отвечают существующие методологии проектирования ПО (MSF, RUP, CDM и др.) и инструментальные средства на их основе.

Методы исследования

Для решения поставленных задач применены методы, основанные на синтезе фундаментальных положений теории конечных последовательностей, теории переменных областей Д.Скотга, теории семантических сетей и теории фреймов.

Научная новизна результатов

В результате анализа динамических взаимосвязей важнейших факторов, влияющих на развитие исследуемого класса программных систем, сделан вывод о необходимости создания новой технологии интеграции данных в КПК и разработана ее общая схема. В отличие от существующих схем проектирования ИС для Интернет-среды, основанных на стандартах и подходах XML, OMG, MDC, WfMC, ISO/ШС и др., созданная в настоящей работе технологическая схема интеграции поддержана как инструментальными средствами, так и математическими моделями, что обеспечивает ее методологическую неразрывность и формализуемость, в т.ч. на семантическом уровне.

Разработанный технологический подход к интеграции данных в КПК приводит к практически приемлемым для крупных и сложных ИС значениям важнейших эксплуатационных характеристик, которые до настоящего времени не были достигнуты посредством теоретически важных подходов, предложенных зарубежными коллективами OASIS, OMG, OGC, W3C и др., а также отече-

ственными научными группами (Л.А.Калиниченко, А.С.Клещев и др.), направленных на онтологическое моделирование, интероперабельность и интеграцию гетерогенных компонент. Таким образом, в условиях неоднородности подходов и стандартов интеграции данных в КПК, предложена унифицирующая их целостная технологическая оспова, включающая достаточно универсальные математические модели и поддерживающие инструментальные средства и позволяющая адекватно реализовать схему интеграции данных таких программных систем.

Разработаны модели как для представления объектов данных (на основе переменных доменов) и инструментальных средств так и для манипулирования такими объектами (на основе абстрактных машин), которые в более полной мере, чем традиционные (например, ЕЯ-модель), учитывают особенности гетерогенных КПК с компонентами различной степени структурированности.

При этом модель манипулирования объектами данных, основанная на управлении состояниями контента, расширяет спектр исследуемых объектов данных до практически произвольных хранилищ информации (включая базы данных и метаданных), поддерживающих как современные архитектуры КПК, так и программные системы промежуточных и «унаследованных» типов.

Математические модели интеграции данных в КПК поддержаны новыми инструментальными средствами для предметно-ориентированного представления объектов данных при помощи семантических сетей с фреймовой визуализацией (Сопсер1Мо<1е11ег), а также для управления контентом на основе абстрактной машины (ИСУК).

Целостный, интегрированный подход к интеграции данных п КПК, объединяющий семейство математических моделей с программным комплексом поддерживающих инструментальных средств, значительно сокращает сроки и стоимость внедрения гетерогенных КПК по сравнению с существующими аналогами.

Результаты, выносимые на защиту

1. Общая технологическая схема интеграции данных в КПК.

2. Семейство моделей сценарного представления и ситуативного манипулирования объектами данных КПК.

3. Семейство предметно-ориентированных инструментальных средств для интеграции данных в гетерогенных КПК и управления их контентом.

4. Архитектурно-интерфейсная схема корпоративного портала как мета-надстройки над гетерогенными компонентами КПК, манипулирующей их контентом.

5. Архитектурно-технологические схемы разработки прототипов и полномасштабных прикладных гетерогенных КПК на основе Интернет- и Интранет-порталов.

Практическая ценность

Практическая ценность диссертационного исследования и полученных результатов заключается в создании эффективных моделей, методов и инструментальных средств, поддерживающих технологию интеграции данных в КПК,

содержащих гетерогенные компоненты. Данный тип программных комплексов является одним из наиболее сложных прикладных информационных систем, критических для деятельности крупных организаций. Разработанная технология для гетерогенных компонент позволяет существенно (в среднем - на 3040%) сократить сроки и стоимость разработки интегрированных КПК в таких индустриальных сферах, как учет и планирование корпоративных ресурсов, управление производственными процессами, электронная коммерция и др.

На протяжении ряда лет разработанная технология, включающая комплекс инструментальных средств компонентной интеграции данных в гетерогенных КПК и управления их контентом (ConceptModeller, ИСУК) экспериментально проверялась, развивалась и апробировалась. Опыт внедрения и эксплуатации реализованных на ее основе полномасштабных прикладных КПК для учета и управления производственными ресурсами на крупных предприятиях различных направлений нефтегазовой отрасли, лесной промышленности, логистики, производства мультимедийной продукции и др., программ и курсов подготовки специалистов по проектированию ПО в ведущих образовательных учреждениях (МИФИ, МФТИ, МГУПИ, КГТУ, ЛАНИТ, Softline, ИНТУИТ, ТЕ-КАМА и др.) подтвердил практическую значимость основных положений диссертации.

Достоверность

Достоверность разработанных в диссертации моделей, методов, инструментальных средств, архитектурно-интерфейсных схем, составляющих технологию интеграции данных в гетерогенных КПК, а также программных прототипов и реализаций, подтверждается актами о внедрении, результатами научных семинаров в МИФИ, МИЭМ, ИПУ РАН, ИМАШ РАН и УГАТУ (20052011), а также призами и дипломами научных конференций «Технологии Microsoft в теории и практике программирования» (Москва, МГУ, 2004), «Международная Интернет-конференция по современным проблемам машиноведения» (Москва, ИМАШ РАН, 2005) и "International Multi-Conference on Complexity, Informatics and Cybernetics" (Орландо, США, 2011).

Апробация работы

Развитые в работе модели, методы и средства - событийно-ориентированная модель данных с абстрактными машинами (AM) на состояниях, инструментальные средства (ConceptModeller, ИСУК) для корпоративных программных комплексов,- положены в основу внедрения гетерогенного КПК в Международной Группе Компаний (МПС) "ИТЕРА" с численностью персонала около 10 тыс. человек. Промышленная эксплуатация КПК приносит значительную (в среднем около 30-40% по сравнению с аналогами) экономию по срокам и стоимости внедрения, при этом существенно повышается эффективность организации управления контентом.

Результаты диссертационного исследования докладывались и обсуждались на Ш-Х1 Международных конференциях "Computer Science and Information Technologies" (Уфа, 2001, 2003, 2005, 2010; Патрас (Греция), 2002; Будапешт (Венгрия), 2004; Карлсруэ (Германия), 2006; Краспоусольск, 2007; Анталия

(Турция), 2008; Репшнон (Греция), 2009), V Международной конференции "Computer Science and Information Technology" (Ереван (Армения), 2005), I и II Международных конференциях "Web Information Systems and Technologies" (Майами (США); 2005, Сетубал (Португалия), 2006), I Международном симпозиуме "Knowledge Communication and Conferences" (Орландо (США), 2006), I и Ш Международных конференциях "Enterprise Information Systems and Web Technologies" (Орландо (США), 2007, 2009), XI, ХП1, XIV и XV Международных мультиконференциях "International World Multi-Conference on Systemics, Cybernetics and Informatics" (Орлавдо (США), 2007, 2009-2011), П Международной конференции "International Conference on Information Society" (Mep-риллвилл, (США), 2007), Х1П Международной конференции "International Conference on Enterprise Information Systems" (Пекин (Китай), 2011), XVII Международной конференции "International Conference on Conceptual Structures" (Москва, НИУ ВШЭ, 2009), Vm Международном симпозиуме "Technomat and Info-tel" (Бургас (Болгария), 2006), IV Международном российско-германском научном семинаре "Инновации в ИТ: теория и практика" (Уфа, 2011), XXXV-XXXVra Международных конференциях «Информационные технологии в науке, образовании, телекоммуникации и бизнесе» (Гурзуф, Украина, 2008-2011), XV Международном научно-техническом семинаре «Современные технологии в задачах управления, автоматики и обработки информации» (Алушта (Украина), 2006), I Международной конференции-"Intemationai Conference on Computer Science and Information Technologies" (Львов (Украина), 2006), I и П научных конференциях "Аппликативные вычислительные системы" (Москва, 2009, 2010), Международной нефтегазовой технической конференции и выставке «Мир технологий для уникальных ресурсов» (Москва, 2006), Ежегодной научной конференции «Ломоносовские чтения» (Москва, 2006), VIII, Х-ХП Международных конференциях «Корпоративные системы» (Москва, 2003, 2005-2007), I-VI Международных конференциях "Software Engineering Conference" (Москва, 2005-2010), П-П1 Всероссийских научных конференциях с международным участием «Технологии информатизации профессиональной деятельности» (Ижевск, 2008, 2011), Международной научно-практической конференции «Современные информационные технологии и ГГ-образование» (Москва, 2005), П-IV Международных конференциях «Управление развитием крупномасштабных систем» (Москва, ИЛУ РАН, 2008-2011), Международной конференции «Технологии Microsoft в научных исследованиях и высшем образовании» (Москва, 2003), XI, XII, XIV, XVI Всероссийских конференциях «Проблемы информационной безопасности в высшей школе» (Москва, 2004, 20Ю5, 2007, 2009), IX Всероссийской объединенной конференции «Интернет и современное общество» (С.-Петербург, 2006), I Всероссийской конференции «Ипфо-коммуникации XXI века - будущее за тобой!» (Москва, 2006), VT-Vin Всероссийских научных конференциях с международным участием «Информация, инновации, инвестиции» (Пермь, 2005-2007), Международных научно-практических Интернет-конференциях «Информационные технологии в науке и образовании» (Шахты, 2005,2006; Железноводск, 2007) и др.

Связь нсследоваиий с научными программами

Исследования в данном направлении выполнялись в 2004-2011гг. в НИЛУ МИФИ при поддержке, оказанной Microsoft Research Ltd. (договор №83-3042-024), РФФИ (гранты №96-01-01923, №99-01-01229, №01-07-90309, №02-0100616, №03-01-06339, №04-07-90156, №07-07-08017), а также рядом грантов НИУ ВШЭ.

Публикации

Автором опубликовано свыше 100 печатных работ, в т.ч. по основным результатам исследования - свыше 80 работ (основные из которых, [1-50], приведены ниже), включая 4 монографии [16-19] и 15 работ в изданиях из перечня ведущих рецензируемых научных изданий, рекомендованного ВАК РФ для публикации основных результатов диссертаций [1-15]. Общий объем публикаций по теме исследования - около 90 пл.

Все результаты, которые включены в диссертацию, получены лично автором.

Структура и объем диссертации

Диссертация состоит из введения, 5 глав, заключения, списка литературы и приложений. Основная часть диссертации содержит 320 страниц машинописного текста, включая 89 рисунков, 22 таблицы, список литературы из 303 наименований.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

В работе рассматриваются методы и модели данных, инструментальные средства, архитектурно-интерфейсные схемы, а также результаты реализации и внедрения технологии интеграции данных в гетерогенных КПК.

Во введении обоснована актуальность направлений исследования, сформулированы его цель и задачи, перечислены применяемые для их решения методы. Изложены элементы научной новизны и практической ценности результатов исследования, приведено краткое содержание диссертации по главам.

Первая глава работы посвящена сравнительному анализу подходов и тенденций разработки интегрированных КПК, ориентированных на гетерогенную среду.

В разделе первом представлена классификация основных архитектурных подходов к построению Интернет-ориентированных программных комплексов.

Раздел второй исследует функциональные и выразительные возможности графических нотаций, поддерживающих модели данных для КПК.

В разделе третьем приводится сопоставление СУБД, реализующих модели данных для гетерогенных распределенных программных систем и комплексов.

В разделе четвертом излагаются аспекты сравнения программно-инструментальных средств, поддерживающих проектирование и реализацию КПК.

Раздел пятый содержит сопоставление программных комплексов и технологических схем для разработки интегрированных программных систем в Интернет-среде.

Раздел шестой представляет обзор КПК на основе портальной архитектуры (далее - порталов) и инструментальных средств для управления контентом с учетом различной степени его структурированности.

В разделе седьмом дана содержательная постановка общей технологической схемы интеграции данных в КПК.

При этом основное внимание уделяется разработке интегрированных КПК контент-ориентированного типа, обеспечивающих как front-end (в соотнесении с интерфейсом пользователя), так и back-end (в соотнесении с системным интерфейсом) взаимодействие с гетерогенными хранилищами данных посредством портальной метанадстройки, а также динамических инструментальных средств представления контента и манипулирования им.

В результате сравнительного исследования подходов, моделей, методов и инструментальных средств проектирования программных систем впервые создана комплексная технология интеграции данных в гетерогенных КПК, представляющая собой решение крупной научной проблемы, имеющей важное народнохозяйственное значение.

Одним из существенных компонентов разработанной технологии является комплекс моделей для интеграции данных в КПК, обеспечивающий унификацию представления и манипулирования контентом, поддержанный языковыми и программно-инструментальными средствами. Другой важной частью технологии является ее обобщенная схема, поддерживающая непрерывное многоуровневую итеративную интеграцию КПК (включая реинжиниринг) от моделей данных предметной области до схем описания и управления контентом с возможностью поддержания его целостности на всем протяжении разработки и эксплуатации. Еще один принципиальный аспект работы связан с созданием предметно-ориентированных инструментальных комплексов для поддержки ПО интеграции, прототипирования и управления контентом КПК. Развитие методов конструирования таких прикладных программных систем требует математического обобщения процессов манипулирования контентом с целью разработки технологии и средств управления данными в гетерогенных КПК на основе унифицированных, открытых и расширяемых программно-инструментальных, языковых и интерфейсных средств.

При этом, благодаря динамическому анализу взаимосвязанных факторов, оказывающих влияние на развитие КПК, удалось более рельефно, чем в известных исследованиях (М.Р.Когаловский, В.Э.Вольфенгаген и др.) выявить особенности этого класса программного обеспечения.

По результатам проведенного сравнительного анализа выявлены наиболее существенные проблемы интеграции данных в КПК, построена классификация таких комплексов и разработаны требования к методам и средствам интеграции данных них с учетом предметной ориентированности и специфики портального управления контентом. Основное внимание сосредоточено на выра-

ботке технологических принципов построения математического и программно-инструментального обеспечения.

Выявление особенностей КПК, позволившее уточнить требования к ним и разработать новый, комплексный подход к их интеграции на уровне данных, стало возможным благодаря созданию оригинальной классификации, учитывающей динамику восьми взаимосвязанных основополагающих факторов, к важнейшим из которых отнесены модели данных, архитектуры, СУБД и инструментальные средства.

Рисунок 1 - Общая технологическая схема интеграции данных в КПК

Специфика КПК диктует необходимость поддержки многоуровневого профилированного доступа к гетерогенным распределенным хранилищам корпоративного контента на основе унифицированных программных Интернет-сервисов и протоколов информационного обмена для глобальных сетей. В ин-

терфейсной части КПК поставленным требованиям должны отвечать динамическая вариация формы портального представления контента, гибкое разграничение прав доступа к нему на основе персонализации, а также поддержка актуальности и целостности данных. В части архитектуры КПК должны обеспечивать открытость, расширяемость, гибкую адаптацию к состоянию предметной области, явное разделение на front-end и back-end, а также возможность оперативной коррекции контента с учетом состояния среды вычислений, в т.ч. персональных предпочтений пользователей.

Разработанная общая технологическая схема интеграции данных в КПК (рисунок 1) обеспечивает итеративную двунаправленную покомпонентную разработку открытых, расширяемых комплексов гетерогенных ИС для глобальных сетей с возможностью контроля адекватности и целостности контента.

В процессе интеграции КПК описания схем данных составляющих их гетерогенных ИС трансформируются от понятий предметной области к сущностям математической модели представления контента, далее, посредством оригинального инструментального комплекса (ConceptModeller, ИСУК) - к системе семантических сетей и схеме объектно-реляционных хранилищ контента, управляемых абстрактной машиной и, в результате,- к формализуемой схеме интерфейсных компонент КПК и портальной надстройки. Выделяемые при этом уровни представления характеризуют применяемые на каждом этапе категории сущностей, связей, языков представления и манипулирования контентом, инструментальных средств. ____

По результатам исследования специфики интеграции данных в КПК создан комплекс объектных моделей для ситуативного представления и сценарного манипулирования контентом, синтезирующий ряд фундаментальных положений и методов теорий конечных последовательностей, переменных доменов и семантических сетей.

В главе второй работы представлены вычислительные модели поддерживающие технологическую схему интеграции данных в КПК.

В разделе первом исследованы возможности и специфика применения предложенного математического аппарата к ситуативному представлению распределенных гетерогенных КПК в Интернет-среде.

В разделе втором конкретизирована техника использования переменных объектов для построения обобщенной модели сценарного манипулирования контентом гетерогенных КПК.

В разделе третьем детализированы особенности применения семантических сетей для визуального, предметно-ориентированного построения модели представления контента.

В разделе четвертом разработана техника управления контентом с использованием математического аппарата вычислений значений в категориях и теории абстрактных машин.

В разделе пятом развито типизированное исчисление для формализации семантики моделей представления и манипулирования контентом гетерогенных КПК.

В разделах шестом и седьмом на основе общей технологической схемы конкретизированы объектные модели данных и метаданных для контента КПК.

В разделе восьмом представлена формализация портального управления контентом гетерогенных КПК на основе семантических доменов и AM на состояниях.

Разработано обобщенное представление элементов комплекса моделей в виде последовательности конкретизации «класс —> объект значение». Созданный подход является развитием концептуального метода проектирования банков данных В.Э.Вольфенгагена в направлении современных объектных ИС, прежде всего, КПК.

Отмечено, что основными компонентами для построения модели представления и манипулирования объектами данных КПК являются классы, (элементы) шаблонов HTML-страниц И СУК и (значения) контента. Показано, что конкретизации этих типов объектов данных КПК являются функциями соотнесений.

Ошечено, что основное внимание в технологической схеме интеграции данных в КПК (рисунок 1) сосредоточено на таком специфическом аспекте проектирования КПК, как разработка объектных математических моделей для представления и манипулирования контентом согласно введенному принципу «класс -> объект —> значение».

Такое построение в более полной мере, чем известные результаты, полученные рядом современных исследователей (В.ЭВольфенгаген, Л.АЛСалиничешсо, А.С.Клещев, В.А.Серебряков и др.) проявляет адекватность специфике КПК в силу интеграции объектного подхода, позволяющего учесть особенности современных инструментально-программных средств для Интернет-среды, а также ориентированности на гетерогенный характер контента КПК.

По сравнению с известными исследованиями (в частности, проектами СИНТЕЗ ЛА.Калиниченко, работами в области онтологий А.С.Клещева и др.), принципиальными преимуществами построенного в работе комплекса моделей для интегрированного представления и управления контентом КПК является более адекватное ситуативное отображение динамики гетерогегашх слабоструктурированных объектов и поддержка событийно-ориентированного управления контентом. В архитектурно-интерфейсном аспекте комплекс моделей обеспечивает непрерывный, «сквозной», итеративный семантически ориентированный подход к интеграции данных в гетерогенных, распределенных, интероперабельных КПК на основе технологий и стандартов UML, XML, СОМ и CORBA. В отношении реализации поддерживается интегрированная, frontend/back-end обработка контента из различных типов хранилищ данных гетерогенных компонент КПК на основе портальных персонализированных событий-но-управляемых технологий и инструментальных средств с динамическим процедурным языком запросов SQL.

В ходе исследований развит комплекс моделей для интегрированного представления и управления контентом КПК, включающий формализации для

инструментальных средств их интеграции. Моделирование ситуативного представления и сценарного управления контентом основано на двукратном применении принципа свертывания с установлением отношений между классами объектов данных (рисунок 2).

-1 »2

Класс (UML)

Photo

-Name: char -CofcxOeptti: M •Resolution: Inl -ID: long -Width: ¡til ■Height: Inl -TempfMaak: long double

Построение объектов: = flu Ли] а, о {о} = {о eD\ [ЛоЦ

объекг.(иСУК);

Агрегирование объектов: От(А) = {о | о: А -> Т)

Типизация: Т ={v:D \Л), От(А) ISA Т

Значение .(ipprart).

Рисунок 2 - Технологическая схема применения комплекса моделей для представления и манипулирования контентом КПК

При соотнесении созданной общей технологической схемы интеграции данных и комплекса моделей применительно к КПК возникают следующие виды сущностей:

1) класс объектов данных интегрированной БД контента КПК;

2) объект данных шаблона информационной НТМЬ-страницы ИСУК;

3) информационная страница ИСУК (как означивание объекта данных шаблона).

Каждый из переходов (!)—>• (2) и (2) —> (3) представляет собой свертывание, т.е. последовательное снижение уровня абстракции от классов объектов корпоративного контента к собственно объектам данных и далее - к их значениям.

При этом адекватность математических моделей на основе теории конечных последовательностей (в частности, в форме типизированного X-исчисления) обусловлена наличием операций абстракции (т.е. изменения уровня общности сущностей) и аппликации (приложения функции к аргументу). Последняя позволяет формализовать вычисление значений контента, т.е. осуществить последовательность конкретизации при моделировании и разработке интегрированных гетерогенных КПК.

Интеграция хранилищ данных корпоративного контента становится возможной благодаря оригинальному инструментальному средству СопсеріМосІеІ-1ег для визуального семантического объединения компонент в КПК. Процесс такой интеграции в силу невозможности его полной автоматизации требует участия предметных экспертов.

Класс объектов данных интегрированного хранилища контента (или, короче, класс) расширяет объектпо-ориентированный подход и моделируется посредством переменных доменов - аналогов множеств, расширенных неопределенными элементами и средствами поддержки рекурсивных функций.

Объект данных шаблона информационной НТМЬ-страницы ИСУК (или, короче, объект) понимается как конкретизация (фиксированного) класса интегрированного хранилища контента в соотнесении с выбранным шаблоном ИСУК.

Значение информационной НТМЬ-страницы ИСУК (или, короче, значение) формируется окончательнной конкретизацией объекта данных для шаблона с учетом соотнесений со значениями элементов контента КПК.

Класс сложных («многомерных») объектов контента представляется по индукции с помощью п-арного отношения между объектами данных:

Яя = Зу>: [V,. У2,..,Уп] \Л>,:У, К>2:У2... \А>„:Уп Мъ.....^ <->Г) =

{[»1-У,.....уп-' Уп] I О

Таким образом, класс объектов представляет собой семейство упорядоченных пар (у/.'Уі), где V/- і'-й атрибут класса, к, - его тип, Г- критерий отбора, 3- оператор дескрипции.

Отметим, что в состав атрибутов входят как данные, так и метаданные -размерности объектов, ограничения целостности и др., включая числовую характеристику (битовое поле), определяющую возможность использования об> ектов класса в шаблонах информационных НТМЬ-страниц ИСУК (в бинарной форме). Предложенный подход позволяет расширить и адаптировать объектные модели применительно к интеграции данных в гетерогенных КПК.

При конкретизации класса С в соотнесении с шаблоном Ак НТМЬ-страницы ИСУК, означивание семейства шаблонов М устанавливает в значение «истинно» тот единственный его элемент т„ который совпадает по номеру (к) с номером шаблона:

М= (т1,...,ть-.,тц)1 где т{е{0,1};

1, / = к;

[M\Ak/ = (m1*,...,ml\...,mN*), где т,* =

0,i*k.

Кроме того, атрибуты метаданных v/, ...,v„ конкретизируются объектами метаданных согласно условиям ограничений f„ заданным в соотнесении для шаблона Р.

f(v,:V,.....v^VJJt, = f[vjJ\r(tO,..., [vj\m) = (y,,:V,\...,<:Vn%

причем Vi' ISA V/,..., V„' ISA Vm где ISA - отношение частичного порядка.

Уровень абстракции элементарных сущностей комплекса моделей для ситуативного ситуативного представления и сценарного манипулирования контентом КПК снижается при переходе от классов к объектам и далее - к значениям, а расширяемость объектов при переходах между (мета)уровнями обеспечивает проектирование расширяемых КПК. Объекты, согласно приписанным типам, агрегируются в зависящие от соотнесений совокупности и формируют переменные домены.

Классы объектов и определяются операторами-дескрипциями Зи Л(и) со значениями [Зи A(u)J, где А - критерий, отбора. Двукратное применение соотнесений а\еА и ajeA из домена соотнесений А переводит эти классы сначала в объекты о = [Зи A(u)J at, а затем в значения с = оа2.

Двунаправленный характер соотнесений - от классов к значениям и обратно - обеспечивает адекватность реинжиниринга интегрированных КПК до уровня моделей данных; механизм дескрипций облегчает построения в обоих направлениях.

Переменные домены Ою(А) = {о \ о : А->Т} строятся как семейства объектов о с типами Г, полученными из предметной области корпоративного контента D с применением предикатов-критериев отбора А, причем совокупность возможных объектов о содержится в Д а действительных объектов От(А) - в Г.

Исследование взаимодействия классов, объектов и значений контента КПК позволяет сформулировать основной принцип моделирования:

[ класс объектов ]: соотнесение объект, где левая часть соотношения соответствует языковому уровню описания классов, а правая - уровню предметной области. Суть соотношения состоит в том, что для описания классов используются критерии отбора (предикаты), идентифицирующие функции из соотнесений в объекты, т.е. класс рассматривается как процесс. Для отбора и идентификации объектов контента КПК применяется следующая схема исследования предметной области (с обобщением принципа свертывания):

Iкласс/: соотнесение объект> объект >

> соотнесение —> значение У значение, где символ и>" обозначает снижение уровня абстракции.

Таким образом, диаграмма (рисунок 2) иллюстрирует принцип свертывания

о = [Зи Аи]а, о {о} = (о eD\ [А (о) ]} и схему исследования предметной области с переходом от классов объектов в языке к таковым в предметной области посредством функции вычисления значения [•], а также с последовательной конкретизацией классов в объекты и объектов в значения.

Класс объектов идентифицируется критерием отбора А с дескрипцией 3. Вычисление значения контента формирует соответствие между объектами данных предметной области и языка описания (соотнесение обозначается индексом). В общем виде класс С объектов интегрированного хранилища D контента КПК моделируется доменом

С = 3w:[DJ Vv.D (w(v) <->А) = fv:D | А}, где: - С ISA D (ISA - отношение частичного порядка);

-Л - критерий принадлежности объекта к классу с точки зрения эксперта в предметной области.

При построении объектной модели метаданных, классы (мета)уровней разделяются на семейства отношений, поддерживаемых инструментальными средствами. Для каждого уровня к традиционная реляционная модель Кодда расширяется принципом свертывания:

v*+J [...[DJ...J W: [...[D]...J(wk+l(vk) <+Ak),

где wk+l, v*+/ - предикатные символы (мета)уровня, v* - объект, Лк - конструкция языка представления объектов (например, диаграмма классов UML или схема XML).

Разработанный комплекс объектных моделей для ситуативного представления и сценарного манипулирования контентом КПК с фреймовой визуализацией учитывает его состояния и характеризуется структурированностью, масштабируемостью, агрегируемостью, инкапсуляцией метаданных, иерархичностью и наглядностью. Расширяемость и формализуемость семантики созданного комплекса моделей данных обеспечивают предметно-ориентированную интеграцию КПК с сохранением адекватности на всех этапах технологической схемы.

В ходе исследования обоснована возможность и разработан метод автоматизированной трансляции представления контента в схемы целевых хранилищ данных и коды AM управления контентом (АМУК), обеспечивающий целостность данных. Для поддержки метода разработано предметно-ориентированное инструментальное средство ConceptModeller с визуализацией семантических сетей, транслирующее математическую модель представления контента в UML-спецификацию традиционных CASE-средств.

Разработана семантика АМУК, моделирующей управление контентом гетерогенных КПК на основе теории переменных доменов со следующим порядком построения:

1) перечисление стандартных (наиболее употребительных) доменов;

2) определение конечных (содержащих явно перечислимые элементы) доменов;

3) определение конструкторов (операций построения новых доменов на основе имеющихся), т.е. способов комбинирования доменов;

4) агрегирование доменов на базе стандартных, конечных доменов и конструкторов.

Разработаны синтаксис и семантика языка АМУК КПК с доменом выражений Е (включающим константы, идентификаторы I, операцию «записи» контента в «слот» шаблона) и доменом команд С (включающим сравнение, последовательность команд и другие операции). Синтаксис АМУК формализован в терминах синтаксических доменов для идентификаторов (Id), команд (Cmd) и выражений (Ехр).

Значение состояния АМУК (домен St) определяется состоянием памяти (домен Мет) с учетом значений контента гетерогенных КПК (домен Val) на входе (домен In) и HTML-страницы на выходе AM (домен Out). Под памятью понимается отображение из домена идентификаторов в домен значений контента гетерогенных КПК со свойствами, аналогичными операции связывания переменной со значением в Л-исчислении. Для моделирования исключительных ситуаций, вызванных некорректной типизацией контента и иными возможными несоответствиями гетерогенной среде КПК, введены специальный элемент «не связано» (unbound) и состояние «ошибка» (егтог). Домен значений представляет собой дизъюнктную сумму доменов с допустимыми типами гетерогенного контента:

St = Mem х In х Out;

Мет = Id -> [Val + {unbound}];

In - Val*;

Out = Val";

Val = Int + Bool + String.

Семантические предложения описывают значения денотатов (правильно построенных конструкций) языка управления контентом АМУК КПК и имеют вид:

С: Cmd ->[St~>[St + {error} ]];

Е: Exp [St —M [[Val xSt] + {error}]];

E[I] s - (m, I = unbound) error, (m, I, s) ;

С: Com -*St ~>[St + {error}];

С [1-Е] = E [E] * Xv (m, i, o). (m [v/I], i, o).

Последнее предложение моделирует команду присваивания контепта элементу портального шаблона информационной HTML-страницы КПК.

На основе разработанного многопараметрического функционала

F = F((v),(e), ...)(s)(p), где

¡,р, V, е — соотнесения, учитывающие гетерогенность контента (соответственно персональные предпочтения, регистрационный статус и параметры интерфейса пользователя, а также устройства доступа к КПК), построены объектная модель и обобщенная процедура конкретизации представления корпоративного контента в зависимости от перечисленных соотнесений, базирующиеся на вычислении значения оценивающего отображения [*] функционала Р.

В главе третьей рассмотрены особенности конкретизации разработанной технологии применительно к проектированию портальных КПК.

В разделе первом систематизированы особенности построения программных комплексов для рассматриваемого класса предметных областей.

В разделе втором в соответствии со спецификой решаемых задач осуществлен выбор архитектурно-интерфейсного решения и инструментальных средств для проектирования интегрированных КПК.

В разделах третьем-пятом обобщен семантически ориентированный подход к портальной интеграции компонент КПК для повышения эффективности интеграции и управления корпоративным контентом.

В разделе шестом детализированы этапы интеграции данных в КПК с учетом особенностей предметной области.

При этом в фокусе исследования находятся такие специфические для гетерогенных КПК технологические аспекты, как интеграция математических моделей представления и манипулирования корпоративным контентом с поддерживающими их инструментальными средствами - СопсерШос1е11ег и ИСУК,- которые впервые обеспечивают замкнутость цикла разработки. Подобная интеграция выводит созданную технологию на качественно новый уровень как по сравнению с методологиями ведущих производителей инструментальных средств для КПК (МБР, 1ШР, (Л)М и др.), так и в сопоставлении с потенциально перспективными теоретическими подходами (категории, онтологии, СИНТЕЗ и др.).

Качественное превосходство предложенной технологии обеспечивается благодаря интегрированному представлению и манипулированию гетерогенным контентом КПК на основных этапах его жизненного цикла (от математической модели до программной реализации), а также благодаря поддержке специфических этапов этого цикла комплексом новых, предметно-ориентированных инструментальных средств.

Конкретизация обобщенной технологической схемы интеграции данных в КПК в форме Интернет- и Интранет-порталов, управляющих корпоративным контентом, включает следующие этапы:

1) постановка целей и планирование мероприятий по проектированию КПК, которые отображаются в формальные бизнес-правила в модели программных компонент;

2) построение предварительной структурно-функциональной обобщенной бизнес-модели представления гетерогенных объектов корпоративного контента;

3) динамическое ОЬАР-исследование вариативных сценариев названной бизнес-модели;

4) проектирование бизнес-логики, архитектуры и интерфейсов компонент КПК на языке сценариев с трансляцией в UML-схемы посредством оригинальных предметно-ориентированных программно-инструментальных средств на семантических сетях;

5) реализация и сопровождение хранилищ контента КПК; управление контентом.

На этапах (1)-(3) предметными аналитиками используется инструментальное средство для визуального семантически ориентированного моделирования и проектирования схемы интеграции корпоративного контента (Соп-ceptModeller), поддержанное моделью представления объектов данных на семантических сетях и фреймах. При этом, целью первого этапа является построение первоначального представления модели, а двух последующих - ее уточнение и вариативный сценарный анализ. Четвертый этап осуществляется проектировщиками КПК и завершает переход от специфических моделей и инструментальных средств представления контента к традиционному инструментарию CASE-проектирования.

Наконец, пятый, завершающий этап схемы интеграции корпоративного контента представляет собой управление построенным интегрированным хранилищем корпоративного контента на основе портальной метанадстройки над КПК и инструментального средства ИСУК, поддержанного моделью манипулирования контентом в форме абстрактной машины на состояниях. Этот этап осуществляется корпоративными контент-менеджерами и приводит к генерации информационных HTML-страниц и их размещению (или, иначе, публикации) на Интернет- или Интранет-порталах.

Отметим, что предложенная схема является итеративной и предполагает развитие и совершенствование КПК на основе реинжиниринга (вплоть до уровня модели представления контента) с использованием инструментального средства ConceptModeller.

В соответствии с конкретизацией общей технологической схемы интеграции данных в КПК предложен , обобщенный порядок обработки гетерогенных хранилищ контента, позволяющий пользователям КПК в зависимости от динамически активируемых сценариев- соотнесений взаимодействовать с распределенным контентом в различных состояниях.

При этом персонализированные сценария в форме профилей доступа к контенту и хранимых процедур объектно-ориентированных языков программирования (в среде ИСУК с состояниями) инициируются в зависимости от активируемых со стороны пользователя событий, обеспечивая прозрачный, интеллектуальный, распределенный портальный интерфейс класса front-end. Пример конкретизации технологической схемы интеграции данных в КПК представлен на рисунке 3. Динамически варьируемые профили доступа к контенту обеспечивают строгую и гибкую персонализацию, высокую отказоустойчивость и защищенность КПК.

О 2004 Все права защищены

Рисунок 3 - Пример конкретизации технологической схемы проектирования

КПК

Конкретизация технологической схемы интеграции данных в КПК включает метод расширения существующих КПК новыми программными компонентами. В основу метода положен анализ семантически приоритетных объектов данных, обеспечивающий целостность контента на уровне моделей с возможностью итеративного проектирования КПК посредством реинжиниринга.

В главе четвертой представлена схема разработки архитектурно-интерфейсной структуры КПК.

В разделе первом рассмотрены основные особенности событийно-управляемой Интернет-архитектуры.

Раздел второй содержит классификацию и описание модулей, составляющих КПК.

В разделе третьем описано инструментальное средство СопсерІМосІеІІег для предметно-ориентированного фреймового моделирования и визуальной интеграции схем данных КПК (рисунок 4).

В разделе четвертом детализированы разработанные спецификации внутренних интерфейсов КПК.

В разделе пятом изложены особенности взаимодействия созданных компонент ИСУК (рисунок 5).

Раздел шестой содержит описания основных классов спроектированных шаблонов ИСУК для ввода и Интернет-публикации корпоративного контента.

В разделе седьмом приведены примеры сформированных ИСУК представлений корпоративных отчетов.

Г" |5

Рисунок 4 - Интерфейс инструментального средства СопсеріМосІеІ 1 ег

'Э WÜQ 4irro*i>ft Internet Ікріогм - а

tw... »и »«і»«" чр«« s*»»«

- ■ Ф ta : фпмх э! ® @ • â «

Алрж; Htp-Jteaa Iva пДОЬ*;г]о*я*и/ Теремд ¡иг*! »1

1 Х>ю 1 Ста»«» ■ " СИИ Пик» Api СМИ £рк ЛР4С СЬі Квотой События Алм*< ,. "VV г-1 j

HEHSUiiïLLilû!, жшляш «нрц Cmrnto . :

« 1 ITERA GROUP MAIN PAGE (<M*4) Hoaaa

* 2 Ant*M< Energy Outlook 2003WiUiPiojection» lo2£C5Q Опуб/иаюоаиа

я Aid Chemical Plant (Hmearab) U.Kfm.A'.n.;,«

* Qwiity (bUgotva) 0г*5/міооа«в|

'я OS «>d Baltic Slate* 0 □пубімювана]

я Contact u>: (cuntaot) РцІамні

в Comtrie» and lleporo 0 Огчблтовапа Onjiea-xeaMO _ Огчбімсомиа Огьб линована

» і Gorrwidy Nfcolaevich Skidanov F»it Vct> P-ondon: of the Managhg Board ITERA Oi and Gat Compare Lid (Cw«®«B. finorpaSMa)

* 9 Igor Vktoroich MAKAROV Chairman of Bond al Diactori ITERA 0i and G« Compaq Ltd (EworpaiWH. Ma»«poe M B )

«1 IQ Inditmal rtoRctt Ipiodpul

щ ,1 ITERA and the Conwwiy (popu| Огцбдиссміа

» 12 ITERA Brow (main) Оціїммм

а 13 Maluntfcy quany (nafck«) ОгдммиамиЬ

Я 14 Moldova Metd Wortu (moidod) Ппуігмшааив

* IS FET Piogram (TOT) Оц&ишииы

я 16 Production of Gai (gaa| Ол^яашванаІ

I 17 Raiwa Mikhaicvna Fienkel Member ot Board of Diecton ITERA Oi and Ga> Comp<r>» Lid. (biow»'l Опуйпі кована

9 їв flutsian Fodnralion 0 Qnyéiw.coaivs

■я 13 Sale» d natural gat lieafl Опублікована

* 20 Sipport tor toenoo and education (Hayta) Огцйипмма

ш « < > »

"і 1 "(Л^ч*«'.

Рисунок 5 - Интерфейс инструментального средства ИСУК

Отмечено, что существенное внимание в рамках разработанной общей технологической схемы интеграции данных в гетерогенных КПК (рисунок 1) уделяется таким специфическим аспектам архитектурно-интерфейсного представления КПК, как портальные средства манипулирования данными и riepco-нализация доступа к контенту.

При этом, в отличие от подходов, рассмотренных в главе I, особенностью разработанной портальной архитектуры является семантическая ориентированность поддерживающих ее оригинальных инструментальных средств (ConceptModelier, ИСУК) и их интеграция на уровне математических моделей для представления и манипулирования гетерогенным корпоративным контентом, а также на уровне традиционных CASE-средств проектирования КПК (Microsoft Visual Studio .Net, IBM Rational и др.).

Системная архитектура гетерогенного КПК предоставляет (в зависимости от положения пользователя в иерархии доступа) соотнесения определенным уровнем персонализированных полномочий по вводу, коррекции, анализу и выводу контента на портал. В качестве интерактивных интерфейсных средств реализованы контент-ориентированные дизайнер форм и шаблонов информационных HTML-страниц ИСУК, генератор отчетов, онлайновая документация и

средства администрирования. Интегрированное корпоративное хранилище контента поддерживает возможность оперативного доступа и коррекции данных в гетерогенных КПК.

Я PR

ИС расчета зарплаты

DC ИСдок; оба гменго-рога

FA

ИС учета основных сведств_

Мцфль Mwvib

Огпуааи ftiywiM BUWOM

МаМшн мулни*

Модгл.

Обучмвигаа

папфоамш

Рисунок 6 - Логическая структура компонент КПК

Предложенная технология разработки была практически апробирована при создании и промышленной эксплуатации гетерогенного КПК, включающего Интернет- и Интранет-порталы, а также «унаследованную» ИС управления персоналом (UniQue), в международной группе компаний "ИТЕРА".

Логические структуры гетерогенного КПК и инструментального средства ИСУК в форме диаграмм потоков данных представлены на рисунках 6-7; потоки метаданных изображены в виде параметров.

Все компоненты гетерогенного КПК охвачены унифицированным портальным интерфейсом и интегрированы (на уровне данных) в среду «унаследованных» и современных ERP-систем учета, планирования и управления корпоративными документами, людскими, финансовыми и товарными ресурсами (в т.ч. семейства Oracle Applications). Архитектурная схема реализованного гетерогенного КПК представлена на рисунке 8.

СМ

Упр-ніе конфигурацией-«

Мод™3

№но Сірагацьі

Параметры исоатммя леиоиспраниц «""«»ье

К/к»евье Кпкнсвьв ста слова I

Юкневьв слова

■■: ■ ■ а \

АО

Адмиюклрироеание

Мэддъ Мабуть

Синхре»«- Радкгорсим

заиия цикл

Параметры дфмции

Параметры спа;раздетое Ір/брисиря и др)

состояния сообщениц

Главарей

циов

соспххние слраниц

Спеииапьньв разделы

Мвдль ЕЬоуп-лешя

Мэду/ъ События

Рисунок 7 - Логическая структура ИСУК

Сервер ИСУК

ш 1

нти.-

контент

/

Г'-« і

Цомашн + £Ш

ПК

Ччюрук

) «я, Смарт

И Фом/

1 РОА

I Мобильный

і телефон

сервер

Рисунок 8 - Структурно-интерфейсная схема гетерогенного КПК

В главе пятой обобщены результаты реализации, экспериментальной проверки и внедрения интегрированных гетерогенных КПК.

В разделе первом описан процесс реализации полномасштабного гетерогенного КПК.

В разделах втором и третьем проведен анализ апробации, внедрения и эксплуатации программно-инструментальных средств, поддерживающих интеграцию данных и управление контентом в КПК.

В разделах четвертом и пятом представлены особенности реализованных корпоративных порталов для осуществления управления контентом.

В разделах шестом и седьмом сформулированы рекомендации по доработке созданных КПК для повышения эффективности их использования.

В разделе восьмом систематизированы обязанности пользователей

КПК.

В разделе девятом приведены результаты сравнительного анализа эксплуатационных характеристик доработанных КПК с коммерческими аналогами.

В разделе десятом изложены рекомендации по развитию функциональных возможностей и совершенствованию технологических характеристик разработанных КПК.

Показано, что в отличие от узконаправленных прикладных программных решений ведущих производителей ПО для корпоративных порталов, реализация созданных в результате настоящего исследования КПК, интегрированных на уровне данных, в более полной мере отвечает специфике гетерогенности составляющих их программных систем.

Благодаря сквозной ориентированности разработанных моделей и программных средств на представление и управление гетерогенным контентом обеспечивается существенная экономия в сроках и стоимости внедрения КПК, содержащих как современные ERP-компоненты, так и «унаследованные» ИС, а также слабоструктурированные хранилища объектов мультимедиа. При этом созданная технология интеграции данных по сравнению с известными современными подходами крупнейших производителей ПО для КПК (Microsoft, Oracle, ШМ и др.), обеспечивает облегченное, улучшенное манипулирование сложными объектами данных, агрегирующими контент перечисленных типов.

В ходе реализации обобщенной технологической схемы интеграции данных в КПК (рисунок 1), спецификации объектной модели интегрированного представления контента в виде фрагментов семантических сетей, сформированных инструментальным средством ConceptModeller, преобразуются в UML-диаграммы, затем, посредством традиционных CASE-средств - в ER-диаграммы и схемы данных контента, и наконец, посредством ИСУК,- в шаблоны и HTML-страницы корпоративного портала.

С целью проверки адекватности разработанных математических моделей, методов и поддерживающих их программно-инструментальных средств, создан быстрый прототип КПК. По результатам апробации прототипа разработаны и введены в промышленную эксплуатацию полномасштабные КПК для

1Г ЛИ МЕЖДУНАРОДНАЯ ГРУППА КОМПАНИЙ

Сиобщшмя СМИ

26/11/2004 ВЛтчерцоиу присукдеме НЛЦИШЫПЫЫН премия

Российской Академии

11/11/2004-ИТН»*" инвестирует в нефтегазовые проекты в Капмымим ЕполроЛ««»-

Все пресс-релизы*

Мы несем тепло людям!

06/12/2004 "ИТЕРА" сохраняет прогноз ставни купоне по эайму на уровне 1ЭЧЬ с гкыровн«* ¡>

/ЯегАжИ

03/12/2004 Общие ресурсы газе НТК "УТВРА" пи конец 2004 г. составят 1(1, и млрд кубометров

(ИнтерфакЫПI)

Всп сообща и я СМИ •> (

Междгнародхяя группа «сипаний"ИТЕРА" валяется одним из «рупнвйших независимых производителей и продавцов природного газа, работающих в аренах СНГ и Балтии.

'ИТЕРА' успешно реализует производственные прсопы I облает знергетии», газохимии, строительстве » странен Европы, Азии и Америки Ведется рлбога на рынки недвижимости и страхования

Номера тепефонвомосяюаамо офиса МПСИТВ>А-. «7(Ю5)708-И500, «7(095)411-8500.

Версия дм ппчят

К мчаеу стремы

Рисунок 9 - Примеры контента КПК, сформированного ИСУК: вверху - Интранет-портал, внизу - Интернет-сайт МГК «ИТЕРА»

решения задач интеграции и управления корпоративным контентом с применением портальных Интернет- и Интранет-интерфейсов. решения задач интеграции и управления корпоративным контентом с применением портальных Интернет- и Интранет-интерфейсов.

Примеры веб-страниц, автоматически созданных ИСУК для Интранет-портала и официального Интернет-сайта МГТС «ИТЕРА», представлены на рисунке 9.

Последний ресурс, формируемый на русском или английском языке (в зависимости от соотнесения) постоянно доступен в сети Интернет по адресу: http://www.itera.ru.

В заключении сформулированы основные выводы и результаты диссертации.

Реализация результатов работы

Основные компоненты разработанной технологии интеграции данных в гетерогенных КПК - модели интегрированного представления и манипулирования контентом, инструментальные средства интеграции схем данных корпоративных порталов (ConceptModeller) и управления их контентом (ИСУК), событийно управляемая архитектурно-интерфейсная схема портала с персонали-зацией доступа к контенту и др. - внедрены и прошли промышленную эксплуатацию от 3 до 7 лет в прикладных КПК (Интернет- и Интранет-порталы, ПО учета, планирования и управления людскими ресурсами и др.) в ряде компаний МГК «ИТЕРА» и других организациях.__

По теме диссертации под руководством и при непосредственном, определяющем личном участии автора выполнен ряд хоздоговорных и госбюджетных НИР с такими учреждениями, предприятиями и организациями, как Microsoft Research Ltd., ИПУ РАН, Интернет-университет ИНТУИТ.РУ, Career-lab, Softine Academy, УЦ «Сетевая Академия «ЛАНИТ», ЗАО «Горячая линия -Телеком» и др. В целом, разработано и внедрено свыше 10 крупномасштабных прикладных гетерогенных КПК с портальными надстройками для решения задач учета и планирования корпоративных ресурсов, управления производственными процессами, логистики, поддержки СМИ и др. Эксплуатация внедренных гетерогенных КПК приносит значительный экономический эффект. При этом сроки внедрения КПК сокращены в среднем па 40%, суммарные затраты средств — в 1,5 раза, а время возврата инвестиций после ввода в промышленную эксплуатацию - в 1,6 раза. Благодаря предметно-ориентированному интерфейсу с контролем целостности данных скорость первичного ввода данных существенно превосходит аналоги. Кроме того, существенно повысилась эффективность манипулирования сложным контентом, агрегирующим гетерогенные объекты данных. Разграничение и персонализация доступа к контенту КПК позволили значительно уменьшить риск его искажения или утраты.

Математические модели, методы, инструментальные средства и архитектурно-интерфейсные решения, составляющие технологию интеграции данных в КПК, в 2003-2011 гг., положены в основу созданных под руководством автора учебных курсов для подготовки специалистов по проектированию ИС в

таких организациях, как Microsoft Corporation, Softline Academy, Careerlab, ИН-ТУИТ, МИФИ, МФТИ, МГУПИ, КГТУ, НИУ ВШЭ и др. Созданные курсы поддержаны учебными пособиями, рекомендованными УМО [3,4], общим объемом более 40 пл. Общее количество слушателей разработанных автором курсов, включая дистанционную форму обучения, составляет около 2 тыс. человек.

Основные элементы разработанной технологии интегрированного проектирования КПК поддержаны в 2004-2010 гг. 11 грантами Microsoft Research, РФФИ и НИУ ВШЭ.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В ходе диссертационного исследования были сделаны следующие выводы и получены следующие результаты:

1. Создана концептуальная схема технологии интеграции данных в гетерогенных КПК на основе математических моделей и инструментальных средств, поддерживающая замкнутый, двунаправленный цикл разработки КПК с реин-женирингом.

2. Разработан комплекс контент-ориентированных объектных моделей вида «класс-объект-значение», обеспечивающий интеграцию и управление данными в гетерогенных КПК.

3. Разработана ситуативная модель интегрированного представления контента предметной области на семантических сетях (с фреймовой визуализацией), обеспечивающая интуитивную ясность и удобная для использования предметными экспертами.

4. Разработана модель манипулирования данными в форме AM с состояниями и ролевыми соотнесениями для управления контентом гетерогенных КПК.

5. Разработана архитектурная схема для интегрированного представления данных в гетерогенных КПК с метанадстройкой в форме Интернет-портала, унифицирующая манипулирование контентом на основе ассоциативных связей на уровне объектов данных.

6. Разработано взаимосвязанное с моделями и CASE-средствами инструментальное средство ConceptModeller, осуществляющее на основе фреймовой нотации семантически ориентированную визуальную разработку схемы интеграции данных гетерогенных КПК и обеспечивающее замкнутый цикл разработки КПК с реинженирингом.

7. На основе AM разработано инструментальное средство ИСУК, унифицирующее сценарно-ориентированную, визуальную интеграцию и манипулирование гетерогенным контентом портальных КПК и обеспечивающее гибкие, эргономичные интерфейсы с персонализацией. Технологический комплекс математических моделей, инструментальных средств и архитектурных решений позволил разработать гетерогенные КПК, интегрирующие ERP-, унаследованные и слабоструктурированные программные системы.

ОСНОВНЫЕ ПОЛОЖЕНИЯ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ

В РАБОТАХ

В рецензируемых журналах из списка ВАК

1. Зыков C.B. Корпоративные информационные системы на основе веб-сервисов: проблемы и перспективы // Безопасность информационных технологий.- 2003.- № 1.- с.90-92

2. Зыков C.B. Интегрированная концепция проектирования и реализации индустриальных интернет-систем // Безопасность информационных технологий.-2004 - №4 - с. 52-57

3. Зыков C.B. Методология интегрированного проектирования портальных корпоративных информационных систем. // Системы управления и информационные технологии - 2005.-№5- с.42-46

4. Зыков C.B. Методология проектирования Интернет-порталов для нефтегазовой отрасли - от теории к внедрению // Автоматизация, телемеханизация и связь в нефтяной промышленности- 2005. - № 12,- с. 11-16

5. Зыков C.B. Концепция и методология интегрированного проектирования корпоративных информационных систем для глобальной среды вычислений // Приборы и системы. Управление, контроль, диагностика.- 2006 - №2.-с. 15-20 ___

6. Зыков C.B. ConceptModellen особенности реализации Интернет-порталов с применением семантических CASE-средств // Автоматизация, телемеханизация и связь в нефтяной промышленности.- 2006. - №2 - с. 10-15

7. Зыков C.B. Управление жизненным циклом корпоративных информационных ресурсов // Проблемы управления - 2006 - №3- с.8-12

8. Зыков C.B. Реализация системы управления корпоративным контентом // Приборы и системы. Управление, контроль, диагностика.- 2006,- №10.— с.5-12

9. Зыков C.B. Методология создания системы управления контентом на базе Internet-технологий // Автоматизация в промышленности - 2006,- №3 - с.12-14

10. Зыков C.B. Интеграция корпоративных приложений с использованием технологии веб-порталов // Приборы и системы. Управление, контроль, диагностика. - 2007.- №4 - с. 1 -5

П.Зыков C.B. Схема интегрированпого проектирования больших Интернет-систем с примером применения // Приборы и системы. Управление, контроль, диагностика - 2008 - №4 - с.25-30

12. Зыков C.B. Технология разработки корпоративных программных комплексов - от моделей к внедрениям // Безопасность информационных техноло-гий.-2008.-№1- с.87-90

13. Зыков C.B. Технология семантической интеграции данных в корпоративных программных комплексах // Приборы и системы,- 2009 - №6.- с. 52-55

14. Зыков C.B. Технология интегрированной разработки корпоративных программных систем // Безопасность информационных технологий-2009,-№1.-с.104-105

15.Зыков C.B. Семантическая интеграция данных для безопасности и целостности корпоративных систем // Безопасность информационных техноло-гий.-2009.-№3 .-с. 16-19

Монографии

16.3ыков C.B. Управление персоналом с помощью интегрированных информационных систем. М.:Недра коммюникейшнс.- 2001.- 160 с. 17.3ыхов C.B. Введение в теорию программирования. М.:Интернет-университет

информационных технологий.- 2004.- 400 с. 18.Зыков C.B. Проектирование Интернет-порталов. - М..МФТИ.- 2005 - 258 с. 19.3ыков C.B. Основы современного программирования. Разработка гетерогенных систем в Интернет-ориентированной среде. - М.: Горячая линия - Телеком,-2006.-443 с.

Другие публикации

20.Вольфенгагеп В.Э., Брызгалов C.B., Гаврилов A.B., Зыков C.B. и др. Категориальная объектно-ориентированная абстрактная машина (КООАМ) // Информационный бюллетень РФФИ.- №4 - 1996.- с.786 21.Зыков СВ. Концепция интегрированного проектирования и реализации индустриальных информационных систем для глобальной среды вычислений. // Качество и ИЛИ (CALS)-Texmwionra».- №4,2004 - с.24-31 22.Зыков C.B. Теоретические и методологические основы построения корпоративных порталов // Электронный многопредметный научный журнал «Исследовано в России» (Рег.№042030001 в НТЦ «ИНФОРМРЕГИСТР» от 03.03.2003).-2005.- №12,- с.2286-2290 23.Зыков C.B. Инструментальное средство проектирования корпоративных информационных интернет-систем // Электронный многопредметный научный журнал «Исследовано в России» (Per. № 042030001 в НТЦ «ИНФОРМРЕГИСТР» от 03.03.2003).-2005.- № 12.- с.2278-2285 24.3ыков C.B. Проблемно-ориентированные средства разработки интернет-порталов И Электронный многопредметный научный журнал «Исследовано в России» (Рег.№ 042030001 в НТЦ «ИНФОРМРЕГИСТР» от 03.03.2003).-2006.-№3.-с.326-331 25.Зыков C.B. Технология семантического проектирования корпоративных портальных систем И Электронный много предметный научный журнал «Исследовано в России» (Рег.№ 042030001 в НТЦ «ИНФОРМРЕГИСТР» от 03.03.2003).- 2006.-№ 3.-C.332-336 26.Зыков C.B. Построение интегрированных корпоративных хранилищ данных на основе интернет-порталов // 2-я научная конференция "Автоматизация в промышленности".-М.:ИПУ РАН, 2008 - с. 143-146

27.3ыков C.B. Учебный курс «Методология разработки корпоративных приложений»: от аппликативных моделей - к индустриальным программным комплексам // 2-я международная конференция «Аппликативные вычислительные системы» (под ред. проф. В.Э. Вольфенгагена). - М.:«ЮрИнфоР-МГУ».-2010 - с.306-314 28.3ыков C.B. Пост-кризисное управление жизненным циклом разработки программных систем // Управление проектами, №3(20), 2010, с.42-47 29.3ыков C.B. Управление жизпенным циклом корпоративных программных комплексов в посткризисный период // Материалы 5-й международной конференции "Управление развитием крупномасштабных систем (MLSD'2011)".- М.:ИПУ РАН, 2011.- т. П.- с.225-228 ЗО.Зыков C.B. Интеграция корпоративных приложений при помощи технологии веб-порталов (на англ. яз.) // 5-я Международная конференция "Компьютерные науки и информационные технологии" (CSIT2003)" .- Уфа:УГАТУ, 2003.-T.1.-C.60-65

31.Зыков C.B. Абстрактная машина как модель управления контентом (на англ. яз.) // б-я Международная конференция "Компьютерные науки и информационные технологии(CSIT2004), Будапешт,Венгрия,-УфагУГАТУ,2004-T.1.-C.251-252

32.3ыков C.B. Корпоративный портал - от модели к реализации (на англ. яз.) // б-я Международная конференция "Компьютерные науки и информационные технологии (CSIT2004), Будапешт, Венгрия.- Уфа:УГАТУ, 2004.- т.2.~

с.188-193 ------

ЗЗ.ЗыковС.В. Интегрированная методология разработки интернет-ориентированных корпоративных информационных систем (на англ. яз.) // 1-я Международная конференция "Информационные системы и технологии для веб", Майами, США.- Cery6an:INSHCC Press, 2005.- с.168-175 34.Зыков C.B. Разработка веб-ориентированных информационных систем - интегрированная методология (на англ. яз.) // 5-я Международная конференция "Компьютерные науки и информационные технологии (CSIT2005), Ереван, Армения.- Ереван: HAH Армении, 2005 - с.373-378 35.3ыков C.B. Управление контентом корпоративных порталов - от модели к реализации // (на англ. яз.) // 2-я Международная конференция "Информационные системы и технологии для веб (WEBIST 2006)", Сетубал, Португалия.- CeTy6an:INSHCC Press, 2006 - с.465-468 Зб.Зыков C.B. Технология построения крупномасштабных интернет-систем (на англ. яз.) // 8-й Международный симпозиум "Материалы, методы и технологии ("TECHNOMAT & INFOTEL 2006"), Бургас, Болгария.-Bourgas:ScienceInvest LTD, 2006.- с. 18-29 37.3ыков C.B. Управление корпоративным контентом: теория и инженерия для поддержки полного жизненного цикла (на англ. яз.) // 6-я Международная конференция "Компьютерные науки и информационные технологии (CSIT2004), Будапешт, Венгрия - Уфа:УГАТУ, 2004 - т.1.- с.251-252

38.Зыков C.B. Поддержка полного жизненного цикла: методология управления корпоративным контентом (на англ. яз.) // 1-я Международная конференция "Компьютерные науки и информационные технологии (CSIT2006), Львов, Украина.- Львов:ЛПНУ, 2006 - с. 163-166 39.Зыков C.B. Управление корпоративным коптептом - интегрированная методология (на англ. яз.) // Международная конференция "Корпоративные информационные системы и веб-технологии" (EISWT07), Орлапдо, США, 2007 - Orlando:niS.- 2007.- с.226-233 4О.Зыков C.B. Интегрированный подход к управлению корпоративным контентом (на англ. яз. // Международная мульти-конференция "Систематика, кибернетика и информатика (WMSCI 2007)", Орландо, США, 2007,-Orlando:IIIS.- 2007.- с.212-216 41.Зыков C.B. Управление корпоративным контентом: наведение мостов между наукой и практикой (на англ. яз.) // Международная конференция "Информационное общество (¡-Society 2007)", Мерриллвилль, США, 2007-London:Inderscience- 2007, т.1- с. 145-152 42.3ыков C.B. Корпоративный портал "ИТЕРА" - от модели до внедрения (на англ. яз.) // Международная конференция "Корпоративные информационные системы и веб-технологаи (EISWT 2009)", Орландо, США, 2009-Orlando:ISRST-2009.- с.140-145 43.3ыхов C.B. Интегрированная методология управления корпоративным контентом (на англ. яз.) // 13-я Международная мульти-конференция "Систематика, кибернетика и информатика (WMSCI 2009)", Орландо, США, 2009-Orlando:mS - 2009 - с.259-264 44.3ыков C.B. ConceptModellen инструментальный пакет для моделирования сложных прикладных программ на основе фреймов (на англ. яз.) // Международная мульти-конференция "Сложность, информатика и кибернетика (IMCIC 2010)", Орландо, США, 2010 - Orlando:IIIS.- 2010 - с.468-473 45.3ыков C.B. Технология разработки шаблонов для гетерогенных корпоративных программных систем (на англ. яз.) .- Журнал "Journal of Communication and Computer", 2010, вып.7, No.4.-c.56-61 46.Зыков C.B. Интегрироваппая методология разработки и сопровождения корпоративных приложений на основе паттернов (на англ. яз.) // 6-я Международная конференция "Программная инженерия в странах Восточной и Центральной Европы (CEE-SECR 2010)".-Нью-Йорк: IEEE.- с.214-219 47.3ыков C.B. Разработка индустриальных информационных систем на основе паттернов: модели, инструментарий и результаты (на англ. яз.) // 12-я Международная конференция "Компьютерные науки и информационные технологии (CSIT2010)", Москва-С.-Петербург, 2010.- Уфа:УГАТУ, 2010.- т.1.-с.10-14

48.Зыков C.B. Адаптивная методология жизненного цикла программных систем на основе "пост-кризисных" паттернов (на англ. яз.) // 4-й Российско-германский семинар "Инновационные информационные технологии: Теория и практика".-Уфа:УГАТУ, 2011,- с.24-27

49.3ыков C.B. Уроки кризиса: оптимизация жизненного цикла корпоративного программного обеспечения (на англ. яз.) // Международная мульти-конференция "Сложность, информатика и кибернетика (IMCIC 2011)", Орландо, США, 2011.- OrlandormS.- 2011.- с. 156-160 50.3ьпсов C.B. Разработка корпоративных систем на основе паттернов: от концептуальных моделей - к серийным внедрениям (на англ. яз.) // 13-я Международная конференция "Корпоративные информационные системы (ICEIS 2011 )", Пекин, Китай, 2011.- Пекин: SciTePress - т.4 - с.475-478

Диссертант

C.B. Зыков

ЗЫКОВ Сергей Викторович

ТЕХНОЛОГИЯ ИНТЕГРАЦИИ ДАННЫХ В ГЕТЕРОГЕННЫХ КОРПОРАТИВНЫХ ПРОГРАММНЫХ КОМПЛЕКСАХ

Специальность: 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук

Подписано в печать 11.03.2012. Формат 60x84 1/16. Бумага офсетная. Печать плоская. Гарнитура Тайме. Усл. печ.л. 2,0. Уч.-изд. 2,0 Тираж 100 экз. Заказ № 616

ФГБОУ ВПО Уфимский государственный авиационный технический университет Центр оперативной полиграфии УГАТУ 450000, Уфа-центр, ул. К. Маркса, 12

1 2 - 1 5 870

2012090970

2012090970