автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Интеллектуальные компоненты для автоматизированного проектирования систем электронного документооборота
Автореферат диссертации по теме "Интеллектуальные компоненты для автоматизированного проектирования систем электронного документооборота"
На правахрукописи
АХМАД Бадер
ИНТЕЛЛЕКТУАЛЬНЫЕ КОМПОНЕНТЫ ДЛЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ СИСТЕМ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА
Специальность:
05.13.01 - Системный анализ, управление и обработка информации (в машиностроении и вычислительной технике)
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Ижевск 2005
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования "Ижевский государственный технический университет" (ГОУ ВПО ИжГТУ).
Научный руководитель: доктор технических наук,
профессор КучугановН.Н.
Официальные оппоненты: доктор физико-математических тук,
профессор Тененев В.А.;
доктор технических наук НистюкА.И.
Ведущая организации: Московский государственный
технологический университет "СТАНКИН"
Защита состоится " 24_"_мая 2005 года в ¡4_часон на
заседании диссертационного совета в ГОУ ВПО ИжГТУ но адресу: 426069, г.Ижевск, ул. Студенческая, 7, корпус 1.
С диссертацией можно ознакомиться в библиотеке ГОУ ВПО ИжГТУ.
Автореферат разослан апреля__2005 года.
Ученый секретарь диссертационного совета, —\ /
кандидат технических наук, доцент Сяктерев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. В настоящее время очевидным является факт, что эффективное управление предприятием (крупным, средним, малым) невозможно без использования более или менее развитых систем электронного документооборота (СЭД) предприятия. В частности, СЭД предприятия является обязательной составляющей любой системы комплексной автоматизации управления предприятием (бизнес-процессами). В связи с этим, рынок информационных технологий и программных продуктов, позволяющих ускорить создание и, самое главное, облегчить дальнейшее сопровождение СЭД конкретного предприятия, является одним из самых бурно развивающихся в сфере ИТ.
Основой современных СЛ8Б-систем, обеспечивающих поддержку жизненного цикла (ЖЦ) информационной системы (ИС) предприятия в постоянно меняющихся рыночных условиях, является информационная модель (ИМ) предприятия (его бизнес-процессов). Именно формальная (математическая) ИМ предприятия позволяет применять формальные (алгоритмизуемые) методы и технологии для автоматизации поддержки ЖЦ ИС предприятия.
Практически все известные СЛ8Б-системы используют представление ИМ предприятия, основанное на применении методологий и стандартов семейства IDEF или их модификациях, На основе таких ИМ можно проводить системный анализ и оптимизацию бизнес-процессов предприятия и даже частичный синтез (структура хранилищ данных, учет и контроль событий, в том числе, связанных с оформлением документов) ИС предприятия.
К сожалению, все эти методологии и стандарты изначально ориентированны преимущественно на описание уже существующих бизнес - процессов и документооборота организации, а не на синтез новых. Кроме этого, для малых и средних предприятий экономически не всегда оправдывается приобретение дорогостоящих систем электронного документооборота или средств их разработки, ввиду дорогостоящего внедрения, высокой сложности методологий и трудоемкости процессов анализа, необходимости тесного сотрудничества экспертов в предметной области и программистов высокой квалификации.
Таким образом, актуальной является задача повышения степени автоматизации процессов системного анализа документооборота, снижения трудоемкости проектирования систем электронного документооборота, и, тем самым, повышения эффективности управления бизнес-процессами на малых и средних предприятиях путем разработки формальных методов и алгоритмов анализа документооборота и бизнес-процессов, основанных на методах искусственного интеллекта.
Бурное развитие методов искусственного интеллекта позволяет предположить, что уже в ближайшее время специалисты в той или иной предметной области смогут самостоятельно, без привлечения программистов описывать технологию информационного обеспечения бизнес-процессов, управления ими и анализа эффективности.
Объектом исследования является информационное обеспечение средних и малых предприятий: бизнес-процессов, существующего документооборота и потребностей в реорганизации информационной системы предприятия.
Предметом исследования являются методы и средства автоматизации анализа бизнес-процессов, документооборота и проектирования информационных систем.
Цель работы. Повышение степени автоматизации процессов системного анализа документооборота, снижение трудоемкости проектирования систем электронного документооборота, и, тем самым, повышение эффективности управления бизнес-процессами на малых и средних предприятиях путем разработки формальных методов и алгоритмов анализа документооборота и бизнес-процессов, основанных на методах искусственного интеллекта.
Основные задачи.
1. Аналитический обзор методов и систем анализа бизнес-процессов и документооборота, методов и средств автоматизации проектирования баз данных и систем электронного документооборота (СЭД).
2. Разработка математической модели предметной области предприятия.
3. Разработка методики автоматизированного системного анализа существующего на предприятии документооборота.
4. Разработка методов логического анализа и синтеза схем процессов.
5. Разработка метода логического синтеза схем документооборота,
6. Разработка и исследование интеллектуальных программных компонент для автоматизированных систем анализа документооборота.
Методы исследования. Теоретические исследования выполнены с использованием теории множеств, теории графов, математической логики, математического моделирования.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается корректностью разработанных математических моделей, их адекватностью по известным критериям оценки в рассматриваемой предметной области, использованием известных положений фундаментальных наук, положительными результатами проведенных экспериментов,
На защиту выносятся:
- модель знаний о предметной области бизнес-процессов и документооборота предприятия;
- методы исчисления (выявления) на предложенных моделях различных видов отношений между свойствами, предметами, процессами;
- метод логического описания и автоматического анализа и синтеза схем бизнес-процессов с помощью логики схем программ;
- принципы логического описания документооборота предприятия;
- пример описания и синтеза схемы документооборота;
- метод распознавания семантической сущности атрибутов таблиц и документов;
- метод кластеризации атрибутов документов;
- метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов и знаний о регламенте делопроизводства предприятия;
- архитектура автоматизированной системы анализа документооборота;
- общая методика анализа проблемной ситуации.
Научная новизна.
1. Модель знаний о предметной области документооборота предприятия в виде совокупности деревьев знаний о предметах, документах, процессах и отношениях, представляемых с помощью атрибутов и методов их получения,
2. Метод логического синтеза схем документооборота предприятия на основе логики схем программ.
3. Метод кластеризации атрибутов существующих документов, заключающийся в морфологическом и синтаксическом анализе идентификаторов, семантическом анализе методов их вычисления, а также сопоставлении типов, диапазонов, единиц измерения значений.
4. Метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
5. Методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Практическая полезность и реализация.
1. Полученные в работе методы и алгоритмы позволяют повысить степень автоматизации процессов анализа существующих на предприятиях бизнес-процессов и проектирования систем электронного документооборота.
2. Разработанные на основе предложенных методов интеллектуальные программные компоненты могут быть использованы в САПР баз данных и системах управления бизнес-процессами, а также в учебном процессе ВУЗов для студентов соответствующих специальностей.
3. Разработанная на основе предложенных методов программная система DCA для анализа и проектирования систем электронного документооборота внедрена:
- на ФГУП "Ижевский механический завод";
- в Министерстве образования и науки Удмуртской Республики.
Апробация работы. Основные положения диссертационной работы докладывались на 2-х международных конференциях: на VII Всероссийской с международным участием научной конференции молодых ученых и аспирантов "Новые информационные технологии. Разработка и аспекты применения". Таганрог, 2004; на научно-техническом форуме с международным участием "Высокие технологии-2004", Ижевск 2004. Работа многократно обсуждалась на постоянном семинаре "Системный анализ, управление и обработка информации" кафедр "Автоматизированные системы обработки информации и управления" и "Вычислительная техника" Ижевского государственного технического университета.
Публикации. Результаты работы отражены в 6 научных публикациях, в том числе в 5 статьях в журналах и сборниках, в 2-х докладах на научно-технических конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 110 машинописных листах с таблицами и иллюстрациями. Список литературы включает 43 наименования.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, сформулированы цель и решаемые задачи. Кратко изложено содержание работы, сформулированы научная новизна и практическая полезность.
В первой главе проанализированы существующие на данный момент методы и системы информационного обеспечения бизнес-процессов и документооборота: описаны наиболее распространенные методологии и стандарты моделирования информационных систем, дана общая характеристика и классификация СЛ8Б-средств и систем электронного документооборота (СЭД).
Во второй главе предлагается модель представления знаний о предметной области информационной системы, в которой информация явным образом разделена на два основных компонента: декларативные (описательные) и императивные (процедурные) знания, отображаемые в виде иерархий (деревьев) на различных множествах объектов и связей между ними, что обеспечивает, с одной стороны, наглядность и удобство пополнения, с другой - универсальность по отношению к различным предметным областям.
Опишем архитектуру базы знаний о предметной области.
Знаниями будем считать информацию проблемно систематизированную с помощью классификационных деревьев, таблиц, графиков, функций, закономерностей, правил, планов действий, примеров,
База знаний представляет собой семейство деревьев: <Деревоконцептов>: :=< Номеруровня>, <Концепт>,
<Списокподконцептов >, где подконцепт концепта уровня и - это концепт уровня и - 1.
Концепты являются узлами деревьев знаний.
Имеется 4 базовых вида концептов:
- свойство (атрибут) концепта / экземпляра предмета или процесса;
- предмет или часть (деталь) предмета;
- процесс или подпроцесс;
- отношение между концептами, экземплярами.
Концепт-свойство имеет вид:
< Концепт-свойство>::= <Имя>, [<Камментарий>], <Типзначения>, [<Метод>],
где Имя - имя свойства;
Комментарий - текст на естественном языке;
Тип значения - тип принимаемого значения может быть: непрерывный (real), например, длина, площадь, вес, скорость и т.д.; дискретный (integer), например, количество; качественный (перечисляемый), например, "малый", "средний", "большой"и т.п.; текстовый (string); ссылочный (адрес объекта);
Метод - вычислительная модель - способ вычисления атрибута.
Предметы имеют состав (детали) и схему соединения, т.е. описываются геометрическими моделями: кинематическая схема, чертеж, карта, изображение, 3D геометрическая модель:
<Предмет>:.= <Имя>, <Комментарий>, <Списокатрибутов>, [<Список компонент >,
[<Список отношениймежду компонентами >]], [<Теометрическаямодель >] <Комментарий> ::- <Текст на естественномязыке> <Атрибут> ::= [<Имя>], <Концепт-свойство>, <Диапазон изменениязначений >, < Ожидаемоезначение>,[<Единица измерения>], [< Экземпляр -метод >].
При конструировании концепта-предмета список его атрибутов набирается из ранее созданных концептов-свойств. При этом имя атрибута может быть переопределено, т.е. отличаться от имени прототипа. Например, имя концепта-свойства - "Цена", а имя соответствующего атрибута в концепте-предмете -"Цена стола".
Также можно переопределить и Метод, заданный в базовом концепте-свойстве, сославшись на другую формулу вычисления Цены.
В таблице экземпляров данного концепта каждый атрибут будет иметь значение и статус (изначально подставляется ожидаемое значение, потом оно может быть заменено на заданное или вычисленное, т.е. динамическое).
Список компонентов - это дерево входимости деталей в изделие. Во время конструирования концепта-предмета задается типовой состав, которому будут удовлетворять все его экземпляры (хотя там тоже допускаются исключения). Для этого достаточно перечислить все входящие в него подсборки (концепты или экземпляры) уровня и - 1, где и - текущий уровень сборки. Тогда полное дерево состава сгенерируется автоматически.
Список отношений между компонентами определяет относительное положение, типы соединений, степени свободы и т. п.
Концепты, принадлежащие одному классификационному дереву, в общем случае, наследуют все свойства своих предков и дополнительно приобретают новые. Иначе обстоит дело с составом, который, как сказано выше, есть разновидность геометрической модели. Состав бывает одинаковым для всех образцов концепта, но некоторые компоненты у того или иного образца могут быть утеряны или же заимствованы из объекта, принадлежащего другому генеалоги-
ческому дереву, другой предметной области,
Таким образом, в базе знаний выделены два механизма наследования:
- "предок-потомок" - для экономии при описании свойств;
- "сборка-деталь" - для удобства описания составных (многокомпонентных) объектов.
Механизм наследования свойств применяется к концептам как средство экономии хранения описаний тех свойств, для которых тип, диапазон, метод вычисления не меняются на младших уровнях иерархии в дереве классов.
Механизм заимствования компонентов состава применяется к конкретным образцам продукта для заимствования тех или иных деталей или подсбо-рок из ранее сконструированных изделий. Они находятся в других деревьях классов и в новой сборке для них пишутся только отличающиеся параметры.
Процессы отображают в базе знаний деятельность коллектива исполнителей в некотором отрезке времени и пространства. В общем случае, процессы имеют состав и алгоритм, т.е. их описание содержит вычислительные модели, которые подразделяются на три вида:
- поиск фактов и вычисление свойств;
- анализ ситуаций и исчисление (выявление) отношений;
- действия и работы.
Концепт процесса в общем случае имев! следующий вид: <Процесс>::=<Имя>, <Комментарий >,<Списокатрибутов>, [<Длительность>],[<Вычислительнаямодель >], <Список имен входных структур данных>, <Список имен выходных структур данных >, [<Составподпроцессов>, <Списокотношенийподпроцессов>].
Характерной особенностью списка атрибутов процесса является то, что он, помимо общих характеристик процесса, содержит атрибуты, описывающие роли участников действия:
- актор (исполнитель),
- бенефициант - заказчик, в чьих интересах выполняется действие, работа;
- реципиент - приемник действия;
- объект;
- инструмент и т.д.
Отношения между подпроцессами, как правило, бывают двух типов:
- отношения "кто за кем" аналогичны линиям передачи управления в блок-схеме программы;
- отношения "кто когда" отображают временную диаграмму с помощью множества бинарных отношений вида
(<р1, Щ, Рг-}.
где: Щ - смещение но времени между началом .¡-того процесса относительно конца /-того процесса.
Очевидно, /-тый процесс может быть выполнен только, если входные структуры данных для него заполнены. Отношения между подпроцессами могут быть синтезированы автоматически из схемы процесса.
Схема процесса задает порядок выполнения подпроцессов. Глубина вложенности или степень детализации не лимитируются по аналогии со структур -ным подходом к программированию.
На рис. 1 показан фрагмент схемы процесса. Здесь:
F- последовательность подпроцессов (Follow);
R - циклически с постусловием выполняемые подпроцессы (Repeat),
W- циклически с предусловием выполняемые подпроцессы (While);
С - выбор одного из нескольких подпроцессов (Case);
II - параллельно выполняемые действия (Parallel);
о - простой (неделимый) процесс (Simple); - перед и после имени процесса показывают, что здесь могут быть визуализированы имена входных / выходных структур данных.
Если считать процессы подготовки документов работами, то этот способ изображения схем процессов применим и к схемам документооборота.
Отношения устанавливают факты наличия разнообразных взаимосвязей между объектами. Отношения - это наиболее динамичный раздел базы знаний в том смысле, что они постоянно меняются в ходе осуществления какой-либо деятельности, В целом, в рамках данной модели знаний о предметной области можно рассматривать следующие виды отношений:
- отношения между свойствами, имеющими одинаковую природу, на экземплярах, принадлежащих одному или различным классам и деревьям;
- отношения между предметами;
- отношения между процессами;
- отношения между предметами и процессами.
Для этого необходимо определить набор методов (процессов) и задать соответствующие структуры концептов-отношений, экземплярами которых будут вычисленные или заданные извне факты: <Концепт-отношение> ::= <Имя>, [<Комментарий>],
<Имясуточнителямиобъекта 1>, <Ожидаемоезначение>, < Имя суточнителями объекта 2>, <Тип значения >, [<Единица измерения >, <Экземпляр-метод >.
Итак, предложенная модель знаний о предметной области характерна простотой и единообразием форм, ориентированных на автоматизированное решение задач:
- синтеза программ-запросов;
- планирования и анализа бизнес-процессов;
- оптимизации документооборота и бизнес-процессов.
Деревья знаний и схемы процессов практически содержат всю информацию, необходимую для визуального анализа и CASE-системы.
Рис. 1. Фрагмент схемы бизнес-процесса
В третьей главе рассматриваются возможности и особенности использования логики схем программ не только для описания и анализа бизнес-процессов и документооборота, но и для их синтеза, причем с учетом определенных условий (ограничений) на используемые ресурсы.
В логике схем программ предполагается, что действия являются необратимыми и расходуют некоторый ограниченный и не возобновляемый ресурс, т. е. любая комбинация (блок-схема, построенная из исходных действий с помощью конструкций последовательного исполнения (;), параллельного исполне-
ния (|), условного ветвления (if) и цикла (while)) действий может применятся только конечное число раз.
Система вывода логики схем программ является расширением системы естественного вывода классической логики первого порядка конструктивными правилами вывода, логически описывающие способы комбинации действий. Имеются эффективные алгоритмы решения проблемы поиска вывода.
Одним из очевидных приложений логики схем программ является использование ее для анализа логических спецификаций бизнес-процессов и синтеза схем их исполнения. Это связано с тем, что в реальных бизнес-процессах составляющие их действия могут повторяться только конечное число раз.
Рассмотрим интерпретацию основных понятий логики схем программ, подходящую для целей анализа и синтеза бизнес-процессов.
Описание бизнес-процессов организации на языке логики схем программ представляет собой множество логических формул (теорию) T(S,P), где
S - множество (пространство) возможных состояний системы в которой исполняются бизнес-процессы, которое характеризуется конечным набором параметров - переменных (разных типов), описывающих состояния
организации (или части организации), в которой исполняются бизнес-процессы, достаточно подробно;
Р ~ множество элементарных действий pi, р^ ..., рт используемых при исполнении бизнес-процессов.
Логическое описание T(S,P) бизнес-процессов организации включает в себя следующее:
1) описание TH(S) организации (ее части) в которой исполняются бизнес-процессы - множество формул классической логики первого порядка вида которые описывают основные понятия и сущности, отношения между ними, которые определяют множество возможных состояний с точностью, достаточной для описания элементарных действий, используемых при исполнении бизнес-процессов;
2) описание ТА(Р) элементарных действий Р, используемых при исполнении бизнес-процессов - множество конструктивных импликаций вида Ai(xj, Xj,
..., xrf ~> B/xi, х}, ..., Х/J, гдеЛ/Xj, Хц, ..., х^ иВ/дг,, хз.....- предусловие и
постусловие действия (не обязательно слабейшие или сильнейшие) соответственно. При этом, в соответствии с семантикой логики схем программ, действие и его описание должны быть корректны в том смысле, что:
а) исполнение действия возможно (допустимо) в любом состоянии, когда выполняется его предусловие;
б) исполнение действия заканчивается через конечное время в состоянии в котором выполняется его постусловие;
в) в процессе исполнения действие расходует некоторые заранее ограниченные ресурсы, т.е. может повторяться только конечное число раз;
3) описание T$(S,P) инвариантов действий системы Р - множество формул вида которые описывают окончательные (не изменяемые в ходе дальнейшего исполнения бизнес-процесса) результаты выполнения
элементарных действий.
Задача синтеза схем документооборота является частным случаем общей задачи синтеза схем процессов, но имеет ряд особенностей.
Рассмотрим на примере один из возможных подходов к логическому синтезу схем документооборота организации, основанный на использовании логики схем программ.
Предлагаемый подход основывается на следующих основных принципах и предположениях:
1. Основой документооборота являются реальные бизнес-процессы организации.
2. Каждое элементарное действие бизнес-процесса является полностью (в достаточной степени) документированным. Это означает, что:
а) факт (событие) получения (выделения) ресурсов (исполнителей, механизмов и т.п.) и информации (документов, указаний и т.п.) необходимых и достаточных для выполнения элементарного действия фиксируется документально, т.е. отражается и сохраняется в "документах" (бумажных или электронных документах, БД организации или в любой другой форме);
б) факт (успешного) выполнения элементарного действия и получения соответствующих результатов также фиксируется документально.
3. Каждое действие необратимо изменяет состояние бизнес-процесса (например, расходует некоторые ограниченные ресурсы) и может повторяться (в ходе исполнения бизнес-процесса) лишь конечное число раз.
4. Процесс документооборота можно рассматривать, как самостоятельный бизнес-процесс более высокого уровня, в ходе которого выполняются:
а) действия исходных бизнес-процессов (в их документальном отражении);
б) действия, которые представляют собой преобразование входных (первичных) документов в выходные (отчетные) документы в соответствии с определенными правилами. В реальной жизни такие действия могут выполняться некоторым подразделением организации, выполняющим обработку входных документов и выпуск отчетов, отдельным сотрудником, программой, установленной на компьютере и т.п.
5. Документы, однажды исполненные в ходе документооборота, хранятся в неизменном виде "вечно", т,е. являются инвариантами действий документооборота.
Таким образом, в каждой системе И документооборота организации (должно быть) определено следующее:
1. Множество документов исполняемых и оформляемых (в различных формах) в ходе исполнения бизнес-процессов (и соответствующего документооборота) организации. При логическом описании документооборота факт оформления документа dk надлежащим образом будет отражаться значением соответствующей логической переменной
2. Множество элементарных действий, порождающих (при наличии соответствующих условий) из одних документов - другие. При логическом описа-
нии документооборота каждому действию р, будет соответствовать конструк-тивнаяимпликация => В(> где 0/ - пред- и пост условия действия соответственно.
3. Множество ресурсов, необходимых для осуществления элементарных действий. При логическом описании документооборота тот факт, что при исполнении действия р, используется ресурс /у будет отражаться с помощью предиката ихефь /у. Используя его, можно определить предикат Жгее(г) = -лЗр\]м(р, г), означающий, что ресурс свободен, т.е. никаким действием не используется.
Итак, задача синтеза схемы документооборота может быть сформулирована следующим образом: построить схему действий, обеспечивающую получение необходимых документов, используя описание имеющихся в наличии ресурсов, документов и действий по ихпреобразованию.
Логическая спецификация задачи синтеза схемы документооборота Ф(Н) - конструктивная импликация вида А(Н) => В(Н), где:
А(Н) - предусловие расчета - формула, состоящая из позитивных вхождений переменных и предикатов описывающая документы и ресурсы, имеющиеся на начало процесса документооборота;
В(Н) - постусловие расчета - формула, состоящая из позитивных вхождений переменных описывающая документы, которые требуется получить в результате процесса документооборота.
Синтез схемы производится следующим образом.
Производится поиск вывода конструктивной импликации А(Н) => В(Н) в теории Т(Н,Р);
Если такой вывод найден, то из вывода автоматически извлекается схема документооборота, обеспечивающая получение требуемых документов, при наличии указанных документов и ресурсов. Эта схема может использования экспертом, в качестве исходной, для дальнейшего анализа, оптимизации и доработки.
Отсутствие вывода конструктивной импликации А(Н) -> В(Н) в теории Т(Н,Р) означает, что указанных документов и ресурсов недостаточно получения требуемых.
В работе рассмотрен вариант применения логики схем программ для синтеза схем документооборота на примере задачи учета выполнения строительно-монтажных работ. Полученная при этом схема бизнес-процессов показана на рис. 2 и 3. Здесь Р1(х)-Р9(х) - документы:
- накопительная смета по объекту;
- нормативная потребность в материалах;
- сопоставительная ведомость расхода материалов по исполнителям (материально-ответственным лицам);
- ведомость разницы сметной стоимости материалов по объекту;
- справка о стоимости выполненных работ по объекту;
- накопительная ведомость произведенных работ по объекту;
- реестр актов выполнения работ по исполнителям;
Рис. 2. Схема бизнес-процессов подготовительного этапа при строительстве зданий
Рис. 3. Универсальная схема операций но оформлению документов при строительстве здании
- анализ деятельности по исполнителям;
- справка о выполнении плана по исполнителям и по заказчикам.
В четвертой главе описывается алгоритм семантического анализа и кластеризации множества атрибутов документов, существующих и вводимых вновь при (ре)организации электронного документооборота. Предлагается метод распознавания семантической сущности атрибутов и их классификации, а также метод автоматического синтеза схемы документооборота на основе вычислительной зависимости атрибутов и знаний о регламенте делопроизводства предприятия. На основе результатов, полученных в этой и предыдущих главах, сформулирована общая методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Систематизация знаний о предметной области и построение классификационных деревьев основано на следующих принципах (аксиомах):
Аксиома 1. Множество объектов (понятий) может быть определено с помощью « параметров «-мерного пространства предметной области.
Каждый объект с помощью значений своих параметров отображается в этом пространстве точкой (вектором).
Аксиома 2. Множество объектов, существующих в мире предметной области, может быть разбито на классы, занимающие (в общем случае) некоторые комнатные области - кластеры.
Утверждение 1. Если выявить ключевые (в рамках некоторого класса задач) параметры, от значений которых зависят значения других параметров, т.е. наиболее весомые, то:
1) чем больше "вес" параметра, тем он выше должен располагаться в
классификационном дереве;
2) классификационное дерево можно упростить, оставив в нем только
ветви, соответствующие ключевым параметрам.
Ключевые параметры выявляются с помощью корреляционного анализа.
Утверждение 2. Кластеризация в «-мерном пространстве параметров может быть выполнена путем обычной сортировки по нескольким ключам (параметрам), расположенным в порядке их приоритета.
В разделе логических обобщений знания об объектах систематизируются следующим образом.
Определение 1, Класс K(Sign') образов объектов сигнатуры Sign' С Sign(0), где Sign(Ф) - значения имен признаков, - это множество образов, описанных эквивалентными по именам наборами признаков, которое отображается в некоторую компактную (выпуклую, односвязную) область «мерного пространства этих признаков.
Определение 2. Система знаний о свойствах объектов - это кортеж
S = <{0(УДФ)!, <Sign(TDu), {Sign(TD-')}.....{Sign(rD°)}>, D>,
где !G(V,E, Ф)} - множество графов образов объектов;
<Sign(ro), {Sign(T[)"'1)}, ..., {Sign(rD°)}> - кортеж сигнатур признаков TD",
То"', С Т(Ф), такой, что V К&8п/Г1:;")) = (здесь)
D - дерево (граф) классов, вершинами которого являются ребра гиперграфа, определенного на множестве образов системы знаний, т.е. все образы, оказываются разбитыми по некоторому подмножеству V признаков на классы, которые, в свою очередь, по подмножеству Т"'1 признаков разбиты на подклассы, и т.д.
В зависимости от заданной иерархии имен признаков на одном и том же множестве образов объектов может быть построено множество различных классификационных деревьев и, следовательно, столько же систем знаний о свойствах этого множества объектов.
Определение 3. Если диапазон {х, у} изменения всех одноименных количественных признаков системы S на основании статистического распределения разбит на множество кластеров (поддиапазонов),
то номер} кластера, к которому относится значение /-того признака, есть качественное (грубое) значение Ф количественного признака.
Таким образом, множества образов объектов, близких в п-мерном пространстве признаков, объединяются в классы, которые являются подклассами более старших классов и т.д. Эти иерархии образуют системы знаний (классов) о свойствах объектов. Строится дерево классов, исходящее из некоторого множества "близких" образов.
Укрупнено, порядок решения задачи построения описания предметной области выглядит следующим образом:
1. Предобработки бумажных документов - сканирование и преобразование в текстово-графическую форму.
2. Распознавание атрибутов (полей) документов.
2.1. Поиск копий идентификатора очередною атрибута среди ранее обработанных.
2.2. Морфологический разбор идентификатора с целью нахождения "похожих". В общем случае, идентификатор состоит из нескольких слов, например: "Общий стажработы", "Стажработы па предприятии". Упрощенная модель слова:
[<приставка> ]<основа>[ <суффикс>/^окончание >],
где символы "[", "]"выделяют необязательную часть, "/'-альтернативную,
В результате морфологического разбора получаем вектор в морфологическом пространстве переменной размерности, параметрами которого служат: количество слов в идентификаторе и их морфологические признаки. По близости векторов можно судить о степени похожести идентификаторов и выявить случаи сокращения или перестановки слов, поскольку вероятность грамматических ошибок в написании идентификаторов очень мала.
2.3. Сопоставление параметров значения (тип, диапазон, единица измерения) с соответствующими параметрами найденных копий и похожих идентификаторов с целью их сокращения.
2.4. Распознавание метода исчисления атрибута. Представим метод в
виде многослойного полихроматического графа, вершинами которого являются переменные (атрибуты документа), а дугами - операции между ними. Операции типа "сложение", "умножение", "сцепление" образуют двунаправленные дуги; вычитание, деление - однонаправленные; возведение в степень, извлечение корня - петли; круглые скобки образуют переход на старший слой:
где: V- множество вершину, отображающих подобъекгы уровня и-1;
Е - семейство ребер е еЕ ~ (5?""', ')• 8"' е К отображающих
отношения между подобъектами;
А = (АН, ЕН) - гиперграф атрибутов (параметров) «йп^ £ А ире-
бер еИ € ЕН, которые показывают принадлежность атрибутов из множества А некоторой вершине или ребру
Пусть О, = О(У„ Е,, А) - граф известного (эталонного) образа;
02 = О(У2, Е, А) - граф анализируемого образа;
г = <А, А"> - гребенка анализируемых признаков, где А'- множество имен признаков, определяющее степень абстракции',
А" - множество коэффициентов, определяющих точность сравнения признаков как
<&)< -йи а"к-
Будем называть общей гомоморфной частью '¡) графов 01 и 02 часть О', определенную на множестве У2 и состоящую из всех ребер Т(Е= ) Е2 = для которых существуют соответствующие ребра
Е, = (ян, ^ = т -'(Е2) « (т '(Ы Яи, 8о е V,,
в графе 01, при этом однозначное отображение т существует тогда и только тогда, когда вершины Ян, и соответствующие им прообразы Яц, яу совпадают в «-мерном пространстве А' анализируемых признаков с точностью, заданной А".
Оценка сходства образов, взвешенная по к-тому свойству, есть
где - протяженность цепочки вычисленная с помощью суммируемых
по цепочке значений к-того свойства вершин, что автоматически придает больший вес совпадению тех элементов объектов, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными.
Вычисленная таким образом оценка сходства метода исчисления некоторого атрибута документа с ранее проанализированным методом позволяет оценить степень их близости и принять решение о единстве семантической сущности.
3. Представление очередного документа и его реквизита в терминах базы знаний о предметной области.
4. Кластеризация атрибутов. Примем следующие допущения:
1. Документ есть образ некоторого предмета или процесса.
2. Семантическая сущность (смысл) некоторого реквизита документа определяетсяметодом его исчисления.
Рис. 4. Синонимы
Рис. 5. Аналоги
Рис. 6. Омонимы новизны Рис. 7. Омонимы псевдоновизны
Тогда, по результатам сравнения идентификаторов двух реквизитов из разных документов, а также параметров их значений и методов исчисления мы получим ситуации, изображенные на рис. 4-7:
1. Синонимы ~ идентификаторы разные, а метод исчисления и область исходных данных одни. В этом случае рекомендуется заменить NAME2 на NAMEt или поместить в один кластер и в словарь синонимов (рис, 4),
2. Аналоги - метод исчисления один, а области данных разные, т.е. один и тот же закон существует в разных областях знаний. Желательно, чтобы идентификаторы в документах DOC,, DOC, DOC3 содержали одно и то же слою и уточняющие слова (рис, 5).
3. Омонимы - идентификаторы одинаковые, а сущность (метод и область данных) - разные. Рекомендуется либо сменить имя в DOC2, либо, если данные DATA2 могут быть преобразованы в DATA,, имеем "новизну" - альтернативный путь вычисления (рис. 6).
4. Омонимы - идентификаторы одинаковые, методы исчисления разные, исходные данные - одни. Ситуация "псевдоновизны": рекомендуется заменить
METHOD: на METHOD], т.е. методы могут быть преобразованы один в другой (рис. 7).
5. Синтез схемы документооборота. Схема документооборота (в первом приближении) синтезируется путем ранжирования документов по данным, необходимым для их получения. Пусть имеется:
- множество {ATR} атрибутов, из которых составляются документы;
- множество {МЕТ} методов (схем) вычисления атрибутов;
- множество {DOC} документов, которые должна поддерживать система электронного документооборота (СЭД);
Алгоритм:
1. Ранжирование элементов множества {DOC} на основе множества {Р} правил регламентации. Формирование списка подмножеств <DOC' ..., DOCn'>,
, где все элементы одного подмножества имеют одинаковый
приоритет.
2. Выборка фактов наличия связей между атрибутами документов, справочниками и методами вычисления атрибутов.
2.1. Выявление связей типа "заимствование значения":
doc,[atrJ 4- fCfexmrfatrJ}, (i) где K"[exmk] - k-тый экземпляр концепта-предмета уровня и;
doc,[atrJ 4- docrfatrj. (2)
2.2. Выявление связей 1п типа "участники действия":
docifatrj -*metk> (3)
показывающих, каким способом вычисляется и от каких величин зависит]-тый атрибут i-того документа.
2.3. Развертка вычислительных отношений (3) в подмножество связей вида (1) и (2).
3. Синтез последовательности действий (документов) такой, что все данные, необходимые для оформления i-того документа существуют.
В целом, методика анализа и проектирования документооборота с применением вышеописанного инструментария принимает следующий вид:
1. Описание атрибутов документов и таблиц в редакторе баз данных и знаний Рнс. 8. Архитектура системы анализа системы (рис. 8) Documents Circulation и проектирования документооборота Analysis (DCA).
АС милни
и проектирования документооборота
Редактор БД и Б')
Редактор методов
Редактор схем БП
Анализ ДО
Синтез схем ДО
Конструктор форм
Конструктор отчетов
2. Автоматический анализ атрибутов.
2.1. Выявление одинаковых и похожих по написанию наименований по близости векторов в пространстве морфологических признаков, а также типов, диапазонов и единиц измерения значений.
2.2. Сравнение схем вычисления атрибутов,
2.3. Кластеризация и классификация множества атрибутов путем выявления синонимов, аналогов, омонимов на основе их семантической сущности.
3. Описание сущностей предметной области - предметов, процессов, методов, отношений в системе DCA,
4. Автоматическая классификация сущностей предметной области путем построения классификационных деревьев. Построение таблиц связей.
5. Автоматический синтез схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
6. Логический анализ и синтез схем бизнес-процессов.
7. Автоматический синтез схемы документооборота на основе логики схем программ.
Предложенная методика, на наш взгляд, позволяют получить следующий эффект:
1. Унификация и сокращение общего количества атрибутов и их схем вычислений.
2. Наглядность деревьев сущностей и сокращение количество таблиц в базе данных.
3. Автоматический синтез схемы документооборота, согласование всех этапов получения документов и отчетов.
4. Обеспечение контроля бизнес-процессов и поддержки принятия управленческих решений.
5. Расширение возможности СЭД путем добавления новых сущностей, документов и отчетов без привлечения разработчиков.
Если к описанному инструментарию добавить стандартные компоненты Конструктор форм, Конструктор Отчетов и Интернет-браузер, мы получаем систему электронного документооборота, которая может успешно работать на махгых и средних объемах информации.
По окончании опытной эксплуатации системы и результатам анализа ее эффективности принимается решение:
- либо разрабатышать специализированную базу данныж на доступной СУБД и результаты, полученные по данной методике, используются в качестве проекта БД,
- либо оставить в таком виде с учетом того, что в процессе эксплуатации система непрерывно пополняется в соответствии с новыми потребностями по этой же методике, пока не переполнится, т.е. начнет замедлять доступ к данным. Тогда также принимается решение о необходимости разработки специализированной БД.
Для оценки экономии от использования предлагаемого методического аппарата при разработке СЭД, выполнена экспертная оценка трудоемкости основных этапов разработки и внедрения СЭД по вариантам:
1) традиционное проектирование с использованием СУБД типа Access, Visual FoxPro и/или CASE - средство ERwin;
2) проектирование с помощью предлагаемого методического аппарата.
В табл. 1 приведены основные работы, по которым эксперты давали оценки трудоемкости по сравниваемым вариантам, Во внимание принимались только те работы, по которым наблюдается изменение трудоемкости. При определении трудоемкости учитывалось, что по варианту 1 строится модель данных. Для обеспечения сопоставимости вариантов предполагалось, что кроме разработки модели данных в проект закладывается поддержка традиционными средствами (триггеры, хранимые процедуры, ссылочная целостность и т.п.) бизнес-правил и бизнес-логики. Данные в таблице приведены в человеко-днях. Расчетные формулы рассмотрены ранее.
Таблица 1
Расчет трудоемкости по сравниваемым вариантам
Наименование работы Эксперт! ЭК01еРТ2 Эксперта 1|" ь-
1)ЦЖШТ) 1 Вариант 2 Вариант) Вариант I Вариант) Вариант 2
<11 til чЛ in"" •и*" 1|" 1»" 111" нГ la" lu- hi hi** 1»- ьГ I»"" 1»"
tapMupon-WIHHB Id и 10.1 5 • 5.4 и и 121 1 J ll 1J 13 13.8 1 » 3 аз 3
Эоттшаим юкументо. ¡«ори» Пиработт кмыоаа- iMbCtoro дятерфсяса Прочие рс* ЯСИН! к 21 II 8 it 9.2 17 19 178 10 И 104 18 20 18.8 4 И 9.8 182 10
7 9 7.8 9 10 9.4 8 10 8.8 в 10 II 10 11 104 10 II 10.4 9 10
22 и 23.6 2) 25 23.8 2] 27 23.8 23 27 24« 24 28 23.8 2« 27 26.4 25 23
ИТОГО: •4.7 98
Экономическую эффективность от внедрения методического аппарата рассчитаем по формуле:
К - (Т, Т2) 'Т, * 100%,
где Т1 - ожидаемая трудоемкость создания СЭД без использования предлагаемой методики;
Т2 - ожидаемая трудоемкость создания СЭД с использованием предлагаемой методики. Ожидаемая трудоемкость создания СЭД:
где 1 - порядковый номер варианта.
Таким образом, по данным табл. 1 эффективность применения предлагаемое методического аппарата на этапе разработки системы электронного документооборота составляет:
К = (64.7 - 50)/58.5* 100% = 22.7%.
ЗАКЛЮЧЕНИЕ
В работе получены следующие основные выводы и результаты:
1. Для малых и средних предприятий экономически не всегда оправдывается приобретение дорогостоящих систем электронного документооборота или средств их разработки, ввиду дорогостоящего внедрения, высокой сложности методологий и трудоемкости процессов анализа, необходимости тесного сотрудничества экспертов в предметной области и программистов высокой квалификации. Бурное развитие методов искусственного интеллекта позволяет предположить, что уже в ближайшее время специалисты в той или иной предметной области смогут самостоятельно, без привлечения программистов описывать технологию информационного обеспечения бизнес-процессов, управления ими и анализа эффективности.
2. Предложена модель знаний о предметной области для автоматизированного проектирования систем электронного документооборота (СЭД), в которой информация явным образом разделена на два основных компонента: декларативные (описательные) и императивные (процедурные) знания, отображаемые в виде иерархий (деревьев) на различных множествах объектов, что обеспечивает, с одной стороны, наглядность и удобство пополнения, с другой -универсальность по отношению к различным предметным областям.
3. Показаны возможности исчисления (выявления) на предложенных моделях различных видов отношений между свойствами, предметами, процессами, ролевые отношения между участниками бизнес-процесса, между участниками и предметами сцены, которые необходимы для поддержки принятия решений.
4. Сформулирована содержательная интерпретация формальной математической семантики логики схем программ, ориентированная на описание бизнес-процессов и, в том числе, документооборота предприятия.
5. Предложен алгоритм логического вывода схем программ.
6. Рассмотрены возможности логического описания и автоматического анализа и синтеза схем бизнес-процессов с помощью логики схем программ,
7. Сформулированы основные принципы логического описания документооборота предприятия и рассмотрен конкретный пример описания и синтеза схемы документооборота.
8. Предложен метод распознавания семантической сущности атрибутов таблиц и документов путем оценки близости векторов в пространстве морфологических признаков, семантического анализа схем их вычисления и сравнения типов, диапазонов, единиц измерения значений.
9. Разработан метод кластеризации атрибутов документов, заключающийся в выявлении синонимов, аналогов, омонимов на основе их семантической сущности.
10. Предложен метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
11. Приведена архитектура автоматизированной системы анализа документооборота.
12. Сформулирована общая методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Экономия от использования предлагаемого методического аппарата при разработке СЭД, рассчитанная на основе экспертных оценок трудоемкостей но сравнению с традиционным проектированием с использованием СУБД Access, Visual FoxPro и/или CASE-средства ERwin, составила более 20%.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ ПУБЛИКАЦИЯХ
1. Ахмад Б., Кучуганов В.П. Некоторые подходы к интеллектуализации систем офисного документооборота // Перспективные информационные технологии и интеллектуальные системы. - № 4(16), 2003. С. 72-81 -http://pitis.tsme.ru
2. Ахмад Б., Кучуганов В.И. Вопросы автоматизации анализа и описания документооборота // Труды TV Электронной заочной конференции "Молодежь, студенчество, наука XXI века" - Ижевск: Изд-во ИжГТУ, 2004. -С. 3-11.
3. Ахмад Б,, Кучуганов В.И. Логический синтез схем документооборота // VII Всероссийская с международным участием научная конференция молодых ученых и аспирантов "Новые информационные технологии. Разработка и аспекты применения". Таганрог, 2004, С. 76-81.
4. Ахмад Б. Логический синтез схем бизнес-процессов//Труды научно-технического форума с международным участием "Высокие технологии-2004" ()5 четырех частях). 4.1 -Ижевск: Изд-во ИжГТУ, 2004. - С. 12-17.
5. Ахмад Б. Интеллектуальные компоненты для автома газированного проектирования систем электронного документооборота // Интеллектуальные системы в производстве, № 1. - Ижевск: Изд-во ИжГТУ, 2005. - С. 101 -112.
6. Ahmad В., Kuchuganov V.N. Automation analysis matters and document circulation description (в печати).
7. Ahmad В., Kuchuganov V.N. Some approache intcllectualization of office document circulation systems (в печати).
Baulcr rffbrruvl
05~. Ш - 05. /3
Подписано в печать 14.04.05. Усл. печ. л. 1,4. Тираж 100 экз. Заказ №130 Отпечатано в типографии Издательства Иж1 "ГУ
Типография Издательства Ижевского государственного технического университета
426069, Ижевск,, Студенческая, 7 ' & \
» • 4" 4
19 МАЙ 2005 Ч 1/305
Оглавление автор диссертации — кандидата технических наук Ахмад Бадер
ВВЕДЕНИЕ.
1. МЕТОДЫ И СИСТЕМЫ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ БИЗНЕС-ПРОЦЕССОВ И ДОКУМЕНТООБОРОТА.
1.1. Методология функционального моделирования БАОТ.
1.2. Моделирование потоков данных (процессов).
1.3. Моделирование данных.'.
1.4. Общая характеристика и классификация САБЕ-средств.
1.5. Общая характеристика и классификация систем документооборота.
1.6. Выводы и постановка задачи.
2. МОДЕЛЬ ЗНАНИЙ О ПРЕДМЕТНОЙ ОБЛАСТИ.
2.1. Архитектура базы знаний о предметной области.
2.2. Описание атрибутов.
2.3. Описание предметов. 2.4. Описание процессов и методов.
2.5. Описание отношений.
2.6. Выводы по главе.
3. ЛОГИЧЕСКИЙ СИНТЕЗ СХЕМ ДОКУМЕНТООБОРОТА.
3.1. Логика схем программ.
3.2. Логическое описание схем процессов.
3.3. Логический анализ и синтез схем процессов.
3.4. Синтез схем документооборота.
3.5. Выводы по главе.
4. АВТОМАТИЗАЦИЯ ПРОЦЕССОВ АНАЛИЗА 81 ПРЕДМЕТНОЙ ОБЛАСТИ И БИЗНЕС-ПРОЦЕССОВ.
4.1. Семантический анализ и кластеризация атрибутов.
4.2. Кластеризация объектов и построение классификационных деревьев.
4.3. Ранжирование документов на основе знаний о предметной области.
4.4. Автоматизированная система анализа и проектирования документооборота. 4.5. Выводы по главе.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Ахмад Бадер
В настоящее время очевидным является факт, что эффективное управление предприятием (крупным, средним, малым) невозможно без использования более или менее развитых систем электронного документооборота (СЭД) предприятия. В частности, СЭД предприятия является обязательной составляющей любой системы комплексной автоматизации управления предприятием (бизнес-процессами). В связи с этим, рынок информационных технологий и программных продуктов, позволяющих ускорить создание и, самое главное, облегчить дальнейшее сопровождение СЭД конкретного предприятия, является одним из самых бурно развивающихся в сфере ИТ.
Основой современных САБЕ-систем, обеспечивающих поддержку жизненного цикла (ЖЦ) информационной системы (ИС) предприятия в постоянно меняющихся рыночных условиях, является информационная модель (ИМ) предприятия (его бизнес-процессов). Именно формальная (математическая) ИМ предприятия позволяет применять формальные (алгоритмизуемые) методы и технологии для автоматизации поддержки ЖЦ ИС предприятия.
Практически все известные САБЕ-системы используют представление ИМ предприятия, основанное на применении методологий и стандартов семейства ГОЕР или их модификациях. На основе таких ИМ можно проводить системный анализ и оптимизацию бизнес-процессов предприятия и даже частичный синтез (структура хранилищ данных, учет и контроль событий, в том числе, связанных с оформлением документов) ИС предприятия.
К сожалению, все эти методологии и стандарты изначально ориентированны преимущественно на описание уже существующих бизнес - процессов и документооборота организации, а не на синтез новых. Кроме этого, для малых и средних предприятий экономически не всегда оправдывается приобретение дорогостоящих систем электронного документооборота или средств их разработки, ввиду дорогостоящего внедрения, высокой сложности методологий и трудоемкости процессов анализа, необходимости тесного сотрудничества экспертов в предметной области и программистов высокой квалификации.
Таким образом, актуальной является задача повышения степени автоматизации процессов системного анализа документооборота, снижения трудоемкости проектирования систем электронного документооборота, и, тем самым, повышения эффективности управления бизнес-процессами на малых и средних предприятиях путем разработки формальных методов и алгоритмов анализа документооборота и бизнес-процессов, основанных на методах искусственного интеллекта.
Бурное развитие методов искусственного интеллекта позволяет предположить, что уже в ближайшее время специалисты в той или иной предметной области смогут самостоятельно, без привлечения программистов описывать технологию информационного обеспечения бизнес-процессов, управления ими и анализа эффективности.
Объектом исследования является информационное обеспечение средних и малых предприятий: бизнес-процессов, существующего документооборота и потребностей в реорганизации информационной системы предприятия.
Предметом исследования являются методы и средства автоматизации анализа бизнес-процессов, документооборота и проектирования информационных систем.
Цель работы. Повышение степени автоматизации процессов системного анализа документооборота, снижение трудоемкости проектирования систем электронного документооборота, и, тем самым, повышение эффективности управления бизнес-процессами на малых и средних предприятиях путем разработки формальных методов и алгоритмов анализа документооборота и бизнес-процессов, основанных на методах искусственного интеллекта.
Основные задачи.
1. Аналитический обзор методов и систем анализа бизнес-процессов и документооборота, методов и средств автоматизации проектирования баз данных и систем электронного документооборота (СЭД).
2. Разработка математической модели предметной области предприятия.
3. Разработка методики автоматизированного системного анализа существующего на предприятии документооборота.
4. Разработка методов логического анализа и синтеза схем процессов.
5. Разработка метода логического синтеза схем документооборота.
6. Разработка и исследование интеллектуальных программных компонент для автоматизированных систем анализа документооборота.
Методы исследования. Теоретические исследования выполнены с использованием теории множеств, теории графов, математической логики, математического моделирования.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается корректностью разработанных математических моделей, их адекватностью по известным критериям оценки в рассматриваемой предметной области, использованием известных положений фундаментальных наук, положительными результатами проведенных экспериментов.
На защиту выносятся:
- модель знаний о предметной области бизнес-процессов и документооборота предприятия;
- методы исчисления (выявления) на предложенных моделях различных видов отношений между свойствами, предметами, процессами;
- метод логического описания и автоматического анализа и синтеза схем бизнес-процессов с помощью логики схем программ;
- принципы логического описания документооборота предприятия;
- пример описания и синтеза схемы документооборота;
- метод распознавания семантической сущности атрибутов таблиц и документов;
- метод кластеризации атрибутов документов;
- метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов и знаний о регламенте делопроизводства предприятия;
- архитектура автоматизированной системы анализа документооборота;
- общая методика анализа проблемной ситуации.
Научная новизна.
1. Модель знаний о предметной области документооборота предприятия в виде совокупности деревьев знаний о предметах, документах, процессах и отношениях, представляемых с помощью атрибутов и методов их получения.
2. Метод логического синтеза схем документооборота предприятия на основе логики схем программ.
3. Метод кластеризации атрибутов существующих документов, заключающийся в морфологическом и синтаксическом анализе идентификаторов, семантическом анализе методов их вычисления, а также сопоставлении типов, диапазонов, единиц измерения значений.
4. Метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
5. Методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Практическая полезность и реализация.
1. Полученные в работе методы и алгоритмы позволяют повысить степень автоматизации процессов анализа существующих на предприятиях бизнес-процессов и проектирования систем электронного документооборота.
2. Разработанные на основе предложенных методов интеллектуальные программные компоненты могут быть использованы в САПР баз данных и системах управления бизнес-процессами, а также в учебном процессе ВУЗов для студентов соответствующих специальностей.
3. Разработанная на основе предложенных методов программная система DCA для анализа и проектирования систем электронного документооборота внедрена: на ФГУП "Ижевский механический завод"; в Министерстве образования и науки Удмуртской Республики.
Апробация работы. Основные положения диссертационной работы докладывались на 2-х международных конференциях: на VII Всероссийской с международным участием научной конференции молодых ученых и аспирантов "Новые информационные технологии. Разработка и аспекты применения". Таганрог, 2004; на научно-техническом форуме с международным участием "Высокие технологии-2004", Ижевск 2004. Работа многократно обсуждалась на постоянном семинаре "Системный анализ, управление и обработка информации" кафедр "Автоматизированные системы обработки информации и управления" и "Вычислительная техника" Ижевского государственного технического университета.
Публикации. Результаты работы отражены в 6 научных публикациях, в том числе в 5 статьях в журналах и сборниках, в 2-х докладах на научно-технических конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 110 машинописных листах с таблицами и иллюстрациями. Список литературы включает 43 наименования.
В первой главе проанализированы существующие на данный момент методы и системы информационного обеспечения бизнес-процессов и документооборота: описаны наиболее распространенные методологии и стандарты моделирования информационных систем, дана общая характеристика и классификация САБЕ-средств и систем электронного документооборота.
Во второй главе предлагается модель представления знаний о предметной области информационной системы, в которой информация явным образом разделена на два основных компонента: декларативные (описательные) и императивные (процедурные) знания, отображаемые в виде иерархий (деревьев) на различных множествах объектов и связей между ними, что обеспечивает, с одной стороны, наглядность и удобство пополнения, с другой -универсальность по отношению к различным предметным областям.
В третьей главе рассматриваются возможности и особенности использования логики схем программ не только для описания и анализа бизнес-процессов и документооборота, но и для их синтеза, причем с учетом определенных условий (ограничений) на используемые ресурсы.
В четвертой главе описывается алгоритм семантического анализа и кластеризации множества атрибутов документов, существующих и вводимых вновь при (ре)организации электронного документооборота. Предлагается метод распознавания семантической сущности атрибутов и их классификации, а также метод автоматического синтеза схемы документооборота на основе вычислительной зависимости атрибутов и знаний о регламенте делопроизводства предприятия. На основе результатов, полученных в этой и предыдущих главах, сформулирована общая методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Заключение диссертация на тему "Интеллектуальные компоненты для автоматизированного проектирования систем электронного документооборота"
4.5. Выводы по главе
1. Предложен метод распознавания семантической сущности атрибутов таблиц и документов путем оценки близости векторов в пространстве морфологических признаков, семантического анализа схем их вычисления и сравнения типов, диапазонов, единиц измерения значений.
2. Разработан метод кластеризации атрибутов документов, заключающийся в выявлении синонимов, аналогов, омонимов на основе их семантической сущности.
3. Предложен метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
4. Приведена архитектура автоматизированной системы анализа документооборота.
5. На основе результатов, полученных в этой и предыдущих главах, сформулирована общая методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез. Основное отличие от технологии ГОЕР состоит в том, что здесь вначале описывается предметная область в виде деревьев понятий предметов, методов и отношений между ними, а потом автоматически синтезируются или описываются в интерактивном режиме графические схемы бизнес-процессов.
Экономия от использования предлагаемого методического аппарата при разработке СЭД, рассчитанная на основе экспертных оценок трудоемкостей по сравнению с традиционным проектированием с использованием СУБД Access, Visual FoxPro и/или CASE - средства ERwin, составила более 20%.
ЗАКЛЮЧЕНИЕ
В работе получены следующие основные выводы и результаты:
1. Для малых и средних предприятий экономически не всегда оправдывается приобретение дорогостоящих систем электронного документооборота или средств их разработки, ввиду дорогостоящего внедрения, высокой сложности методологий и трудоемкости процессов анализа, необходимости тесного сотрудничества экспертов в предметной области и программистов высокой квалификации. Бурное развитие методов искусственного интеллекта позволяет предположить, что уже в ближайшее время специалисты в той или иной предметной области смогут самостоятельно, без привлечения программистов описывать технологию информационного обеспечения бизнес-процессов, управления ими и анализа эффективности.
2. Предложена модель знаний о предметной области для автоматизированного проектирования систем электронного документооборота (СЭД), в которой информация явным образом разделена на два основных компонента: декларативные (описательные) и императивные (процедурные) знания, отображаемые в виде иерархий (деревьев) на различных множествах объектов, что обеспечивает, с одной стороны, наглядность и удобство пополнения, с другой - универсальность по отношению к различным предметным областям.
3. Показаны возможности исчисления (выявления) на предложенных моделях различных видов отношений между свойствами, предметами, процессами, ролевые отношения между участниками бизнес-процесса, между участниками и предметами сцены, которые необходимы для поддержки принятия решений.
4. Сформулирована содержательная интерпретация формальной математической семантики логики схем программ, ориентированная на описание бизнес-процессов и, в том числе, документооборота предприятия.
5. Предложен алгоритм логического вывода схем программ.
6. Рассмотрены возможности логического описания и автоматического анализа и синтеза схем бизнес-процессов с помощью логики схем программ.
7. Сформулированы основные принципы логического описания документооборота предприятия и рассмотрен конкретный пример описания и синтеза схемы документооборота.
8. Предложен метод распознавания семантической сущности атрибутов таблиц и документов путем оценки близости векторов в пространстве морфологических признаков, семантического анализа схем их вычисления и сравнения типов, диапазонов, единиц измерения значений.
9. Разработан метод кластеризации атрибутов документов, заключающийся в выявлении синонимов, аналогов, омонимов на основе их семантической сущности.
10. Предложен метод синтеза схемы документооборота на основе вычислительной зависимости атрибутов документов, знаний о регламенте делопроизводства предприятия, а также методов интуиционистской логики.
11. Приведена архитектура автоматизированной системы анализа документооборота.
12. Сформулирована общая методика анализа проблемной ситуации, обеспечивающая наглядное и эффективное представление знаний о бизнес-процессах и документообороте предприятия, их анализ и синтез.
Экономия от использования предлагаемого методического аппарата при разработке СЭД, рассчитанная на основе экспертных оценок трудоемко-стей по сравнению с традиционным проектированием с использованием СУБД Access, Visual FoxPro и/или CASE-средства ERwin, составила более 20%.
Библиография Ахмад Бадер, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Ахмад Б., Кучуганов В.Н. Некоторые подходы к интеллектуализации систем офисного документооборота // Перспективные информационные технологии и интеллектуальные системы. - № 4(16), 2003. С. 72-81 -http://pitis.tsure.ru
2. Ахмад Б., Кучуганов В.Н. Вопросы автоматизации анализа и описания документооборота // Труды IV Электронной заочной конференции "Молодежь, студенчество, наука XXI века" Ижевск: Изд-во ИжГТУ, 2004. -С.3-11.
3. Ахмад Б. Логический синтез схем бизнес-процессов // Труды научно-технического форума с международным участием "Высокие технологии-2004" (в четырех частях). 4.1 Ижевск: Изд-во ИжГТУ, 2004. - С. 12-17.
4. Ахмад Б. Интеллектуальные компоненты для автоматизированного проектирования систем электронного документооборота // Интеллектуальные системы в производстве, № 1. Ижевск: Изд-во ИжГТУ, 2005. - С. 101-112.
5. Браун С. Visual Basic: учебный курс. СПб.: Питер, 2002. - 576 с.
6. Буч Г., Рамбо Д., Джекобсон А. Язык UML. Руководство пользователя / Пер. с англ. М.: ДМК, 2000. - 432 с.
7. Вендров A.M. CASE-технологии. Современные методы и средства проектирования информационных систем. М.: Финансы и статистика, 1998. - 176 с.
8. Громов А., Каменнова М., Старыгин А. Управление бизнес-процессами на основе технологии Workflow. Открытые системы, №1, 1997.
9. Губарьков M., Кучуганов M. О выводимости в логиках схем программ // Вычислительные системы, вып. 129, Новосибирск, 1989. С.67-78.
10. Калянов Г.Н. CASE: структурный системный анализ (автоматизация и применение). М.: Изд-во "ЛОРИ", 1996. - 250 с.
11. Калянов Г.Н. CASE технологии. Консалтинг при автоматизации бизнес процессов. - М.: Горячая линия - Телеком, 2000. - 320 с.
12. Клыков Ю.И. Ситуационное управление большими системами. -М.: Энергия, 1974.-С. 135.
13. Колетски П., Дорси П.: Oracle Designer. Настольная книга пользователя. М.:, Изд-во "ЛОРИ", 1999. - 592 с.
14. Кулопулос Томас М. Необходимость Workflow, решения для реального бизнеса. Пер. с англ. Весть-Метатехнология, 2000. - 384 с.
15. Кучуганов В.Н. Семантика графической информации. Известия ТРТУ. Тематич. вып. "Интеллектуальные САПР". Материалы междунар. научн.-техн. конф. "Интеллектуальные САПР". Таганрог: Изд-во ТРТУ, 2002, №3(26). С. 157-166.
16. Маклаков C.B. BPwin и Erwin. CASE-средства разработки информационных систем. М.: ДИАЛОГ-МИФИ, 1999. - 256 с.
17. Маклаков C.B. Моделирование бизнес процессов с BPWin. M.: ДИАЛОГ - МИФИ, 2002. - 224 с.
18. Марка Д.А., МакГоуэн К.Л. SADT: Методология структурного анализа и проектирования. М.: Мета Технология, 1993, - 240 с.
19. Непейвода H.H. Некоторые семантические конструкции конструктивных логик схем программ. // Вычислительные системы, вып. 129, Новосибирск, 1989. С. 49-66.
20. Ойхман Е.Г., Попов Э.В. Реинжиниринг бизнеса: Реинжиниринг организаций и информационные технологии. -М.: Финансы и статистика, 1997. -336 с.
21. Перспективы Workflow в России, Еженедельник "Computerworld Россия", №13, 2000.
22. Попов Э.В. Общение с ЭВМ на естественном языке. Высшая школа: М., 1992.-360 с.
23. Поспелов Д.А., Пушкин В.Н. Мышление и автоматы. М.: Сов. радио, 1972. - С. 224.
24. Поспелов Д.А. Логико-лингвистические модели в системах управления. -М.: Энергоиздат, 1981. С. 231.
25. Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. -М.: Мир, 1978.-С.411.
26. Хаммер М., Чампи Дж. Реинжиниринг корпорации: Манифест революции в бизнесе. СПб.: Изд-во С.- Петербургского ун-та, 1997. - 332 с.
27. Чеппел Д. Технология ActiveX, OLE/Пер. с англ. М.: Издательский отдел "Русская редакция" ТОО "Channel Trading Ltd", 1997. - 320 с.
28. A Common Object Model Discussion Paper.-Winchester, UK: Workflow Management Coalition, 1998.
29. Ahmad В., Kuchuganov V.N. Automation analysis matters and document circulation description (в печати).
30. Ahmad В., Kuchuganov V.N. Some approache intellectualization of office document circulation systems (в печати).
31. Anderberg M.R. Cluster Analysis for Applications. Academic Press, New York, 1973.
32. Audit Data Specification.- Workflow Management Coalition, 1998.
33. Barker R. CASE*Method. Entity-Relationship Modelling. Copyright Oracle Corporation UK Limited, Addison-Wesley Publishing Co., 1990.
34. Gane Ch., Sarson T. Structured System Analysis. Prentice-Hall, 1979.
35. Hollingsworth D. Workflow Managment Coalition: The Workflow Reference Model., 1995.
36. IDEF.Integrated DEFinition Methods, http://www.idef.com.
37. Kuchuganov M. A predicate logic of well founded actions // Lecture Notes in Computer Science, v. 813 (1994). P. 218-226.
38. Kuchuganov V.N. Project and alfa-version of a training system for information technology and expert systems development. The Second Intern. Al Shaam Conf. on Inform. Technology: Damascus - Syria, 1999. P. 85.
39. Using ADO. MSDN Library Microsoft, 2001.
40. Work Group 1: Workflow Management Coalition: Interface 1: Process Definition Interchange Process Model., 1999.
41. Workflow Management Coalition: Terminology & Glosssaty, 02.99.
42. Yourdon E. Modern Structured Analysis. Prentice-Hall, 1989.
-
Похожие работы
- Теория и методы управления транспортными технологическими процессами на основе электронной технической документации железнодорожной автоматики и телемеханики
- Технология и методы управления документооборотом промышленных предприятий Социалистической Республики Вьетнам
- Совершенствование автоматизации конструкторско-технологической подготовки производства на основе использования электронного документооборота
- Организация системы электронного документооборота на основе агентных технологий
- Разработка методов и алгоритмов безбумажного документооборота электронных архивов технической документации САПР
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность