автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота

кандидата технических наук
Кортиков, Федор Сергеевич
город
Санкт-Петербург
год
2013
специальность ВАК РФ
05.25.05
цена
450 рублей
Диссертация по документальной информации на тему «Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота»

Автореферат диссертации по теме "Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота"

На правах рукописи

\

005537001

Кортиков Федор Сергеевич

Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного документооборота

Специальность 05.25.05. - «Информационные системы и процессы»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

7 НОЯ 2013

Санкт-Петербу рг-2013

005537001

Работа выполнена в ФГБОУ ВПО «Санкт-Петербургский государственный архитектурно строительный университет»

Научный руководитель доктор технических наук, профессор

Воробьев Владимир Иванович

Официальные оппоненты Марлей Владимир Евгеньевич

доктор технических наук, профессор ФГБОУ ВПО «ГУМРФ имени адмирала С.О. Макарова»

Заведующий кафедрой «Вычислительных систем и информатики»

Алексеев Анатолий Владимирович доктор технических наук, профессор НКП «Некоммерческое партнерство "Институт автоматизации процессов борьбы за живучесть корабля, судна» Исполнительный директор

Ведущая организация ФГБОУ ВПО «Вологодский

Государственный Технический Университет»

Защита диссертации состоится 21 ноября 2013 года в 14-00 на засед диссертационного совета Д 223.009.03 на базе ФГБОУ ВПО «Государствен университет морского и речного флота имени адмирала С.О. Макарова» по адр 198035, Санкт-Петербург, ул. Двинская 5/7

С диссертацией можно ознакомиться в библиотеке на базе ФГБОУ «Государственный университет морского и речного флота имени адмирала Макарова».

Автореферат разослан «21» октября 2013 года.

Ученый секретарь диссертационного совета Д 223.009 кандидат технических наук, доцент

Барщевский Е.

Общая характеристика работы

Актуальность проблемы. Разработка методов интеграции информационных ресурсов -одна из наиболее актуальных проблем в области информационных систем. Особенно большое внимание она стала привлекать в последние годы в виду высокой гетерогенности информационных источников данных. Наличие различного рода электронных документов делает систему электронного документооборота (СЭД) высоко гетерогенной информационной системой. При этом электронные документы не обеспечиваются семантическим описанием, что резко затрудняет целенаправленное извлечение знаний для идентификации в предметной области. В данной работе метаданные выделяются согласно специально разработанному словарю. Это должно повысить уровень производительности функционирования системы электронного документооборота, таким образом, работа является актуальной

Степень разработанности темы. Проблема интеграции данных не является новой. Первые шаги в этой области относятся еще к сере/пше 70-х гг., когда начались разработки распределенных систем баз данных. Вопрос интеграции данных достаточно хорошо проработан для реляционных БД, однако для структурных моделей остается лишь слабо изученной областью исследований. По отдельным направлениям специалистами по проектированию информационных систем выдвигались методы и подходы к решению проблем достижения штгероперабельности и тггеграции баз и хранилищ данных. Из существующих, можно выделить работы Калиниченко Л.А., Колчанова H.A., Подколодного Н.Л., Когаловского М.Р. Данные работы имели узкоспециализированное значение и ориентировались на решение конкретных проблем.

Цель дпссертациоппой работы - повысить производительность функционирования системы электрошюго документооборота в государственных учреждениях, а также на транспортных и производственных предприятиях.

Основные задачи исследования. Для достижения указанной цели диссертации решены следующие задачи, которые выносятся на защиту:

1. Провести анализ существующих систем электронпого документооборота. Произвести классификацию существующих систем электронного документооборота. Определить основные принципы и требования к функционированию системы электронпого документооборота.

2. Построить структурную модель предметной области. Разработать численные методы и соответствующие им алгоритмы, обеспечивающие количественную оценку интероперабельности структурной модели.

3. Вывести основные правила принятие решения о степени интероперабельности СЭД на основе ее совокупного взвешенного ранга.

4. Разработать программный комплекс по управлению бизнес-процессами, описанными с помощью предложенного формального языка. Разработать модель автоматического определения метаданных электронных документов.

5. Провести апробацию результатов диссертационной работы на процессе управления документопотоком на предприятии.

Научная новизна.

Разработана структурная модель системы электронного документооборота, отличающаяся от существующих систем тем, что включает семантический анализ документов с использованием математического аппарата.

Разработаны алгоритмы оценки степени обеспечения интероперабельности систем документооборота по количественным и качественным характеристикам. Разработаны критерии оцепки степени достижения интероперабельности системы документооборота.

Сформулирован подход к автоматическому получению семантической разметки электронного документа, отличающийся меньшей алгоритмической сложностью.

Результаты работы соответствуют паспорту специальности 05.25.05 «Информационные системы и процессы»:

1. «Методы и модели описания, оценки, оптимизации информационных процессов и информационных ресурсов, а также средства анализа и выявления закономерностей в информационных потоках. Когнитивные модели информационных систем, ориентированных на человеко-машинное взаимодействие».

3. «Информационное обеспечение процессов и систем, в том числе новые принципы организации и структурирования данных, концептуального, логического, физического проектирования табличных, текстовых, графических и мультимедийных баз данных, документальных, фактографических и иных специализированных информационных систем. Методы оценки и оптимизации структур баз данных на логическом и физическом уровне».

7. «Прикладные автоматизированные информационные системы, ресурсы и технологии по областям применения (технические, экономические, гуманитарные сферы деятельности), форматам обрабатываемой, хранимой, представляемой информации (табличная, текстовая, графическая, документальная, фактографическая, первичная или вторичная). Аналитические, процедурные, информационные модели предметной области (системы принятия групповых решений, системы проектирования объектов и процессов, экспертные системы и др.), включаемые в контур обработки информации и принятия решений».

Теоретическая и практическая значимость работы подтверждается актом внедрения результатов диссертационного исследования в государственном учреждении города Санкт-Петербурга Указанные результаты диссертационной работы с успехом использовались при проектировании и разработке программного обеспечения, внедряемого в Комитете по градостроительству и архитектуре города Санкт-Петербурга.

А именно:

1. Оптимизацию поиска и навигации в электронных ресурсах

2. Решение проблемы интеграции разнородных баз и хранилищ данных

Методы и методологии исследования базируются на положениях современной теории систем и системного анализа, математической логике, а также на методах принятия решения в многокритериальной среде. В работе использованы методологии объектно-ориентированного программирования, метапрограммирования, теории баз и храшшищ данных.

Положения, выносимые на защиту.

1. Структурированное описание множества объектов и понятий позволяющее сделать

выборку ключевых свойств, влияющих на интеропер абельносгь системы электронного документооборота.

2. Концепция автоматизированной технологии извлечения знаний из информационных ресурсов, не имеющих предварительного семантического описания.

3. Автоматическое извлечение семантической разметки из электронного документа. Составление структурной модели предметной области. Разбиение электронного документа, написанного на естественном языке человека на отдельные семантически размеченные фрагменты.

4. Интеграция данных гетерогенных источников на основе дескрипционной логики.

5. Система электронного документооборота на базе технологии S WEB.

Все основные положения и результаты, выносимые на защиту, получены автором самостоятельно.

К объектам исследования относятся процессы документооборота производственных и транспортных предприятий, методы интеграции информационных систем, электронные документы, документопотоки, процессы движения и управления электронными докумеш-ами, бизнес-процессы на предприятии.

Предметом исследования является автоматизация документооборота в государственных учреждениях, а так же на производственных и транспортных предприятиях.

Степень достоверности и апробации результатов.

Теоретические результаты, численные алгоритмы и реализующие их программы получены лично соискателем. Основные результаты работы докладывались соискателем на ежегодпых научно-технических конференциях СПбГАСУ (2006-2013 гг.), на научно-технических конференциях СПИИРАН в 2011 - 2012 г., на международной конференции молодых ученых Ломоносов 2011, международной конференции IADIS Internet Technologies & Society 2011 (ITS 2011) Conference, Information Technology in Business 7nd Conference. Departament of Informatics St.Petersburg State University of Economics and frnance.

Публикации. По теме диссертации опубликовано 20 научных работ, из которых 8 -печатные. Результаты диссертации опубликованы в следующих журналах из списка ВАК: «Вестник гражданских инженеров», «Информационно-управляющие системы», «Вестник Академии (Московская Академия Предпринимательства при Правительстве Москвы)».

Структура диссертации. Диссертация изложена на 107 страницах и состоит из введения, трех глав и заключения. Список литературы содержит 138 наименований. Работа содержит 12 рисунков и 6 таблиц.

Содержание работы

Во введении рассматриваются наиболее популярные на российском рынке системы управления корпоративным, информационным контентом (системы документооборота). Показано, что российский рынок перевозок завязан на различных видах транспорта, в основе которого находится морской флот. Отображена динамика роста грузопотока в ОАО «Морской порт Санкт-Петербург» 2009-2012гг. Приведены статистические данные о понижении непроизводственного простоя флота при внедрении системы электронного документооборота .

В первой главе проведен анализ существующих систем управления корпоративным информационным контентом на примерах систем электронного документооборота, проблем интеграции и использования нескольких систем электронного документооборота, как единого информационного пространства. Разрабатывается много параллельных и конкурирующих систем электронного документооборота, - но пи одна система не является полностью интероперабельной, то есть способной к взаимодействию на уровне интеграции данных с другими системами. Вследствие чего, обмен данными между различными системами электронного документооборота не предусмотрен, что не соответствует концепции электронного правительства, которая была утверждена 6 мая 2008 года Правительством России.

В результате детального анализа функционала, используемого для разработки той или иной системы документооборота, выделены 86 основных критериев

{Д.}, (| = Ц2,...,и) для оценки СЭД. Проведено ранжирование каждой системы документооборота по каждому из критериев. Задача ранжирования решалась экспертным методом.

Пусть, {д } - множество нечисловых характеристик системы электронного документооборота. Количественные суждения о парах объектов (Д,Д) представляются матрицей пу п , А = (я,,), (/,_/ = 1,2,...,п). Элементы аи определяются по правилам:

Правило 1. Если аи = Ъ, то а]1=\/Ь, Ъф 0.

Правило 2. Если свойства Д и В/ одинаково важны, то аи = 1, а1: = 1; в частности, а „ - 1 для всех 1.

Таким образом, матрица А имеет вид:

1 аа ... а,„ А= 1/ап 1 ... а^

}К 1

ПравилоЗ. Если Д незначительно важнее Д., то а,. = 3 .

П р а в и л о 4. Если Д значительно важнее Д, то ач = 5 .

Правило5. Если Д. явно важнее Д, то = 7.

Правил об. Если Д категорически важнее Д , то а,.. = 9.

Правило 7. Значение а,7 =2,4,6,8 и их обратные величины используются для облегчения компромиссов между слегка отличающимися от основных чисел суждениями.

П р а в и л о 8. По соглашению сравнение степени важности всегда производится для объекта, стоящего в левом столбце, по отношению к объекту, стоящему в верхней строке.

Для начала представим количественные суждения о парах (Д, Д ) в числовом выражении

через а, ^. Далее, множеству объектов Д,02,. ..,Д, сопоставим в соответствие множество числовых показателей важности, которые будут соответствовать высказанным суждениям о парных сравнениях. Для этого вычислим вектор приоритетов по матрице (А) - вычисление главного собствешюго вектора, который после нормализации становится вектором приоритетов. Существует несколько подходов для оценки вектора приоритетов. Все они обладают различной точностью оценок.

Первый подход. Суммировать элементы каждой строки и нормализовать делением каждой суммы на сумму всех элементов. Сумма полученных результатов будет равно единице. Первый элемент результирующего вектора будет приоритетом первого объекта, второй - второго объекта и т.д.

Второй подход. Суммировать элементы каждого столбца и получить обратные величины этих сумм, нормализовать их так, чтобы их сумма равнялась единице, разделить каждую обратную величину на сумму всех обратных величин.

Третий подход. Разделить элементы каждого столбца на сумму элементов этого столбца (т.е. нормализовать столбец), затем сложить элементы каждой полученной строки и разделить эту сумму на число элементов строки. Это - процесс усреднения по нормализованным столбцам.

Четвертый подход. Умпожить п элементов каждой строки и извлечь корень п-й степени. Нормализовать полученные числа.

Все четыре подхода обеспечивают одинаковые векторы приоритетов, если матрица согласована. Известно, что согласованность положительной обратно симметричной матрицы А эквивалентна требованию Яш = и, где Ят1 - максимальное собственное значение матрицы.

Я -п

Отклонение от согласованности определяется индексом согласованности ИС = ——-.

п-1

Индекс согласованности, сгенерированный случайным образом по шкале Т.Саати обратно симметричной матрицы с соответствующими обратными величинами, называют случайным индексом (СИ).

Средние СИ для матриц порядка от 1 до 86, получены на базе случайных выборок. Отношение ИС к среднему СИ для матрицы того же порядка называется отношением согласованности (ОС). Значение ОС меньшее или равное 0,10 считается приемлемым.

Получены результаты ранжирования свойств продукта, полученные: вторым подходом парных сравнений по шкале Т.Саати.

Показатели согласованности матрицы: >1^=95,86; ИС = ^^—— = ОД 16; СИ = 1,49;

п — 1

ИС

ОС = - 0,08 . ОС < 0,1, что свидетельствует о хорошей согласованности.

Информация о парных сравнениях, получаемая от экспертов по 9-ти бальной шкале Т.Саати, несет сведения крайне полезные при анализе ключевых характеристик системы электронного документооборота.

На основе ранжирования сделана выборка ключевых свойств, влияющих на интероперабельность системы электронного документооборота. Группа самых значимых свойств характеризуют семантическое описание электронных документов, а именно:

1. Поддержка ссылок к экземплярам и понятиям структурной модели с помощью унифицированного идентификатора ресурса.

2. Использование инструментов для анпотирования документов различными группами пользователей.

3. Разрешение формировать аннотации различных типов (экземпляры, понятия и отношения).

4. Возможность работы со структурными моделями, которые содержат большое количество понятий и отношений.

5. Возможность аннотирования различных форматов документов, например таких, как PDF, изображения и мультимедиа файлы.

Во второй главе описывается интеграция данных распределенных гетерогенных информационных источников в единую систему, которая позволяет эффективно исполнять запросы на выборку взаимосвязанных данных из таких источников.

Задача интеграции данных заключается в соединении данных из различных источников и

предоставлении пользователю унифицированного представления этих данных. Система интеграции данных позволяет освободить пользователя от необходимости самостоятельно отбирать источники, в которых находится интересующая пользователя информация, обращаться к каждому источнику по отдельности и вручную сопоставлять и объединять данные из различных источников. При решении задачи интеграции данных возникают проблемы технического обеспечения взаимодействия с информационными источника,™, синтаксической неоднородности форматов данных и семантической неоднородности данных. В данной работе акцентируется внимание на последней, наиболее существенной проблемной области, которая затрагивает вопрос спецификации соответствия смысла (семантики) информации в разных информационных источниках.

Введем следующие понятия для структурной модели:

— Объект - экземпляр класса, имеющий конкретные свойства.

— Класс объектов - описывает устройство однородных объектов. Экземпляры конкретного класса имеют одинаковые атрибуты, отношения с другими экземплярами класса и семантику.

— Метаданные или атрибуты - являются характеристиками описываемых сущностей. Описывают свойства экземпляра класса.

— Отношение — связь между объектами.

Для описания отношений использована среда описания ресурса Resource Description Framework (RDF). Утверждение, высказываемое о фрагменте документа, имеет вид «субъект — предикат — объект» и называется триплетом. Существуют различные подходы к интеграции реляционных баз дапных. Мы введем новое попятие шггеграции систем управления корпоративным информационным контентом - объединение системы электронного документооборота со смежной инфраструктурой, связывающее множество документов и отношений в данных системах. Использование модели описапия информационных ресурсов па языке OWL обеспечивает общую одпозначпую интерпретацию смысла сообщений (пакетов) при коммуникации - принцип семантической интероперабельности. Язык описания OWL имеет математическую основу, базирующуюся на дескршщионной (описательной) логике. Описательная логика оперирует двумя видами отношений - одпоместными предикатами (концептами или классами), и двуместными предикатами (ролями или свойствами). Допускаем существование сложных классов и атрибутов, определенных с помощью конструкторов языка дескршщионной логики на основе других концептов и ролей. Метаданные разделим на абстрактные роли, связывающие объекты, а так же на атрибуты (конкретные роли), связывающие объекты со значениями примитивного типа данных.

Структурную модель в дескряпционной логике можно определить как О =~ {Т, А}, где Т — терминология, множество терминологических аксиом, т. е. высказываний о

терминах структурных моделей — концептах и ролях;

А.—множество фактов, высказываний об объектах структурпой модели.

Рассмотрим формальиое определение допустимых высказываний структурной модели для дескрипционной логики которая соответствует диалекту OWL-DL. Пусть С

— бесконечное множество констант, состоящее из двух непересекающихся подмножеств Сд объектов и Сd значений примитивных типов данных. Пусть F«J(' — множество имен концептов, ИRa — множество имен абстрактных ролей, MRJ — множество имен атрибутов. Множество всех имен будем также называть алфавитом N = RJcUFsJ^UNfo/. Атомарной ролью будем называть Р е Mfi(1U атомарным концептом — А е Шг. Абстрактной ролью называется роль На или обратная роль Ra для любой Ra е Атрибутом

называется роль Rd е Шы.

Глобальная структурная модель Og={Tg, Ag} выраженная на языке дескрипционной логики позволяет ответить на следующий набор запросов о предприятии: Структурные запросы:

• Какую роль играет агент?

• Какому подразделению принадлежит агент?

• Кто должен общаться с агентом?

• Какого рода информация содержится в общении с агентом?

• Кому должен отчитываться агент?

• Является ли роль агента обобщением другой роли? Поведенческие запросы:

• Каковы цели организации?

• Каковы цели конкретной роли?

• Каковы цели сотрудника X?

• Какие мероприятия доступны в роли для достижения своей цели сотруднику X?

• Какие имеются ресурсы для достижения цели?

Так же все перечисленные вопросы можно представить в виде огранизационной таксономии, изображенные на Рисунке 1

цель

Сосните яд

ПС^НОМОЧЛЯ

ДМТелЫКХТ*

Рисунок 1: Организационная таксономия

Наиболее сложной задачей можно выделить перевод запросов написанных на естественном языке человека, в машинно-читаемый язык дескрипционной логики DL Для описания запросов в соответствии с моделью данных RDF предложено использовать язык SPARQL, так как он является фактическим стандартом и специально спроектирован для унифицирующей модели данных RDF, а также предполагает совместное использование с языком описания OWL.

Ниже приведен пример запроса из класса SPARQL-BGP, предназначенного для

выборки информации о документах которые редактировал Сотрудник 1 из отдела поставок

предприятия 1 для предприятия2 за март 2012 г.

prefix : <http://umeta.ru/...> select ?х, ?у where {

?х .Сотрудник) ?d. ?d :отделПоставок ?о предприятие I <urn:orgid:omn

<игп:роль:редактировать>. ?х :документ1 ?о.

?о :Предприятие2 <urn:orgid:omn>. ?у : месяц 'март' ?х. ?у ход '2012'. }

Формальным эквивалентом класса запросов SPARQL-BGP являются конъюнктивные запросы. Введем формальные определения для конъюнктивных запросов на выборку данных в контексте DL-онтологий, которые нам понадобятся в дальнейшем. Конъюнктивным запросом Q(X) над терминологией Т, выраженной на языке

дескрипционной логики L, называется формула

Q(X3 ■<— В(Х, У), где В(Х У) = Ai=l..í pi(Zi) - тело запроса, представленное конечным числом конъюнктов. Переменные из вектора X называются свободными (различимыми) переменными, Y — экзистенциальными (неразличимыми) переменными. Конъюнкты p¡, называемые предикатами, могут иметь форму С(а), где С — концепт в терминологии Т, либо R(a, Ъ), где R — роль в терминологии Т.

Рассмотренная форма запросов допускает указание в предикатах сложных концептов или ролей с помощью конструкторов дескрипционной логикой L. Конъюнктивные запросы относительно пустой терминологии, допускающие только атомарные концепты или роли в конъюнктах, будем обозначать CQ (их объединения - соответственно UCQ). Такие языки запросов будем называть реляционными. Реляционный язык конъюнктивных запросов, допускающий также конъюнкты в форме неравенств будем обозначать

CQ^, конечные объединения (дизъюнкции) таких запросов - UCQ множеством ответов на CQ-L запрос Q относительно интерпретации I называется множество векторов констант í, такое, что при подстановке их вместо свободных переменных тела запроса, формула $ Y ll(t, Y) является истинной в I:

ß(I) ==? j I t= SYBQ, Y),t = (cu c„\ c¡ & C}.

Когда t является ответом на запрос Q относительно интерпретации I (t е Q(l)): будем также писать X t= Q(í).

Множеством ответов на CQ-L запрос Q относительно структурной модели О = {Т, А} называется множество векторов констант t, которые являются ответами на запрос Q относительно любой интерпретации I, являющейся структурной моделью О:

Q(О) f=ß(0I еМо,/ = (с|, ...,cn),c¡e€}.

В отличие от реляционной базы данных, содержащей фиксированный набор данных, структурная модель может иметь множество подмоделей, каждая из которых представляет собой набор данных, совместимый со структурной подмоделью. Ответами же на запрос относительно структурной модели считаются только такие факты, которые верны для всех совместимых с интерпретаций, т. е. которые неизбежно логически следуют из фактов и высказываний структурной модели

Третья глава посвящена описанию реализации программной системы, которая составляет иерархически организованный проект структурной модели, состоящий из главной структурной модели и моделей более низких уровней. Программный обработчик документов идентифицирует семантические объекты, выделяя синтаксические конструкции языка документа и определяя их семантические характеристики путем отображения на структурную модель предметной области Рисунок 2:

: •sKfcjíttSKx

Риунок 2. Анализ на основе структурной модели предметной области Для управления проектом структурной модели представляется целесообразным применение программного комплекса Protege, представляющего собой средство для создания и поддержки структурных моеделей, использующее ОКВС - совместимый интерфейс управления знаниями, что позволяет Protege-2000 использовать единый интерфейс для работы с различными языкам генерации различных представлений и т.д.

M^JU—^J ■■.ГШnк4 ......."".мы,

w V <5 ú.

[ ^

: у. ыоге<о«< п;гг с

Í « i.H«tl

i Ч* iom> fc L - -'ьгмч^н

Рисунок 3. Структурная модель верхнего уровня Моской порт

Имея различные неоднородные модели верхнего и нижнего уровней Грузовое судио, Типы грузов. Москойпорт (Рисунок 3) воспользуемся моделью интеграции онтологий У ~~ {Оо, {Об}1../и, {Р}1..т}, где Оо={То, Ав} - глобальная структурная модель, выраженная на языке дескрипционной логики Множеством точных ответов на 01_э запрос относительно системы интеграции данных У называется множество векторов констант I, которые являются ответами на запрос О относительно любой корректной

глобальной модели для У: 2 (У) = {< | 10 0(1) еМОг : 1(5 корректна

относительно У}.

Возможным вариантом переименования запроса С? написашюго на естественном языке человека р:«Найти документ, подтверждающий о разгрузке судна с контейнерами в марте 2012 года » в диалект дескрипцишшой логики ПЬ-Ше выглядит следующим образом

запрос О': 7ДОКУМННТП ПОРТ'= {ГОРОДЕ 7Г0Р0Д} П (юрО^е^Ргорейу Е контейнерные грузы}. Ответ 11(0'): Д0КУМЕНТ1П П0РТ_БАЛТИЙСК - {ГОРОДА БАЛТИЙСК } П {ЬрОЬ^ейРгорейу Е контейнерные грузы}. ГТ СОТРУДНИК 1ЕПРЕДПРИЯТИЕ 1ЕБАЛТИЙСК

Эта переформулировка означает, что такие ответы логически следуют из фактов и высказываний структурных моделей источников, отображений, а также высказываний глобальной структурной модели. Ответ является точным (является логическим следствием), если он имеет место в любой глобальной интерпретации, совместимой с высказываниями глобальной структурной модели и отображениями ее в модель источников данпых

В работе получены правила переформулировки запроса с использованием дескрипционной логики к структурной модели.

Переформулировка запроса относительно 01_- терминологии:

Входные параметры: <3 — запрос на языке Брагр!, Т — терминология на языке 0

р

Результат: - запрос на языке 11С(3-01_-и1е ►<У = <}

Цикл { // цикл поиска возможных переформулировок О врем :=

Цикл V дизъюнкта q в С)врси { // переформулирован с учетом аксиом терминологии:

Цикл V конъюнкта р в q { Цикл V аксиомы Т терминологии Т {

Если для р и Т есть правило замены на р' { := (ч — р) а р' // заменить р на р' согласно правилу := (3' V // добавить в 0' переписанный дизъюнкт } } }

// конец цикла по конъюнктам. Цикл V пары конъюнктов р,, р2 в ч { // учет аксиом

непересекаемости: Если параметры предикатов р1 и р2 идентичны

//(одинаковые переменные и константы) {

Цикл V аксиомы непересекаемости терминологии Т в форме

^ Е -Ч2, где I,, 12 е {А, И,, { Если I, сводимо к р,, а \.г к р2 (либо ^ к р2, либо и к р,) путем рекурсивного применения правил замены. С}' := — q // убрать невыполнимый дизъюнкт }} // минимизация запросов:

Если р1, р2 представлены одним и тем же концептом или ролью, причем приравниванием переменных может быть достигнута полная идентичность конъюнктов Р1 и р2 {

q' := q — p2 // убрать дублирующий предикат p2

q' := ren vars(q') // переобозначить в q' переменные с учетом их приравнивания для идентичности р, и p2j Q' := Q' v q'

// добавить в Q' переписанный дизъюнкт }} // конец цикла по конъюнктам }

// конец цикла по дизъюнктам: Если Q' = QBpBM, прервать цикл // нет переформулировок}

// конец цикла поиска переформулировок

Вернуть Q' <

В результате выполнения всех этапов алгоритма вычисляется максимальная

переформулировка исходного UCQ-DL-Lí/é?^ запроса к системе интеграции y, представляющая собой объединение конъюнктивных запросов (UCQ) к информационным источникам, в которых используются исключительно термины модели источников. На основе переформулированного запроса производится построение физического плана исполнения запроса, определяющего последовательность операций по извлечению данных из источников и их обработке.

Разработанные структурные модели «Морскойпорт» и «Предприятие» включает небольшое универсальное ядро и расширение со спецификой наборов данных (по предметным областям). В качестве базиса структурной модели выбрано Дублинское ядро, принятое в качестве стандарта для госучреждений, и удовлетворяющее стандартам ГОСТ Р 7.0 10-2010 (ISO 15836-2003).

Структурная модель разработана с расширениями для интеграции с другими

информационными ресурсами.

OWL-реализация разработанной структурной модели обеспечивает доступ к данным по

интернет технологиям и предоставление данных структурам управления верхних уровней, и

расширение включением разработанных структурных моделей - длина причала, глубина у

пирса, типы груза и т.д.

Используя инструмент интеграции моделей Protege 2000 с использованием дескрипционной логики получим глобальную структурную модель «Морской порт» (Рисунок 4).

$7я№е

♦ ГОРОО

шшъсг.

. ЛУГА

•:'■ he ВОТ •_•■-<. «Wt* ;; lUVJHOI'Ut "•> СЛН*!-ПЬ11РЬУМ " •■ 4Cjpf.KO/_I»OI>r_CA«KT ПЕТЕРБУРГ

«ОН! ь5ии>иы>._1 НРЧ/1НЛЛ : «МОРСКС1Й_ПОвТ

.: РЕ*РУ0КЕР8ТОенЫ/(_ТЕРЧ|^нап ; нчттг

У. ПОРТ_НОР.ПРГИТ«1И'*

Рисунок 4. Глобальная структурная модель «Морской порт»

Моделирование процесса анализа документов на основе технологий SemanticWeЪ позволил построить модель программной системы обработки информации электронных документов, изображенную на рисунке 5.

Рисунок 5. процесс анализа документа и извлечения знаний

Для качественной оценки степени интеграции нескольких структурных моделей предлагается ввести функцию интероперабельности: МегегаЬ1Шу = К{х1,х2,...хп}, где Р -функция, определяющая степень интероперабельности, xi - свойство системы, определяющее интероперабельность. Сегодня рынок программного обеспечения характеризируется большим разнообразием решений, каждое из которых обладает различной степенью интероперабельности, что приводит к возникновению у пользователей проблем при выборе приемлемого варианта. Таким образом, разработка единой методики сравнительной оценки двух или более систем электронного документооборота для определения степени их интероперабельности является актуальной задачей. Целью данной статьи является разработка методики сравнительной оценки систем электронного документооборота и определение решающих правил, согласно которым можно судить о степени их интероперабельности. Объектом проводимого в статье исследования являются системы электронного документооборота, обладающие различной степенью интероперабельности. Для удобства изложения введем следующие обозначения: «1-системы» интероперабельной системы; «N1-системы» - неинтероперабельные системы. Для проведения сравнительной оценки различных систем и определения степени их интероперабельности необходимо провести подробный анализ каждой системы. Чтобы он был наиболее полным, а вывод достоверным, необходимо выделить набор свойств, которые в той или иной степени характеризуют рассматриваемую систему, как более или менее интероперабельную. Этот набор для разных групп систем может быть различным. В качестве примера приведем возможный набор свойств системы, предназначенных для оценки интероперабельности информационных систем. Предлагается представить каждое выделенное свойство системы через совокупность его составляющих и именовать каждое составляющие детализированной единицей данного свойства. X; = Р{рц,Рц,--Рц}, где х, - свойство системы, определяющее интероперабельность; р^ -детализированная единица данного свойства.

| Оуг; I СЬт2 I ОнтЗ

Детализация выделенных свойств системы

Для выбранных ранее свойств, характеризующих степень интероперабельности информационных систем, можно предложить следующий возможный вариант детализации, перечисленный в Таблице!.

№ Свойства системы Детализированные единицы свойств

1 Функциональность системы - количество типов выполняемых задач, решаемых при обработке информации - функциональность (качество) выполняемых задач, решаемых при обработке информации - уровень совместимости пабора функций, реализуемых исследуемой системой с функциями смежных систем

Таблица 1. Свойства системы

Рассмотрим предлагаемую методику сравнительной оценки степени интероперабельности систем.

Методика сравнительной оценки интероперабильности систем

Представленная ниже методика основана на методах интервальной и экспертной взвешенной оценки и может быть применена для оценки степени интероперабельности любых групп систем при определенной адаптации к их особенностям. Далее рассмотрим подробнее каждый этап оценки.

1 этап: Выделение набора свойств, необходимых для оценки степени интероперабельности рассматриваемой группы систем и подробная детализация.

2 этап: Выделение интервалов значений для каждой детализировагаюй единицы каждого свойства. Используется метод анализа иерархий, разработанный американским математиком Т.Саати.

3 этап: Присвоение каждой детализированной единице рангов согласно интервалам значений, в которых они находятся. Ранги присваиваются по принципу: самый высокий ранг «9» присваивается тому интервалу значений, который более всего характеризует I-систему, а самый низкий pain- «1» -интервалу значений, более всего характеризующему N1- систему по данной детализировагаюй единице. Рассмотрим пример присвоения рангов детализированным единицам свойств «функциональность» и «производительность».

4 этап: Расчет средних рангов свойств характеризующих степень интероперабельности для каждой рассматриваемой системы. Средний ранг по каждому свойству вычисляется по формуле: RcP. = Xri,r2,...rn/n, где Rcp., - средний ранг свойства, Г1Г2...г„-ранги детализированных единиц дагагаго свойства, п - количество детализированных единиц данного свойства.

5 этап:. Расчет совокупного взвешенного ранга оцениваемой системы будет осуществляться по следующей формуле:

RrM.=-X RCp I £ I; RCp Л;--- Rcp„£„, где RB3S. - совокупный взвешенный ранг системы,

К ср ь К срг;--- Я Сргт средние ранги свойств системы, £]; £2;... £п - веса свойств системы. 6 этап: Принятие решения о степени интероперабелыгости системы на основе ее совокупного взвешенного ранга, руководствуясь решающими правилами оценки. Отнесение системы к одной из восьми степеней интероперабелыгости.

Для количественной оценки критерия достижения интероперабельности вводится понятие сводного показателя. Количественную оценку, учитывающую указанные ранее выбранные показатели, будем называть критерием готовности СЭД (Н).

Для расчета критерия готовности используется Оболочка Системы Поддержки Принятия Решений (ООПII') АСПИД-3\¥, разработанная профессором СПбГУ Ховановым Н.В. Эта система предназначенная для всестороннего оценивания сложных объектов. Заключение

1. Для системы документооборота, получены:

a. Структурная модель предметной области;

b. Семантическая разметка документов;

c. Основные правила принятия решения о степени интероперабельности системы на основе ее совокупного взвешенного ранга.

2. Разработаны численные методы и соответствующие им алгоритмы, обеспечивающие количественную оценку критерия готовности СЭД.

3. Определены и рассмотрены механизмы оценки степени обеспечения интероперабельности систем документооборота по количественным и качественным характеристикам, а также сформулированы критерии оценки степени достижения интероперабельности системы документооборота, получена система электронного документооборота с высокой степенью готовности.

4. Получена структурная модель предметной области, позволяющая построить таксономию организации, а так же реализованы алгоритмы проведения суждений о принадлежности информации к тому или иному тезаурусу;

5. Получены методы и алгоритмы, которые позволяют оценить интероперабельность системы электронного документооборота, выбрать наиболее приемлемую с точки зрения интероперабельности систему из множества альтернатив.

6. На примере Комитета по развитию транспортной инфраструктуры Санкт-Петербурга и Комитета по Градостроительству и Архитектуре Санкт-Петербурга показано, что использование модели интеграции структурной модели позволяет сократить время на движение докумептопотока.

Статьи в журналах из перечня ВАК

1 Воробьев В.И., Кортиков Ф.С. Применение онтологического моделирования при реализации документооборота в строительной организации / Кортиков Ф.С. // Вестник гражданских инженеров №2. - 2012 - С. 324 - 328;

2. Кортиков Ф.С. Методика оценки интероперабельности системы электронного документооборота как открытой информационной системы /Кортиков Ф.С.// Журнал «Информационно-измерительные и управляющие системы» № И. Издательство: «Радиотехника». - 2011. - С. 17 - 22;

3. Кортиков Ф.С. Методика сравнительной оценки интероперабельности систем электронного документооборота в строительной организации /Кортиков Ф.С.// Москва. Издательство: «Вестник Академии (Московская Академия Предпринимательства при Правительстве Москвы)». №4 - 2011. - С. 125 - 129;

Другие публикации

4 Кортиков Ф.С. Применение онтологических моделей для решения задач идентификации предметных областей/Кортиков Ф.С Л - Бизнес-информатика, № 2(4), 2010-С. 53-57;

5 Кортиков Ф.С. Оценка системы электронного документооборота строительной организации в условиях неопределенности/Кортиков Ф.С.// Информационные технологии в бизнесе. Издательство: СПБГУЭФ. — 2011 - С. 134—139;

6 Кортиков Ф.С. Интероперабельность информационных систем./Кортиков Ф.С.// Москва. Издательство: INFOFOSSRU. - 2011 - С. 71 - 72;

7 Кортиков Ф.С. Построение системы электронного документооборота в строительной организации./Кортиков Ф.С.// Информационные технологии в бизнесе. Издательство: СПБГУЭФ.-2011-С. 171-174;

8 Кортиков Ф.С. Оценка системы электронного документооборота методом сводного показателя./Кортиков Ф.С.// Материалы Международного молодежного научного форума «ЛОМОНОСОВА 10». Издательство: МГУ имени М.В.Ломоносова. -2010

Подписано в печать с оригинал-макета автора 16.10.13 Сдано в производство 16.10.13 Формат 60x84 1/16 Усл.-печ.л. 1,16. Уч.-изд. л. 1.

_Тираж 60 экз._Заказ № 124_

Отпечатано в типографии ФГБОУ ВПО ГУМРФ имени адмирала С.О. Макарова 198035, Санкт-Петербург, Межевой канал.

Текст работы Кортиков, Федор Сергеевич, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

ФГБОУ ВПО «ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МОРСКОГО И РЕЧНОГО ФЛОТА ИМЕНИ АДМИРАЛА С.О. МАКАРОВА»

На правах рукописи

Кортиков Федор Сергеевич

Разработка комплекса алгоритмов и программ для повышения производительности функционирования электронного

документооборота

Специальность 05.25.05. - «Информационные системы и процессы»

Диссертация на соискание ученой степени кандидата технических наук

00 о

^^ Научный руководитель -

Ю ^

^ доктор технических наук,

СО СМ профессор В.И.Воробьев

ы

о -

СМ

Ц! см

N

Санкт-Петербург 2013

Оглавление

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ..............................................................4

Введение..........................................................................................................9

Глава 1. Анализ существующих СЭД.......................................................11

1. Базовые понятия и терминология......................................................12

1.2.1 Основные решаемые задачи.........................................................12

1.2.2 Факторы выбора............................................................................13

1.2.3 Проблемы при внедрении.............................................................15

1.3 Классификация СЭД..............................................................................15

1.4 Анализ существующих систем электронного документооборота в России............................................................................................................20

1.5 Сопоставление функционала у существующих систем..................21

1.6 Ранжирование.........................................................................................22

Глава 2. Интеграция данных распределенных гетерогенных информационных источников...................................................................28

2.1 Проблема интеграции данных. Существующие подходы................28

2.2 Механизмы отображения моделей данных........................................35

2.3 Открытая архитектура данных.............................................................38

2.4 Автоматизированное извлечение семантической разметки из электронного документа............................................................................39

2.5 Объединение семантически размеченных данных на основе

структурных моделей..................................................................................44

Глава 3. Реализация комплекса программ с использованием структурной модели............................................................................................................49

3.1 Система документооборота на базе технологии SWEB..................49

3.1.1 Дизайн............................................................................................51

3.2 Архитектура............................................................................................52

3.2.1 Мобильный модуль.......................................................................55

3.3 Безопасность Web-cepbhcob.................................................................57

3.4 Использование технологии XML-DS...................................................58

3.4.1 Формирование цифровой подписи...............................................60

3.4.2 Проверка подлинности подписи...................................................64

3.5 Технологии, использованные в программном комплексе...............65

3.6 Встраивание компонента цифровой подписи в систему SWEB......70

3.7 Пример интеграции структурной модели в проекте SWEB...............71

3.8 Оценка интероперабельности системы электронного документооборота....................................................................................... 76

3.8.1 Параметры соответствия открытой архитектуре данных...........78

3.8.2 Методика сравнительной оценки интероперабельности систем.82

3.9 Расчет критерия готовности СЭД с использования структурного

подхода методом сводного показателя...................................................84

ЗАКЛЮЧЕНИЕ......................................................................................................89

ЛИТЕРАТУРА.......................................................................................................90

ДОПОЛНЕНИЕ....................................................................................................101

Общая характеристика работы.

Актуальность проблемы. Разработка методов интеграции информационных ресурсов - одна из наиболее актуальных проблем в области информационных систем. Особенно большое внимание она стала привлекать в последние годы в виду высокой гетерогенности информационных источников данных. Наличие различного рода электронных документов делает систему электронного документооборота (СЭД) высоко гетерогенной информационной системой. При этом электронные документы не обеспечиваются семантическим описанием, что резко затрудняет целенаправленное извлечение знаний для идентификации в предметной области. В данной работе метаданные выделяются согласно специально разработанному словарю. Это должно повысить уровень производительности функционирования системы электронного документооборота, таким образом, работа является актуальной.

Степень разработанности темы. Проблема интеграции документ ориентированных баз и хранилищ данных не является новой. Первые шаги в этой области относятся еще к середине 70-х гг., когда начались разработки распределенных систем баз данных. Вопрос интеграции данных достаточно хорошо проработан для реляционных БД, однако для структурных моделей остается лишь слабо изученной областью исследований. По отдельным направлениям специалистами по проектированию информационных систем выдвигались методы и подходы к решению проблем достижения интероперабельности и интеграции баз и хранилищ данных. Из существующих, можно выделить работы Калиниченко Л.А., Колчанова H.A., Подколодного Н.Л., Когаловского М.Р. Данные работы имели узкоспециализированное значение и ориентировались на решение конкретных проблем.

Цель диссертационной работы - повысить производительность функционирования системы электронного документооборота в государственных учреждениях, а также на транспортных и производственных предприятиях.

Основные задачи исследования. Для достижения указанной цели диссертации решены следующие задачи, которые выносятся на защиту:

1. Провести анализ существующих систем электронного документооборота. Произвести классификацию существующих систем электронного документооборота. Определить основные принципы и требования к функционированию системы электронного документооборота.

2. Построить структурную модель предметной области. Разработать численные методы и соответствующие им алгоритмы, обеспечивающие количественную оценку интероперабельности структурной модели.

3. Вывести основные правила принятие решения о степени интероперабельности СЭД на основе ее совокупного взвешенного ранга.

4. Разработать программный комплекс по управлению бизнес-процессами, описанными с помощью предложенного формального языка. Разработать модель автоматического определения метаданных электронных документов.

5. Провести апробацию результатов диссертационной работы на процессе управления документопотоком на предприятии.

Научная новизна.

Разработана структурная модель системы электронного документооборота, отличающаяся от существующих систем тем, что включает семантический анализ документов с использованием математического аппарата.

Разработаны алгоритмы оценки степени обеспечения интероперабельности систем документооборота по количественным и качественным характеристикам. Разработаны критерии оценки степени достижения интероперабельности системы документооборота.

Сформулирован подход к автоматическому получению семантической разметки электронного документа, отличающийся меньшей алгоритмической сложностью.

Результаты работы соответствуют паспорту специальности 05.25.05 «Информационные системы и процессы»:

1. «Методы и модели описания, оценки, оптимизации информационных процессов и информационных ресурсов, а также средства анализа и выявления закономерностей в информационных потоках. Когнитивные модели информационных систем, ориентированных на человеко-машинное взаимодействие».

3. «Информационное обеспечение процессов и систем, в том числе новые принципы организации и структурирования данных, концептуального, логического, физического проектирования табличных, текстовых, графических и мультимедийных баз данных, документальных, фактографических и иных специализированных информационных систем. Методы оценки и оптимизации структур баз данных на логическом и физическом уровне».

7. «Прикладные автоматизированные информационные системы, ресурсы и технологии по областям применения (технические, экономические, гуманитарные сферы деятельности), форматам обрабатываемой, хранимой, представляемой информации (табличная, текстовая, графическая, документальная, фактографическая, первичная или вторичная). Аналитические, процедурные, информационные модели предметной области (системы принятия групповых решений, системы проектирования объектов и процессов, экспертные системы и др.), включаемые в контур обработки информации и принятия решений».

Теоретическая и практическая значимость работы подтверждается актом внедрения результатов диссертационного исследования Результаты

диссертационной работы с успехом использовались при проектировании и разработке системы электронного документооборота в ООО «БалтМорПроект».

А именно:

1. Повышению производительности поиска и навигации в электронных ресурсах;

2. Решение проблемы интеграции разнородных баз и хранилищ данных.

Методы и методологии исследования базируются на положениях современной теории систем и системного анализа, математической логике, а также на методах принятия решения в многокритериальной среде. В работе использованы методологии объектно-ориентированного программирования,

метапрограммирования, теории баз и хранилищ данных.

Положения, выносимые на защиту.

1. Структурированное описание множества объектов и понятий позволяющее сделать выборку ключевых свойств, влияющих на интероперабельность системы электронного документооборота.

2. Концепция автоматизированной технологии извлечения знаний из информационных ресурсов, не имеющих предварительного семантического описания.

3. Автоматическое извлечение семантической разметки из электронного документа. Составление структурной модели предметной области. Разбиение электронного документа, написанного на естественном языке человека на отдельные семантически размеченные фрагменты.

4. Интеграция данных гетерогенных источников на основе дескрипционной логики.

5. Система электронного документооборота на базе открытой архитектуры.

Все основные положения и результаты, выносимые на защиту, получены автором самостоятельно.

К объектам исследования относятся процессы документооборота производственных и транспортных предприятий, методы интеграции информационных систем, электронные документы, документопотоки, процессы движения и управления электронными документами, бизнес-процессы на предприятии.

Предметом исследования является автоматизация документооборота в государственных учреждениях, а так же на производственных и транспортных предприятиях.

Степень достоверности и апробация результатов.

Теоретические результаты, численные алгоритмы и реализующие их программы получены лично соискателем. Основные результаты работы докладывались соискателем на ежегодных научно-технических конференциях СПбГАСУ (2006-2013 гг.), на научно-технических конференциях СПИИРАН в 2011 - 2012 г., на международной конференции молодых ученых Ломоносов 2011, международной конференции IADIS Internet Technologies & Society 2011 (ITS 2011) Conference, Information Technology in Business 7nd Conference. Departament of Informatics St.Petersburg State University of Economics and finance.

Публикации. По теме диссертации опубликовано 8 научных работ. Результаты диссертации опубликованы в трех журналах из списка ВАК: «Вестник гражданских инженеров», «Информационно-управляющие системы», «Вестник Академии (Московская Академия Предпринимательства при Правительстве Москвы)».

Структура диссертации. Диссертация изложена на 107 страницах и состоит из введения, трех глав, заключения и дополнения. Список литературы содержит 138 наименований. Работа содержит 12 рисунков и 6 таблиц.

Введение.

В любой из современных организаций в определенный момент встает вопрос о необходимости структурировать имеющуюся документацию, например, регистрировать входящую корреспонденцию, заявки, организовывать цифровые подписи в документах и т.п. Отсутствие таковой системы приведет к тому, что со временем возникают трудности: потеря важных документов, утечка конфиденциальной информации, документ не содержит требуемую подпись. Одним из методов, призванных обеспечить прозрачность и управляемость бизнес -процессами компании и поднять на уровень выше контроль их выполнения и реализации служит внедрение корпоративной информационной системы. По данным портала «DOC-ONLINE.RU» объем рынка систем электронного документооборота в денежном выражении в России в 2007 году составил более $ 170 млн.

Наиболее популярными на рынке информационных систем являются ЭОС, «Ланит», Directum и Cognitive Technologies, Upscale Soft, Docsvision, Alfresco и «CompanyMedia». Общее количество лицензий-мест проданных на территории стран CHF за 2011год составило~более 800 тысяч. За 2012 год прирост составил 300 тысяч лицензий.

По данным иностранных судоходных компаний, при заходе судна в порт представители проверяющих органов ставят на документы до 96 подписей. По официальным данным ОАО «Морской порт Санкт-Петербург» наблюдается стабильная динамика роста грузопотока с 2009 по 2012 года с преобладанием в темпе развития насыпных, навалочных и пищевых грузов. Система электронного документооборота делает работу порта более простой прозрачной - унифицирует процесс прохождения грузов, а именно дает возможность приступить к загрузке-разгрузке судна сразу же после его швартовки. Это сокращает время непроизводительных простоев флота, что выгодно как портовикам, так и

судовладельцу. Так, по опыту обработки судов-контейнеровозов в Одесском порту: экономия стояночного времени составляет до 25 суток в год, дополнительный доход порта - 6 млн долларов, судовладельца - не менее 2 млн долларов. Детализация по числовым показателям грузопотока приведена в Дополнении в (Таблице 5) и (Таблице 6).

Глава 1. Анализ существующих СЭД

Существуют различные системы электронного документооборота, и остается

только выбрать, какая же из систем, представленных в России, подходит именно этой организации. В первую очередь, конечно, важна экономическая эффективность использования электронного документооборота.

Эффективность = Результат/Затраты

Эффективность деятельности любой организации можно повысить двумя способами: сокращая затраты и увеличивая конечный результат.

Чтобы показать, насколько эффективно внедрение СЭД на предприятии, сделаем оценку эффективности. Оценим затраты на внедрение в 50 ООО рублей - при цене систем среднего ценового сегмента порядка 40 ООО и учете необходимости потратить некоторые ресурсы на обучение персонала - это достаточно пессимистичная оценка. Потери предприятия на ручном выполнении некоторых рутинных задач составляют до 30%. Предположим, у нас есть некоторое предприятие со штатом в 10 человек, средними потерями времени 20% и средним окладом в 20 000 рублей. Это означает, что уже за первый месяц работы установленной системы предприятие сэкономит примерно 40 000 рублей, что составляет 80% инвестиций в систему.

На снижение затрат влияют следующие факторы:

• сокращение затрат на бумажный документооборот (электронные документы дешево создавать, хранить и передавать);

• количественное уменьшение длительности операций, выполняемых сотрудниками;

• повышение производительности документопотока.

Для точной оценки экономического эффекта от внедрения системы нужно вычислить время, затрачиваемое на рутинные операции. По оценкам консалтинговых компаний это может быть 20-30% рабочего времени.

1. Базовые понятия и терминология.

Минимальная величина информации в СЭД - электронный документ. Основная задача в СЭД хранить электронные документы, вести их хронологическую запись изменений, обеспечивать документопотоки по предприятию, контроль над процессами, удовлетворяющими требованиям бизнеса, с которыми электронные документы имеют связь. С внедрением СЭД документ инкапсулирует в себя инструменты управления (и фактически сам становится оным) - все приказы, поручения, решения и прочие становятся потоком документов.

Существует два термина, которые часто путают: «делопроизводство» и «документооборот». Документооборот - это определение, используемое при оглашении специфичного набора действий при работе с метаданными документа. Существуют так называемые СЭД, которым можно задать все необходимые правила документопотока. Существуют системы, к которым изначально поставили цель - это поддержка различных правил. Такие системы не обладают всевозможными общими функциями, присущими другим системам, приближённо похожими к тому, чтобы они считались полностью автоматизированными СЭД. ГОСТ по документообороту и правил делопроизводства, который принят в России, довольно многоаспектен, и создание системы документооборота, удовлетворяющей всех положениям стандарта и правилам - задача не сложная и многокритериальная.

1.2.1 Основные решаемые задачи.

Системы документооборота в России, в частности на морском транспорте, внедряются, �