автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Совершенствование процессов коллективной обработки информации на основе темпоральной организации данных и метаданных

кандидата технических наук
Лизин, Сергей Николаевич
город
Саранск
год
2011
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Совершенствование процессов коллективной обработки информации на основе темпоральной организации данных и метаданных»

Автореферат диссертации по теме "Совершенствование процессов коллективной обработки информации на основе темпоральной организации данных и метаданных"

005003089

ЛИЗИН Сергей Николаевич

СОВЕРШЕНСТВОВАНИЕ ПРОЦЕССОВ КОЛЛЕКТИВНОЙ ОБРАБОТКИ ИНФОРМАЦИИ НА ОСНОВЕ ТЕМПОРАЛЬНОЙ ОРГАНИЗАЦИИ ДАННЫХ И МЕТАДАННЫХ

Специальность 05.13.17 - Теоретические основы информатики (технические науки)

Автореферат диссертации на соискание ученой степени кандидата технических наук

- 1 ДЕК 2011

ПЕНЗА 2011

005003089

Работа выполнена на кафедре «Автоматизированные системы обработки информации и управления» Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Мордовский государственный университет им. Н. П. Огарева».

Научный руководитель - кандидат технических наук, профессор

Федосин Сергей Алексеевич

Официальные оппоненты: доктор технических наук, профессор

Соснин Петр Иванович;

доктор технических наук, доцент Зинкин Сергей Александрович

Ведущая организация: ФГУП «Всероссийский научно-

исследовательский институт проблем вычислительной техники и информатики» (г. Москва)

Защита диссертации состоится 22 декабря 2011 г. в 14 часов на заседании диссертационного совета Д 212.186.01 при Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.

С диссертацией и авторефератом можно ознакомиться в библиотеке Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Пензенский государственный университет». Автореферат диссертации размещен на сайте http://www.pnzgu.ru и официальном сайте Министерства образования и науки Российской Федерации.

Автореферат разослан « /У» ноября 2011 г.

Ученый секретарь диссертационного совета доктор технических наук, профессор

Е. И. Гурин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Возрастающие объемы информации требуют изменения бизнес-процессов предприятий и организаций. На смену традиционному бумажно-ориентированному взаимодействию, где информационные системы лишь обрабатывают сведения из бумажных документов-первоисточников, приходят электронно-ориентированные системы, в которых первоисточником являются операции, совершаемые пользователями в информационной системе.

Большинство современных корпоративных информационных систем-это многопользовательские автоматизированные информационные системы на основе реляционных баз данных. Возможность выполнения пользователями отдельных операций в системе определяется (программно или нормативно) содержанием в базе данных в каждый момент времени данных. Для возможности обнаружения некорректных операций и установления их причин (действия пользователя, неактуальность данных или другие факторы) необходима возможность восстановления содержания базы данных по состоянию на произвольный момент времени. Современные стандарты требуют хранения данной информации не менее 3-5 лет.

Для этих целей могут быть использованы существующие технологии темпоральных баз данных. Среди исследований в данной области можно отдельно выделить работы Р. Снодграса, К. Йенсена, А. Стейнера, К. Дейта. Среди отечественных работ в данной области следует отметить работы Б. А. Новикова, Е. А. Горшковой, Д. С. Порай, А. В. Соловьева, Г. В. Королькова. Большая часть из них сосредоточена на разработке специализированных языков запросов, темпоральных СУБД и других инструментальных средств, упрощающих оперирование темпоральными данными. Использование темпоральных баз данных для целей управления коллективным доступом к данным до настоящего времени практически не исследовалось.

Поскольку большинство современных многопользовательских АИС имеют клиент-серверную архитектуру, то для решения указанной задачи требуется обеспечение возможности восстановления данных, содержавшихся в момент выполнения пользователем операции, не в базе данных, а в локальном кэше клиента. Одновременно требуется сохранение сведений об авторстве всех производимых в данных изменений.

В настоящее время обеспечение юридической значимости информации на практике применимо лишь в отношении электронных документов. Документ, сформированный на основании данных информационной системы, приобретает юридическую значимость после его подписи уполномоченным должностным лицом, которое может не иметь возможности проверки истинности исходных данных. Не редки ситуации, когда выбор-

ки из информационной системы формируются и подписываются автоматически (электронным сервисом). Если в корпоративных информационных системах отслеживание авторства всех изменений совместно с некоторым набором организационных документов может быть достаточным способом разграничения ответственности за данные, то при совместной обработке данных пользователями нескольких юридических лиц необходимо обеспечение юридической значимости (посредством электронной подписи) всех производимых изменений.

Изменение отдельных категорий данных, особенно при обработке совместных данных, не может осуществляться отдельными пользователями, а требует согласования, которое может осуществляться различными способами (все участники, большинство, отдельные участники и более сложные схемы). Причем проведение согласования должно осуществляться не на уровне пересылки сообщений, а в рамках единого юридически значимого массива данных.

Совместная обработка данных несколькими информационными системами зачастую предполагает не просто редактирование единого информационного массива, а редактирование только общих элементов либо только поддержание связанности единых элементов (НСИ, Master Data Management). Зачастую данные в различных информационных системах могут быть организованы с использованием различных структур данных, которые также необходимо связывать.

Другой крайне важной задачей является необходимость обеспечения возможности модернизации информационных систем и связей между ними. В первую очередь сложность составляет необходимость модернизации метаданных систем. Таким образом, требуется обеспечение темпорально-сти не только данных, но и метаданных систем. При этом требуется обеспечение работы с данными прошлых периодов в соответствующей схеме данных.

Актуальность данной тематики отмечается в Клермонтском отчете об исследованиях в области баз данных, в котором задачи нахождения компромиссов между согласованностью и доступностью для достижения лучшей производительности и масштабируемости, отслеживания происхождения данных, а также поддержки эволюции схем и версий отнесены к числу приоритетных исследований в области баз данных.

Объектом исследования являются процессы коллективного управления данными в автоматизированных информационных системах.

Предметом исследования являются модели представления данных и метаданных в реляционных базах данных и способы их коллективной обработки.

Цель диссертационной работы - разработка моделей темпоральной организации данных и метаданных для совершенствования процессов

коллективной обработки данных в автоматизированных информационных системах.

В диссертационной работе поставлены и решены следующие задачи:

1. Системный анализ информационных потребностей коллективных пользователей автоматизированных информационных систем, оценка применимости существующих способов коллективного управления данными.

2. Разработка реляционной модели темпоральной организации данных, позволяющей осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

3. Разработка реляционной модели темпоральной организации данных и метаданных, обеспечивающей темпоральность метаданных, исключающей возникновение проблем отсутствующих значений.

4. Разработка реляционной модели темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющей осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

5. Апробация предложенных моделей путем их реализации на основе промышленной системы управления базами данных и оценка их эффективности в сравнении с известными прототипами, разработка методики реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

6. Оценка эффективности предложенных моделей и алгоритмов на основе исследования результатов использования разработанного программного комплекса в процессе его эксплуатации.

Методы исследования. В диссертационной работе использованы теоретические основы информационных систем и технологий, теория управления, теория системного анализа, элементы теории множеств, теория баз данных, реляционная алгебра, теория темпоральных баз данных, математическая логика, методы проектирования информационных систем.

Научная новизна работы. Научная новизна результатов диссертационного исследования представлена совокупностью следующих положений:

1. Предложена реляционная модель темпоральной организации данных, отличающаяся раздельным хранением сведений о жизненных циклах сущностей и значений атрибутов на основе полутемпоральных отношений

и использованием отношения транзакций, включающего сведения об авторстве изменений, электронной подписи и максимуме транзакционного времени исходных данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

2. Предложена реляционная модель темпоральной организации данных и метаданных, отличающаяся раздельным хранением сведений о жизненных циклах классов, атрибутов, сущностей и значений атрибутов на основе полутемпоральных отношений, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.

3. Предложена реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, отличающаяся наличием темпоральных связей между классами, атрибутами и сущностями, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

4. Впервые предложена методика реорганизации баз данных существующих автоматизированных систем для совершенствования процессов коллективного управления данными на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

Практическая значимость. Практическое значение результатов данной работы состоит в решении задач управления коллективным доступом к данным, сокращении памяти, требуемой для хранения темпоральных данных, упрощении процессов модернизации автоматизированных информационных систем.

Основные положения, выносимые на защиту:

1. Реляционная модель темпоральной организации данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

2. Реляционная модель темпоральной организации данных и метаданных, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.

3. Реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, позво-

ляющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

4. Методика реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

Внедрение результатов работы. Результаты диссертационной работы использованы:

1)при модернизации АИС «Электронный социальный регистр населения Республики Мордовия» для построения регионального регистра получателей государственной помощи и организации информационного взаимодействия Министерства социальной защиты населения Республики Мордовия с Отделением Пенсионного фонда по Республике Мордовия;

2) в научно-исследовательской работе по теме «Создание действующего макета системы автоматизированного учета и формирования справочной отчетности о тиражах печатных средств массовой информации», выполненной Закрытым акционерным обществом «Эволента» в 2011г. по заказу Федерального агентства по печати и массовым коммуникациям.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и научных школах: конференции «Наука и инновации в Республике Мордовия» (Саранск, 2006-2009), Ежегодной научной конференции «Огарев-ские чтения» (Саранск, 2007, 2008), Четвертой Международной научной школе-семинаре «Математическое моделирование, численные методы и комплексы программ» (Саранск, 2009), Международной научно-практической конференции «Электронная Казань - 2009» (Казань, 2009), Межвузовской научной конференции по проблемам информатики «СПИСОК-2009» (Екатеринбург, 2009), VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010), I Международной научно-практической конференции «Объектные системы - 2010» (Ростов-на-Дону, 2010).

На конкурсе работ VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010) доклад автора был отмечен дипломом первой степени по секции «Базы данных и информационные системы».

Публикации. Основные результаты, полученные в диссертации, опубликованы в 13 статьях (3 из них в соавторстве), в том числе 3 статьи -в журналах, рекомендованных ВАК для публикации результатов научных работ. Подана заявка на выдачу патента на изобретение РФ.

Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 171 наименования. Объем работы - 135 страниц.

Работа выполнена при финансовой поддержке федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 гг.» (ГК № П1113).

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цели и задачи исследования, отражены научная новизна работы и практическая значимость, перечислены методы исследования.

В первом разделе проведен анализ информационных потребностей пользователей автоматизированных информационных систем и существующих моделей темпоральной организации данных и метаданных, а также способов коллективного управления данными.

Большинство современных автоматизированных информационных систем строится на основе реляционных систем управления базами данных. В их основе лежит реляционная модель данных, разработанная Э. Кодцом1, предполагающая, что база данных представляет собой набор истинных высказываний. Высказывания сгруппированы в отношения, каждое из которых задается предикатом. Кортежи отношений представляют собой значения переменных, которые при подстановке в предикат превращают его в истинное высказывание.

Многопользовательская обработка данных требует управления конкурентным доступом, которая, как правило, реализуется с помощью ОЬТР-технологий (в распределенных базах данных могут использоваться технологии распределенных транзакций). Однако далеко не все выполняемые операции представляют собой полные транзакции. Зачастую программными средствами просто невозможно определить последовательность чтений и записей пользователем данных, составляющих атомарную операцию. В результате невозможно откатить такую транзакцию при изменении данных чтения.

Альтернативой обеспечению гарантированной согласованности данных является обеспечение возможности восстановления данных чтения для каждой транзакции (причем в распределенных системах требуется восстановление данных локального кэша/реплики). Одновременно необходима возможность установления авторства изменений и сохранение его доказательств посредством электронной подписи. Базы данных, обеспечивающие версионность данных как в разрезе действительного, так и тран-закционного времени, называются битемпоральными. Однако в настоящее время отсутствуют разработанные технологии темпоральной организации данных для целей управления коллективным доступом к данным.

1 Codd E. F. A Relational Model of Data for Large Shared Data Banks // Communications of the ACM. - 1970. - № 6. - V. 13.

Управление коллективным доступом включает не только задачи конкурентного доступа к данным. Не все изменения в базу данных могут вноситься по решению одного пользователя - зачастую необходимо согласование изменений. Данная задача решается, как правило, посредством взаимодействия вне базы данных посредством обмена сообщениями, вследствие чего информация об авторстве изменений не сохраняется.

Коллективное управление совместными данными несколькими информационными системами не всегда предполагает наличие распределенной базы данных. Количественный состав элементов, подлежащих обработке в каждой информационной системе, может значительно различаться. В таком случае обработка требуется только в отношении совместных элементов. Кроме того, одни и те же сущности в разных информационных системах могут иметь различные значения атрибутов, причем задача синхронизации не ставится. В отношении таких элементов, как правило, требуется лишь поддержание информации о связях между сущностями.

Существенной сложностью при взаимодействии информационных систем может являться асинхронность используемых структур данных (метаданных). Решение данной задачи состоит в решении задачи дедупли-кации в отношении метаданных систем. Кроме того, автоматизированные системы подвержены практически непрерывной эволюции, которая в первую очередь затрагивает метаданные систем. Таким образом, процессы управления данными, как в рамках отдельно взятой системы, так и при их взаимодействии, должны быть устойчивы к изменению метаданных.

Во втором разделе разрабатываются модели темпоральной организации данных и метаданных, проектируется обобщенная архитектура коллективного управления совместными данными в нескольких автоматизированных информационных системах.

Существовавшие во времена появления первых СУБД компьютеры имели небольшую память, низкую производительность и использовались в основном для проведения расчетов. В качестве очевидной оптимизации воспринималось хранение в базе данных только актуальных данных и размещение их в таблицах. Следствием этого серьезной проблемой является нарушение истинности соединений высказываний при изменении значений одного из них (при сохранении истинности каждого из них в отдельности). Кроме того, современные системы требуют наличия возможности восстановления данных, содержавшихся в базе данных, в момент формирования вторичных данных (отчетов, выборок и т.п.). Решение перечисленных задач требует отказа от хранения лишь только актуальных данных.

Обрабатываемые сущности (множество X) и данные (множество г) можно разделить на две большие категории: транзакционные и нетранзак-ционные. Транзакционные сущности - сущности во множестве X, харак-

теризующиеся относительно некоторого фиксированного (точечного) момента времени, все их характеристики также относятся к данному моменту времени и не изменяются в последующем. Транзакционные данные -это данные во множестве 2, непосредственно содержащие сведения о транзакционных сущностях множества X. Сущности множества X, не являющиеся транзакционными, называются нетранзакционными. Нетран-закционные сущности относятся к некоторому временному интервалу (возможно неограниченному), в течение которого его характеристики могут изменяться. Аналогично, данные, непосредственно хранящие сведения о нетранзакционных сущностях, называются нетранзакционными данными. В транзакционных данных часто используются ссылки на нетранзак-ционные данные. Изменение записи нетранзакционных данных, на которую уже имеются ссылки из записей транзакционных данных, приводит к появлению в базе данных ложных высказываний на основе соединений предикатов. Следовательно, в базе данных должны использоваться только транзакционные данные, с помощью которых должны описываться тран-закционные и нетранзакционные сущности.

Множество всех сущностей в базе данных 7. обозначим Е. Множество сущностей класса с Е С будем обозначать Ес. Тот факт, что некоторый элемент х е X в базе данных 2 идентифицируется сущностью е £ Е, будем обозначать ¡с1(х) = е. Домен атрибута а будем обозначать с1от(а). Объединение доменов атрибутов класса с обозначим с1от04с).

Используя введенные обозначения, введем определение отношения

Кс = {(в, Val,..., рапс) 6 Ес х П Чот(Лс) | Рс (е, уа1,..., 1^)}. (1) Предикат Рс имеет вид

.....v )*ё1хех-.

/ ч (2)

0М(х) = е) Л (*(а0 = уа1) Л ... Л (х(аПс) = vanс).

Известная полнотемпоральная реляционная модель2 данных имеет

вид:

Нгс = {г = (е, С,,, Ць, .....г;апс) е Ес х Г4 х П с!от(Лс) |

Н (е, иа1,..., уЯпс) л (уь 6 г Е .

2 Snodgrass R. T. Developing Time-Oriented Database Applications in SQL. - Mor-

gan Kaufmann Publishers, 2000.

Предикат Р/ (е > Ч' Ч' vat> •••• vanc) имеет вид

Р/ (е- Ч< Ч< .....vanc) = Эх € X Vt„ 6 [4. 4) :

е, tv) л (х(а1( t„) = vaJ Л ... Л (х(аПс, tv) = vajiJ.

Здесь Qc(x,e,t„) = (хб X(t„)) Л (е 6 Ec(tv)) Л (id(x) = е).

Поскольку 4 и tte являются значениями, обновляемыми после создания записи, то данные на основе (3) не являются транзакционными. Взамен полнотемпоральной модели может быть предложена простая полутемпоральная модель, обладающая свойством транзакционности:

Я? = {r = (e,tVb,ttb,f,vai, ...,vanc) €ЕсхТ2 X П<1от(Лс) |

(( / Л Рс (е, Ч' %.....»«„,)) V (-,/ Л Ре(е, Ч)) j Л (5)

Л (эе > 0 : Vit 6 [4,4 + е) г 6 Z(tt))). Предикаты Р/ и Рс определяются следующим образом:

Рс (е- Ч' %.....vanc) = Зж 6 ХЭе > 0 Vt„ е [4, Ч + £) :

Qc(x, е, tv) Л (x(av tv) - vaJ Л ... Л (х(аПс, tv) = vanJ; Рс(е, tVb) « 3s > 0 Vt„ 6 [trv 4 + е) •■ ~>Qc(x, е, t„). (7)

Однако с сущностями могут происходить не только события появления, исчезновения и изменения атрибутов. Для отражения изменений в жизненном цикле атрибутов необходимо ввести дополнительное отношение - отношение жизненного цикла сущности в целом:

Rc = {re = <elf ег, Ч- ttb) еЕ*хТ2\

PcE(*v е2. ч) Л (зе > о : vtt е [ttb, ttb + £) re е z(tt))}. (8)

Предикат РСЕ имеет следующий вид:

Р/(е1( е2, tVb) = Зх1( x2 е X, Эе > 0 : Vtv е [4, Ч + £) : (9) -iQc(xvev tj Л Qc(x2,е2, tv) л (хг с х2). Поскольку данные отношения являются битемпоральными и транзакционными, на их основе могут быть решены задачи управления коллективным доступом к данным. Для отслеживания авторства вносимых изменений с каждой записью в базу данных достаточно сохранять информацию о пользователе, внесшем ее. Поскольку все записи носят транзак-ционный характер, то данная информация не будет потеряна при изменении значений атрибутов сущностей. Множество пользователей информационной системы обозначим символом U, а элементы данного множе-

ства - соответственно и 6 U. Множество значений электронной цифровой подписи обозначим символом 5, а элементы данного множества соответственно s G S. Функцию расчета значения электронной цифровой подписи на основе закрытого ключа пользователя и по данным некоторого подмножества Ç £ Z обозначим sign(u, 0.

Для решения задачи отслеживания исходных данных, использовавшихся пользователями при принятии решений о внесении изменений, может быть использовано транзакционное время. Введем следующие обозначения:

Р£(9,т) = {r = (ev е2, tVb, ttb) е REC с Z | (tt„ =■ т )л(гё 6)}; р"(е, т) = [г = (в, tVb, ttb, vai,..., van) 6 Rvc с Z | (4 = x) л (r Ë 9)}.

В случае если обработка данных распределенная, то для локальной базы данных Z1 множество исходных данных имеет вид

z(max({t е т | (t < tt) Л (рЕ(г\ t) и Рv(zl, t) * 0)})).

Для обеспечения отслеживания авторства всех производимых изменений с сохранением соответствующих доказательств, а также обеспечения согласования изменений необходимо включение в модель дополнительного отношения транзакций. В качестве идентификатора транзакции целесообразно использовать транзакционное время:

R° = [г = <ttb,tr,u,s) € Т2 X U xS | tr = max({t 6 T | (t < tt) Л (pB(Zl. t) U pv(Zl, t) * 0)}) Л Л s = sign(u, pE(Z, t) U pv(Z, t))}.

Существенной проблемой реляционной модели является проблема отсутствующей информации - случаи, когда значения отдельных атрибутов могут быть неизвестны. Отсутствие одного из значений vCl,..., ведет к тому, что предикаты Рс и Р/ нельзя считать истинными. По мнению К. Дейта3, такого рода случаи нарушают реляционную модель. Данная проблема может быть решена путем разделения каждого отношения (предиката) на простые, каждое из которых содержит значение только одного атрибута сущности:

R = {(с, e,a,v) € С х Е х Ах domG4) | Р(с, е, a, v) = 1}. (10) Предикат Р(с, е, a, v) в данном случае будет иметь вид

Р(с,е,а, v) 'ё Зх е X ■ (id(%) = е) Л (е е Ес) Л (а £ Ас) Л (х(а) = v).(ll)

3 Дейт К. Дж. Введение в системы баз данных / пер. с англ. - 8-е изд. - М. : Вильяме, 2006. - 1328 с.

Аналогичные темпоральные отношения будут иметь следующий

вид:

ЯЕ = {ГЕ = (ег, е2, с, С„ , с£ ) 6 Е2 х С X Т2 I ег, е2 £ £с А А Р/(в1, е2, Л (зе > 0 : УСс £ [с£ь, ССь + г) гЕ £ ¿(С£))}; = [гу = (е, а, V, С„ , С£ ) £ Е х А х с!отС4) х Т2 I

/1 'ЗЧ

Ру{е, а, V, С„„) Л (эе > 0 : УС£ £ [с£&, ^ + е) £ .

Предикат Р1/(е, о, V, С„ь) определяется следующим образом:

Рч{е, а, V, £„й) = Зх 6 X, Эе > О УС„ 6 ^ + Е) : <20*:, е, С„) Л (х(а, О = г?). Как отмечалось в первом разделе, одной из серьезнейших проблем информационных систем является необходимость поддержки развития структуры данных во времени, т.е. темпоральность метаданных. При этом, очевидно, не должно происходить появления некорректностей, и в первую очередь - сведений об авторстве и электронной подписи.

Описание жизненного цикла классов может быть представлено в виде, схожем с описанием жизненного цикла сущностей: яс = {гс = (с1(с2д л )6с2хг2|

/1 г\

РС{сV с2, Ч) Л (В£ > 0 : УС, 6 [с£(,, + £) гс £ 2(С£))}.

Предикат Рс(сг, с2, имеет вид

РС(сс2> С^) = Зе > 0,5 > 0 : УС" 6 (с„ь - е,

УС £ С„ь + 5) (сгСф = с^С") и с2(С")).

Описание жизненного цикла атрибутов, по сути, аналогично описанию жизненного цикла сущностей:

^ = [ГА = {аъа2,с,С„С£ > ЕА2хСхТ2\ РА(аг,а2,с,^ь) Л (зб > 0 : УС£ £ [сСй,С£ь + е) га Е 2(С,))}. Предикат РА(а1, а2, с, С^) имеет вид:

РА(а1,а1,с,^ь) Ш Эе> 0,6 > 0 ; УС" £ - £, С„ь) УС^ £ [Сиь, С„ь + 5) (18)

(а^ф = 0) Л (а2(с+) = Я1(С-) и а2(С")) Л (а2(С+) £ Лс). Управление совместными данными в нескольких информационных системах предполагает решение одной из трех задач: дедупликации, актуализации или синхронизации. Решение задачи дедупликации связано с коллективным (в смысле - несколькими системами) управлением связями

между сущностями разных информационных систем. Задача актуализации дополнительно предполагает коллективную обработку значений атрибутов. Решение задачи синхронизации вместо управления связями между сущностями предполагает управление непосредственно самими сущностями и значениями атрибутов. Множество данных, коллективно обрабатываемых во всех информационных системах, обозначим символом I.

Для обеспечения синтаксической интероперабельности необходимо связывание метаданных (классов и атрибутов) информационных систем. Для этого во множестве £ должны быть определены глобальные классы и атрибуты. Предикат, задающий отношение классов, аналогичен соответствующему предикату во множествах Z'c:

^ = {гс1 = <С[, с\, С„ь< С1ь> € С1 х С" х Т2\

(19)

Рс\с1х, с\, О А (зе > 0 : е [с4ь, с,ь + е) гс" € £&))}. Предикат Рс2,(с[, с^, имеет вид

Рс\с1с1гУь) = Эе> 036>0 : V«:- е (ц, - 1п) е + 6) (20)

= 0) А {с^Сф = и

Отношение атрибутов в множестве Ь также имеет схожий вид:

К*' = [г^ = <аЬс1, и) еА^А'хС'хТ21

(21)

РА\аЬ, а.2, с1, А (э£ > 0 : УСс £ + е) г*' 6 ВД)}.

Предикат РА1(а\, с1, имеет вид

Р4^, аЬ с1, = Зе > 0 35 > 0 : УС" е - £, С„ь)

е + 6) (с+) = 0) А (22)

А (а%(ф = аК^) и (ф) Л (а%(ф 6 Л^ ).

Отношение сущностей имеет вид, аналогичный

^ = {г*1 = КеЬс1-,^,^) е.Е1 хЕ1 хС1 х Т2\

(23)

е1 С1", О А (эе > 0 : 6 ^ + Е) Vе1 6 ¿(Сс))} . Предикат Р^е^, е|, сь, имеет вид

с', = Эе > 0 35 > 0 : 6 (с„ь - с, ц)

£ Ц + б) (а[(£+) = 0) А (24)

Л (е2ЧФ = еК^) и е^(ф) А (е^Я Е ЕС1).

Пусть LE' - множество связей между сущностями множеств £J и El. Отношение, задающее связи между сущностями множеств и Е1, имеет вид

RiEl = [rLE> = (/f, II', e>, eL, tvy ttb) £ Leî x Leî x E> xELxT2\ PlE' (l*J, lE2>, ei, eL, tVb) л (эе > 0 : Vtt 6 [tt„, ttb + e) r^ 6 L(tt))J .(25)

Предикат PlE (if, Щ*, e>, eL, tVbj имеет вид

PLEl (if7. If, e', e1, tVb) = 3e > 0, б > 0 : Vt; G (tVfc - e, tv J

Vi+ G [tVb, tVb + 6) y (e>(tf), eL(t+)) Л (26)

A (1ЕЛФ = 0) л (ifV) = If'(ti) U ify(t")).

На основе данных отношений может осуществляться хранение совместных данных для решения задачи дедупликации сущностей. В целях решения задачи дедупликации все сущности, создаваемые в каждой информационной системе, должны проходить процедуру идентификации. Если в качестве ответного значения от функции идентификации возвращается идентификатор существующего объекта, то данный идентификатор присваивается сущности в L.

Использование данной модели позволяет обеспечить асинхронное согласование модификаций. При этом решение о возможности использования записей принимается системами на основе установленных правил в зависимости от состава согласований. Для данной модели множества L в работе предложены алгоритмы управления совместными данными.

В третьем разделе осуществляются апробация предложенных моделей путем их реализации на основе промышленной реляционной СУБД, оценка их эффективности в сравнении с известными аналогами и разработка способов внедрения предложенных технологий в существующие автоматизированные системы.

Для реализации предложенных реляционных моделей средствами стандартных СУБД требуется поддержка последними универсального или неопределенного типа данных, такого как sql_variant в Microsoft SQL Server. При этом для осуществления простого отката транзакций, как на уровне сервера баз данных, так и на уровне сервера приложений, посредством удаления только соответствующей записи транзакции требуется использование ограничений внешних ключей между таблицей транзакций и остальными таблицами.

Недостаточная приспособленность средств языка SQL к обработке темпоральных данных приводит к необходимости использования соеди-

нений типа «self-join», где для упрощения написания запросов требуется использование вспомогательных функций, а для повышения производительности при их обработке - соответствующих индексов.

Для прозрачного внедрения темпоральной технологии организации данных в существующие системы требуется использование представлений, замещающих собой соответствующие использовавшиеся ранее таблицы, для обработки запросов модификации данных - триггеров типа «instead of»:

1. Выполняется генерация SQL-дампа исходной таблицы базы данных.

2. Создаются темпоральные таблицы Элементов и Атрибутов.

3. Удаляется исходная таблица.

4. Создается представление (view) с тем же именем, что и исходная таблица.

5. Для созданного представления создаются триггеры instead of insert/update/delete.

6. Выполняется восстановление данных посредством запуска скрипта SQL-дампа.

Экспериментальная проверка предложенных моделей темпоральной организации данных проводилась посредством сравнения ранее известной модели полнотемпоральной организации данных (2) с полутемпоральной моделью на базе одного отношения (совпадающего по функциональности с полнотемпоральной моделью), полутемпоральной моделью на базе двух отношений (с расширением операций над сущностями) и полутемпоральной моделью на базе четырех отношений (дополнительно обеспечивающих темпоральность метаданных).

В первую очередь была произведена вставка записей с шагом в 10 000 сущностей. Изменение размера баз данных представлено на диаграмме (рис. 1).

50000 40000 30000 20000 10000 о

10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 Ш Полнотемпоральная модель 0Полутемпоральная модель (значения) В Полутемпоральная модель (сущности, значения) В Полутемпоральная модель (классы, атрибуты, сущности, значения)

Рис. 1

Затем была произведена операция обновления значений атрибутов (в соответствии с установленными правилами). Изменения размера базы данных после каждых 10 ООО обновлений (одно обновление каждой записи) изображено на диаграмме (рис. 2).

50000

10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 Рис.2

Таким образом, полутемпоральная модель на основе одного отношения (значений) во всех случаях эффективнее полнотемпоральной модели на 8-12 %.

При сравнении полнотемпоральной модели и полутемпоральной модели на основе двух отношений (сущностей и значений) имеет значение соотношение количества новых сущностей и обновлений. Полутемпоральная модель на основе двух отношений более эффективна в случаях, когда количество обновлений в 2,46 раза больше количества сущностей.

При сравнении полнотемпоральной модели и полутемпоральной модели на основе четырех отношений (классов, атрибутов, сущностей и значений) имеет значение соотношение количества новых сущностей, обновлений и среднего количества обновляемых атрибутов. Если к - отношение количества сущностей к количеству обновлений, г - среднее количество одновременно обновляемых атрибутов каждой сущности, то полутемпоральная модель на основе четырех отношений более эффективна, когда выполняется неравенство:

г < 2,754 - 3,548к.

Поскольку г всегда не меньше 1, то должно выполняться соотношение:

к < (2,754 - 1)/3,548 « 0,494.

То есть на каждую сущность в среднем должно быть больше двух обновлений. Также очевидно, что г всегда меньше 2,745.

Предложенные в работе набор сервисов и алгоритмов, универсальные по отношению ко всем доменам данных, позволяют сохранить системную интероперабельность при организации взаимодействия систем в части обеспечения их семантической интероперабельности.

В четвертом разделе производится оценка эффективности предложенных моделей и алгоритмов на основе исследования результатов использования разработанного программного комплекса в процессе его эксплуатации в Автоматизированной информационной системе «Электронный социальный регистр населения Республики Мордовия».

Использование темпоральной организации метаданных позволило построить систему, устойчивую к изменениям форматов обмена и структур данных. Темпоральная организация данных обеспечивает отслеживание источников данных и разграничение персональной ответственности между участниками взаимодействия за их содержание и достоверность.

В заключении формулируются основные результаты диссертационной работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ ПО РАБОТЕ

В ходе теоретических и экспериментальных исследований, выполненных в диссертационной работе, были получены следующие научные и практические результаты:

1. Проведен системный анализ информационных потребностей коллективных пользователей автоматизированных информационных систем, выявивший ограниченную применимость существующих способов коллективного управления данными.

2. Разработана реляционная модель темпоральной организации данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

3. Разработана реляционная модель темпоральной организации данных и метаданных, обеспечивающая темпоральность метаданных, исключающей возникновение проблем отсутствующих значений.

4. Разработана реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

5. Реализация предложенных моделей на основе промышленной системы управления базами данных и их сравнение с известной полнотемпоральной моделью показали, что простая полутемпоральная модель требует меньшего объема памяти во всех случаях, а полутемпоральная модель, обеспечивающая темпоральность метаданных, - в части случаев. Предложена методика реорганизации баз данных существующих автома-

газированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

6. Анализ результатов использования разработанного программного комплекса в процессе его эксплуатации показал эффективность предложенных реляционных моделей.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, рекомендованных ВАК РФ

1. Лизин, С. Н. Электронные государственные услуги: проблемы и решения / С. Н. Лизин // Открытые системы. - 2011. - № 6(172). - С. 22-25.

2. Лизин, С. Н. Управление данными в корпоративных системах / С. Н. Лизин // Открытые системы. - 2010. - № 8(164). - С. 31-33.

3. Лизин, С. Н. Три барьера на пути к электронному государству / С. Н. Лизин // Открытые системы. - 2009. - № 6(152). - С. 28, 29.

Публикации в других изданиях

4. Лизин, С. Н. Темпоральная организация данных и метаданных для коллективного управления данными / С. Н. Лизин // Журнал СВМО. -2011.-Т. 13, №3,-С. 135-145.

5. Лизин, С. Н. Управление данными в корпоративных информационных системах / С. Н. Лизин, С. А. Федосин // Журнал СВМО. - 2010. -Т. 12, №4.-С. 263-270.

6. Лизин, С. Н. Построение информационных систем, содержащих юридически значимую информацию / С. Н. Лизин // Объектные системы - 2010 : материалы I Междунар. науч.-практ. конф. (г. Ростов-на-Дону, 10-12 мая 2010 г.) / под общ. ред. П. П. Олейника. - Ростов н/Д, 2010. -С. 90, 91.

7. Лизин, С. Н. Построение информационной системы с темпоральными данными и метаданными на базе Microsoft SQL Server / С. H. Лизин // Технологии Microsoft в теории и практике программирования : сб. тр. VII Всерос. науч.-практ. конф. студентов, аспирантов и молодых ученых. - М„ 2010. - С. 259-260.

8. Лизин, С. Н. Проблемы управления мастер-данными при построении распределенно-централизованных информационных систем на примере Электронного социального регистра населения Республики Мордовия 1 С. Н. Лизин // Материалы межвузовской научной конференции по проблемам информатики «СПИСОК-2009». - Екатеринбург, 2009. -С. 237-240.

9. Лизин, С. Н. Проблемы управления мастер-данными в контексте интеграции автоматизированных информационных систем / С. Н. Лизин // Электронная Казань - 2009 : материалы Междунар. науч.-практ. конф.

(Казань, 27-29 апреля 2009 г.) / редкол.: К. Н. Пономарев (пред.) и др. -Казань : ЮНИВЕРСУМ, 2009. - С. 105-108.

10. Лизин, С. Н. Проблемы создания систем межведомственного информационного взаимодействия / С. Н. Лизин // Наука и инновации в Республике Мордовия : материалы УП Респ. науч.-практ. конф. - Саранск : Мордовск. 17м. ин-т, 2008. - С. 531-537.

11. Лизин, С. Н. Интеграция государственных информационных ресурсов Республики Мордовия (на примере информационного взаимодействия ведомственных информационных ресурсов с Электронным социальным регистром населения Республики Мордовия) / С. Н. Лизин // Наука и инновации в Республике Мордовия : материалы VI Респ. науч.-практ. конф. - Саранск : НИИГН при Правительстве РМ, 2007. - С. 398403.

12. Лизин, С. Н. Автоматизация управления производственно-экономическими процессами в агропромышленном комплексе / С. Н. Лизин, А. Р. Сафаров // Наука и инновации в Республике Мордовия : материалы V Респ. науч.-практ. конф. - Саранск : Изд-во Мордовск. ун-та, 2006. -С. 96-98.

13. Лизин, С. Н. О создании систем электронного документооборота на предприятиях Республики Мордовия / С. Н. Лизин, В. И. Стешин // Наука и инновации в Республике Мордовия : материалы V Респ. науч.-практ. конф. - Саранск : Изд-во Мордовск. ун-та, 2006. - С. 509-512.

Регистрация изобретения

14. Компьютерная система и способ управления данными / Лизин С.Н. Заявка о выдаче патента на изобретение. 2010139447 RU, МПК G06.

Научное издание

ЛИЗИН Сергей Николаевич

СОВЕРШЕНСТВОВАНИЕ ПРОЦЕССОВ КОЛЛЕКТИВНОЙ ОБРАБОТКИ ИНФОРМАЦИИ НА ОСНОВЕ ТЕМПОРАЛЬНОЙ ОРГАНИЗАЦИИ ДАННЫХ И МЕТАДАННЫХ

Специальность 05.13.17 - Теоретические основы информатики (технические науки)

Подписано в печать 15.11.2011. Формат 60x84716. Усл. печ. л. 1,16. Заказ № 002006. Тираж 100.

Издательство ПТУ. 440026, Пенза, Красная, 40. Тел./факс: (8412) 56-47-33; e-mail: iic@pnzgu.ru

Оглавление автор диссертации — кандидата технических наук Лизин, Сергей Николаевич

Содержание.

Введение.

1. Совершенствование коллективной обработки информации в современных автоматизированных информационных системах.

1.1. Автоматизированные информационные системы на основе реляционных баз данных.

1.2. Управление совместными данными.

1.3. Выводы по разделу.

2. Модели темпоральной организации данных и метаданных для совершенствования коллективной обработки информации.

2.1. Модели темпоральной организации данных для совершенствования коллективной обработки информации.

2.2. Модели темпорального хранения метаданных и совместных данных.

2.3. Выводы по разделу.

3. Реализация моделей темпоральной организации данных и метаданных средствами промышленных реляционных СУБД.

3.1. Реализация темпорального хранения данных и метаданных в Microsoft SQL Server.

3.2. Методика реорганизации существующих баз данных.

3.3. Сравнение эффективности темпоральной организации данных с известными аналогами.

3.4. Выводы по разделу.

4. Апробация разработанных технологий для организации взаимодействия информационных систем.

4.1. Постановка задачи информационного взаимодействия.

4.2. Описание решения задачи информационного взаимодействия.

4.3. Выводы по разделу.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Лизин, Сергей Николаевич

Актуальность темы. Возрастающие объемы информации требуют изменения бизнес-процессов предприятий и организаций. На смену традиционному бумажно-ориентированному взаимодействию, где информационные системы лишь обрабатывают сведения из бумажных документов-первоисточников, приходят электронно-ориентированные системы, в которых первоисточником являются операции, совершаемые пользователями в информационной системе.

Большинство современных корпоративных информационных систем -это многопользовательские автоматизированные информационные системы на основе реляционных баз данных. Возможность выполнения пользователями отдельных операций в системе определяется (программно или нормативно) содержанием в базе данных в каждый момент времени данных. Для возможности обнаружения некорректных операций и установления их причин (действия пользователя, неактуальность данных или другие факторы) необходима возможность восстановления содержания базы данных по состоянию на произвольный момент времени. Современные стандарты требуют хранения данной информации не менее 3-5 лет.

Для этих целей могут быть использованы существующие технологии темпоральных баз данных. Среди исследований в данной области можно отдельно выделить работы Р. Снодграса, К. Йенсена, А. Стейнера, К. Дейта. Среди отечественных работ в данной области следует отметить работы Б. А. Новикова, Е. А. Горшковой, Д. С. Порай, А. В. Соловьева, Г. В. Королькова. Большая часть из них сосредоточена на разработке специализированных языков запросов, темпоральных СУБД и других инструментальных средств, упрощающих оперирование темпоральными данными. Использование темпоральных баз данных для целей управления коллективным доступом к данным до настоящего времени практически не исследовалось.

Поскольку большинство современных многопользовательских АИС имеют клиент-серверную архитектуру, то для решения указанной задачи требуется обеспечение возможности восстановления данных, содержавшихся в момент выполнения пользователем операции, не в базе данных, а в локальном кэше клиента. Одновременно требуется сохранение сведений об авторстве всех производимых в данных изменений.

В настоящее время обеспечение юридической значимости информации на практике применимо лишь в отношении электронных документов. Документ, сформированный на основании данных информационной системы, приобретает юридическую значимость после его подписи уполномоченным должностным лицом, которое может не иметь возможности проверки истинности исходных данных. Не редки ситуации, когда выборки из информационной системы формируются и подписываются автоматически (электронным сервисом). Если в корпоративных информационных системах отслеживание авторства всех изменений совместно с некоторым набором организационных документов может быть достаточным способом разграничения ответственности за данные, то при совместной обработке данных пользователями нескольких юридических лиц необходимо обеспечение юридической значимости (посредством электронной подписи) всех производимых изменений.

Изменение отдельных категорий данных, особенно при обработке совместных данных, не может осуществляться отдельными пользователями, а требует согласования, которое может осуществляться различными способами (все участники, большинство, отдельные участники и более сложные схемы). Причем проведение согласования должно осуществляться не на уровне пересылки сообщений, а в рамках единого юридически значимого массива данных.

Совместная обработка данных несколькими информационными системами зачастую предполагает не просто редактирование единого информационного массива, а редактирование только общих элементов либо только поддержание связанности единых элементов (НСИ, Master Data Management). Зачастую данные в различных информационных системах могут быть организованы с использованием различных структур данных, которые также необходимо связывать.

Другой крайне важной задачей является необходимость обеспечения возможности модернизации информационных систем и связей между ними. В первую очередь сложность составляет необходимость модернизации метаданных систем. Таким образом, требуется обеспечение темпоральности не только данных, но и метаданных систем. При этом требуется обеспечение работы с данными прошлых периодов в соответствующей схеме данных.

Актуальность данной тематики отмечается в Клермонтском отчете об исследованиях в области баз данных, в котором задачи нахождения компромиссов между согласованностью и доступностью для достижения лучшей производительности и масштабируемости, отслеживания происхождения данных, а также поддержки эволюции схем и версий отнесены к числу приоритетных исследований в области баз данных.

Объектом исследования являются процессы коллективного управления данными в автоматизированных информационных системах.

Предметом исследования являются модели представления данных и метаданных в реляционных базах данных и способы их коллективной обработки.

Цель диссертационной работы - разработка моделей темпоральной организации данных и метаданных для совершенствования процессов коллективной обработки данных в автоматизированных информационных системах.

В диссертационной работе поставлены и решены следующие задачи:

1. Системный анализ информационных потребностей коллективных пользователей автоматизированных информационных систем, оценка применимости существующих способов коллективного управления данными.

2. Разработка реляционной модели темпоральной организации данных, позволяющей осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

3. Разработка реляционной модели темпоральной организации данных и метаданных, обеспечивающей темпоральность метаданных, исключающей возникновение проблем отсутствующих значений.

4. Разработка реляционной модели темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющей осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

5. Апробация предложенных моделей путем их реализации на основе промышленной системы управления базами данных и оценка их эффективности в сравнении с известными прототипами, разработка методики реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

6. Оценка эффективности предложенных моделей и алгоритмов на основе исследования результатов использования разработанного программного комплекса в процессе его эксплуатации.

Методы исследования. В диссертационной работе использованы теоретические основы информационных систем и технологий, теория 7 управления, теория системного анализа, элементы теории множеств, теория баз данных, реляционная алгебра, теория темпоральных баз данных, математическая логика, методы проектирования информационных систем.

Научная новизна работы. Научная новизна результатов диссертационного исследования представлена совокупностью следующих положений:

1. Предложена реляционная модель темпоральной организации данных, отличающаяся раздельным хранением сведений о жизненных циклах сущностей и значений атрибутов на основе полутемпоральных отношений и использованием отношения транзакций, включающего сведения об авторстве изменений, электронной подписи и максимуме транзакционного времени исходных данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

2. Предложена реляционная модель темпоральной организации данных и метаданных, отличающаяся раздельным хранением сведений о жизненных циклах классов, атрибутов, сущностей и значений атрибутов на основе полутемпоральных отношений, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.

3. Предложена реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, отличающаяся наличием темпоральных связей между классами, атрибутами и сущностями, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

4. Впервые предложена методика реорганизации баз данных существующих автоматизированных систем для совершенствования процессов коллективного управления данными на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

Практическая значимость. Практическое значение результатов данной работы состоит в повышении эффективности управления данными и сокращении сроков модернизации автоматизированных информационных систем.

Основные положения, выносимые на защиту:

1. Реляционная модель темпоральной организации данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

2. Реляционная модель темпоральной организации данных и метаданных, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.

3. Реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

4. Методика реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

Внедрение результатов работы. Результаты диссертационной работы использованы:

1) при модернизации АИС «Электронный социальный регистр населения Республики Мордовия» для построения регионального регистра получателей государственной помощи и организации информационного взаимодействия Министерства социальной защиты населения Республики Мордовия с Отделением Пенсионного фонда по Республике Мордовия;

2) в научно-исследовательской работе по теме «Создание действующего макета системы автоматизированного учета и формирования справочной отчетности о тиражах печатных средств массовой информации», выполненной Закрытым акционерным обществом «Эволента» в 2011 г. по заказу Федерального агентства по печати и массовым коммуникациям.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и научных школах: конференции «Наука и инновации в Республике Мордовия» (Саранск, 2006-2009), Ежегодной научной конференции «Огаревские чтения» (Саранск, 2007, 2008), Четвертой международной научной школы-семинара «Математическое моделирование, численные методы и комплексы программ» (Саранск, 2009), Международной научно-практической конференции «Электронная Казань - 2009» (Казань, 2009), Межвузовской научной конференции по проблемам информатики «СПИСОК-2009» (Екатеринбург, 2009), VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010), I Международной научно-практической конференции «Объектные системы - 2010» (Ростов-на-Дону, 2010).

На конкурсе работ VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010) доклад автора был отмечен дипломом первой степени по секции «Базы данных и информационные системы».

Публикации. Основные результаты, полученные в диссертации, опубликованы в 13 статьях (3 из них в соавторстве), в том числе 3 статьи - в журналах, рекомендованных ВАК для публикации результатов научных работ. Подана заявка на выдачу патента на изобретение РФ.

Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 171 наименования. Объем работы - 135 страниц.

Заключение диссертация на тему "Совершенствование процессов коллективной обработки информации на основе темпоральной организации данных и метаданных"

4.3. Выводы по разделу

1. Предложенная в настоящей работе технология позволила организовать внешнее и внутреннее информационное взаимодействие в Автоматизированной информационной системе «Электронный социальный регистр населения Республики Мордовия» в целях организации предоставления социальной доплаты к пенсии.

2. Использование темпоральной организации метаданных позволило построить систему, устойчивую к изменениям форматов обмена и структур данных.

3. Темпоральная организация данных позволила обеспечить отслеживание источников данных и разграничение персональной ответственности между участниками взаимодействия за их содержание и достоверность.

Заключение

В ходе теоретических и экспериментальных исследований, выполненных в диссертационной работе, были получены следующие научные и практические результаты:

1. Проведен системный анализ информационных потребностей коллективных пользователей автоматизированных информационных систем, выявивший ограниченную применимость существующих способов коллективного управления данными.

2. Разработана реляционная модель темпоральной организации данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.

3. Разработана реляционная модель темпоральной организации данных и метаданных, обеспечивающая темпоральность метаданных, исключающей возникновение проблем отсутствующих значений.

4. Разработана реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.

5. Реализация предложенных моделей на основе промышленной системы управления базами данных и их сравнение с известной полнотемпоральной моделью показали, что простая полутемпоральная модель требует меньшего объема памяти во всех случаях, а полутемпоральная модель, обеспечивающая темпоральность метаданных, - в части случаев. Предложена методика реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.

6. Анализ результатов использования разработанного программного комплекса в процессе его эксплуатации показал эффективность предложенных реляционных моделей.

Библиография Лизин, Сергей Николаевич, диссертация по теме Теоретические основы информатики

1. Алексеев Р., Заборов М., Никитин В. Восходящая «Звезда» MDM // Директор информационной службы. 2008. - № 09.

2. Анфилатов В. С. и др. Системный анализ в управлении: Учеб. пособие / В. С. Анфилатов, А. А. Емельянов, А. А. Кукушкин; Под ред. А.А. Емельянова. М.: Финансы и статистика, 2002. - 368 с.

3. Виер И. В., Капцан Ф. В., Курбан В. В., Сеничев Г. С., Урцев В. Н„ Фомичев А. В. Корпоративная система нормативно-справочного сопровождения // Сталь. 2005. - № 5.

4. Галкин Г. Мифы и парадигмы интеграции приложений // Intelligent Enterprise (RE). 2004. - № 12-13 (101).

5. Глинников М. Универсальные рельсы автоматизации // Директор информационной службы. 2008. - № 09.

6. Глинских А. Мировой рынок ERP-систем // Jet Info. 2002. -№ 2 (105).

7. Головко М. Уроки лоскутной автоматизации, или Почему не работают знания при «серьезных» подходах // Директор информационной службы. -1999. № 19.

8. Гребнев А. Г., Гулько Д. Е. Система нормативно-справочной информации: типовые ошибки и заблуждения // Газовая промышленность. -2004. № 6.

9. Гринев М. Н., Кузнецов С. Д. Управление данными: достижения и проблемы / Всероссийский конкурсный отбор обзорно-аналитических статей по приоритетному направлению «Информационно-телекоммуникационные системы», 2008.-48 с.

10. Гудков К. С. Консолидация нормативно-справочной информации в распределённых информационных системах // Труды 51-ой научной конференции МФТИ. Часть VII. Управление и прикладная математика, 2008.- Том 3.

11. Гулько Д. Единая система НСИ основа сервисно-ориентированной архитектуры // Intelligent Enterprise (RE). - 2006. - № 22 (154).

12. Гулько Д. Как избежать типовых ошибок при построении корпоративных и отраслевых систем нормативно-справочной информации // PC Week/RE. 2004. - № 18 (432).

13. Дейт К. Дж. Введение в системы баз данных, 8-е издание: Пер. с англ.- М.: Вильяме, 2006. 1328 с. - ISBN 5-8459-0788-8.121

14. Дехтярь М. И. Лекции по дискретной математике: учебное пособие. -М.: БИНОМ. Лаборатория знаний, Интернет-университет информационных технологий ИНТУИТ.ру, 2007.

15. Дубова Н. Краткий курс интеграции данных // Открытые системы. -2007.-№9.

16. Интероперабельность информационных систем. Сборник материалов. М.: INFO-FOSS.RU, 2008. - 128 с.

17. Канов А. П. Нормативно-справочная информация как объект управления бизнес-процессами авиакомпании // Информационные технологии в проектировании и производстве. 2006. - № 3. - С. 23-26.

18. Карминский А.М., Черников Б.В. Информационные системы в экономике. М.: Финансы и статистика, 2006.

19. Кинкейд Д. Из плохих данных следуют плохие решения // Директор информационной службы. 2003. - № 10.

20. Колесов А. Технология управления НСИ корпоративного уровня // РС \УеекЖЕ. 2005. - № 18 (480).

21. Колчина Л., Миронов В. Регламенты как гарантия качества // Директор информационной службы. 2008. - № 03.

22. Колчина Л., Миронов В. Шаг к созданию общего информационного пространства // Директор информационной службы. 2008. - № 11.

23. Концепция формирования в Российской Федерации электронного правительства до 2010 года Утверждена распоряжением Правительства Российской Федерации от 6 мая 2008 г. № 632-р. // Собрание законодательства Российской Федерации. 2008. - № 20.

24. Костенко Б. Б., Кузнецов С. Д. История и актуальные проблемы темпоральных баз данных // Труды Института системного программирования РАН. 2007. - Т. 13, № 2. - С. 77-114.

25. Костяков С. Бизнес по нормам и правилам // Intelligent Enterprise (RE). 2006. - № 22 (154).

26. Кузнецов С. Д. Год эпохи перемен в технологии баз данных // Труды Института системного программирования РАН. 2010. - Т. 19. - С. 9-33.

27. Кузнецов С. Д. Основы баз данных 2-е изд. - М.: Интернет-Университет Информационных Технологий; Бином. Лаборатория знаний. -2007. - 484 с. - ISBN 978-5-94774-736-2.

28. Кузнецов С. Д. Транзакционные параллельные СУБД: новая волна // Труды института системного программирования РАН. 2011. - Т. 20. -С. 189-251.

29. Марин Л. Ф., Бойченко Е. В. Технологии создания автоматизированных систем о населении. М.: ИКФ Каталог. - 2003.

30. Мейер Д. Теория реляционных баз данных: Пер. с англ. М.: Мир. -1987. - 608 с.

31. Минасян Г. Интеграционные аспекты единых систем НСИ // Директор информационной службы. 2008. - № 12 (79).

32. Михайлов И. С. Подход концептуального метамоделирования для обеспечения структурной и семантической интероперабельности информационных систем // Ученые записки РГСУ. 2007. - № 1. - С. 93-100.

33. Михайлов С. Национальные подходы к системам поддержки НСИ // СЮ.-2005.-№2.

34. Новиков Б. А., Горшкова Е. А. Темпоральные базы данных: от теории к применению // Программирование, 2008. Т. 34, № 1.123

35. Оганесян А. Интеграция НСИ // PCWeek/RE. 2004. - № 19 (433).

36. Олейник А. Я. Технологии открытых систем. М.: Интернет-университет информационных технологий - ИНТУИТ.ру, 2010.

37. Полотнюк И. Межведомственная интеграция: пути оптимизации // Информационные ресурсы России. 2006. - № 5.

38. Полотнюк И. Метаданные как базис интеграции // PCWeek/RE. -2005. № 30 (492).

39. Помазков Я. Системы НСИ: мировой опыт и тенденции развития // PC Week/RE. 2006. - № 12 (522).

40. Порай Д. С., Соловьев А. В., Корольков Г. В. Реализация концепции темпоральной базы данных средствами реляционной СУБД // Документооборот. Концепции и инструментарий / ред. В.Л. Арлазаров, Н.Е. Емельянов: Эдиториал УРСС, 2004. С. 92-109.

41. Порай Д. С., Тарханов И. А. Односторонняя интеграция информационных систем // Труды Института системного анализа Российской академии наук. 2007. - Т. 29. - С. 59-70.

42. Самохин А. М., Соколов М. А., Чучкин В. И. Технология программных адаптеров в методике интеграции разнородных информационных систем. // Научная сессия МИФИ-2007. 2007. - Т. 12.

43. Седов О. Разнообразие нормативно-справочных ландшафтов // Директор информационной службы. 2008. - № 05.

44. Сергеев Г. Н. SR*-flepeaBo: метод индексирования исторических данных // Информационные технологии и программирование. 2002. -№ 3. - 64 с.

45. Советов Б. Я., Яковлев Б. А. Моделирование систем: Учеб. для вузов 3-е изд. - М.: Высшая школа, 2001.

46. Стрелкова Е. Интеграция данных предприятия // Открытые системы. 2003. - №4.

47. Табаков В. А., Филиппов В.Е., Шутов A.B. Совершенствование системы НСИ предприятия // Газовая промышленность. 2004. - № 3, -С. 38-39.

48. Таненбаум Э., ван Стеен М. Распределенные системы. Принципы и парадигмы. С.: Питер, 2003. - 877 с. - ISBN 5-272-00053-6.

49. Тарханов И. А. Интеграция Системы Электронных Выплатных Дел со сторонними приложениями // Сборник трудов ИСА РАН. «Системный подход к управлению информацией». 2006. - Т. 23.

50. Трейер В. В. Информация ключ к управлению // Управление Компанией. - 2005. - № 11.

51. Трейер В. В. Как формировать корпоративные электронные справочники продукции // PCWeek/RE. 2005. - № 40.

52. Тузовский А. Ф. Распределенная информационно-телекоммуникационная система для работы с онтологическими моделями знаний // Вычислительные технологии. 2007. - Т. 12, спец. вып. 1.

53. Тюрганов А. Г. Семантическое моделирование информационных систем // Интеллектуальные системы и технологии. Научная сессия МИФИ-2006. 2006. - Т. 3.

54. Федеральный закон от 17 июля 1999 г. №178-ФЗ «О государственной социальной помощи» // Собрание законодательства Российской Федерации. -1999. № 29.

55. Федеральный закон от 27.07.2006 №149-ФЗ «Об информации, информационных технологиях и о защите информации» // Собрание законодательства Российской Федерации. 2006. - № 31.

56. Хохлов С. А., Соколов М. А., Самохин А. М. Безопасность методики интеграции разнородных информационных систем экономико-организационного типа // Научная сессия МИФИ-2007. 2007. - Т. 10.

57. Чардин П. Многоверсионность данных и управление параллельными транзакциями // Открытые системы. 2005. - № 1.

58. Черняк JI. НСИ: «живые» и «мертвые» // Директор информационной службы. 2008. - № 9.

59. Черняк JI. Задачи управления мастер-данными // Открытые системы. 2007. - № 5.

60. Шварц С. В поисках единственной версии истины // Intelligent Enterprise (RE). 2006. - № 18 (150).

61. Эберт К. Экскурс в историю программных технологий // Открытые системы. 2008. - № 10.

62. Agrawal R., Srikant R. On integrating catalogs // Proceedings of the 10th international conference on World Wide Web. 2001.

63. An MDM Institute MarketPulse In-Depth Report. The MDM Institute, 2009.

64. Ariav G. A Temporally Oriented Data Model // ACM Transactions on Database Systems. 1986. - № 11(4).

65. Atay С. E., Tansel A. U. Bitemporal Databases: Modelling and Implementation. S. : VDM Verlag Dr. Muller, 2009.

66. Axelrod S. MDM is Not Enough Semantic Enterprise is Needed // Information Management Special Reports. - 2008. - № 3.

67. Belcaid A, Lahdensuo K. Data recovery in a distributed system. United States Patent US 7231408 B2,12.06.2007.

68. Ben-Zvi J. The Time Relational Model. Computer Science Dept., UCLA, 1982.

69. Bernstein P. A., Hadzilacos V., Goodman N. Concurrency Control and Recovery in Database Systems. Addison Wesley Publishing Company, 1987. -ISBN 0-201-10715-5.

70. Berson A., Dubov L. Master data management and customer data integration for a global enterprise. The McGraw-Hill, 2007.

71. Böhlen M. H. Temporal Database System Implementations // CM SIGMOD Record. 1995. - № 24(4).

72. Bonnet P. Master Data Management & SOA. Orchestra Networks, 2007.

73. Borsadwala T. F. Modeling master data // Teradata Magazine. 2008. -№ 12.

74. Brunner J. C. and al. Explorations in the Use of Semantic Web Technologies for Product Information Management // WWW 2007, Track: Semantic Web. 2007.

75. Bussler C. Semantic B2B Integration // International Conference on Management of Data. Proceedings of the 2001 ACM SIGMOD international conference on Management of data. 2001.

76. Chisholm M. Master Data versus Reference Data // Information Management Magazine. 2006. - № 4.

77. Clifford J. E. and al. On the Semantics of 'Now' in Databases // ACM Transactions on Database Systems. 1997. - № 22(2).

78. Clifford J., Croker A. The Historical Relational Data Model (HRDM) and Algebra Based on Lifespans // Proceedings of the International Conference on Data Engineering, IEEE Computer Society Press. 1987.

79. Codd E. F. A Relational Model of Data for Large Shared Data Banks // Communications of the ACM. 1970. - № 6, V. 13.

80. Darwen H., Date C. J., McGoveran D. What a Database Really Is: Predicates and Propositions // Relational Database Writings 1994-1997. -Reading, Mass. : Addison-Wesley, 1998.

81. Data Warehouse vs. Data Mart Approaches to Implementing a Data Integration Solution. - Elite Management Consulting, 2006.

82. Date C. J., Darwen H. Databases, types and the relational model: the third manifesto (3rd ed.). R.: Addison-Wesley, 2006. - ISBN 0-321-39942-0.

83. Date C. J., Darwen H., Lorentzos N. A. Temporal Data and the Relational Model. S.: Morgan Kaufmann Publishers. - 2003.

84. Doan A., Noy N. F., Halevy A. Y. Introduction to the special issue on semantic integration // ACM SIGMOD Record. 2004. - № 4, Volume 33.

85. Eckerson W. W. Three Tier Client/Server Architecture: Achieving Scalability, Performance, and Efficiency in Client Server Applications // Open Information Systems. 1995. - № 1.

86. Evaluation Criteria for a Master Data Management Solution. Alpharetta, Georgia: Stratature, 2007.

87. Finding a Master Data Management Architecture that Fits. Technology Insight, 2009.

88. Gadia S. K. A Homogeneous Relational Model and Query Languages for Temporal Databases // ACM Transactions on Database Systems. 1988 r. - 13(4).

89. Gadia S. K. A Seamless Generic Extension of SQL for Querying Temporal Data. Technical Report TR-92-02. -Computer Science Department, Iowa State University, 1992.

90. Gadia S. K„ Yeung C. S. A Generalized Model for a Relational Temporal Database // Proceedings of the ACM SIGMOD International Conference on Management of Data. 1988.

91. Gray J. The Transaction Concept: Virtues and Limitations // Proceedings of Seventh International Conference on Very Large Databases. 1981. - №9.

92. Halevy A.Y. Enterprise Information Integration: Successes, Challenges and Controversies // Proceedings of the 2005 ACM SIGMOD international conference on Management of data. New York, USA : ACM. - P. 778-787.

93. Halpin H. J. When owl:sameAs isn't the Same: An Analysis of Identity // LDOW2010. Raleigh, North Carolina : 6.h., 2010.

94. Heiler S. Semantic interoperability // ACM Computing Surveys (CSUR). -1995 r. Issue 2 : T. Volume 27.

95. Heiland P., Campbell D. Building on Quicksand // C1DR 2009, Fourth Biennial Conference on Innovative Data. Asilomar, USA, 2009.

96. Heiland P. Data on the Outside vs. Data on the Inside // MSDN. -Microsoft Corporation. http://msdn.microsoft.com/en-us/library/ms954587.aspx.

97. Howard P. Master data management and data integration: complementary but distinct. A White Paper by Bloor Research, 2006.

98. IBM Master Data Management: Effective data governance. IBM Master Data Management and data governance, 2007.

99. IEEE Standard Computer Dictionary: A Compilation of IEEE Standard Computer Glossaries / N.:. 1990.

100. Imhoff C. Understanding the Three E's of Integration EAI, Ell and ETL // Information Management Magazine. 2005 r. - № 4.

101. ISO/IEC standard 7498-1:1994. Information technology Open Systems Interconnection - Basic Reference Model: The Basic Model. - 1994.

102. ISO/IEC 11578:1996. Information technology — Open Systems Interconnection — Remote Procedure Call (RPC). 1996.

103. Jensen C. S., Dyreson C. E. The Consensus Glossary of Temporal Database Concepts // Lecture Notes in Computer Science. 1998. - Vol. 1399.

104. Jensen C. S., Snodgrass R. T. Temporal Data Management // IEEE Transactions on Knowledge and Data Engineering. 1999. - 11(1).

105. Jensen C. S. The TEMPIS Project. Proposal for a Data Model for the Temporal Structured Query Language TEMPIS Technical Report № 37. -Tuscon : Department of Computer Science, University of Arizona. - 1992.129

106. Jensen C. S., Snodgrass R. T. Semantics of Time-Varying Attributes and their Use for Temporal Database Design // Lecture Notes In Computer Science. -1995.-Vol. 1021.

107. Jhingran A.D., Mattos N., Pirahesh H. Information integration: A research agenda // IBM Systems Journal. 2002. - № 41(4). - P. 555-562.

108. Karel R. Introducing Master Data Management. Forrester Research, 2006.

109. Koch C. Data Integration against Multiple Evolving Autonomous Schemata. Dissertation. - 2001.

110. Lenzerini M. Data Integration: A Theoretical Perspective // PODS-2002, Madison, USA, June 2002. 2002.

111. Lorentzos N. A. A Formal Extension of the Relational Model for the Representation and Manipulation of Generic Intervals. Ph.D. Thesis. -Department of Computer Science, Birkbeck College, University of London, 1988.

112. Loser C., Legner C., Gizanis D. Master Data Management For Collaborative Service Processes. Beijing : Research Center for Contemporary Management, Tsinghua University, 2004.

113. Loshin D. Defining Master Data // BeyeNETWORK. 2006. - №5.

114. Loshin D. Master Data Management. Elsevier Science & Technology Books, 2008.

115. Ma L. Semantic Web Technologies and Data Management. Cambridge, USA : W3C Workshop on RDF Access to Relational Databases, 25-26 October 2007. - 2007.

116. Master Data Management: Creating a Single View of the Business. -Powell Media, LLC., Intelligent Solutions and BI Research, 2006.

117. Mahmood N., Burney A., Ahsan K. A Logical Temporal Relational Data Model // IJCSI International Journal of Computer Science Issues. 2010. - Vol. 7, № 1.

118. Master Data Management for the Masses of Data // Technology Insight. -2009. № 2.

119. McKenzie J. E. An Algebraic Language for Query and Update of Temporal Databases. PhD thesis. - Chael Hill : Computer Science Department, Univ. of North Carolina, 1988.

120. McKenzie J. E., Snodgrass R. T. Supporting Valid Time in an Historical Relational Algebra: Proofs and Extensions. Technical Report TR9115. -Tucson, USA : Department of Computer Science, University of Arizona, 1991.

121. Morris H.D., Vesset D. Managing Master Data for Business Performance Management: The Issues and Hyperion's Solution. IDC white papaer, 2005.

122. Oberhofer M., Dreibelbis A. An introduction to the Master Data Management // developer Works. IBM Corporation, 2008.

123. Oracle Database llg Workspace Manager Overview // An Oracle White Paper. 2009.

124. Oracle Flashback Technology. Oracle, 2010.

125. Oracle Total Recall/Flashback Data Archive. Oracle, 2008.

126. Ouksel A. M., Sheth A. Semantic interoperability in global information systems // ACM SIGMOD Record. 1999. - Vol. 28, № 1.

127. OWL Web Ontology Language. -W3C Recommendation, 2004.

128. Pardo T. A. Modeling the Social & Technical Processes of Interorganizational Information Integration. -Proceedings of the 37th Hawaii International Conference on System Sciences, 2004.131

129. Radha R. MDM: Evaluation and Architecture Approach // Information Management Online. 2008. - № 11.

130. Reference Model for Service Oriented Architecture. Committee Specification 1. - 2006.

131. RDF Primer. W3C Recommendation, 2004.

132. Reference Model for Service Oriented Architecture. Committee Specification 1. - 2006.

133. Rosenberg J. M. Dictionary of Computers, Information Processing & Telecommunications, 2nd ed. John Wiley & Sons, 1987.

134. Sciore E., Siegel M., Rosenthal A. Using semantic values to facilitate interoperability among heterogeneous information systems // ACM Transactions on Database Systems (TODS). 1994. - Vol. 19, № 2.

135. Sheth A. P., Larson J. Federated database systems for managing distributed, heterogeneous, and autonomous databases // ACM Computing Surveys (CSUR). 1990. - Vol. 22, № 3.

136. Snodgrass R. T. The Temporal Query Language TQuel // ACM Transactions on Database Systems. 1987. - 12(2).

137. Snodgrass R. T. The TSQL2 Temporal Query Language. Kluwer Academic Publishers, 1995.

138. Snodgrass R. T. Developing Time-Oriented Database Applications in SQL / S.: Morgan Kaufmann Publishers. 2000.

139. SOA in the Real World. Microsoft, 2007.132

140. Streekmann N. and al. Model-Driven Integration of Business Information Systems. Oldenburg, Germany : Softwaretechnik-Trends, 2006.

141. Steiner A. A Generalisation Approach to Temporal Data Models and their Implementations. Departement Informatik, ETH, 1997.

142. Swanton B., Samaraweera D. Master Data Management Framework: Begin With an End in Mind. AMR Research Report, 2005.

143. The Claremont Report on Database Research // ACM SIGMOD Record. -2008. Vol. 37, № 3.

144. The TSQL2 Temporal Query Language. -Kluwer Academic Publishers, 1995.

145. Tansel A. U. and al. Temporal Databases: Theory, Design, and Implementation. Benjamin/Cummings Publishing Company, 1993.

146. Tansel A. U. Adding Time Dimension to Relational Model and Extending Relational Algebra // Information Systems. 1986. -№ 11(4).

147. Torp K. S., Jensen C. S., Snodgrass R. T. Stratum Approaches to Temporal DBMS Implementation // In Proceedings of the 1998 International Database Engineering and Applications Symposium. Cardiff, Wales, UK, 1998. - № 7.

148. Torp K. S., Jensen C. S., Boohlen M. Layered Implementation of Temporal DBMSs Concepts and Techniques. -A TimeCenter Technical Report, 1997.

149. Valmir B. C. An Introduction to Distributed Algorithms. London, England : The MIT Press, 1996.

150. Waddington D. An Architected Approach to Integrated Information. -Kalido, 2004.

151. Wang R., Karel R., Nicolson N. D&B's Acquisition Of Purisma Signals Marke. Forrester Research, 2007.

152. Wang X. S. and al. Logical design for temporal databases with multiple granularities // ACM Transactions on Database Systems (TODS). 1997. -Vol. 22, № 2.

153. White C. Data Integration: Using ETL, EAI, and Ell Tools to Create an Integrated Enterprise / TDWI. 2005.

154. White C. Using Master Data in Business Intelligence. BI Research, 2007.

155. Wolter R. Master Data Management (MDM) Hub Architecture // MSDN. Microsoft Corporation, 2007.

156. Ziegler P. R. Three Decades of Data Integration All Problems Solved? // WCC. - 2004. - P. 3-12.

157. Zimmermann H. OSI Reference Model The ISO Model of Architecture for Open Systems Interconnection // IEEE Transactions on communications. -1980. - COM-28, №4.

158. Елховикова Светлана Ивановна заместитель министра социальной защиты населения Республики Мордовия (председатель комиссии);

159. Ивановичева Евгения Сергеевна заместитель начальника отдела информационных технологий;

160. Елизарова Оксана Эдуардовна главный специалист отдела информационных технологий;