автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методология построения структуры системы обработки информации на основе расширенной реляционной модели данных и алгоритмов

доктора технических наук
Левков, Александр Александрович
город
Уфа
год
2013
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Методология построения структуры системы обработки информации на основе расширенной реляционной модели данных и алгоритмов»

Автореферат диссертации по теме "Методология построения структуры системы обработки информации на основе расширенной реляционной модели данных и алгоритмов"

На правах рукописи

ЛЕВКОВ Александр Александрович

МЕТОДОЛОГИЯ ПОСТРОЕНИЯ СТРУКТУРЫ

СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ НА ОСНОВЕ РАСШИРЕННОЙ РЕЛЯЦИОННОЙ МОДЕЛИ ДАННЫХ И АЛГОРИТМОВ (на примере информационной поддержки деятельности предприятия)

Специальности 05.13.01 - Системный анализ, управление п обработка информации (в промышленности)

Автореферат диссертации на соискание ученой степени доктора технических наук

16 СЕН 2013

Уфа-2013 005533840

005533840

Работа выполнена в ФГБОУ ВПО «Уфимский государственный авиационный технический университет» на кафедре технической кибернетики

Научный консультант заслуж. деятель науки и техники РФ

д-р техн. наук, проф. ИЛЬЯСОВ Барый Галесвич

Официальные оппоненты д-р техн. наук,

МИ ИАКОВ Игорь Александрович

Федеральное государственное бюджетное учреждение науки «Институт проблем управления сложными системами РАН», ст. науч. сотр.

д-р техн. наук, проф. ПАВЛОВ Сергей Владимирович

ФГБОУ ВПО «Уфимский государственный авиациошшй технический университет», зав. кафедрой геоинформационных систем

д-р техн. наук, проф. ФЕДУНОВ Борис Евгеньевич

Федеральное государственное унитарное предприятие «Государственный научно-исследовательский институг авиационных систем»,

нач. лаборатории

Ведущая организация ФГБУН «Санкт-Петербургский институт

информатики и автоматизации РАН»

Защита диссертации состоится 18.10.2013 на заседании диссертационного совета Д-212.288.03 при Уфимском государственном авиационном техническом университете по адресу: 450000, Республика Башкортостан, г. Уфа, ул. К. Маркса, 12

С диссертацией можно ознакомиться в библиотеке университета

Автореферат разослан 2013 г.

Ученый секретарь диссертационного совета д-р техн. наук, проф.

В. В. Миронов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Развитие промышленности и повышение эффективности промышленных предприятий являются одной из наиболее важных задач современности. Выполнение данных задач является базисом развития государства в целом и роста благосостояния его граждан. Повышение эффективности промышленных предприятий и общее развитие промышленности базируется на внедрении инновационных методов и способов производства, но не может быть достигнуто без эффективной информационной поддержки деятельности предприятия.

Системы информационной поддержки деятельности предприятия реализуют выполнение широко круга бизнес-функций предприятия, таких как: управление складом, управление запасами и заказами, управление персоналом, управление продажами, управление отношениями с клиентами, управление документооборотом и т. д. В основе современных систем информационной поддержки деятельности предприятия лежат системы обработки информации, от структуры и способов организации которых напрямую зависит эффективность и надежность выполнения бизнес-задач.

Степень разработанности темы исследования. Решению вопросов логической структуризации данных в системах обработки информации посвящены исследования отечественных ученых С. Кузнецова, М. Когаловско-го, А. Голосова, А. Сахарова, С. Павлова, И. Галахова, И. Блудова, Е. Григорьева, В. Кириллова, О. Христодуло, а также таких известных зарубежных ученых, как С. Date, Е. Codd, R. Воусе, I. Heath, Е. McCreight, A. Maule, M. Fotache, J. Martin, H. Darwen и других. Теоретическими результатами данных исследований являются формальные логические модели данных, а прикладными - системы управления базами данных, позволяющие осуществлять высокоуровневое управление информацией, независимо от формы и способа её хранения.

Область эффективного управления алгоритмами обработки информации глубоко проработана в трудах таких ученых, как Д. фон Неймана, Г. Буча, Е. Григорьева, Б. Страуструпа, P. Wegner, A. Simonet, M. Simonet, M. Roger, U. Keller, A. Степанова и других. Основными результатами данных работ явились объектно-ориентированная (и субъектно-ориентированная), аспектно-ориентированная и обобщенная (А. Степанов) парадигмы обработки информации.

В области формального описания знаний и метаданных работали такие зарубежные ученные, как Б. Рассел, М. Schmidt, G. Smolka, M. Milici, D. Berzati, F. Baader и др., и такие отечественные ученные как М. Черняховская, А. Костюченко, Б. Майер, А. Бездушный, работы которых составили фундамент онтологического описания информации в виде дескриптивных

логик и широко находят применения в построение Symantec Web, прикладных онтологий и т. д.

Несмотря на актуальность данных работ, посвященных различным аспектам проектирования и построения структур систем обработки информации, существует ряд принципиальных проблем, неразрешённых на концептуальном уровне, наличие которых затрудняет построение эффективных, согласованных, целостных и выразительных систем.

Современные системы обработки информации, сталкиваясь с возрастающей интенсивностью потоков данных, увеличением их количества, возрастающей связностью информации, усложнением методов обработки данных и расширением областей своего применения в целом, требуют использования новых, комплексных средств организации структуры данных и средств их обработки.

Современные системы обработки информации уже не могут быть описаны на основе нестрогих и фрагментарных моделей, независимо друг от друга определяющих различные компоненты системы (факты, ограничения целостности, алгоритмы и знания). Для построения эффективных систем информационной поддержки деятельности предприятия необходима новая методология построения структуры системы обработки информации, позволяющая формально описать данные и алгоритмы их обработки в рамках единого неразрывного пространства абстракций.

Целью диссертационной работы является разработка методологии, теоретических основ и прикладных методов построения структуры системы обработки информации на основе расширенной реляционной модели данных и алгоритмов, применение их в составе систем информационной поддержки деятельности предприятия и оценка их эффективности.

Основные задачи, которые потребовалось решить для достижения цели:

1. Разработать информационную модель структуры системы обработки информации на основе системной интеграции данных и алгоритмов.

2. Разработать методы и принципы структуризации реляционных данных, направленные яа построение иерархий реляционных отношений и повышение согласованности информации и разработать способы их реализации в рамках существующих систем управления базами данных.

3. Разработать методы описания и структуризации алгоритмов обработки информации в рамках расширенной реляционной модели данных, основанные на иерархической декомпозиции и нормализации алгоритмов и разработать способы их реализации в рамках существующих систем управления базами данных.

4. Разработать методы отображения пространства определения онтологий (концепции открытого мира) в пространство определения баз данных

(концепцию закрытого мира) и способы прямой и обратной трансформации расширенных реляционных схем данных в онтологии дескриптивных логик.

5. Разработать прикладную систему обработки информации на основе расширенной реляционной модели данных и алгоритмов, применить её в составе системы информационной поддержки деятельности предприятия и оценить её эффективность.

Научпая новизна диссертационной работы заключается в следующем:

1. Предложена информационная модель структуры системы обработки информации на основе триады «Данные»-«Знания»-«Действия», отличающаяся системной интеграцией элементов в рамках единого базиса описания информации и позволяющая формулировать задачи хранения данных, обработки информации и манипуляции знаниями в рамках единой модели данных.

2. Предложена расширенная реляционная модель данных, которая отличается:

• предложенной структурообразующей функцией семантической эквивалентности, позволяющей создавать целостные иерархии реляционных отношений;

• типизацией неопределенных значений, что позволяет выявлять и устранять скрытые аномалии в структурах реляционных схем данных;

• предложенными правилами совместимости реляционных отношений по теоретико-множественным операторам и новой интерпретацией области определения атрибутов реляционных отношений, что позволяет повысить логическую целостность данных.

3. Предложены методы описания и структуризации алгоритмов в рамках расширенной реляционной модели данных, отличающиеся учетом алгоритмов как элементов данной модели, их структуризацией на основе устранения повторяющихся инструкций и семантических эквивалентностей, что позволяет минимизировать количество алгоритмов в системе, повышая целостность и согласованность всей системы обработки информации в целом.

4. В рамках интеграции онтологии и расширенной реляционной модели данных предложены:

• метод отображения концепции открытого мира в концепцию закрытого мира, основанный на покрытии пространства определения открытого мира суперпозицией реляционных выражений; данный метод отличается использованием неопределенных значений и возможностью выбора совокупности реляционных выражений, имеющих минимальную пространственную сложность, что позволяет производить трансляцию выражений дескриптивных логик в выражения реляционной модели данных;

• вариант дескриптивной логики, соответствующий иерархически-реляционным структурам в рамках расширенной реляционной модели дан-

ных, отличающийся использованием оператора наследования концептов и типизацией ролей с помощью концептов, что позволяет транслировать расширенные реляционные схемы данных в терминологические аксиомы дескриптивной логики и обратно.

Практическую значимость работы составляют:

1. Методы универсальной и специальной структуризации реляционных отношений по критерию семантической эквивалентности, методы структуризации отношений на основе типизированных неопределенных значениях, что позволяет создавать таксономии реляционных отношений, повышает централизацию данных и увеличивает их согласованность.

2. Методы структуризации алгоритмов на основе инструкций и методов как особого вида атрибутов расширенной модели данных и алгоритмов, их нормализации и структуризации на основе отношения семантической эквивалентности, что позволяет повысить целостность алгоритмов обработки данных и согласованность данных и алгоритмов.

3. Методы трансформации выражений в рамках концепции открытого мира в выражения в рамках концепции закрытого мира и способы трансляции онтологий в расширенные реляционные схемы данных, что позволило реализовать расширенную реляционную модели данных в рамках существующих систем управления базами данных и обеспечить использование предложенных способов структуризации данных в прикладных системах обработки информации без необходимости разработки новых средств управления данными на уровне внутренней и внешней памяти.

4. Программная реализация системы обработки информации на основе расширенной реляционной модели данных и алгоритмов, использование которой позволяет снизить структурную сложность системы обработки информации и повысить целостность данных и алгоритмов, а также их согласованность.

В основу диссертации положены научные результаты, полученные лично автором при непосредственной разработке прикладных информационных систем и технологий для предприятий России:

• система информационной поддержки деятельности промышленного предприятия ОАО «НПП «Мотор»;

• система информационной поддержки деятельности промышленного предприятия ОАО «УЗМ «Магнетрон»;

• система информационной поддержки деятельности фармацевтического торгово-дистрибьюторского предприятия ООО «Илья» (ЗАО «36,6»);

• система информационной поддержки деятельности фармацевтического торгово-дистрибыоторского предприятия ООО «Башмедснаб» (ЗАО «36,6»).

Основные теоретические положения диссертации использованы в учебном процессе УГАТУ: на кафедре Информатики по дисциплине «Организация баз данных» для студентов специальности 230301 «Моделирование и исследование операций в организационно-технических системах».

Эффективность реализованных методов, алгоритмов и программного обеспечения подтверждена 4 актами о внедрении.

Методология и методы исследования.

Объектом исследования являются системы обработки информации, их концептуальные и логические модели, операции над ними, правила композиции их структур. Предметом исследования являются методология и методы построения эффективных систем обработки информации. Для решения поставленных задач в работе использовались методы онтологического и объектно-ориентированного проектирования и программирования, аппарата реляционной алгебры, теории нормализации, теории множеств и дескриптивные логики.

Положения, выпосимые на защиту:

1. Информационная модель структуры системы обработки информации основанная на системной интеграции данных и алгоритмов (соответствует п. 2. паспорта специальности).

2. Методы и принципы структуризации реляционных данных, основанные на построении иерархии реляционных отношений, типизированных неопределенных значениях и активных доменах (соответствует пп. 4, 5 и 8 паспорта специальности).

3. Методы описания и структуризации алгоритмов обработки информации, основанные на нормализации алгоритмов и их консолидации по семантической эквивалентности (соответствует пп. 4, 5 и 8 паспорта специальности).

4. Методы отображения концепции открытого мира в концепцию закрытого мира и способы прямой и обратной трансформации расширенных реляционных схем дапных в онтологии, основанные на дескриптивной логике (соответствует пп. 4, 5 и 8 паспорта специальности).

5. Программная реализация системы обработки информации для поддержки деятельности предприятия (на примере системы обработки информации промышленного предприятия ОАО УЗМ «Магнетрон») на основе предложенных методов структуризации данных и алгоритмов их обработки, а также результаты исследования эффективности предложенных методов (соответствует пп. 3, 4, 5, 8 и 12 паспорта специальности).

Степень достоверность и апробация результатов.

Основные результаты научных разработок, выполненных автором по теме диссертации, представлены на международных и российских конференциях:

• Международная конференция С81Т-2002, Греция, Университет г. Патра, 18-24 сентября 2002 г.

• Седьмая международная конференции "Проблемы техники и технологий телекоммуникаций", Самара, 2006.

• Международная научно-технической конференция «Информационно-математические технологии в экономике, технике и образовании», Екатеринбург, 2007.

• Международная научная конференция «Решетневские чтения», Красноярск, 2007.

• Международная научно-техническая конференция "Проблемы техники и технологии телекоммуникаций", Уфа, 2007.

• Международная научно-технической конференция «Проблемы управления и моделирования в сложных системах», Самара, 2012;

• Международная научно-технической конференция «Современные сложные системы управления», С. Оскол, 2012.

• Конференция «Информационные технологии в управлении», Санкт-Петербург, 2012.

• Конференция «Информационные технологии и системы», Челябинск, 2013

Публикации. Основные результаты диссертационной работы отражены в 48 научных трудах, в том числе в 15 статьях в рецензируемых журналах из перечня ВАК, 1 монографии, 30 статьях и трудах конференций, 2 свидетельствах об официальной регистрации программы для ЭВМ, 16 работ без соавторов.

Структура и объем работы. Диссертация включает введение, 6 глав, заключение, библиографию из 146 наименований и 12 приложений. Диссертация изложена на 330 страницах текста, из них основное содержание работы составляет 264 страницы, в т. ч. 8 таблиц, 113 рисунков.

ОСПОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность проблемы построения даталоги-ческой и алгоритмической структуры системы обработки информации для информационной поддержки деятельности предприятия. Сформулирована цель диссертационной работы, перечислены задачи исследований, научная новизна, апробация, практическая ценность и реализация основных результатов работы.

В первой главе рассмотрены существующие подходы к построению структуры системы обработки информации в рамках систем поддержки деятельности предприятия, основанные на механистическом объединении разных информационных моделей, что приводит к внутренним противоречиям и

несогласованностям таких систем и невозможности использования существенной части возможностей каждой из моделей.

Определены основные черты системы обработки информации для управления предприятием:

• Большой объем обрабатываемых данных при интерактивном режиме работы, что требует использования только масштабируемых, ресурсно-эффективных решений.

• Сложная схема данных, состоящая из большого количества абстракций и связей между ними (103-106 элементов), что не позволяет эффективно использовать экспертный анализ и требует применения адекватных исходной системе формальных методов структуризации.

• Сложная семантика данных, требующая применения множества сложных алгоритмов обработки данных и организации формальной связи данных и метаданных, что определяет необходимость нового подхода к организации структуры системы обработки информации.

• Высокая динамика структуры системы, обусловленная влиянием как внешних факторов, так и внутренним развитием системы, и требующая одновременно обеспечения надежности и оперативности выполнения изменений.

Рассмотрены паиболее распространенные подходы к проектированию и построению структуры системы обработки информации для поддержки деятельности предприятия:

• проектирование на основе логической модели сущность-связь с трансляцией в физическую реляционную схему данных и хранимые процедуры обработки информации;

• объектно-ориентированное моделирование системы на основе реляционного хранилища данных и поэлементной обработки объектов.

Первый подход позволяет использовать формальные средства структуризации данных и получать высокую ресурсную эффективность прикладных реализаций, но не позволяет структурировать алгоритмы обработки данных, являющиеся существенной частью системы обработки информации, что приводит к необходимости экспертного контроля за целостностью и согласованностью алгоритмов. Кроме того, данный подход предлагает слишком примитивные средства структуризации реляционных отношений, неадекватные структурам реальной системы. В целом, многие задачи проектирования решаются за счет наращивания организационной сложности проекта, что ведет к существенному росту его стоимости и затрудняет развитие и поддержку системы.

Второй подход отличается высокой структурной выразительностью и общим системным взглядом на структуризацию данных и алгоритмов как единого целого. Существенными недостатками является отсутствие строго

формализованного базиса структуризации абстракций, что не позволяет в полной мере автоматизировать проектирование и сопровождение системы, и низкая ресурсная эффективность, обусловленная использованием баз данных только как хранилища объектов и поэлементной их обработкой в рамках парадигмы объектно-ориентарованного программирования.

Также рассмотрены вопросы применимости многомерных и онтологических (дескриптивно-логических) моделей данных. Показано, что обе эти модели не предназначены для потоковой интерактивной обработки оперативной информации и не позволяют управлять алгоритмами обработки данных.

Таким образом, вышеперечисленные проблемы существенно затрудняют построение эффективных, надежных и масштабируемых систем обработки информации. Для преодоления данных проблем требуется разработка новых концепций и методов построения структур систем обработки информации, интегрировано отражающих вопросы организации данных и алгоритмов в рамках систем информационной поддержки деятельности предприятия.

Во второй главе предложена информацио1шая модель структуры системы обработки информации системно интегрирующая следующие ключевые абстракции:

• Данные - первичная абстракция, являющаяся отражением внешних и внутренних процессов в рамках системы обработки информации. Сами данные могут быть определены как «информация, в любой форме ее проявления, представленная в пригодном для машинной обработке виде», где информация - «любые сведения». На физическом уровне, в современной информационной среде основанной на двоичной логике, данные являются совокупностью бинарных состояний памяти (как внутренней, так и внешней) вычислительной машины.

• Знания - особый вид данных (дшшые второго порядка, метаданные), которые определяют тип, структуру, способы и принципы организации данных первого порядка, без которых данные первого порядка не несут смысловой нагрузки. Знания могут быть встроены в систему, обрабатывающую и интерпретирующую данные, могут храниться совокупно с данными, но независимо от конкретных форм и способов своего представления образуют самостоятельную абстракцию: одни и те же данные могут быть по-разному сформулированы, зафиксированы, обработаны и интерпретированы, в зависимости от различных знаний.

• Действия - активная составляющая, выражаемая через алгоритмы данных (именно полная совокупность всех алгоритмов обработки данных реализует данную абстракцию) и реализующая функцию движения информации. Действия обеспечивают трансформацию данных - на основе первичных, сырых данных генерируются вторичные данные. Если первичные реализуют отражение реального мира в информационной системе, то на основе вторич-

ных данных происходит отражение моделируемых процессов на реальные системы (вторичные данные являются основой для управляющего воздействия).

Информационная модель структуры простой системы обработки информации, ориентированной на потоковую обработку транзакций в рамках жёстко определенной бизнес-логики функционирования представлена в в иде триады элементов «данные» (D - data), «знания» (К - knowledge) и «действия» (А - activity) (рисунок 1).

Рисунок 1 - Информационная модель структуры простой системы обработки

информации

Связи в данной модели имеют следующую семантику:

• (od), (оа), (ок) - отражает поступление новых данных, знаний и действий извне;

• ^о), (ко), (ао) - отражает доступность данных, действий и знаний внешнему наблюдателю;

• ^а) — отражает выполнение определенных алгоритмов при поступлении новых данных;

• (аф — отражает генерацию новых данных действиями (в результате работы алгоритмов обработки информации);

• (кё) - отражает структуризацию данных на основе соответствующих знаний;

• (ка) — о тражает соответствие действий имеющимся знаниям;

Таким образом, информационная модель структуры простой системы

обработки информации является датацентричной, т. е. ориентированной только на систематизацию, хранение и изменение данных, но предлагает минимальный функционал по управлению алгоритмами их обработки и управлению знаниями. Знания в данной модели не имеют полного отражения (что

показано светлой заливкой элемента) и присутствуют только в объеме, необходимом для описания данных в рамках выбранной формальной модели, но не могут сами быть объектом манипулирования и анализа. Знания статичны и не могут существенно изменяться без реинжиниринга всей системы. Алгоритмы в рамках данной модели имеют минимальную экспертно-определяемую структуризацию, основанную на процедурном, или, в лучшем случае, на объектно-ориентированном подходе, но также не могут быть объектом манипуляции и анализа со стороны самой системы. Отсутствие глубокого представления знаний и отсутствие явной связи действий и знаний приводят к потере согласованности абстракций в системе, невозможности автоматической адаптации алгоритмов обработки информации и реструктуризации системы без привлечения экспертов и реинжиниринга всей системы.

В работе предложена двухуровневая модель информационной структуры комплексной системы обработки информации (рисунок 2), свободная от данных недостатков и обеспечивающая явное сохранение знаний и действий.

Дополнительные связи в двухуровневой модели структуры системы обработки информации имеют следующую семантику.

® (с!к) - отражает представление знаний в системе в виде данных второго порядка (метаданных);

® (ак) - отражает генерацию новых знаний через действия.

Рисунок 2 - Информационная модель структуры комплексной системы обработки информации

В модели комплексной системы обработки информации светлым цветом выделены элементы модели первого порядка (Ц А, К), а темным - элементы модели второго порядка (£>', А\ К'), обеспечивающие управление элементами знаний и действий модели первого порядка, т. е. рассматриваю-

щие их как данные второго порядка. Такая модель позволяет на основе операций с данными второго порядка гибко изменять поведение системы - генерировать новые действия и знания. При соблюдении условия совместимости средств описания разных уровней модели системы обработки информации на основе единой модели данных, двухуровневая модель может быть «свернута» до одноуровневой полносвязной триадной модели.

В данной работе в качестве единого базиса описания информации предлагается использовать реляционную модель данных, расширенную: возможностью формального определения иерархий, для отражения высокоподобных структур данных; формальными средствами описания и структуризации алгоритмов и способами трансляции абстракций единого базиса описания информации в абстракции дескриптивных логик.

В третьей главе предложен вариант расширения реляционной модели данных новыми абстракциями и приемами структуризации, направленными на построение иерархий реляционных отношений и повышении согласованности информации.

Для расширения существующих возможностей структуризации в рамках реляционной модели данных предлагается использовать новый вид отношения между атрибутами - отношение семантической эквивалентности, определяемое на атрибутах (х,у) реляционных сущностей (К,Р) следующим образом: Я.х~Р.у. Семантическая эквивалентность говорит об одинаковой смысловой нагрузке, которую несут атрибуты (т. е. семантически эквивалентные атрибуты отличаются только названием). В реляционных системах выполняется условие равенства доменов (£>) семантически эквивалентных атрибутов: Я.х~Р.у О(Я.х) = О (Р. у).

Структуризация на основе семантической эквивалентности приводит к построению иерархий реляционных отношений. Универсальный вариант структуризации определяется следующим образом: пусть заданы отношения Я с заголовком {А, X, г} и Р с заголовком {В, У, 0}, где А и В - первичные ключи отношений Я и Р (Л -+ Х2, В -> и выполняются следующие семантические эквивалентности: А~В, Х~У. Тогда процесс структуризации по критерию семантической эквивалентности может быть определен с помощью формирования вспомогательного отношения С с первичным ключом Ж, содержащей кортежи С(IV) = {{1}, {2}} следующим образом:

Я* = х <%=1(С), Р* = Квд(Р) X <%=г(0> О3 = Яд*(Ю X <>1У=1 (С),

О6 = Рх/у (рл/в X Оиг=2(С))).

О = О3 и О6.

Процесс обратной композиции в этом случае может быть представлен следующим образом:

д = «ладСЯ* " О), Р = Рг/х (рв/л (ядасСм О)))-

Чтобы подтвердить отсутствие потерь и артефактов при выполнении данных преобразований доказаны:

• теорема «о разбиении», которая устанавливает, что для любого отношения Н{А,Х,2}, А -» XI, выполняется равенство й = Пл.х,г ((^а,х(Ю X С) XI (л^Сй) х С)) для любого С & 0;

• теорема «о соединении с объединением», которая устанавливает истинность й XI Г = 0 => й « 5 = й XI (5 и Г).

Если рассмотреть процесс декомпозиции и синтеза отношений при построении иерархии на основе отношения семантической эквивалентности, объединив формулы, то выполняемые преобразования можно записать следующим образом:

Я = ялад ((лдг(й) х <%=!(С)) " ((ядх(Я) х <%=1(С)) и О6^, /((^00 х <%=1(С)) м (тглд(й) х а„=1(о)) и^

\ и ((яд2(й) х а^=1(С)) м О6]

Так как ¡^является первичным ключом отношения С и входит в состав первичного ключа отношений О6 и л^Сй) X <%=1(С), то (^¿(й) X

<%=г(0) * О6 = 0, так как: О6. Ж = 2, ттлг(й) х <%=г(С). IV = 1.

Отсюда, согласно теореме «о соединении с объединением», в данном контексте

К = ((ядгСй) х СТц,=1(С)) м (тг^(й) х <%=1(С))),

что согласно теореме «о разбиении» является тожеством.

Таким образом, в работе доказано, что декомпозиция отношений и последующий их синтез при построении иерархий на основе семантической эквивалентности атрибутов отношений произведены без потерь и артефактов.

Также в работе предложен упрощенный способ построения иерархии реляционных отношений, основанный на требовании сквозной уникальности первичных ключей всех отношений в пределах всей схемы данных, т. е. требование определение всех первичных ключей в рамках одного домена в виде атомарного суррогатного ключа. В этом случае декомпозиция и синтез не потребуют вспомогательного отношения С:

я* =

Р*=пАД{Р),

о = 7ГЛД0?) и КАЛ(Р).

Процесс обратной композиции в этом случае может быть представлен следующим образом:

К = К* и О, р =р* и О.

Построение иерархии реляционных сущностей на основе критерия семантической эквивалентности позволяет избежать аномалии неполного покрытия и аномалии соединения по омонимам.

Аномалия неполного покрытия определяется следующим образом: пусть дан запрос К{рс], для которого определена семантика х (рет^х) = $). И пусть существует множество отношений Е, содержащих атрибуты с данной семантикой (3£'{е1,е2,...,еп}, 6 Еб £ б;). Тогда невозможно на уровне реляционной модели данных гарантировать целостное выполнение запроса, применительно ко всему множеству отношений Е (если Е' с: Е, то ^ Л"{х}(£')). На практике это означает, что при выполнении консолидирующих запросов (связанных с объединением данных разных отношений) существует вероятность реализации запроса не на всех необходимых отношениях, а только на их подмножестве. Актуальность данной аномалии особенно высока для баз данных с изменяющейся структурой, для которых необходимо постоянное отслеживание и изменение используемых запросов, с целью их актуализации и приведения в соответствие со схемой базы данных. Для сложных баз данных такие операции отличаются высокой трудоемкостью. Построение иерархии по критерию семантической эквивалентности позволяет избежать данной аномалии, так как выполняется условие |Я| = 1.

Аномалия соединения по омонимам определяется следующим образом: пусть существует отношение Я с заголовком {А, X} и Р с заголовком {В, У}}, где А и В - первичные ключи отношений Д и Р (А -» X, В —> У) соответственно, и О (Л) — О(В). И пусть существует отношение N {С, 7.}, где С - первичный ключ отношения N (С -» Z), такое, что 2=РК(А). Тогда существует возможность построения нового отношения М = N м Р, для которого |М| Ф 0 (тело отношения М будет непустым). Возможность получения непустого тела такого отношения является аномалией соединения по омонимам, так как не несет полезной информации и тело отношения является артефактом. Построение иерархии по критерию семантической эквивалентности позволяет избежать данной аномалии, так как все первичные ключи определяются на одном домене и не могут содержать одинаковых значений.

Для повышения целостности и согласованности данных проведен анализ проблемы неопределенных значений и определены три их подвида.

Неизвестные значения (иЫКЫ). Используются, когда значения атрибута какого-либо кортежа имеет семантический смысл, но точное значение ат-

рибута в данный момент неизвестно. Такое использование не несет опасности потери согласованности данных в структуре данных системы обработки информации.

Неиспользуемые значения (NIL). Значение NULL в данном случае интерпретируется как известное отсутствие значения для атрибута в кортеже (атрибут является возможной, но необязательной характеристикой объекта) и может быть заменено при изменении схемы отношений на иерархическую. В рамках реляционной теории эта операция может быть сформулирована следующим образом. Пусть задано отношение R {А,В,Х}, где А - первичный ключ, В — атрибут (возможно составной), не допускающий значений NIL и X - атрибут (возможно составной) допускает значения NIL, тогда возможно произвести декомпозицию отношения R на два различных отношения (основное R* и уточняющее R') по следующему правилу: R* = ttab(R), R' =

Обратный синтез исходного отношения можно получить при помощи операции соединения и использованию вспомогательного отношения С(Х) = {{NIL]}: О = (тгл(Г) - яд(Я')) * К*, Я = (Я' * Я*) и (О X С).

Семантически запрещенные значения (NOP). В данном контексте значение NULL трактуется как отсутствие семантического смысла значения атрибута для данного кортежа и говорит об объединении сущностей по семантически эквивалентным атрибутам, что может быть разрешено построением явной иерархии на основе семантической эквивалентности, как это было рассмотрено выше.

Типизация неопределенных значений позволяет на этапе проектирования схемы данных системы обработки информации производить правильное структурирование данных, не позволяющее появлению неопределенных и семантически запрещенных значений, что повышает общую согласованность данных в системе.

Предложена новая формулировка требования совместимости реляционных отношений по теоретико-множественным операторам, заключающееся в прямом использовании активных доменов (AD) Кодда - особого вида доменов, которые определяются на основе явно используемых в отношении значениях атрибутов в соответствии со следующим определением: пусть дано отношение R {г1(.., гп}, тогда активный домен атрибута ц, i Е [1, п] AD(n) = яГ|(Я).

Новый вид требования совместимости отношений сформулирован следующим образом: пусть даны отношения Л(а1(...,а„) и B(bt, ...,bn~), Va; Е А 3 такой bj е В, что щ = bj iE [l,n], j G [1,п], тогда результатом операции С = All В будет отношение С(с1, ...,с„), такое, что Vck £ С 3 такая пара аиbj, что ck = at = bj i Е [1, n],j E [1, n], к E [1, n] и AD(ck) =

ЛО(а;) и ЛО(Ьу) (активный домен атрибута результирующего отношения является объединением активных доменов атрибутов исходных отношений). В прикладных системах данное определение может быть дополнительно ограничено требованием совместимости типов одноименных атрибутов в отношениях, либо разрешено при помощи неявного преобразования типов, что является тривиальной технической задачей.

Предлагаемый подход, основанный на использовании активных доменов, позволяет снять ограничение на вычисление только доменно-незави-симых запросов и явно использовать оператор реляционного дополнения, а также позволяет осуществлять преобразование доменов на основе выполнения стандартных операций реляционной алгебры.

В рамках систем, основанных на активных доменах и новой формулировке требования совместимости, устранена аномалия семантической недостоверности дополнений сложных отношений, которая определяется следующим образом: пусть задано отношение ЩА,Х,У}, определенное на доменах О (Л) = {а1,а2}, 0(Х) — [х1,х2}, О (У) = {у1,у2}, Если реальная предметная область имеет область определения 0={{а1,х1,у1}, {а2,х2,у2}} то реляционное дополнение <НОТ>{а1,х1,у1} не совпадет с логическим дополнением относительно предметной области -\{а1,х],у1}. Такое несовпадение связано с тем, что теория доменов устанавливает область определения любого отношения как декартово произведения доменов, в то время как область определения реальных систем не обязательно соответствует такому допущению. В общем виде, область определения реальной системы является произвольным подмножеством области определения реляционного отношения.

Для устранения данной аномалии предлагается различать область определения для атрибутов отношения, не являющихся внешними ключами отношений (простых атрибутов отношения), и атрибутов, которые связаны внешними ключами (ссылочными ограничениями целостности) с другими отношениями (ссылочных атрибутов).

Состав области определения атрибута отношения определяется:

• для простых атрибутов отношений область определения ограничена активным доменом данного атрибута;

• для ссылочных атрибутов область определения задается возможными значениями первичного (потенциального) ключа отношения, на которое ссылается внешний ключ (главного отношения).

Соблюдение данных требований при использовании иерархической организации реляционных сущностей на основе отношения семантической эквивалентности атрибутов отношений позволяет определять отношения в качестве области определения для атрибутов других отношениях, создавать иерархии областей определений, что обеспечивает возможность получения

правильных логических дополнений реляционных отношений на основе оператора взятия реляционной разности.

В четвертой главе рассмотрены методы описания и структуризации данных и алгоритмов их обработки в рамках интеграции расширенной реляционной модели данных и объектно-ориентированного подхода.

Предлагается следующий структурный изоморфизм расширенной реляционной и объектно-ориентированной моделями данных:

• отношение - дифференциальная часть класса;

• класс - производное (полное) отношение, которое может быть по-

гесли а Япред.ТО Е

лучено по следующей формуле: Е'и = ] Ги11 ;

I й м пред

» объект - кортеж полного отношения;

• идентификатор объекта - первичный ключ отношения;

• поле класса — атрибут отношения.

Установление структурного изоморфизма между моделями позволяет перенести способы и приемы построения структур, используемые в рамках объектно-ориентированного подхода, на способы построения структур в расширенной реляционной модели данных.

В работе предлагается использовать свойство полиморфизма применительно к атрибутам реляционных отношений. Полиморфизм атрибута - это ограничение целостности на атрибуте отношения, которое может быть уточ-

Рисунок 3 - Реализация полиморфизма атрибутов в расширенной реляционной схеме данных (Д^рес./к(Я) полиморфно в Р^рес и О^рес)

Реляционная модель данных не предлагает средств описания и структуризации алгоритмов обработки информации. В диссертации предлагается использовать объектно-ориентированную парадигму описания алгоритмов в виде иерархически-дифференциальной декомпозиции методов, так как построение иерархии реляционных сущностей на основе отношения семантической эквивалентности аналогично таксономии классов объектно-ориентированного подхода.

В работе предлагается определить реляционную операцию (инструкцию) в дифференциальной форме как атомарный элемент воздействия на данные. Каждая инструкция принадлежит тому отношению, кортежи которого изменяются при ее выполнении. Совокупность инструкций образует множество подобное атрибутам отношения.

Использование дифференциальной формы инструкций позволяет определить отноше1ше семантической эквивалентности между ними и адекватно реалиям прикладный ¿^-систем, в которых операции разделены подобным же образом, на операции вставки, удаления и модификации данных. При этом инструкция является структурно более простым компонентом модели -область определения инструкции ограничена метаданными и не имеет отражения на уровне кортежей отношений, в отличие от атрибутов реляционных

Семантика Дифференциальная форма Алгебраическая форма

Добавление Д:/+ = Р я = я ир

Удаление Я-.Г = Р Я = Д-Р

Изменение Я:/{&В} = Р Я = (Я - Р) и (тгдс(й) м 7ГЛВ(Р))

Отношение семантической эквивалентности для инструкций может быть сформулировано следующим образом: если типы инструкций совпадают и правые части инструкций равны, то инструкции семантически эквивалентны (для Г1 = Орг и у*2 = Ор2; Орг = 0р2 и *.,=*2=> Г1-/*2). На основе данного определения возможно проведение структуризации системы обработки информации не только по атрибутам, но и по инструкциям реляционных отношений (рисунок 4).

Дифференциальные инструкции являются простейшими элементами, реализующими поведение системы, однако они не могут выразить сложное поведение, связанное с согласованным внесением изменений в множество различных отношений.

Дальнейшую структуризацию алгоритмов предложено проводить на основе методов в объектно-ориентированном понимании данного термина -особого вида исполняемых процедур, наследуемых по иерархии наследования реляционных сущностей. Метод является именованной упорядоченной последовательностью инструкций и/или методов обработки данных. Методы,

подобно инструкциям, принадлежат классу, но эта принадлежность устанавливается экспертно, в зависимости от смысла выполняемых методом операций с данными, также как и в объектно-ориентированном подходе.

Структуризацию методов предлагается проводить на основе их нормализации и консолидации по семантической эквивалентности.

в

РК А

В

Р

РК,РК1 А

0

Ц

РК,РК1 А

,*Е, ЩЦ

Г

/

К

РК А

Ё

ШгШ

р'

РК,РК1 А

0

Ц'

РК,РК1 А

Р

Р:&1пзП% = 5Ги„5,(о.1.в)0Ю

Я':&/ти# = ЛитХо,ив) (Ю

Р. С~(}, Е~Я'. С

Рисунок 4 - Структуризация схемы данных и алгоритмов по семантически эквивалентным методам

Нормализация методов заключается в определении скрытых и вложенных методов (цепочек инструкций) и их консолидации в производных методах на родительском уровне иерархии. Таким образом, если в разных методах существуют одинаковые последовательности инструкций, то такая последовательность должна быть выделена в отдельный метод и вызов последовательностей данных инструкций в исходных методах должен быть заменен на вызов нового метода.

Формально данная операция может быть представлена следующим образом: пусть заданы методы С{дх,д2, ~,0т}'> Р{А>/г. ->/&}; и

3Р'{/г+г,/г+2...../;+„}; Р' <= Р\ С с С такие, что

р' = С => необходимо создание Щ.И.у, 1г2, ...,кп}, такого что Н = Р' = С и переопределения Р{/1,...,/1,Н,[1+п+1,...,[к} и с{ди...,д^н,д^п+г,...,дт}. Предлагаемая структуризация не зависит от семантики инструкций и методов и в прикладных системах может производиться автоматически, без необходимости привлечения экспертов.

Консолидация методов по семантической эквивалентности заключается в формировании полиморфной группы методов с одним именем в рамках иерархии наследования реляционных сущностей.

Формально данная операция может быть определена следующим образом: пусть заданы методы G{glt ~.,дт>Н-9m+i F{fv —,fk>H>fk+1 — >f\F\} (возможна ситуация, когда Н = 0) и выполняется условие G ~ F ~ Н, тогда можно реализовать вызов иерархии семантически эквивалентных методов на основе следующего правила:

{если 3 Япред, то Н ( +1 . В этом случае метод Н определяется как роди-

I" ."пред/" )

тельский метод, тогда как методы G и F определяются как пары пред- и постметодов G~[g1,...,gm), G+{gm+1 ...,g\G\\, F~{fi,-,fk), F+{fk+i -J\f\}- Подобное определение методов позволяет соблюдать их строгую инкапсуляцию с одной стороны и обеспечивает их полиморфизм с другой за счет уточняющего описания методов в иерархии наследования.

Применение предложенных методов структуризации данных и алгоритмов их обработки позволяет существенно уменьшить структурную сложность системы обработки информации.

В диссертации структурная сложность системы обработки информации рассчитывается на основании агрегатной сложности Н. П. Бусленко и определяется количеством составляющих систему элементов и связей. Структура элементов расширенной реляционной модели данных и алгоритмов имеет иерархическую природу и выражается через:

■ реляционные сущности (Е), состоящие из:

• • скалярных атрибутов (А);

• ссылок на другие сущности - комбинация атрибута и внешнего ключа (С);

• ссылок иерархии (Н) - ссылок один-ко-одному, определенных на первичных ключах отношений;

• реляционных инструкций (I), определенных на:

♦ реляционных сущностях (1е);

♦ атрибутах (1а);

♦ ссылках (1с);

• методов (М), которые состоят из:

♦ инструкций (Mi)

Таким образом, структурная сложность (О) определяется как вектор: О <т \А\,\С\, \Н\. ш, \Ie\,\Ia\, \lc\,\М\, [Mi]).

Если считать дерево иерархии реляционных сущностей сбалансированным, а структуру системы обработки информации полносвязной (т. е. системой, которая строго описана иерархией по семантическим эквивалентностям

и не имеет корректных запросов, основанных на объединении отношений с разных ветвей иерархии) и весовые коэффициенты для каждого показателя структурной сложности считать равными (0.1), то относительная структурная сложность расширенной реляционной системы будет иметь вид, представленный на рисунке 5.

Рисунок 5 — Относительная структурная сложность расширенной реляционной схемы данных и алгоритмов их обработки к классической реляционной

схеме

Как видно из данного графика, структурная сложность расширенной реляционной модели данных существенно ниже классической реляционной модели и её эффективность повышается с ростом количества моделируемых сущностей, что особенно актуально для больших и растущих систем.

Пятая глава посвящена разработке методов отображения пространства определения онтологий (концепции открытого мира) в пространство определения баз данных (концепцию закрытого мира) и способам прямой и обратной трансформации расширенных реляционных схем дашшх в онтологии дескриптивных логик.

Одна из основных проблем отображения онтологий на реляционную модель является высокая пространственная сложность такого отображения, связанная с тем, что в реальной системе для сложного предиката истинных высказываний существенно меньше чем ложных.

В данной работе предлагается способ отображения: выражение в рамках КОМ в виде «-местного предикат М{т1,т2, ...,тп}, который транслируется в (л+7)-местное отношение г2, — ,т"п,гп+1}, где г1~т1 (I = 1..л), а гп+г~М{т1, т2, ...,?пп} в рамках концепции КЗМ. В этом случае отношение Я, выступающее в роли проекции предиката, может быть представлено как объединение значимой тройки отношений, характеризующий возможные состояния предиката (истинные, ложные, и неизвестные): я = (^£гие) и (Я/а^е) и (Кипкп)>

Кьгие — °гп+1=1(Ю> Щаке = агп+1=о(Ю>

Кипкп —

Так как в расширенной реляционной модели данных каждый атрибут отношения К может быть явно определен на домене-отношении (для УГ[(Ё ~ 1.. п) 3 ЕГ1 такое, что ц = РК(£п))> то для Я как для полного отображения всей области значения предиката М выполняется следующее условие:

п

П'=лГ1,Г2.....Гя(Я) = X Е".

£ = 1

При определении вспомогательного отношения С, задающего область определения для атрибута гп+1 С{{0}, {1}, можно вывести следую-

щие эквивалентные отношения:

Яцие = (й' — и ^/аке)).

Кьье — (Л' — ТСГ1Хг.....и ^(гие))»

^имКИ = (к' — Кг1,г2.....гп(^[гие и Й/агхе))-

Таким образом, при помощи неизвестных значений и трансляции всей области определения предиката в реляционное отношение становится возможным преобразовывать без потери предикаты, сформулированные в рамках КОМ в отношения расширенной реляционной модели данных, сформулированные в рамках КЗМ. Также на основе данных отношений можно определить явно хранимой любую пару отношений из тройки й[гце, й^е и йимкм, исходя из соображений минимизации использования ресурсов, так как третье отношений может быть получено как разность пространства опре-. деления предиката и пары хранимых отношений, согласно приведенным формулам.

Для точного отображения таксономии классов в плоскость дескриптивных логик предлагается новый диалект дескриптивной логики, основанный на явных таксономиях (/(¿Г-диалект). В рамках данного диалекта вводятся следующие новые понятия - типизация и наследование концептов.

Типизация концептов заключается в их разделении на базовые и производные концепты, где базовый концепт является средством определения таксономии понятий и отражает реальные типы сущностей в онтологии, в то время как производный концепт выполняет роль фильтра на множестве индивидов базового концепта и выделяет их некоторое подмножество по ролям (т. е. «человек» является базовым концептом, а «инженер» - производным концептом). Базовые концепты организуются в структуры при помощи нового оператора наследования («<»), определяющего расширение описания концепта и более строгого, нежели стандартный оператор поглощения. Произ-

водные концепты организуются при помощи стандартного оператора поглощения.

Предлагаемый подход позволяет формально отличать структурообразующие концепты, от всевозможных вторичных их проекций и пересечений по ролям, что позволяет упростить описание полносвязных и близких к ним онтологий.

Для базовых концептов, в рамках предложенного АЬТ-диалекта, разработана матрица замены структурных конструкторов онтологии на структурные конструкторы расширенной реляционной модели данных (рисунок 6).

б

Рисунок 6 - Отображение ТВох и КВох на расширенную реляционную модель данных (а - дизъюнкция, б — конъюнкция, в - иерархия, инверсия и вложенность ролей)

Транзитивные роли на уровне реляционной базы данных могут быть реализованы через представления на основе общих табличных выражений. Расширение языка формальными типами неотъемлемо присутствует в любой прикладной системе управления базами данных, а ограничения кардинальности ролей и функциональность полей могут быть реализованы на основе триггеров базы данных.

В шестой главе на основе предложенной методологии и прикладных методов разработана система обработки информации для поддержки деятельности предприятия ОАО УЗМ «Магнетрон». Данная система обработки информации представляет собой интегрированную среду ввода, хранения, обработки и визуализации оперативных и первичных аналитических данных о детальном состоянии происходящих и произошедших на предприятии учетных событиях и самих автоматизируемых процессах.

Логическая структура системы обработки информации для поддержки деятельности промышленного предприятия ОАО УЗМ Магнетрон представлена на рисунке 7. _

Управление потребностями

Запасы Потребности Прайс-листы Заказы

Оперативная аналитика

Агрегация доижений товаров

Сальдо контрагентов Временная

детализация дон-тое

АСОИ ОАО УЗМ

Первичный бух.учет

^ Магнетрон

Приход товара • Расход товара Сверки и инвентаризации

Управление\ товародвижениями

Партии Артикула Приходно/ расходные операции

Кадры и занятость

Штатное расписание Персональный учет

И-К

\п/

юавление \ V..

Управление производством

Листы комплектации Подбор компонентов Перечни сборки

Управление каталогом Товары

Классификаторы Спецификации

Пользователь

Пользователь

Пользователь

Рисунок 7 — Логическая структура системы обработки информации ОАО УЗМ Магнетрон

В рамках созданной системы обработки информации, исходя из требований бизнес-заказчика, были реализованы следующие подсистемы информационной поддержки деятельности предприятия:

• подсистема управления каталогом элементов, узлов, изделий и их спецификаций, позволяющая производить учет существующей номенклатуры МТР, осуществлять её экспорт и импорт, группировку и классификацию.

• подсистема управления внутренними и внешними товарными движениями компонентов, что позволяет производить точный партионный учет товародвижения на складах и цехах сборки изделий, автоматизировать процесс приема-отпуска МТР со склада, их тестирования, проверок, возврата поставщикам и отпуска заказчикам

• подсистема управления изготовлением узлов и изделий и контроля их качества, позволяющая осуществлять адресный подбор необходимых элементов изделий, учет производственных операций и контроль их результатов.

• подсистема управления элементными потребностями предприятия, планирование заказов и запасов элементов и узлов, основанная на анализе производственных планов, существующих ресурсов, планов выпуска продукции и предлагаемой поставщиками номенклатуры элементов и узлов и позволяющая осуществлять автоматический формирование графиков производства и заказов по критерию минимизации себестоимости продукции;

• подсистема первичного бухгалтерского учета предприятия, позволяющая осуществить учет экономических операций в разрезе финансовых показателей;

• подсистема учёта кадров и управление рабочим временем работников предприятия, позволяющая вести учет и контроль их деятельности и оптимизировать выполнение бизнес-операций за счет правильного планирования и назначения заданий работникам;

• подсистема консолидированной оперативной аналитики по движениям товаров в разрезе партий и артикулов и движениям финансовых потоков в разрезе документов и контрагентов, позволяющая пользователям получать быстрый доступ к консолидированным финансовым и товарным данным.

На основе расширенной реляционной модели данных и алгоритмов была разработана структура система обработки, фрагмент которой представлен на рисунке 8.

Ч1Г

РК У!4

д1г_8оо<15_5рес_(1е1аИ

ш

РКЗ ГК1 и д^ коо<}5_5р ес_р Ьа 5 е ц кД д^ к оо4 5_х1 а уе 4

фг^оск^

РК,РК1

goods_name Йе$сг1р1юп

РК^К! Шй

РК,Ш ше!

РК2 рКа5е_пате #сН еск_йе1а?15_Ьу_ге51 йсЬ е ск_<!е1а!15_Ьу_ге:Л_аг^_*«ау

5

дгг_воос15_а55ет Ыу

РК.РК1 оИ

dat«_reg

соде

РК2

оп!ег_пит

аЛй)

«ве^Ьагез

#с Ь е с к_со т р!_Ч_Ьу ге5»5

#сЬеск_сотр1_ч_Ьу гезй_апй_\«/ау

#сНеск_Шщ_Ьу_р!ап

#ПЙег_Ьу_е1

Ш*ег_Ьу_р1ап

#Й11 ег_Ьу_р го Ь

РК,ЯК1 иМ

гкг

Ч1х_£ос^5_ргсх1и«

РК,П<1 иЫ

qtг_goods_product_spec

РК,РК2 4М

РК1

Рисунок 8 - Расширенная реляционная схемы данных и алгоритмов спецификации узлов и изделий (методы отмечены символом «#»)

Экспериментальное исследование эффективности разработанной системы обработки информации для поддержки деятельности предприятия показало:

1. Адекватность разработанных моделей, методов и алгоритмов требованиям, предъявляемым к системе обработки информации со стороны специалистов по бухгалтерскому, складскому, кадровому учету и высшего менеджмента организации.

2. Существенное снижение структурной сложности системы обработки информации (структурная сложность предложенной структуры данных и алгоритмов составила 122.5 пункта, что более чем в 2 раза ниже структурной сложности аналогичной структуры на основе классического реляционного базиса, которая составила 285.3 пункта).

3. Повышение целостности и согласованности данных и алгоритмов их обработки, вызванное объединением семантически эквивалентных абстракций расширенной реляционной модели данных и устранения неточностей и разночтений при операциях с ними, что выразилось в:

• отсутствии аномалии неполного покрытия пространства определения атрибута для 85 используемых в системе обработке информации методов (75 % методов);

• отсутствии аномалии соединения по омонимам для всех сущностей в структуре системы обработки информации;

• отсутствии семантически запрещенных и неиспользуемых значений во всех сущностях структуры системы обработки информации;

• выявлении и консолидации 78 вложенных и скрытых методов, охватывающих 70 сущностей в структуре иерархии (70 % сущностей);

• создании 7 полиморфных методов, охватывающих 33 сущности в структуре иерархии (33 % сущностей).

В заключении подчеркивается прогрессивность предложенных методов и технологий проектирования структуры системы обработки информации, когда последние интенсивно развиваются и усложняются. Сформулированы актуальные направления дальнейших научных исследований в области структурирования систем обработки информации.

ЗАКЛЮЧЕНИЕ

Основные научные положения диссертационной работы и их практическая реализация представляют собой дальнейшее развитие реляционной теории, теории объектно-орие1ггаровашюго проектирования и дескриптивных логик. Прикладные аспекты работы посвящены решеншо научной проблемы - построению интегрированной структуры данных и алгоритмов системы обработки информации для поддержки деятельности предприятия.

В диссертации получены следующие новые теоретические и практические результаты:

1. Предложена информационная модель структуры системы обработки информации на основе триады «Данные»-«Знания»-«Действия», отличающаяся системной интеграцией элементов в рамках единого базиса описания информации и позволяющая формулировать задачи хранения данных, обработки информации и манипуляции знаниями в рамках единой модели данных.

2. Предложена расширенная реляционная модель данных, которая отличается:

• предложенной структурообразующей функцией семантической эквивалентности, позволяющей создавать целостные иерархии реляционных отношений;

• типизацией неопределенных значений, что позволяет выявлять и устранять скрытые аномалии в структурах реляционных схем данных;

• предложенными правилами совместимости реляционных отношений по теоретико-множественным операторам и новой интерпретацией области определения атрибутов реляционных отношений, что позволяет повысить логическую целостность данных.

3. Предложены методы описания и структуризации алгоритмов в рамках расширенной реляционной модели данных, отличающиеся:

• учетом алгоритмов как элементов данной модели, что позволяет интегрировано описывать данные и алгоритмы в рамках одной структуры;

• структуризацией алгоритмов на основе устранения повторяющихся инструкций и семантических эквивалентностей, что позволяет минимизировать количество алгоритмов в системе, повышая целостность и согласованность структуры системы обработки информации в целом.

4. В рамках интеграции онтологий и расширенной реляционной модели данных предложены:

• метод отображения концепции открытого мира в концепцию закрытого мира, основанный на покрытии пространства определения открытого мира суперпозицией реляционных выражений; данный метод отличаегся использованием неопределенных значений и возможностью выбора совокупности реляционных выражений имеющих минимальную пространственную сложность, что позволяет производить трансляцию выражений дескриптивных логик в выражения реляционной модели данных;

• вариант дескриптивной логики, соответствующий иерархически-реляционным структурам в рамках расширенной реляционной модели данных, отличающийся использованием оператора наследования концептов и типизацией концептов, что позволяет транслировать расширенные реляционные схемы данных в терминологические аксиомы дескриптивной логики и обратно.

5. Разработана прикладная программная реализация системы обработки информации для поддержки деятельности предприятия, основанная на предложенной расширенной реляционной модели данных и алгоритмов их обработки. В рамках системы обработки информации разработаны подсистемы: управления каталогом, управления товародвижением, управления производством, управления кадрами, первичного бухгалтерского учета, управления потребностями и заказами предприятия Разработанная система обработки информации внедрена в промышленных и торговых предприятиях России.

Экспериментальные исследования эффективности предложенных моделей и алгоритмов показали их адекватность требованиям бизнес- и менеджмент- специалистов. Применение расширенной реляционной модели данных и алгоритмов позволило существенно увеличить их целостность и со-

гласованность, что выразилось в устранении: аномалии неполного покрытия пространства определения атрибута, актуальной для 75 % методов; аномалии соединения по омонимам, актуальной для всех методов в системе; семантически запрещенных и неиспользуемых значений для всех сущностей в структуре системы обработки информации; а также в выявлении и консолидации вложенных и скрытых методов, которые охватывают 70 % сущностей в разработанной структуре и создании полиморфных методов, охватывающих 33 % сущностей в системе обработки информации.

Рекомендации и перспективы дальнейшей разработки темы. Важным направлением дальнейшего развития данной тематики является реализация контрактного исполнения методов агентами активности, что позволит в условиях динамического информационного окружения реализовать субопти-мальпый выбор прикладных алгоритмов обработки информации. Другим перспективным направлением дальнейших исследований является определение дополнительных метрик структурной сложности, связанных с выявлением циклов в рамках методов и инструкций, что позволит оценить потенциальную устойчивость системы обработки информации.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

В репетируемых журналах, входящих в перечень ВАК

1. Модели представления данных в информационных системах реального времени / А. А. Левков, В. А. Масленников // Вестник УГАТУ. 2005. № 1 (12). С. 121—134.

2. Проблемы организации структуры данных в сверхбольших базах данных / А. А. Левков, В. А. Масленников // Системы управления и информационные технологии: науч.-техн. журн. 2007. № 3.1 (29). С. 153-156.

3. Методы использования классовых алгоритмов и структур в реляционных базах данных 1 А. А. Левков // Системы управления и информационные технологии. № 4.1 (30). 2007. С. 159-162.

4. Методики формального описания классово-ориентированной модели данных / А. А. Левков // Системы управления и информационные технологии. № 4.1 (30). 2007. С. 162-166.

5. Методы оптимизации хранения информации об испытаниях авиационных двигателей / А. А. Левков, С. П. Павлинич // Нефтегазовое дело. № 2. 2007. С. 20-25.

6. Методы повышения эффективности систем управления организационно-техническими объектами / А. А. Левков // Мехатроника, автоматизация, управление. № 7. 2008. С. 42-47.

7. Построение эффективных онтологии в больших системах управления предприятием / А. А. Левков // Искусственный интеллект и принятие решений. № 4. 2011. С. 92-101.

8. Организация эффективной системы хранения фактов в онтологиях / А. А. Левков // Информационные технологии и вычислительные системы. №4. 2011. С. 3-9.

9. Управление данными в корпоративных ИС / А. А. Левков // Вестник УГАТУ. № 1 (41). 2011.С. 176-181.

10. Организация эффективных полиморфных алгоритмов в сложных системах управления информацией / А. А. Левков // Прикладная информатика. № 5 (35). 2011. С. 127-133.

11. Оценка структурно-алгоритмической сложности реляционных схем данных / А. А. Левков, Б. Г. Ильясов // Вестник компьютерных и информационных технологий. № 4. 2011. С. 28-32.

12. Структурная оптимизация реляционных моделей сложных иерархических систем / А. А. Левков, Б. Г. Ильясов // Информационные технологии. №3.2011. С. 50-54.

13. Триадный подход к управлению интеллектуальными информационными системами (теоретические основы) / А. А. Левков, Б. Г. Ильясов // Вестник компьютерных и информационных технологий. № 4. 2011. С. 3-6.

14. Триадный подход к управлению интеллектуальными информационными системами (практические аспекты) / А. А. Левков, Б. Г. Ильясов // Вестник компьютерных и информационных технологий. № 1. 2012. С. 3-7.

15. Интеграция знаний и данных в больших информационных системах / А. А. Левков // Информационные технологии. № 2. 2012. С. 29—33.

Монография

16. Структурная оптимизация многомерных систем храпения данных / А. А. Левков, Ю. С. Кабалыюв, В. А. Масленников. М.: "Изд. МАИ", 2009. 140 с.

Зарегистрированные программы для ЭВМ

17. Свид. об офиц. per. программы для ЭВМ № 2013612328. Программа для автоматизированного структурирования реляционных схем данных и алгоритмов их обработки по отношению семантической эквивалентности / А. А. Левков. Зарег. 21.02.2013.

18. Свид. об офиц. per. программы для ЭВМ № 2013612325. Программа для обеспечения деятельности кадрового подразделения предприятия / А. А. Левков, В.А. Масленников. Зарег. 21.02.2013.

Другие публикации

19. Модуль адаптации многомерных структур хранения данных / А. А. Левков, Д. В. Ивлев // Информационные и кибернетические системы управления и их элементы: матер, всеросс. молодежи, науч.-техн. конф., 2526 ноября 1997. Уфа: УГАТУ, 1997. С. 49-50.

20. Система предварительной обработки информации в составе интегрированной АСУТП нефтегазодобычи / А. А. Левков, Ю. И. Зозуля, С. И. Братцев, Ю. С. Кабальнов, Р. Р. Каримов, Д. В. Ивлев // Вычислитель-

ная техника и новые информационные технологии: межвуз. науч. сб. Уфа: изд. УГАТУ, 1998. С.59-65.

21. Автоматизированная система хранения и обработки диагностической информации основе концепции многомерных баз данных применительно к объектам нефтедобычи / А. А. Левков, Ю. И. Зозуля, Ю. С. Кабалънов, Р. Р. Каримов, Д. В. Ивлев // Проблемы нефтегазового комплекса России: междунар. науч.-техн. конф. Уфа: УГНТУ, 1998. С. 143-147.

22. Анализ достоверности данных в системах реального времени / А. А. Левков, Ю. И. Зозуля, С. И. Братцев, Ю. С. Кабальнов, Р. Р. Каримов, Д. В. Ивлев // Новые технологии управления движением технических объектов: 1-я междунар. конф. 13-15 января, 1999. Ставрополь. С. 174-175.

23. Информационная система реального времени в составе интегрированной АСУТП нефтегазодобычи / А. А. Левков, Ю. И. Зозуля, С. И. Братцев, Ю. С. Кабальнов, Р. Р. Каримов, Д. В. Ивлев II Управление сложными системами: межвуз. науч. сб. Уфа: изд. УГАТУ, 1999. С. 37-44.

24. Оценка эффективности индексных структур в многомерных базах данных / А. А. Левков, Ю. И. Зозуля, С. И. Братцев, Ю. С. Кабальнов, Р. Р. Каримов, Д. В. Ивлев // Интеллектуальные системы управления и обработки информации: междунар. науч. техн. конф. Уфа: УГАТУ, 1999. С. 69.

25. Хранение и обработка данных в информационных системах в реальном времени, используя многомерные технологии / А. А. Левков, Ю. С. Кабальнов, Д. В. Ивлев, О. И. Христодуло // Информатика и информационные технологии (С8П"2000): тр. 2-й междунар. конф., 18-23 сентября, 2000. Уфа, изд. УГАТУ, 2000. Т. 1. С. 49-50.

26. Применение многомерных технологий при создании информационных систем в образовании / А. А. Левков, Б. Г. Ильясов, Ю. С. Кабальнов; Д. В. Ивлев // Телематика 2001: междунар. науч. методич. конф. Санкт-Петербург: СПбГУ ИТМО, 2001. С. 62.

27. Применение многомерных технологий в информационных системах реального времени / А. А. Левков, Ю. С. Кабальнов, Д. В. Ивлев, О. И. Христодуло // Вопросы управления и проектирования в информационных кибернетических системах: межвуз. науч. сбор. Уфа: изд. УГАТУ, 2001. С. 141151.

28. Применение бит-логической модели информациошюго представления для организации эффективного взаимодействия пользователя с многомерными базами данных / А. А. Левков, Д. В. Ивлев // Информатика и информационные технологии (С81Т'2002): тр. 4-й междунар. конф., 18-24 сентября, 2002. Греция, университет г. Патры. С. 39.

29. Применение многомерных информационных технологий в системах открытого образования / А. А. Левков, Д. В. Ивлев // Информатика и информационные технологии (С81Т'2002): тр. 4-й междунар. конф., 18-24 сентября, 2002. Греция, университет г. Патры. С. 42.

30. Методы математического описания информационных объектов гиперкуба многомерной базы данных / А. А. Левков, Д. В. Ивлев // Проблемы техники и технологии телекоммуникаций: матер. 3-й междунар. науч.-техн. конф., 26-27 ноября, 2002. Уфа: УГАТУ. С. 57-58.

31. Применение циклических структур для организации эффективного размещения информации на физических носителях в СУБД / А. А. Левков, О. И. Христодуло // Телекоммуникации и информатизация образования. № 1. 2003. С. 43-52.

32. Применение синтеза многомерного гиперкуба для увеличения централизации данных / А. А. Левков, О. И. Христодуло, Д. В. Ивлев // 5-й международный симпозиум по информатике и информационным технологиям. Уфа: УГАТУ, 2003. С. 169-174.

33. Увеличение производительности многомерных баз данных, применяя древовидные структуры поиска для систем дистанционного образования / А. А. Левков, Д. В. Ивлев // 5-й международный симпозиум по информатике и информациошшм технологиям. Уфа: УГАТУ, 2003. С. 75-78.

34. Объектно-ориентировшшые модели для хранения данных /

A. А. Левков, В. А. Масленников // Компьютерные пауки и информационные технологии: матер. IX междунар. сем. Уфа: УГАТУ, 2007. С. 87-89.

35. Повышение эффективности реинжиниринга сложных БД при помощи использования объектно-ориеитированных БД / А. А. Левков,

B. А. Масленников // Проблемы техники и технологий телекоммуникаций: 7-я междунар. конф. Самара: Ш УТИ, 2006. С. 34-36.

36. Реализация наследования при оптимизации объектно-ориентированной модели данных / А. А. Левков, В. А. Масленников // Проблемы техники и технологий телекоммуникаций: 7-я междунар. конф. Самара: ПГУТИ, 2006. С. 48-50.

37. Оптимизация структуры базы данных оперативного учета и документооборота / А. А. Левков, В. А. Масленников // Информационно-математические технологии в экономике, технике и образовании: II междунар. науч.-техн. конф. Екатеринбург: УГТУ-УПИ, 2007. С.54-55.

38. Методология построения системы оперативного учета и документооборота / А. А. Левков, В. А. Масленников // Мавлютовские чтения: Все-росс. молодежи, науч. конф., посвященная 75-летию УГАТУ. Уфа: УГАТУ, 2007. С. 41-43.

39. Способы оптимизации построения логических моделей данных ОО БД / А. А. Левков, В. А. Масленников // Проблемы техники и технологии телекоммуникаций: УШ междунар. науч.-техн. конф. Уфа, 2007. С. 144—146.

40. Использование классовых алгоритмов и структур в реляционных базах данных / А. А. Левков, В. А. Масленников // Решетневские чтения: XI междунар. науч. конф. Красноярск: СГАУ, 2007. С. 36-37.

41. Управление структурой информации в сложных реляционных системах / А. А. Левков // Проблемы управления и моделирования в сложных системах: междунар. науч. техн. конф. Самара: ИПУСС РАН, 2012. С. 227231.

42. Управление информацией в сложных системах на основе семантики / А. А. Левков, Б. Г. Ильясов // Современные сложные системы управления: междунар. науч. техн. конф. С. Оскол: Тонкие наукоемкие технологии, 2012.

43. Построение комплексных информационных систем управления данными и знаниями в системах расширенного управления предприятием / А. А. Левков // Информационные технологии в управлении: междунар. науч. техн. конф. С.-Петербург: СПИИРАН, 2012.

44. Классификация неопределенных значений для правильной структуризации реляционных отношений / А. А. Левков // Информатика и информационные технологии (CSIT'2012): тр. 14-й междунар. конф., 2012. Уфа: УГАТУ. № 2. С. 57-60. (опубликовано на английском языке).

45. Определение операций в расширенной реляционной модели данных / А. А. Левков // Информатика и информационные технологии (CSIT'2012): тр. 14-й междунар. конф., 2012. Уфа: УГАТУ. № 2. С. 74-77. (Опубликовано на англ. языке).

46. Построение эффективных онтологий в больших корпоративных информационных системах / А. А. Левков // Научно-техническая информация. 2012. № 6 (39). С. 328-335. (Опубликовано на англ. языке).

47. Концептуальная модель современной системы обработки информации для систем управления предприятием / А. А. Левков // Информационные технологии и системы: междунар. науч. техн. конф. Челябинск: ЧелГУ, 2013. С. 165-170.

48. Повышение согласованности данных в современных информационных системах / A.A. Левков // Информационные технологии и системы: междунар. науч. техн. конф. Челябинск: ЧелГУ, 2013. С. 139-142.

С. 48-51.

Соискатель

А. А. Левков

ЛЕВКОВ Александр Александрович

МЕТОДОЛОГИЯ ПОСТРОЕНИЯ СТРУКТУРЫ

СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ НА ОСНОВЕ РАСШИРЕННОЙ РЕЛЯЦИОННОЙ МОДЕЛИ ДАННЫХ И АЛГОРИТМОВ (на примере информационной поддержки деятельности предприятия)

Специальности 05.13.01 - Системный анализ, управление и обработка информации (в промышленности)

Автореферат диссертации на соискание ученой степени доктора техшіческих наук

Подписано к печати 26.08.2013. Формат 60x84 1/16. Бумага офсетная. Печать плоская. Гарнитура Times New Roman Суг. Усл. печ. л. 2,0. Усл. кр.-огг. 1,0. Уч.-изд. л.2,0. Тираж 100 экз. Заказ № 443

ФГБОУ ВПО Уфимский государственный авиационный технический

университет Центр оперативной полиграфии 450000, Уфа-центр, ул. К.Маркса, 12