Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий

Пшеничный, Данил Андреевич

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий

кандидата технических наук: Пшеничный, Данил Андреевич
город: Москва
год: 2013
специальность ВАК РФ: 05.13.06
цена: 450 рублей

Диссертация по информатике, вычислительной технике и управлению на тему «Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий»

Автореферат диссертации по теме "Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий"

005050204

На правах

писи

ПШЕНИЧНЫЙ ДАНИЛ АНДРЕЕВИЧ

Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий

Специальность 05.13.06 - Автоматизация и управление технологическими процессами и производствами (промышленность)

Автореферат диссертации на соискание ученой степени кандидата технических наук

2 8 ФЕВ 2013

Москва - 2013

005050204

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский автомобильно-дорожный государственный технический университет (МАДИ)» на кафедре «Автоматизированные системы управления»

Научный Рогова Ольга Борисовна,

руководитель кандидат технических наук,

доцент кафедры «Автоматизированные системы управления» МАДИ

Илюхин Андрей Владимирович доктор технических наук, профессор, заведующий кафедрой «Автоматизация производственных процессов» МАДИ

Подпорин Дмитрий Игоревич, кандидат технических наук, заместитель генерального директора ООО «МП «РОБОТ», г. Москва

Ведущая организация: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский государственный технический университет им. Н.Э.Баумана - Национальный Исследовательский Университет техники и технологий (МГТУ им.Н.Э.Баумана), г. Москва.

Защита состоится 20 Марта 2013 г. в 10.00 на заседании диссертационного совета Д 212.126.05 при Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский автомобильно-дорожный государственный технический университет (МАДИ)» по адресу: 125319, г. Москва, Ленинградский проспект, д.64, ауд. 42. Телефон для справок: (499) 155-93-24. С диссертацией можно ознакомиться в библиотеке МАДИ. Текст автореферата размещен на сайте Высшей аттестационной комиссии: www.vak.edu.gov.ru

Автореферат разослан 18 февраля 2012 года. Отзывы на автореферат в двух экземплярах, заверенные печатью организации, просим направлять в адрес диссертационного совета университета, а копии отзывов присылать по электронной почте: uchsovet@madi.ru

Ученый секретарь диссертационного совета, кандидат технических наук, доцент

Официальные оппоненты

Михайлова Н.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы

Анализ особенностей функционирования промышленных предприятий подтверждает необходимость всестороннего исследования и пересмотра существующих бизнес-процессов, методов и подходов к проектированию информационных систем (ИС), а также методов и подходов к проектированию баз данных (БД), как основной составляющей любой ИС.

Любому крупному предприятию, такому как производственный концерн, холдинг или проектная организация приходится иметь дело с огромным объемом разнородной информации, поступающей из различных информационных систем, которую необходимо обрабатывать и анализировать с целью ее последующего использования в бизнес-процессах или технологическом цикле производства.

Решение указанных задач невозможно без использования современных информационных систем интеграции и управления данными. Их применение позволяет повысить эффективность работы предприятий, сократить издержки, оптимизировать численность персонала. На крупных предприятиях, разработка таких систем очень часто связана с необходимостью интеграции данных из высоконагруженных информационных систем и обеспечением приемлемого времени выполнения запроса пользователя.

В силу значительной стоимости создания такого рода систем и специфичности деятельности каждого крупного предприятия или организации, подобные системы разрабатываются, как правило, под заказ, хотя и строятся на базе готовых решений крупных производителей. Эти системы решают задачи в соответствии с конкретными требованиями, установленными техническими заданиями и почти всегда являются уникальными продуктами, применение которых на других предприятиях невозможно или неэффективно.

Следует также отметить, что фирмы - разработчики информационных систем объективно не заинтересованы проводить исследования, направленные на поиски универсальных подходов к их проектированию, поскольку, в конечном счете, это уменьшает коммерческую выгоду от их деятельности.

Следствием сложившейся ситуации является то, что при обилии существующих информационных систем различного направления, тема разработки информационной системы, автоматизирующей процессы интеграции и управления данными, предназначенной для работы в режиме высокой загрузки и позволяющей легко адаптировать их структуру и возможности под конкретные задачи предприятий разного профиля, почти не освещена в публикациях.

Ре факторинг баз данных (англ. database refactoring) — это простое изменение в схеме базы данных, которое способствует улучшению ее проекта при сохранении функциональной и информационной семантики. Иными словами, следствием рефакторинга базы данных не может быть добавление новых функциональных возможностей или ограничение уже существующих, равно как и добавление новых данных или же изменёние смысла существующих.

Современная теория и практика показывает, что эффективное управление деятельностью промышленных предприятий должно быть основано на перманентном совершенствовании структуры БД. В этой ситуации особо актуальным становится вопрос исследования рефакторинга БД как метода радикальных преобразований сложившейся структуры БД промышленных предприятий. При этом следует принимать во внимание, что необходимым условием эффективной деятельности ИС предприятия является не только последовательное осуществление рефакторинга БД, но и его объективная оценка.

Таким образом, в современных условиях роль рефакторинга БД промышленных предприятий приобретает актуальных характер. Данный метод позволит преодолеть инерционность в управлении, и изменить существующие бизнес-процессы, что позволит успешно адаптироваться к современным условиям хозяйствования и устранить системную проблему.

Необходимость нивелировать разрыв между теорией и практикой, недостаточность методической разработанности, и возрастающая практическая значимость предопределили выбор темы и основных направлений диссертационного исследования.

Для того чтобы понять почему многие веб-разработчики не используют классический метод проектирования и понять, можно ли улучшить классический метод или разработать альтернативный, необходимо произвести детальный анализ классического метода. Проектирование логической структуры реляционной базы данных осуществляется на основе модели «сущность-связь» П. Чена или расширенной реляционной модели Э. Кодда. Методы проектирования описаны в работах П. Чена, Э. Кодда, К. Дж. Дейта, Р. Фагина, Д. Кренке, Г. Гарсиа-Молина и др.

Существующий классический метод проектирования логической структуры реляционной базы данных имеют следующие недостатки:

1. Сложность и трудоемкость идентификации функциональных зависимостей.

2. Зависимость конечного результата проектирования от опыта и субъективного взгляда проектировщика, а не от метода проектирования.

3. Проблема идентификации сущностей и атрибутов сущностей.

В существующей модели «сущность-связь» невозможно формально идентифицировать является ли объект предметной области сущностью или атрибутом сущности, что вызывает необходимость проводить нормализацию таблиц, которая основывается на функциональных зависимостях. При значительном количестве классов сущностей и атрибутов количество всевозможных функциональных зависимостей существенно возрастает.

Указанные недостатки и проблемы определяют актуальность разработки метода проектирования логической структуры реляционной базы данных устраняющего ошибки проектирования, соответствующего практическим реалиям и значительно снижающего трудозатраты.

Предмет исследования

Предметом исследования являются базы данных систем автоматизации промышленных предприятий, обеспечивающие повышение эффективности его деятельности, за счет применения современных информационных систем и технологий.

Цель диссертационной работы

Целью диссертационной работы является снижение затрат на создание и сопровождение информационных систем за счет разработки и использования метода проектирования логической структуры реляционной базы данных для приложений, основанного на функциональных требованиях к программному обеспечению.

Для достижения поставленной цели в работе решаются следующие задачи:

1. Проанализировать подходы к проектированию баз данных и создать методику совершенствования структур баз данных промышленных предприятий на основе методов эволюционного моделирования, рефакторинга и учетом факторов внешней и внутренней среды.

2. Исследовать и выявить особенности существующих методов и подходов совершенствования структур баз данных промышленных предприятий.

3. Разработать формализованную методику проектирования базы данных, основанную на сочетании методов классического и эволюционного проектирования.

4. Постановка, формализация и разработка метода решения задачи формирования структуры базы данных промышленного предприятия с учетом ограничений на реализуемость процесса проектирования баз данных, эффективной эксплуатации системы и однородности транзакций.

5. Разработать модели и методы динамического управления структурой базы данных промышленного предприятия, позволяющие, осуществлять поиск структуры базы данных, близкой к оптимальной.

6. Разработать научно-практические предложения по оценке структуры базы данных, позволяющие оценивать эффективность их применения в аспекте выполнения предъявленных к ним требований и с позиций обеспечения результативности системы автоматизации деятельности промышленного предприятия.

7. Провести апробацию предложенных подходов, методик и инструментов рефакгоринга структур баз данных промышленных предприятий.

Методы исследования

Результаты диссертационной работы получены на основе использования комплексного использования теории множеств, теории отношений, методов кластерного анализа, теории баз данных, методов проектирования реляционных баз данных, методов объектно-ориентированного анализа и проектирования, структурного метода проектирования, дискретной математики.

Научная новизна

Научная новизна состоит в структуризации и формализации процессов, а также разработке методов и средств проведения рефакторинга баз данных для автоматизации процесса проектирования и сопровождения баз данных промышленных предприятий.

На защиту выносится:

1. Формализованная методика проектирования базы данных, основанная на сочетании методов классического и эволюционного проектирования.

2. Формализованная постановка и разработка метода решения задачи формирования структуры базы данных с учетом ограничений на реализуемость процесса проектирования баз данных, эффективной эксплуатации системы и однородности транзакций.

3. Модель и методы динамического управления структурой базы данных, позволяющие, осуществлять поиск рациональной структуры базы данных, близкой к оптимальной, а также назначать моменты проведения рефакторинга базы данных на основе линейной модели роста эффекта и затрат.

4. Научно-практические предложения по оценке структуры базы данных, позволяющая оценивать эффективность их применения в аспекте выполнения предъявленных к ним требований и с позиций обеспечения результативности системы автоматизации деятельности промышленного предприятия.

5. Архитектура и структура программного обеспечения анализа состояния ИС и помощи построения плана проекта РБД, основанного на математической модели кластер-анализа состояний.

Использование ПО, реализованного по данной технологии, позволяет автоматизировать разработку на этапах планирования и анализа, а так же выявить и устранить возможные перспективные сложности.

Достоверность научных положений, рекомендаций и выводов

Достоверность положений и выводов диссертации подтверждена результатами работы на предприятиях: ЗАО «Русский Алкоголь», ЛВЗ «Топаз», ООО «Мостелеком», ООО «Парламент Продакшн».

Практическая ценность и реализация результатов работы

Результаты проведенных научных исследований были использованы при создании систем автоматизации элементов технологических процессов на промышленных предприятиях, функционирующих на основе комплекса прикладных программ построения адаптивного информационного обеспечения и соответствующей информационной системы, автоматизирующей технологические процессы промышленного предприятия.

Применение на практике программного комплекса построения адаптивного информационного обеспечения позволило рационально спроектировать информационное обеспечение и повысить качество управления промышленным предприятием.

Разработанные методы и алгоритмы прошли апробацию и внедрены для практического применения на ряде предприятий, а также используются в учебном процессе в Московском автомобильно-дорожном государственном техническом университете (МАДИ).

Содержание отдельных разделов и диссертации в целом было доложено и получило одобрение:

• на республиканских и межрегиональных научно-технических конференциях, симпозиумах и семинарах (2009-2012 гг.);

• заседаниях кафедры "Автоматизированные системы управления" МАДИ в 2009-2012 годах;

• 68-70 на научно-методических конференциях МАДИ (Москва 2009-2012 годы).

Совокупность научных положений, идей и практических результатов исследований представляет интерес в области автоматизации проектирования информационных систем промышленных предприятий.

СОДЕРЖАНИЕ РАБОТЫ

Структура работы соответствует списку перечисленных задач, содержит описание разработанных методов и моделей.

Во введении обосновывается актуальность работы, приведено краткое содержание глав диссертации, определена цель и поставлены основные задачи исследований.

В первой главе рассматриваются и анализируются основные проблемы проектирования информационных систем (ИС),

базирующихся на концепции систем баз данных. Исследуются методы представления данных на концептуальном и логическом уровнях. Проведенный анализ служит основой для разработки методики проектирования информационных систем подобного класса и применения математических методов их исследования.

На рисунке 1 показан жизненный цикл осуществления технологии А1УЮО. Данная технология предусматривает создание в начале проектирования модели высокого уровня, которая полностью охватывает всю предметную область, а так же описывает потенциальную архитектуру, лежащую в основе будущего проекта. Степень детализации концептуальной модели по мере углубления знаний о предметной области остается постоянной.

Задача эволюционного моделирования данных является сложной. Приходится учитывать ограничения данных, унаследованные от предыдущего проекта. Необходимо придерживаться соглашений об интеллектуальном моделировании данных, поскольку это регламентируют стандарты прикладного моделирования, принятые в методе адаптивного моделирования

Рис. 1. Жизненный цикл метода AMDD (Agile Model-Driven Development - адаптивная разработка на основе модели) Рассмотрены современные технологии построения распределенных интегрированных информационных систем (РИИС). В этих системах приходится решать в более сложных постановках все задачи, свойственные централизованным системам. В настоящее время большинство распределенных СУБД базируется на реляционной модели данных и рассчитано на использование в локальных сетях ЭВМ.

Проведен анализ задач проектирования и управления РИИС. Возникшая первоначально как задача размещения файлов, с появлением и развитием РБД ставится как задача размещения подструктур РБД по узлам РИИС. Рассматриваются различные постановки задачи и соответствующие им различные методы решения, которые различаются по целевым функциям и ограничениям. Важной проблемой становится систематизация моделей и методов, их классификация, на основе которой возможно как выявить сравнительные достоинства и недостатки, очертить область применения каждой модели, метода, так и определить направления дальнейших исследований.

Частное N Контролируемое^ Жестко контролируемое гч развертывание1' развертывание * развертывание *

Варианты специализированной среды разработки проекта А Специализирова иная среда интеграции проекта А

Варианты специализированной среды разработки проекта А Спе циали зирова иная среда интеграции проекта В

Варианты специализированной среды разработки проекта А Специализирова нная среда интеграции проекта п

Специализированная среда тестирования / КОНТРОЛЯ

качества на этапе подготовки производства

Вариант демонстрационной специализированная среда

Рис. 2. Развертывание с передачей из одной специализированной

среды в другую

По критерию оптимальности различные варианты постановки задач размещения можно разделить на 3 основные группы. В первую группу входят задачи минимизации общих или приведенных затрат, связанных с организацией доступа к подструктурам РБД. Ко второй группе относятся задачи максимизации производительности системы. Третью группу образуют задачи, целевая функция которых включает как затраты, так и производительность, взятые с некоторыми весовыми коэффициентами.

Рассмотрены проблемы применения рефакторинга баз данных при его внедрении в производственный процесс.

Описан подход, в котором предусмотрено применение целого ряда специализированных вариантов среды, предназначенных для реализации, тестирования и эксплуатации конкретных систем. Как показано на рисунке 2, каждая группа проектировщиков имеет в своем распоряжении целый ряд вариантов специализированной среды разработки и, возможно, даже собственную демонстрационную специализированную среду, соответствующую конкретным требованиям.

Рассмотрен подход РБД путем выполнения набора операций рефакгоринга БД. Работа групп разработчиков организована в виде коротких итераций. Операция рефакгоринга базы данных рассматривается как транзакция, которая должна быть реализована как совокупность сценариев на языке определения данных DDL. На рисунке 3 приведена схема, в которой в качестве идентификаторов используются числа. Проще всего можно рассматривать эту ситуацию так, что с начала разработки нового выпуска системы создается новый стек операций рефакторинга базы данных. По завершении разработки текущего выпуска стек изменений закрывается, после чего рассматривается как набор операций изменения схемы для текущего выпуска.

БД

разработчика, версия 813

БД

разработчика версии 815

БД

разработчика, версия 809

разработчика, версия 811

БД интеграции проектов, версия 811

БД

тестирования

ИОД1 ОГОВКИ производства, версия 80S

БД

демонстрацией . версия 800

Производствен иая БД. версия 758

Рис. 3. Подготовка разных версий для различных БД На рисунке 4 условно представлена показано, как две группы разработчиков планируют развертывание предложенных ими изменений в предусмотренные для этого интервалы развертывания.

Рис. 4. Развертывание изменений схемы на производстве в заранее отведенные интервалы времени На рисунке 5 представлена блок-схема 11М1_, на которой условно изображен процесс развертывания.

Операцию рефакторинга базы данных нельзя считать полностью развернутой до тех пор, пока из производственной среды не будет

удалена устаревшая схема. В этом случае должно быть

Рис. 5. Процесс развертывания Во второй главе рассмотрена формализованная постановка задачи рефакторинга баз данных и метода ее решения. В этой главе решены следующие задачи: выделен метод формирования структуры базы данных, реализовано планирование разработки системы баз данных, выделено место проведения рефакторинга в данном процессе, а так же разработан метод выявления критических состояний системы. Метод распознавания, реализованный в виде ПО, позволяет автоматизировать разработку на этапах анализы и выявления проблем.

Предложен метод формирования структуры БД. Для оптимизации полученного начального решения используются различные варианты метода вектора спада и метод Гаусса-Зейделя, что обусловлено трудоемкостью вычисления значения целевой функции и проверки системы ограничений.

Алгоритм формирования структуры системы базы данных (СБД) достаточно большой и приводиться не будет.

Проведенные испытания показали, что предлагаемые алгоритмы позволяют улучшить значение целевой функции на 10-ИЗ% относительно начального решения. Из характеристики программ, реализующих разработанные алгоритмы, видно, что полученное время счета на 10-И 2% лучше, чем при ранее существующей двухкритериальной постановке задачи.

Формализовано описание задачи планирования и методов ее решения. Так как на этапе концептуального проектирования невозможно дать точную численную оценку критериев, то для формализации задачи используется аппарат теории нечетких множеств.

Длительность разработки ¡-й подсистемы БД (ПБД) задаем нечеткой переменной времени Т, с монотонно возрастающей функцией принадлежности £(х), имеющей предел, равный 1.

Из класса монотонно возрастающих функций для описания процессов планирования рекомендуется использовать экспоненциальную функцию следующего вида:

О, при х < а;

чЛ (1)

, при х >а.

Г(х) =

а

I

Разобраны и доказаны следующие свойства:

Свойство 1. Функция принадлежности суммы двух нечетких переменных принадлежит к тому же классу, что и функции принадлежности слагаемых.

Свойство 2. Операция сжатия не выводит функцию принадлежности вида (1) из заданного класса функций.

Свойство 3. Операция сжатия функции принадлежности дистрибутивна относительно операции сложения

311(Х1 + X,) = Э^Х, + Б^Хз-

Введен штраф за разработку каждой ПБД, значение которого надо минимизировать:

Р. *(1-<хС(х)Н-с(х' ч1Х}> (2)

^ 1<П '

При переходе к однокритериальной задаче для функций вида (1) оправдано применение аддитивной свертки с одинаковыми весовыми коэффициентами:

Задачу планирования разработки можно сформулировать как задачу минимизации целевую функцию \Л7 при ограничениях, заданных формулами. Данная задача относится к классу задач линейного целочисленного программирования. Предложен следующий алгоритм поиска оптимального решения.

Алгоритм поиска оптимальной последовательности реализации ПБД. Исходные данные:

||с,||- вектор эффективности; ЦЬ^- вектор параметров времени

разработки ПБД; где Ь;=а;+а(.

Шаг 0. Ввод исходных данных.

Шаг 1. Построение матрицы X VI V]

Если 1 = 1, то х. = 1.

J' п

Если ([Ф ]) л(с;Ь; ^с^;), то Ху=1, Х^=0, иначе х =0, X =1.

Шаг 2. Определить вектор последовательности разработки

__N

К =[|к;|| по формуле: У} е1,М : 1= ^х^, к( = ].

'-1

ШагЗ. Печать ||к;||. Конец.

Разработан и предложен метод распознавания сходства текущего состояния системы с выделенными критическими состояниями. Методы классификации состояний и, в частности, наиболее общие из них - методы кластерного анализа, можно использовать также при согласовании разнородных структур описания состояний баз данных и знаний, построении ряда механизмов абстракций (агрегация, обобщение, группирование).

В результате кластер-анализа группа состояний разбивается на некоторое заданное число подгрупп (кластеров) на основании выбранной (часто субъективно) метрики или псевдометрики. В задачах данного типа в качестве метрики обычно используются коэффициенты (индексы) различия или сходства - своеобразные псевдометрики, определяемые пересечением множеств характеристик элементов. Анализ показал целесообразность использования для данного приложения индекса Жаккара: N..

и =_1_

.V, к\;, - л; . V

Обобщенный алгоритм нечеткой классификации N - элементов в М - классов можно представить в следующем виде:

Шаг 1. Номер итерации 5 Г= 0.

Найти начальное разбиение на М - классов:

о о о

с\ ) 2'""' Л/

Шаг 2. Вычислить матрицу значений функции принадлежности элементов классам:

{»«У У-ПАГ (4)

Шаг 3. 5 :=5 + 1. Модифицировать разбиение по правилу, минимизирующему выбранную целевую функцию:

Шаг 4. Если выполнено условие завершения процесса кластеризации, то СТОП, иначе - перейти к шагу 2.

Проведенный анализ показал, что в качестве условий окончания процесса кластеризации необходимо выбрать достижение порогового значения функции и/или максимального количества итераций, или сходимость к окончательному устойчивому разбиению, или ограничение времени кластеризации при несходимости алгоритма.

Решена проблема вычисления функций принадлежности в рамках теории нечетких множеств для данного приложения. Разработаны алгоритмы классификации элементов моделей данных, способные работать в реальном масштабе времени.

Решение первой задачи автоматизации проведения процесса рефакторинга БД требует разработки механизма распознания текущего состояния БД. Проведен анализ некоторых известных метрик численной таксономии для конкретных приложени. Проведен анализ множества возможных мер сходства с точки зрения совокупности знаний о процессе проектирования БД. Изучена возможность использования в этом процессе свойств-атрибутов объектов и взаимосвязей ПО, формирующих множество К.

На рисунке 6 показаны результаты расчета коэффициентов сходства одного из объектов для различных зависимостей. В примере наблюдается максимальное сходство объектов е4, е7, ец, е21, е25, некоторое сходство объекта е4 с другими объектами.

Таким образом, осуществляется переход от исходных данных в виде бинарных матриц принадлежности элементов моделей типа «БД-параметр БД», «состояние-параметр БД», к матрицам коэффициентов сходства, используемым для проведения кластер-анализа, расчета функций принадлежности и функционалов качества разбиения.

В третьей главе рассмотрены методы разработки оптимальных структур данных промышленных предприятий, описано оптимальное размещение данных и критерии оптимальности. Главными критериями оптимальности БД являются:

1. производительность;

2. расход ресурсов внешней памяти;

3. надежность и простота администрирования.

Оптимизация ИС предполагает следующий перечень традиционно решаемых задач:

1. рациональное размещение данных и распределение информационных ресурсов на серверах;

2. постоянное администрирование БД, поддержание логических структур данных в актуальном состоянии;

3. оперативное управление клиентскими приложениями, поиск путей повышения производительности БД, к которой направляется большое количество запросов со стороны клиентских приложений;

4. анализ состояния надежности и периодическое проведение профилактических мероприятий по безопасности ИС.

Распределение данных и информационных ресурсов будет эффективным при соблюдении нижеперечисленных мероприятий:

1. Установка оптимальных размеров блоков данных.

2. Уменьшение фрагментации данных.

3. Группировка хранимых данных по пространствам.

4. Децентрализация БД.

5. Оптимизация хранения больших двоичных объектов.

6. Индексирование таблиц данных.

Рис. 7. Влияние размера блока данных на производительность БД Была проведена оценка семантических свойств доменов при обеспечении целостности и эффективности БД. В качестве оценки значения семантических свойств доменов, при организации ввода и формирования БД ИС, могут выступать вероятности нарушения целостности БД при вводе и модификации информации в БД.

Разобран вопрос учет индивидуальных семантических свойств данных в доменно-ориентированной организации данных.

В качестве индивидуальных семантических свойств данных можно рассматривать способ именования (кодирования, записи и т.д.) данных в естественном языке. Рассмотрены зависимости средней длины строкового поля, выделяемого для хранения фамилий, для организации данных в ряде известных СУБД.

1.2

0,8

0,6

о 0,4

0.2

0

Рис. 8. Зависимость вероятности Оо(\м) от длины слова для традиционной организации данных

Рис. 9. Зависимость вероятности СЬМ от длины слова для доменно-ориентированной организации данных, к=2

Рис. 10. Зависимость вероятности нарушения целостности от количества элементов в БД имеющих одинаковое значение Была рассмотрена организация данных, учитывающая семантику слов. На основе данных из проведенных тестов был построен график (рис. 11.) зависимости средней длины значения поля от количества элементов в структур данных промышленных предприятий по рейтингу запросов. Рассматривается одноканальная система обслуживания с пуассоновским входящим потоком и произвольным распределением времени обслуживания области хранения. Рассмотрен и предложен метод оптимизации.

Исследование подтвердило, что поставленная задача может быть решена на основе введения рейтинга запросов, в зависимости от их информативности (точности). Указанные характеристики влияют на среднее время обработки запроса.

количество элементов в области хранения

Средняя длина значения поля с учетом семантики и (байт) і і

Средняя длина значения поля в текстовом файле (байт)

Средняя длина значения поля в СУБД FoxPro, Clipper (байт) Средняя длина значения поля в СУБД Oracle (байт) :

Рис. 11. Зависимость средне длины значения поля от количества элементов в области хранения

Доказано, что для всех основных показателей рациональное назначение рейтингов входящих в систему запросов способно повысить эффективность ее работы, причем оптимальное решение может быть получено путем минимизации выражения

S = ^=1(i-Ar-0(i-Ar) min, при Ar = I[=1Pk < 1,р > 0 для любого 1 < г < R (5)

В соответствии с разработанной теорией далее в работе предлагается подход к определению времени обработки запроса.

В четвертой главе разобрано практическое проведение рефакторинга распределенной базы данных ликероводочного холдинга промышленного предприятия и оценка его эффективности, выполнена разработка методики рефакторинга баз данных. Разобраны вопросы управления развертыванием изменений, применения средств контроля версий, отката изменений. Выполнена сравнительная оценка эффективности вариантов иерархической структуры данных и оценка производительности и работоспособности систем с различной архитектурой.

Согласно приведенной теории, на схеме ниже приведена общая картина выполнения РБД ИС ПП.

Выделены и проанализированы признаки нарушения в работе ИС. Разработан план проведения РБД ИС ПП. Необходимо выделить часть схемы БД, привязанной к данному бизнес-процессу. Выделить все зависимые объекты ИС (другие объекты БД, программы доступа, триггеры и т.д.).

О

Проверка необходимости

Выбор правильного способа РБД • (выбор применяемых операции, планирование работ)

Обозначение исходной схемы мак уст арен шеи

6-

Выпопнение переноса данных (астуапизаипя. синхронизация, ибраОитха данных! Обноепение программ

1 1

I рефакто1>ииге номера версии Выполнение

Рис. 12. Процесс рефакторинг базы данных.

В данной работе и в конкретном внедрении, при проведении данного шага разработки, использовалась специальная информационная система. Данный программный продукт помогает оценивать текущее состояние БД и предлагает различные варианты проведения рефакторинга. Оценка текущего состояния заключается в получении коэффициента сходства с заданным состоянием. Коэффициент сходства вычисляется математическим способом на основе кластер-анализа состояний. Алгоритм и методика проведения построения предварительного плана проведения рефакторинга БД ИС

ПП объясняется ниже.

Фрагмент справочника с информацией о состояния: информационной системы и множествах операций приведен ! диссертационной работе.

Для того, чтобы учесть взаимосвязи между выполняемым! операциями был разработан дополнительный справочник связей межд операциями рефакторинга.

Чтобы картина проведения рефакторинга была полной, а так же дл: того, что бы можно было спрогнозировать изменения параметро информационной системы и скорректировать план проведени рефакторинга, была разработана таблица зависимостей параметро информационной системы от выполняемых операций. В ход выполнения данной работы был выполнен анализ и выделенны параметров БД. Показатели этих параметров снимались с различны БД. Над этими различными БД выполнялись одни и те же операции РЪ1 После параметры вновь замерялись. Для учета новых состояни информационной системы по каким либо из её параметров используете

механизм обратной связи.

В процессе внедрения по данному алгоритму из общей схемы Б, была выделена подсхема, соответствующая бизнес-процесс «Планирование производства». Эта схема представлена средствам

визуализации Microsoft SQL Server Manager 2008 и приведена на рисунке 13. -" " • ■"• ; ■ ' ,v

Параметры информационной системы снимались и передавались в аналитическую подсистему. Для идентификации некоторых состояний были написаны специальные программные реализации, которые автоматически идентифицировали наличие определенных нарушений. Согласно данным состояниям подсистема анализа предложила несколько планов выполнения рефакторинга. Это набор объектов, за которыми закреплена последовательность операций рефакторинга. Один из них был помечен как «рекомендуемый». Этот план был оценен экспертным методом и одобрен для выполнения. Следующим этапом проводилась развертка изменений в целевой среде. При данной реализации учитывалась необходимость поддержания старой схемы базы данных в течении переходного периода.

Была выполнена формализация и классификация ОРБД. Согласно такому делению, в регламентирующих документах предприятия описаны каждый из критериев, разобраны входящие в них операции, а так же встречающиеся проблемы и методы их устранения. Это позволяет воспринимать информацию одинаково, дает возможность передавать дела от одного сотрудника другому, работать группами, а так же вести параллельную разработку.

Выполнено внедрение средств управления развертыванием изменений, средств контроля версий и отката изменений. На рисунке 14 показана схема логических специализированных вариантов среды, позволяющих разработчикам работать в безопасности.

Выявлены недостатки эволюционных методик разработки БД, препятствующие их внедрению. Реализован процесс отката изменения до предыдущего состояния. Для обеспечения успешного проведения РБД были установлены под контроль средств управления конфигурациями указанные ниже объекты: сценарии на языке DDL, сценарии загрузки/извлечения данных, файлы с определениями моделей данных, метаданные объектно-ориентированного отображения, справочные данные, определения хранимых процедур и триггеров, определение представлений, ограничение ссылочной целостности, другие объекты БД (такие как индексы, последовательности и т.д.), тестовые данные, сценарии создания тестовых данных, тестовые сценарии, операции и методы проведения рефакторинга БД, алгоритмы определения наилучшего пути проведения рефакторинга БД.

Рис. 13. Схема БД соответствующая бизнес-процессу «Планирование производства»

Частное

развертывание1'

Контроле

развертывание

руемовк

.1РЯИМР V •

_2Кесткщо11Ш1ИРУемое^ ...v, развертывание 1

Специапизирова иная среда разработки

Специализирова иная среда интеграции проектов

Ускоренная разработка

Тестирование на уровне проекта

Демонстрационная специализированная среда

Специализированная среда тестирования и контроля

качества на этапе подготовки производства

Тестирование системы и приемочное тестирование

Эксплуатация и сопровождение

некачественный

Ф

выпуск

отчеты п выявленных ошибках отчеты г. описание нелостятков программного обеспечения

Рис. 14. Специализированные варианты среды

Выполнена сравнительная оценка эффективности вариантов иерархической структуры данных.

Выполнена оценка производительности и работоспособности систем с различной архитектурой.

Выполнена оценка характеристик производительности системы. Переоценка вычислительных ресурсов приводит к лишним затратам, а их недооценка - к вынужденному пересмотру принятых решений и задержке сроков их реализации.

Протестированы ИС и приложения БД как готовые программно-аппаратных решения, оценена их производительность и работоспособность при различной конфигурации сети -двухуровневой и с промежуточным слоем (middleware).

Диаграммы анализа показывают, что основная часть ресурсов тратится на обработку запросов сервером и передачу данных по сети. Это подтверждает вывод о том, что эффективность функционирования клиент-серверных БД в значительной степени зависит от оптимальности запросов, реализованных в клиентском приложении. - . ...

Анализ полученных результатов выявил возможность оптимизации системы за счет перераспределения нагрузки между сервером и клиентом при выполнении операций обработки и модификации данных в таблицах БД. Несмотря на то, что больше половины нагрузки приходится на сервер, общая загруженность его ресурсов не превышает 65%. Реализация промежуточного слоя позволила перенести часть нагрузки на сервер и тем самым

уменьшить на 68% обмен по сети (одно из узких мест), а общее время работы сократить на 29%.

В заключении представлены основные результаты работы.

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ

1. Предложена методика процесса концептуального проектирования баз данных, определен класс оценок, применяемый для анализа концептуальной модели данных и ее элементов. На основании выбранного подхода к концептуальному проектированию С БД сформулирована задача формирования структуры СБД с учетом ограничений на реализуемость процесса проектирования БД, адаптации к возможным изменениям потребностей пользователей и эффективности эксплуатации системы: размеры ПБД, однородность ПБД, частота обновления данных.

2. Разработан алгоритм поиска начального допустимого решения задачи формирования структуры СБД с учетом введенной системы ограничений. Проведено исследование программ, реализующих предложенный алгоритм и получены характеристики, подтверждающие их практическую значимость.

3. Предложена методика распознавания сходства текущего состояния системы с выделенными критическими состояниями. Метод распознавания, реализованный в виде ПО, позволит автоматизировать разработку на этапах анализы и выявления проблемных состояний информационной системы.

4. Разработаны основные принципы организации информационных систем на основе категорией доменно-ориентированной модели. Разработаны основные этапы проектирования категорийной доменно-ориентированной информационной системы.

5. Предложена методика выполнения рефакторинга базы данных информационной системы промышленного предприятия. Реализован разработанный алгоритм выполнения рефакторинга.

6. Спроектирована модель системы анализа как отдельной информационной системы или подсистемы основной информационной системы. Предлагаемая система обладает обратной связью, которая обеспечивает постоянное обновление и поддержание информации в актуальном состоянии, а так же постоянное улучшение качества аналитической функции и качества функции планирования рефакторинга. Данное свойство соответствует принципам эволюционной разработки.

7. Предложены классификация операций и формализация (предписание) их выполнения. Подобная классификация не противоречит принципу внесения малых изменений. Использование малых изменений при разработке снижает сложность процесса,

позволяет легко находить ошибки (при'использовании тестов не всех этапах - TDD), облегчает откат изменений при выявлении их некорректности.

8. Обоснована необходимость и приведен пример реализации средства контроля версий. Соблюдение описанных принципов разработки в сочетании с использованием средств управления версиями дает возможным поддерживать систему в рабочем состоянии на протяжении всего процесса разработки, уменьшает время восстановления предыдущего состояния в случае ошибки и упрощает процесс обнаружения причины нарушения.

Публикации по теме работы

По результатам выполненных исследований опубликовано 6 печатных работ (3 из них в центральных изданиях, рекомендованных ВАК).

Из перечня ВАК

1. Пшеничный Д.А. Эффективность и живучесть программных средств облачных нанопроцессорных систем / Петров М.Б., Петриков П.А // Качество. Инновации. Образование. 2012. №2. С. 51-53.

2. Пшеничный Д.А. The Analysis of Parameters and Matching of a DBMS for Realisation of Dataware of Industral Firm / Будихин A.B., Асади M И Качество. Инновации. Образование. 2010. №9. С. 42-48

3. Пшеничный Д.А. Анализ параметров и сравнение СУБД для реализации информационного обеспечения промышленного предприятия / Остроух A.B., Будихин А.В // Промышленные АСУ и контроллеры. 2010. №12. С. 7-11

В других издательствах

4. Пшеничный Д.А. Refactoring databases as the main stage of actualization of structure under a demanded functional / Будихин A.B., Меркулов A.M // Information and telecommunication technologies in intellegent systems. Proceedings of seventh international conference. M.: Моск. гос. ин-т электрон, и математики, 2010. С. 97-100.

5. Пшеничный Д.А. Анализ параметров СУБД в составе информационного обеспечения промышленного предприятия / Будихин A.B., Асади M // Интегрированные технологии моделирования и управления. М.: МАДИ (ГТУ): 2010. С. 50-60.

6. Пшеничный Д.А. Оценка производительности и работоспособности информационных систем с различной архитектурой / Рогова О.Б., Мещеряков C.B. // Автоматизация и управление в технических системах. 2012. №1.

Подписано в печать: 18.02.2013 Тираж 100 экз Заказ №934 Отпечатано в типографии «Реглет» г. Москва, Ленинградский пр-т д.74 (495)790-74-77 www.reglet.ru

Оглавление автор диссертации — кандидата технических наук Пшеничный, Данил Андреевич

ВВЕДЕНИЕ.

1. ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ПРОВЕДЕНИЯ РЕФАКТОРИНГА БАЗ ДАННЫХ ПРОМЫШЛЕННЫХ ПРЕДПРИЯТИЙ.

1.1. Эволюционный подход к моделированию баз данных.

1.2. Современные технологии построения распределенных интегрированных информационных систем.

1.3. АНАЛИЗ Задач проектирования и управления распределенной ингерированной информационной системой.

1.4. Проблемы применения рефакторинга баз данных при его внедрении в производственный процес.

1.4.1 Эффективное развертывание с передачей из одной специализированной среды в другую.

1.4.2 Применение наборов операций рефакторинга базы данных.

1.4.3 Планирование подходящих интервалов развертывания.

1.4.4 Развертывание всей системы.

1.4.5 Удаление устаревшей схемы.

Выводы.

2. СИНТЕЗ И ФОРМАЛИЗАЦИЯ И РЕШЕНИЕ ЗАДАЧИ РЕФАКТОРИНГА БАЗ ДАННЫХ ПРОМЫШЛЕННЫХ ПРЕДПРИЯТИЙ.

2.1. Метод формирования структуры базы данных.

2.2. Планирование разработки системы баз данных.

2.3. Разработка метода распознавания сходства текущего состояния системы с выделенными критическими состояниями.

Выводы.

3. МЕТОДЫ РАЗРАБОТКИ ОПТИМАЛЬНЫХ СТРУКТУР ДАННЫХ ПРОМЫШЛЕННЫХ ПРЕДПРИЯТИЙ.

3.1. Оптимальное размещение данных и критерии оптимальности

3.2. Оценка семантических свойств доменов при обеспечении целостности и эффективности БД.

3.3. Учет индивидуальных семантических свойств данных в доменно-ориентированной организации данных.

3.4. Метод оптимизации структур данных промышленных предприятий по рейтингу запросов.

4. ПРОВЕДЕНИЕ РЕФАКТОРИНГА РАСПРЕДЕЛЕННОЙ БАЗЫ ДАННЫХ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ И ОЦЕНКА ЕГО ЭФФЕКТИВНОСТИ (НА ПРИМЕРЕ ЛИКЕРО-ВОДОЧНОГО ХОЛДИНГА ООО «ПАРЛАМЕНТ ПРОДАКШН»).

4.1. Разработка методики рефакторинга баз данных.

4.1.1 Общая схема проведения РБД ИС1111.

4.1.2 Признаки необходимости проведения рефакторинга БД ИС ПП.

4.1.3 Построение плана проведения РБД ИС 1111.

4.2. Реализация полученного плана рефакторинга.

Сложности, встречающие при реализации операций рефакторинга

Формализация операций рефакторинга.

4.3. Управление развертыванием изменений, средства контроля версий, откат изменений.

4.4. Сравнительная оценка эффективности вариантов иерархической структуры данных.

4.5. Оценка производительности и работоспособности систем с различной архитектурой.

Выводы.

Введение 2013 год, диссертация по информатике, вычислительной технике и управлению, Пшеничный, Данил Андреевич

АКТУАЛЬНОСТЬ РАБОТЫ

Анализ особенностей функционирования промышленных предприятий подтверждает необходимость всестороннего исследования и пересмотра существующих бизнес-процессов, методов и подходов к проектированию информационных систем (ИС) промышленных предприятий, а также методов и подходов к проектированию баз данных (БД), как основной составляющей любой ИС.

Любому крупному предприятию, такому как производственный концерн, холдинг или проектная организация приходится иметь дело с огромным объемом разнородной информации, поступающей из различных информационных систем, которую необходимо обрабатывать и анализировать с целью ее последующего использования в бизнес-процессах или технологическом цикле производства.

Решение указанных задач невозможно без использования современных информационных систем интеграции и управления данными. Pix применение позволяет повысить эффективность работы предприятий, сократить издержки, оптимизировать численность персонала. На крупных предприятиях, разработка таких систем очень часто связана с необходимостью интеграции данных из высоконагруженных информационных систем и обеспечением приемлемого времени выполнения запроса пользователя.

В силу значительной стоимости создания такого рода систем и специфичности деятельности каждого крупного предприятия или организации, подобные системы разрабатываются, как правило, под заказ, хотя и строятся на базе готовых решений крупных производителей. Эти системы решают задачи в соответствии с конкретными требованиями, установленными техническими заданиями и почти всегда являются уникальными продуктами, применение которых на других предприятиях невозможно или неэффективно.

Следует также отметить, что фирмы - разработчики информационных систем объективно не заинтересованы проводить исследования, направленные на поиски универсальных подходов к их проектированию, поскольку, в конечном счете, это уменьшает коммерческую выгоду от их деятельности.

Следствием сложившейся ситуации является то, что при обилии существующих информационных систем различного направления, тема разработки информационной системы, автоматизирующей процессы интеграции и управления данными, предназначенной для работы в режиме высокой загрузки и позволяющей легко адаптировать их структуру и возможности под конкретные задачи предприятий разного профиля, почти не освещена в публикациях.

Рефакторинг баз данных (англ. database refactoring) — это простое изменение в схеме базы данных, которое способствует улучшению ее проекта при сохранении функциональной и информационной семантики. Иными словами, следствием рефакторинга базы данных не может быть добавление новых функциональных возможностей или ограничение уже существующих, равно как и добавление новых данных или же изменение смысла существующих.

Современная теория и практика показывает, что эффективное управление деятельностью промышленных предприятий должно быть основано на перманентном совершенствовании структуры БД промышленных предприятий. В этой ситуации особо актуальным становится вопрос исследования рефакторинга БД как метода радикальных преобразований сложившейся структуры БД промышленных предприятий. При этом следует принимать во внимание, что необходимым условием эффективной деятельности ИС предприятия является не только последовательное осуществление рефакторинга БД, но и его объективная оценка.

Таким образом, в современных условиях роль рефакторинга БД промышленных предприятий приобретает актуальных характер. Данный метод позволит преодолеть инерционность в управлении, и изменить существующие бизнес-процессы, что позволит успешно адаптироваться к современным условиям хозяйствования и устранить системную проблему в отрасли.

Необходимость нивелировать разрыв между теорией и практикой, недостаточность методической разработанности, и возрастающая практическая значимость предопределили выбор темы и основных направлений диссертационного исследования.

В процессе проектирования структуры реляционной БД у проектировщика есть только один объективный критерий оценки проекта -это соответствие всех таблиц в БД пятой нормальной форме (5НФ). Но если все таблицы находятся в 5НФ, то количество таблиц в базе данных максимально возможное. А в этом случае, падает производительность ИС, т.к. выборка данных из нескольких таблиц происходит медленнее, чем из одной. И растет стоимость разработки ИС.

Для того чтобы понять почему многие веб-разработчики не используют классический метод проектирования и понять, можно ли улучшить классический метод или разработать альтернативный, необходимо произвести детальный анализ классического метода.

Проектирование логической структуры реляционной базы данных осуществляется на основе модели «сущность-связь» П. Чена [11] или расширенной реляционной модели Э. Кодда [12]. Методы проектирования описаны в работах П. Чена, Э. Кодда, К. Дж. Дейта [4], Р. Фагина [1], Д. Кренке [5], Г. Гарсиа-Молина [6] и др. Данные модели «сущность-связь» не имеют формальных определений сущности и атрибута сущности, а также не учитывают функциональных требований к ИС на стадии проектирования. Для каких-то приложений, возможно, такой подход и является правильным, когда мы абстрагируемся от операций над данными и моделируем только сами данные. Например, когда функциональные требования заранее не известны, и ИС постоянно пополняется новыми функциональными требованиями. Но для веб-приложений основой являются функциональные требования к ним, описанные в техническом задании (ТЗ). На основе технического задания происходит оценка стоимости проекта. И если делать структуру БД на все случаи жизни без учета конкретных функциональных требований, то будет расти и стоимость проекта.

Существующий классический метод проектирования логической структуры реляционной базы данных имеют следующие недостатки:

1. Сложность и трудоемкость идентификации функциональных зависимостей.

2. Зависимость конечного результата проектирования от опыта и субъективного взгляда проектировщика, а не от метода проектирования.

3. Проблема идентификации сущностей и атрибутов сущностей.

В существующей модели «сущность-связь» невозможно формально идентифицировать является ли объект предметной области сущностью или атрибутом сущности, что вызывает необходимость проводить нормализацию таблиц, которая основывается на функциональных зависимостях. При значительном количестве классов сущностей и атрибутов количество всевозможных функциональных зависимостей существенно возрастает. Как правило, на практике все функциональные зависимости не рассматриваются, и не все таблицы проходят процесс нормализации из-за экономии времени, что может приводить к ошибкам на этапе проектирования. Для устранения этих ошибок на последующих этапах разработки информационных систем требуются значительные затраты временных и человеческих ресурсов.

Указанные недостатки и проблемы определяют актуальность разработки метода проектирования логической структуры реляционной базы данных устраняющего ошибки проектирования, соответствующего практическим реалиям и значительно снижающего трудозатраты.

ЦЕЛЬ ДИССЕРТАЦИОННОЙ РАБОТЫ

Целью диссертационной работы является снижение затрат на создание и сопровождение информационных систем за счет разработки и использования метода проектирования логической структуры реляционной базы данных для приложений, основанного на функциональных требованиях к программному обеспечению.

ОБЪЕКТ ИССЛЕДОВАНИЯ

Объектом исследований является методы проектирования структуры реляционной базы данных, процессы разработки информационных систем, обеспечивающие автоматизацию управления промышленным производством на базе современных информационно-коммуникационных технологий.

ПРЕДМЕТ ИССЛЕДОВАНИЯ

Предметом исследования являются базы данных систем автоматизации деятельности промышленных предприятий, обеспечивающие повышение эффективности его деятельности, за счет применения современных информационных систем и технологий.

МЕТОДЫ ИССЛЕДОВАНИЯ

Результаты диссертационной работы получены на основе использования комплексного использования теории множеств, теории отношений, методов кластерного анализа, теории баз данных, методов проектирования реляционных баз данных, методов объектно-ориентированного анализа и проектирования, структурного метода проектирования, дискретной математики.

НАУЧНАЯ НОВИЗНА

Научная новизна состоит в структуризации и формализации процессов, а также разработке методов и средств проведения рефакторинга баз данных для автоматизации процесса проектирования и сопровождения баз данных промышленных предприятий.

ЗАДАЧИ РАБОТЫ

1. Проанализировать подходы к проектированию баз данных промышленных предприятий и создать методику совершенствования структур баз данных промышленных предприятий на основе методов эволюционного моделирования, рефакторинга и учетом факторов внешней и внутренней среды.

2. Исследовать и выявить особенности существующих методов и подходов совершенствования структур баз данных промышленных предприятий.

3. Разработать формализованную методику проектирования базы данных промышленного предприятия, основанную на сочетании методов классического и эволюционного проектирования.

4. Постановка, формализация и разработка метода решения задачи формирования структуры базы данных промышленного предприятия с учетом ограничений на реализуемость процесса проектирования баз данных, эффективной эксплуатации системы и однородности транзакций.

5. Разработать модели и методы динамического управления структурой базы данных промышленного предприятия, позволяющие, осуществлять поиск структуры базы данных, близкой к оптимальной.

6. Разработать научно-практические предложения по оценке структуры базы данных, позволяющие оценивать эффективность их применения в аспекте выполнения предъявленных к ним требований и с позиций обеспечения результативности системы автоматизации деятельности промышленного предприятия.

7. Провести апробацию предложенных подходов, методик и инструментов рефакторинга структур баз данных промышленных предприятий.

ДОСТОВЕРНОСТЬ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

Достоверность положений и выводов диссертации подтверждена результатами экспериментальных исследований и положительными результатами внедрений разработок на предприятиях: ЗАО «Русский Алкоголь», ЛВЗ «Топаз», ОАО «Мостелеком», ООО «Парламент Продакшн».

ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ

Результаты проведенных научных исследований были использованы при создании систем автоматизации элементов технологических процессов на промышленных предприятиях, функционирующих на основе комплекса прикладных программ построения адаптивного информационного обеспечения и соответствующей информационной системы, автоматизирующей технологические процессы промышленного предприятия.

Применение на практике программного комплекса построения адаптивного информационного обеспечения позволило рационально спроектировать информационное обеспечение и повысить качество управления промышленным предприятием.

АПРОБАЦИЯ РЕЗУЛЬТАТОВ

Основные научные положения и результаты диссертации докладывались и обсуждались:

• на республиканских и межрегиональных научно-технических конференциях, симпозиумах и семинарах (2009-2012 гг.);

• заседаниях кафедры "Автоматизированные системы управления" МАДИ в 2009-2012 годах;

• 68-70 на научно-методических конференциях МАДИ (Москва 20092012 годы).

ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ

Применение на практике программного комплекса позволило рационально спроектировать структуру информационного обеспечения и на ее основе разработать информационную систему (ИС) для автоматизации процессов на промышленном предприятии.

Основные результаты диссертации внедрены в следующих организациях: ЗАО «Русский Алкоголь», ЛВЗ «Топаз», ОАО «Мостелеком», ООО «Парламент Продакшн».

Применение результатов работы позволило сократить сроки разработки ИС на 12-15 %, снизить их трудоемкость, автоматизировать процессы в промышленном предприятии, повысить качество управления промышленным предприятием.

Результаты диссертации использованы также в учебном процессе кафедры АСУ МАДИ при проведении лабораторных работ по курсам: "Базы и банки данных", "Проектирование ИС", а также при выполнении курсовых и дипломных проектов, связанных с вопросами автоматизации деятельности строительных предприятий.

НАУЧНЫЕ ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ

1. Формализованная методика проектирования базы данных промышленного предприятия, основанная на сочетании методов классического и эволюционного проектирования

2. Формализованная постановка и разработка метода решения задачи формирования структуры базы данных с учетом ограничений на реализуемость процесса проектирования баз данных, эффективной эксплуатации системы и однородности транзакций.

3. Модель и методы динамического управления структурой базы данных промышленного предприятия, позволяющие, осуществлять поиск рациональной структуры базы данных, близкой к оптимальной, а также назначать моменты проведения рефакторинга базы данных на основе линейной модели роста эффекта и затрат

4. Научно-практические предложения по оценке структуры базы данных, позволяющая оценивать эффективность их применения в аспекте выполнения предъявленных к ним требований и с позиций обеспечения результативности системы автоматизации деятельности промышленного предприятия.

ПУБЛИКАЦИИ

Отдельные положения диссертации отражены в шести печатных работах, в том числе три в журналах из перечня ВАК.

ОБЪЕМ РАБОТЫ И СТРУКТУРА ДИССЕРТАЦИИ

Диссертационная работа состоит из введения, 4 глав основного текста, выводы по главам, заключения, списка информационных источников из 150 наименований и приложения.

Заключение диссертация на тему "Автоматизация технологических процессов рефакторинга баз данных промышленных предприятий"

ВЫВОДЫ

1. Предложена методика выполнения рефакторинга базы данных информационной системы промышленного предприятия. Реализован разработанный алгоритм выполнения рефакторинга.

2. Спроектирована модель системы анализа как отдельной информационной системы или подсистемы основной информационной системы. Предлагаемая система обладает обратной связью, которая обеспечивает постоянное обновление и поддержание информации в актуальном состоянии, а так же постоянное улучшение качества аналитической функции и качества функции планирования рефакторинга. Данное свойство соответствует принципам эволюционной разработки;

3. Соблюдение принципов эволюционной разработки увеличивает эффективность всего процесса разработки, снижает трудоемкость, снижает временные и материальные затраты.

4. Предложены классификация операций и формализация (предписание) их выполнения. Подобная классификация не противоречит принципу внесения малых изменений. Использование малых изменений при разработке снижает сложность процесса, позволяет легко находить ошибки (при использовании тестов не всех этапах - TDD), облегчает откат изменений при выявлении их некорректности.

5. Необходимо использовать средства контроля версий. Приведен пример реализации подобного средства. Соблюдение описанных принципов разработки в сочетании с использованием средств управления версиями дает возможным поддерживать систему в рабочем состоянии на протяжении всего процесса разработки, уменьшает время восстановления предыдущего состояния в случае ошибки и упрощает процесс обнаружения причины нарушения.

6. Результаты проведенной экспериментальной проверки вариантов организации иерархии данных показали большую эффективность предложенных безрекурсивных методов по критерию производительности по сравнению с традиционными и улучшение быстродействия от 4 до 125 раз в зависимости от объема иерархических данных и глубины их вложенности. Тем не менее, безрекурсивные модели данных целесообразно использовать при большой глубине вложенности - выше 35 уровней. Чем больше количество иерархических уровней, тем больше эффективность безрекурсивных методов по сравнению с традиционными.

Библиография Пшеничный, Данил Андреевич, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

1. Антонов A.B. Системный анализ. Методология. Построение модели: Учеб. пособие. Обнинс: ИАТЭ, 2001. 272 с.

2. Архипенков С., Голубев Д., Максименко О. Хранилища данных. М.: Диалог-МИФИ, 2002. 528 с.

3. Атре Ш. Структурный подход к организации базы данных. М.: Финансы и статистика, 1983. 312 с.

4. Бобровский С.И. Технологии Delphi 2006. Новые возможности. 1-е изд. Спб: Питер, 2006. 288 с.

5. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. 2-е изд., перераб. и доп. М.: Финансы и статистика, 1989. 351 с.

6. Буч Г., Рамбо Дж., Якобсон А. Язык UML. Руководство пользователя. СПб.: Питер, 2004. 432 с.

7. Васяева Е.С., Васяева Н.С., Синельников A.C. Особенность поддержки неопределенных типов данных в интеллектуальных информационных системах // Информационные технологии. 2006. № 6.

8. Венда В.Ф. Системы гибридного интеллекта: эволюция, психология, информатика. М.: Машиностроение, 1990. 448 с.

9. Вендров A.M. CASE технологии. Проектирование программного обеспечения экономических информационных систем. М.: Финансы и статистика, 2000. 544 с.

10. Вендров A.M. CASE технологии. Современные методы и средства проектирования информационных систем. М.: Финансы и статистика, 2000. 176 с.

11. Волова В.Н., Денисов A.A. Основы теории систем и системного анализа СПб.: СПбГТУ, 1997. 510 с.

12. Вьейра P. SQL Server 2000. Программирование в 2 ч / P. Вьейра: Часть I; пер. с англ / под ред. Молявко. С.М. М.: БИНОМ. Лаборатория знаний, 2004. 735 с.

13. Вьейра P. SQL Server 2000. Программирование в 2 ч./ Р. Вьейра: Часть II; пер. с англ / под ред. Молявко. С.М. М.: БИНОМ. Лаборатория знаний, 2004. 807 с.

14. Гарсиа-Молина Г., Ульман Дж., Уидом Дж. Системы баз данных. Полный курс / пер. с англ. М.: Издательский дом "Вильяме", 2003. 1088 с.

15. Гасаров Д.В. Интеллетальные информационные системы. М.: Высш. ш., 2003.431 с.

16. Грейвс М. Проектирование баз данных на основе XML / пер. с англ. М.: Издательский дом "Вильяме", 2002. 640 с.

17. Грэй П. Логика, алгебра и базы данных / пер. с англ. Килова Х.И. М.: Машиностроение, 1989. 368 с.

18. Данилкин C.B., Шэнь Янь. Определение целевого пространства информационных массивов // Журн. "Вопросы современной науки и практики. Университет им. В.И. Вернадского", №11(25) Тамбов, 2009. С. 27-34.

19. Дегтярев Ю.И. Системный анализ и исследования операций. М.: Высш. ш., 1996. 335 с.

20. Дейт К.Д. Введение в системы баз данных / пер. с англ. Гордиенко Ю.Г. 7-е изд. М: Вильяме, 2002. 1072 с.

21. Деметрович Я.,Кнут Е., РадоП. Автоматизированные методы спецификации / пер. с англ. М.Мир, 1989. 115 с.

22. Диго с.М. Базы данных: проектирование и использование: Учебник. М.: Финансы и статистика, 2005. 592 с.

23. Дидэ Е. Методы анализа данных / пер. с англ. М.-.Финансы и статистика, 1985. 357 с.24.