автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка методического аппарата системного анализа при использовании хронологической информации

кандидата технических наук
Фишер, Антон Владиславович
город
Краснодар
год
2014
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка методического аппарата системного анализа при использовании хронологической информации»

Автореферат диссертации по теме "Разработка методического аппарата системного анализа при использовании хронологической информации"

На правах рукописи

Фишер Антон Владиславович

РАЗРАБОТКА МЕТОДИЧЕСКОГО АППАРАТА СИСТЕМНОГО АНАЛИЗА ПРИ ИСПОЛЬЗОВАНИИ ХРОНОЛОГИЧЕСКОЙ ИНФОРМАЦИИ

05.13.01 - Системный анализ, управление и обработка информации (информационные и технические системы)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

17 АПР 2014

005547178

Краснодар - 2014

005547178

Работа выполнена в ФГБОУ ВПО «Кубанский государственный технологический университет»

Научный руководитель: Дьяченко Роман Александрович

кандидат технических наук, доцент

Официальные оппоненты: Сингаевский Николай Алексеевич

доктор технических наук, профессор, заместитель директора по науке филиала «Электрогаз Проект» ДОАО «Электрогаз» ОАО «Газпром», г. Краснодар Бельченко Владимир Евгеньевич кандидат технических наук, доцент, заведующий кафедры информатики и информационных технологий обучения ФГБОУ ВПО «Армавирская государственная педагогическая академия», г. Армавир

Ведущая организация: ФГБОУ ВПО «Кубанский государственный

университет», г. Краснодар

Защита состоится «21» мая 2014 г. в 16:00 часов на заседании диссертационного совета Д 212.100.04 по защите докторских и кандидатских диссертаций при ФГБОУ ВПО «Кубанский государственный технологический университет», по адресу: 350072, г. Краснодар, ул. Московская, 2, ауд. Г-248.

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Кубанский государственный технологический университет», по адресу: 350072, г. Краснодар, ул. Московская, 2А.

Автореферат разослан « О.Ъ л ОЧ 2014 г.

Ученый секретарь

диссертационного совета Д 212.100.04, кандидат технических наук, доцент

Власенко А. В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. С каждым годом растет количество окружающей нас измерительной аппаратуры, используемой в различных системах сбора и хранения данных. Следовательно, увеличивается количество данных, генерируемых этой аппаратурой. Растущие производительные мощности вычислительной техники позволяют обрабатывать большее количество информации за единицу времени, что в свою очередь требует использования более производительных систем хранения, а также оптимизации подходов к организации сбора и хранения данных. Эти изменения создают необходимость качественного системного анализа области, позволяющего принимать верные решения в процессе внедрения таких систем и обеспечивающего их бесперебойную работу при использовании хронологической информации.

Степень разработанности темы исследования. Вопросы применения новых подходов к хранению данных в системах сбора и хранения данных затронуты в трудах таких авторов как Д. Манов, Ю. Чукреев, М. Успенский, В. Кур-бацкий, Н. Томин и других. Применение аппарата цветных сетей Петри рассматривается в работах Л. Дворянского, В. Дмитриева, А. Тушного. Авторы рассматривают применение цветных сетей Петри с использованием инструментария СРЫТоок. В своих работах авторы в меньшей степени уделяют внимание новым методам организации хранения хронологических данных информационных систем.

Основой любой информационной системы является модель хранения данных. Необходимость интеграции современных информационных систем, а также необходимость обмена данными между различными информационными системами приводят к созданию единой общей модели хранения информации. Существование такой модели сокращает затраты на организацию обмена данных между различными информационными системами. Такой моделью на сегодняшний день является общая информационная модель.

Ключевым элементом информационных систем сбора и хранения данных является база данных (БД), на основе которой происходит проектирование. Ряд авторов проводили исследования вопросов проектирования БД. В работе Дж. Вебстера рассмотрены проблемы организации хранения информации, подробно опи-

саны как технические, так и экономические аспекты проблемы проектирования подобных систем. В работе В. Саякина указано на необходимость выполнения работ, направленных на мониторинг и поддержание системы хранения, а также на повышение эффективности хранения информации. В приведенных статьях не рассмотрены способы оптимизации хранения данных, которые доступны без приобретения дополнительного программного обеспечения. В работе В. Федорова отмечено, что стандарт общей информационной модели не накладывает ограничений па организацию хранения данных в БД. По мнению автора, удобнее хранить информацию в БД, поддерживающих хранение классов объектов.

Таким образом, несмотря на наличие достаточного количества работ в области организации сбора и хранения информации, вопросы организации хранения хронологических данных, определения временных характеристик, улучшения показателей надежности и выбора конфигурации распределенной информационной системы, требуют изучения и создания соответствующего методического аппарата.

Объектом исследования является информационная система сбора и хранения хронологических данных.

Предмет исследования. Теоретические положения системного анализа для построения систем сбора и хранения хронологических данных.

Цели и задачи диссертационной работы. Основной целью диссертационной работы является разработка методического аппарата системного анализа для построения систем сбора и хранения хронологических данных. Поставленная цель потребовала решения следующих задач:

1) разработка методики определения временных характеристик систем сбора и хранения хронологических данных;

2) разработка методики организации хранения хронологических данных;

3) разработка методики улучшения показателей надежности систем сбора и хранения хронологических данных;

4) разработка методики оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.

Научная новизна диссертационной работы заключается в разработка методического аппарата системного анализа при использовании хронологической

информации. В ходе диссертационной работы были получены следующие результаты:

1) разработана методика определения временных характеристик систем сбора и хранения хронологических данных;

2) создана имитационная модель систем сбора и хранения данных с использованием языка сетей Петри в моделирующей системе СРНТооЬ\

3) разработана методика организации хранения хронологических данных в базах данных на основе партицирования таблиц;

4) разработана методика улучшения показателей надежности систем сбора и хранения хронологических данных;

5) разработана методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.

Теоретическая и практическая значимость. Результаты, изложенные в диссертационной работе, могут быть использованы для моделирования процессов сбора и хранения информации в информационных системах ЖКХ, информационных системах газораспределения, информационных системах энергокластеров и в других областях.

Разработанная методика организации хранения данных может применяться при проектировании систем хранения с целью оптимизации использования доступных ресурсов и обеспечения требуемых временных характеристик скорости доступа к хранимой информации.

Методика определения временных характеристик систем сбора и хранения хронологических данных с применением аппарата цветных сетей Петри может быть применена для поиска узких мест, а также для вычисления таких параметров системы как: время сбора данных; минимально допустимый интервал сбора данных, гарантирующий сохранения этих данных в хранилище; время доступа к хранимой информации с использованием и без использования технологии партицирования при организации хранения данных.

Разработанная методика оптимального выбора конфигурации распределенной информационной системы с несколькими центрами обработки данных позволяет проектировщикам таких систем принимать управленческие решения по размещению коммуникационного оборудования в рамках готовой инфрасгрукту-

ры. На основе методики было разработано программное обеспечение, автоматизирующее процесс выбора оптимальной конфигурации проектируемой системы.

Методология и методы исследования. Для имитации работы систем сбора и хранения данных применялся метод имитационного моделирования основанный на использовании языка сетей Петри. Был проведен ряд экспериментов, имитирующих работу таких систем при различных условиях. Использовалась теория множеств, теория графов, общие логико-вероятностные методы расчета надежности систем. При построении диаграмм методик использовались методы системно-аналитического описания по технологии SADT. Положения, выносимые на защиту:

1) методика определения временных характеристик систем сбора и хранения хронологических данных;

2) методика организации хранения хронологических данных;

3) методика улучшения показателей надежности систем сбора и хранения хронологических данных;

4) методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.

Степень достоверности и апробация результатов. Основные результаты диссертации докладывались на следующих конференциях:

1) I Межвузовской научно-практической конференции (ФГБОУ ВПО КубГТУ) [5];

2) II Международной научно-практической конференции (Филиал Военного учебно-научного центра Военно-воздушных сил «Военно-воздушная академия им. проф. Н.Е. Жуковского и Ю.А. Гагарина») [9];

3) III Международной научно-практической конференции (Филиал Военного учебно-научного центра Военно-воздушных сил «Военно-воздушная академия им. проф. Н.Е. Жуковского и Ю.А. Гагарина») [10; И]. Публикации. Материалы диссертации опубликованы в 11 печатных работах, из них 3 статьи в рецензируемых журналах, входящих в перечень журналов ВАК при Минобрнауки РФ [1-3], 7 статей в научный журналах и материалы конференций. Получено одно свидетельство о государственной регистрации программы для ЭВМ [7].

Личный вклад автора. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.

В настоящем диссертационном исследовании автором обоснованы теоретические положения системного анализа построения информационных систем сбора и хранения хронологических данных, создан комплексный методический аппарат, объединяющий различные методики системного анализа. При этом автором лично получены следующие результаты:

1) разработана методика организации хранения хронологических данных в базах данных на основе секционирования таблиц;

2) создана имитационная модель систем сбора и хранения данных с использованием языка сетей Петри;

3) разработана методика улучшения показателей надежности систем сбора и хранения хронологических данных;

4) разработана методика определения временных характеристик систем сбора и хранения хронологических данных;

5) разработана методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.

На основе методики оптимального выбора конфигурации распределенной информационной системы было разработано программное обеспечение, автоматизирующее процесс выбора оптимальной конфигурации проектируемой системы.

Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения и библиографии. Общий объем диссертации 134 страниц машинописного текста, включая 30 рисунков, 5 таблиц и 2 приложения. Библиография включает 51 наименование на 6 страницах.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность диссертационной работы, сформулирована цель и аргументирована научная новизна исследований, показана практическая значимость полученных результатов, представлены выносимые на защиту научные положения.

В первой главе рассмотрены вопросы определения временных характеристик систем сбора и хранения хронологических данных, а также вопросы выбора каналов связи и оборудования. По результатам работы была получена методика определения временных характеристик систем сбора и хранения хронологических данных. Полученная методика позволяет вычислять временные характеристики при использовании различного коммуникационного оборудования и осуществлять подбор оборудования и каналов связи на основе требуемых временных характеристик.

В ходе создания систем сбора и хранения данных перед разработчиками встает проблема разработки системы, обеспечивающей требуемый уровень временных затрат на сбор, передачу и формирование хранилища учетных данных, а также обеспечения минимального времени доступа к учетным данным в условиях большого размера хранилища данных. В данной работе указанная задача решалась имитационным моделированием с применением аппарата цветных сетей Петри.

Рассмотрена распределенная система сбора и хранения хронологических данных с 5-ю территориально распределенными узлами. Принципиальная схема системы представлена на рисунке 1, где обозначения ТУ - точки учета; УСПД -устройства сбора и передачи данных; сервер - главная вычислительная машина; хранилище данных (ХД) - вычислительная машина, на которой работает программное обеспечение, организующее хранение собранной информации и предоставляющее доступ к ней; каналы связи - различного рода коммуникационные каналы (выделенные проводные линии, беспроводные, радиочастотные, радиорелейные линии, инфракрасные, спутниковые каналы и каналы построенные на базе сети Интернет).

Согласно введенным Е.А. Котовым обозначений конечная сеть Петри описана выражением (1)

Рисунок 1 - Пример принципиальной схемы системы сбора и хранения хронологических данных

N = (Р, Т, Р, М0), (1)

где Р = {Р1,...,РП} - множество позиций (непустое множество элементов); Т = {Тх,..., Тп} - множество таких переходов, что множество Р не пересекается с множеством Т (Р П Т = 0, непустое множество элементов); Р - функция инцидентности (Р ф 0) • (Уж 6 Р и Т, Эу € Р и Т : хРу V уРх), задающая связь между Р и Т, такая что любой элемент сети инцидентен хотя бы одному элементу другого типа; Мо 6 ¡>8 - начальная маркировка сети (множество содержащее позиции, имеющие маркеры в начальный период времени, с указанием количества маркеров).

На основе принципиальной схемы системы сбора и хранения хронологических данных (рисунок 1) построена цветная сеть Петри, представленная на рисунке 2.

Модель системы сбора и передачи данных описана выражением (2)

N = (Р, Т, Р, Мд), (2)

где Р = {5Ь Я2, иии2, Р1ь Р12, Р13, Р21, Р22, Р23, Рзь Ри, Рзз, Ли, Р42, Р«, Рзь Рэ2,Р53, В1} - множество позиций; Т = {Сь С2, СзЬ С32, С33, С34, С35, С41, С42, С43, С44, С45, С5, Сб} - множество переходов; Р = {(51, Си 1]\), {Б\, С\, (ииС2, Рп + Р21 + Рз, + Р41 + Р51), (Рп + Р12, Сзь Р13); <Р21 + Р22, С32, Р23>, (Рз1 + ^32, Сзз, Рзз>, (Яц+Лз, С34, Р43), +Л>2, С35, Р5з}, (Рз, С41, {Р23, С42, и2), (Рзз, С43, С/2), (Р43, с44> Р2), (Р,з, с45, С/2), (и2, с5,52), <5а, С6, В,)} - функция ин-

циденгности, задающая связь между Р и Т; М0 = {1-вь с-р12, с-р22, с-р32, с-р42, с-Рзг} ^ начальная маркировка сети, с - параметр системы (количество запросов имитируемых системой).

В ходе проведенных исследований были получены следующие результаты:

1) сформулирована проблема вычисления темпоральных параметров систем сбора и хранения данных;

2) получена имитационная модель с использованием аппарата цветных сетей Петри, позволяющая вычислять временные характеристики системы сбора и хранения данных при использовании различного оборудования;

3) получена методика вычисления темпоральных параметров систем сбора и хранения данных с применением аппарата цветных сетей Петри;

4) построена ЮЕР-О диаграмма методики вычисления темпоральных параметров систем сбора и хранения данных.

На рисунке 3 изображена ДЖР-0 диаграмма методики определения минимального времени сбора, передачи и записи в хранилище данных.

Инструменты им1_ Аппарат сетей Петри Методы тестирования

Проектировщик Программный комплекс

Рисунок 3 - ЮЕР-0 диаграмма методики определения минимального времени сбора, передачи и записи в хранилище данных

Во второй главе рассмотрены вопросы организации хранения хронологической информации, исследованы возможности применения технологии парти-цирования при проектировании систем хранения. По результатам работы получена методика организации хранения хронологической информации в информационных системах сбора и хранения данных.

В процессе проектирования распределенных информационных систем сбора учетной информации возникает проблема организации хранения хронологических данных, полученных от отдельных узлов системы. Объектом исследования была распределенная система сбора и хранения данных с 5-ю территориально распределенными узлами, представленная на рисунке 1.

График, показывающий зависимость времени доступа к данным от количества данных хранящихся в БД, представлен на рисунке 4.

Как видно на рисунке 4, при достижении замером таблицы размера ОЗУ выделенного для работы СУБД, время выполнения запросов начинает увеличиваться нелинейно. Следовательно, максимальная производительность запросов в

200 400 600 800 1,000 1,200 1,400 Объем хранимых данных, Мб

Рисунок 4 - График, показывающий зависимость времени доступа к данным от количества данных хранящихся в БД, с применением технологии партицировапия (пунктирная линия) и без применения (сплошная линия)

СУБД возможна при условии, когда суммарный размер таблиц (с учетом размера дополнительных данных необходимых для выполнения запроса), участвующих в запросе, меньше размера ОЗУ доступного СУБД. Решением проблемы хранения хронологических данных может послужить разбиение поступающей информации на части с применением технологией партицирования. Партицирова-ние - это разбиение таблиц на логические части по выбранным критериям. Как минимум, возможно использование одного из двух критериев. Первый предусматривает разбиение данных по самим источникам их поступления, а второй -разбиение данных по времени их поступления. Решение проблемы масштабируемости системы в данном случае ложится на компонент системы, отвечающий за распределение нагрузки (вычислительная машина принимающая все входные данные).

В ходе диссертационной работы были получены две модели хранения данных, одна из которых построена с применением технологии партицирования по критерию времени поступления. После чего было произведено сравнение двух полученных моделей хранения информации для конкретной системы сбора и хранения данных. В результате которого были определены преимущества системы, использующей технологию партицирования. Имитационная модель для систем хранения данных, использующих технологию партицирования, приведена на рисунке 5.

Рисунок 5 - Сеть Петри, моделирующая систему хранения данных с применением технологии партицирования

Модель системы сбора и передачи данных описывается выражением (3)

N = (Р, Т, Р, М(1), (3)

где Р = {5ь52,5з, Вг, В2и В22, В3, В4, В5, б6, В71, В72, В8} - множество позиций; Т = {Сь Сг, Сз, С4, С5, Свь Сб2, <^7} - множество переходов; Р = {С,, Вх + 5!), (52) Сз, В3 + 52), С7, В8), (В! + В6, С2, В21, В22), (В3 + В4, С4, В4), (В4 + В5 + В0, С5, в4 + В5 + в6 + Вп + В72), (В21 + Зп, С6и В21 + В«}, (В22 + Вп, Се2, В22 + В«)} - функция инцидентности, задающая связь между Р и Т; Мо = {с'1 • в1,с2 • «2,1 - ¿>5,1 - 6«} - начальная маркировка ссти; Сх, с2 - параметры системы (количество запросов имитируемых системой).

В результате проведения расчетов производительности выполнения запросов (по критерию времени выполнения запроса) было выявлено преимущество модели, использующей технологию партицирования.

ЮЕР-0 диаграмма методики определения оптимальной организации хранения хронологических данных приведена на рисунке 6.

Представленная методика позволяет: решить проблему увеличения времени доступа к данным с ростом количества собранной информации в системах сбора и хранения хронологических данных; прогнозировать увеличение времени доступа при достижении определенного объема хранимой информации; избежать проблему увеличения времени архивации данных с ростом количества собранной информации; получить высокую скорость массовых операций добавления или удаления записей конкретного периода (путем добавления или удаления це-

Данные об Аппарат сетей Петри Методы тестирования

Проектировщик Программный комплекс

Рисунок 6 - ЮЕР-О диаграмма методики организации хранения хронологических данных

лых партиций данных); обеспечивать возможность переноса редко используемой и архивной учетной информации на партиции, использующие более дешевые или медленные носители.

В третьей главе рассмотрены вопросы обеспечения необходимых показателей надежности информационных систем сбора и хранения данных, исследованы вопросы повышения надежности. По результатам работы получена методика повышения надежности информационных систем сбора и хранение хронологических данных.

Для решения данной проблемы применялись методы общего логико-вероятностного моделирования и методика подбора типов элементов оборудования информационной системы с учетом требований надежности и минимизации общей стоимости.

Расчеты показателей надежности информационных систем производились в программном комплексе "Арбитр". ЮЕР-0 диаграмма полученной методики повышения надежности системы сбора и хранения хронологических данных приведена на рисунке 7.

Проектная документация. Логико-вероятностные

ГОСТы методы

Проектировщик Программный комплекс

"Арбитр"

Рисунок 7 - ЮЕР-0 диаграмма методики повышения надежности информационных систем сбора и хранение хронологических данных

В ходе проведения исследований получены следующие результаты:

1) рассчитаны показатели надежности для простой системы сбора и хранения хронологических данных;

2) рассчитаны показатели надежности для распределенной системы сбора и хранения хронологических данных с несколькими центрами обработки данных;

3) выявлены наиболее значимые элементы систем сбора и хранения хронологической информации;

4) разработана структурная схема системы сбора и хранения хронологической информации с дублированием сервера базы данных;

5) проведен сравнительный анализ надежности системы сбора и хранения данных без применения дублирования и с применением, в результате которого были выявлены положительные изменения в параметрах надежности системы;

6) разработана методика повышения надежности информационных систем сбора и хранение хронологической информации.

В четвертой главе рассмотрены вопросы проектирования распределенной информационной системы и выбора оптимальной конфигурации в условиях минимизации затрат развертывания таких систем. По результатам работы получена методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологической информации с несколькими центрами обработки данных.

Информационные системы сбора и хранения хронологических данных широко применяются в различных сферах деятельности: информационных системах ЖКХ, информационных системах газораспределения, информационных системах энергокластеров и в других областях.

Основой информационной системы являются два типа структурных элементов.

1) ЦОД - центр обработки данных (вычислительный центр обработки темпоральной информации, поступающей от элементов системы). ЦОД включает в себя хранилище данных и, как правило, располагается в местах с развитой инфраструктурой (например, в населенных пунктах). Несколько ЦОД могут объединяться в единую распределённую ИС обработки данных.

2) ЦСД - центр сбора данных. Представляет собой систему сбора данных конкретного элемента, состоит из устройства сбора и передачи данных и цифровых счетчиков (для систем газоснабжения и энергоснабжения располагается на подстанциях).

Для конкретной системы формируется возможные места размещения ЦОД и возможные места размещения ЦСД. В этих условиях задача оптимального распределения ЦСД по ЦОД является актуальной, а методы её решения востребованы в современных условиях развертывания систем сбора и хранения данных.

Задача распределения центров сбора данных по центрам обработки данных для однотипных каналов связи сводится к их распределению в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежности, и может быть сформирована в виде задачи минимизации затрат

при ограничениях:

1) на однократность включения ^-ого ЦСД к ЦОД

¿=1

2) на обязательность использования всех центров обработки данных

т

Уг : > 0;

>••1

(6)

3) на время сбора, передачи и записи темпоральной информации в хранилище данных

11

Ч? • ^ ^ ' ^гз — ЬпаХ! (7)

¿=1

где 1тах - максимально допустимое время передачи информации от ЦСД к ЦОД, при поддержке ЦОД параллельной обработки запросов; 4) на надежность канала связи

V? • ^ ^ Р'_] ' .) — Ртт •

(8)

г=1

где Ртт - требуемое значение надежности канала передачи учетной информации.

Исходными данными для решения задачи являются матрицы: 1) матрица затрат на размещение центров сбора и обработки данных

С11 С21

С\П с2п

\Ст 1

(9)

где су - затраты на подключение ^'-ого ЦСД к г-му ЦОД (включая затраты на проектирование, прокладку канала связи, пуско-наладочные работы, оплату персонала), г 6 1,1 = 1 ,...,п - множество индексов (номеров) ЦОД, ] € 3 = 1,... ,т- множество индексов (номеров) ЦСД;

2) матрица времени сбора, передачи и записи данных

Ли ... ¿т\

_ <21 ••• <2п

• • ■ ¿тп I

где - время сбора, передачи и записи данных при передаче учетной информации от ]-от ЦСД к г-му ЦОД; 3) матрица вероятностей безотказной работы каналов связи

( Рп Р2\

\Prnl

Р\п Р2п

(П)

Ртп)

где ру - вероятность безотказной работы канала связи между ^'-м ЦСД к г-м ЦОД.

При формировании матрицы затрат на подключение ^'-ого ЦСД к г-му ЦОД учитываются следующие показатели: А1 - матрица стоимостей проектных работ; А2 - матрица стоимостей коммуникационного оборудования, устанавливаемого на ЦСД; А3 - матрица стоимостей коммуникационного оборудования, устанавливаемого на ЦОД; А3 - матрица стоимостей оборудования канала связи между j-м ЦСД и г'-м ЦОД; А4 - матрица стоимостей технических работ по установке коммуникационного оборудования и прокладке канала связи; А5 - матрица стоимостей пуско-наладочных работ. Капитальные затраты на подключение ¿-ого ЦСД к г-му ЦОД вычисляется следующим образом:

Су = 4+Л2 + Л? + 4 + 4. (12)

Капитальные затраты на внедрение системы сбора и хранения данных:

п / т \ п / т \

^ = £ £^-(4 + ^ + 4+4 + 4) =Е ■ аз>

г=1

¿=1 \j--l

Решением поставленной задачи минимизации является бинарная матрица

/хи ... ж1п\

3?21 ... х2п

X =

(14)

\%т1 • • • !

где хц = 1 - если й ЦСД подключен к г-му ЦОД, в противном случае хг] = 0.

Поставленная задача минимизации решается методом перебора всех допустимых значений переменной X, либо, в случае большой размерности, другими методами нелинейной целочисленной оптимизации.

Задача распределения центров сбора данных по центрам обработки данных в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежности, но с возможностью применения различных типов каналов связи, также формулируется в виде задачи минимизации затрат

т'п Л (!С ( X]' ) ) о5)

Ь=1 \г=1 \л=1 //

при ограничениях:

1) на однократность включения j-oгo ЦСД к ЦОД

п

V/: = 1; (16)

¡=1

2) на обязательность использования всех центров обработки данных

т

V? : ^ хф > 0; (17)

.7=1

3) на время сбора, передачи и записи темпоральной информации в хранилище данных

п

V? : ^ ^ ' ¿тат (18)

¡=1

где ипах - максимально допустимое время передачи информации от ЦСД к ЦОД, при поддержке ЦОД параллельной обработки запросов;

4) на надежность канала связи

п

У? : ■ к}к > Рты, (19)

¡=1

где ртгП - требуемое значение надежности канала передачи учетной информации.

Исходными данными для решения задачи также являются матрицы С, Т и Р, каждая из которых, в случае проектирования системы сбора и хранения хронологических данных с применением различных каналов связи, имеет вид трехмерной матрицы. Для этого дополнительно вводится измерение к е К, К = 1,..., п - множество каналов связи между ЦОД и ЦСД.

Решением поставленной задачи минимизации является тринарная матрица X, где = 1 - если ЦСД подключен к г-му ЦОД к-м каналом связи, в противном случае хць = 0.

Поставленная задача минимизации может быть также решена методом перебора всех допустимых значений переменных хцк, либо, в случае большой размерности, другими методами нелинейной целочисленной оптимизации.

Системно-аналитическое описание методики по технологии БАЙТ представлено на ЮЕР-0 диаграмме 8.

Проектная документация. Методы оценки Имигационна» Методы теории Методы целочисленной

Рисунок 8 - ЮЕР-0 диаграмма методики конфигурации распределенной информационной системы с несколькими центрами обработки данных с применение различных типов каналов связи

На основе данной методики было разработано программное обеспечение, позволяющее: проектировать системы сбора данных; проводить расчет матриц

X на основе матриц С, Т, Р; решить оптимизационную задачу (15).

Рисунок 9 - Интерфейс программы вычисления оптимального распределения

ЦСД по ЦОД

В ходе проведенных исследований были получены следующие результаты:

1) сформулирована проблема распределения центров сбора данных по центрам обработки данных;

2) решена задача распределения центров сбора данных по центрам обработки данных в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежности для однотипных каналов связи;

3) построена ЮЕР-0 диаграмма методики распределения центров сбора данных по центрам обработки данных для однотипных каналов связи;

4) решена задача распределения центров сбора данных по центрам обработки данных в условиях минимизации стоимости подключения и ограничениях на время сбора, передачи, хранения данных и надежности, с использованием нескольких типов каналов связи;

5) построена ЮЕР-0 диаграмма методики распределения центров сбора данных по центрам обработки данных, с использованием нескольких типов каналов связи;

6) разработано вспомогательное программное обеспечение, позволяющее решить оптимизационную задачу (15) с использованием матриц С (матрица затрат), Т (матрица времени сбора и передачи данных) и Р (матрица вероятностей безотказной работы).

ЗАКЛЮЧЕНИЕ

В результате проделанной работы были разработаны: методика определения временных характеристик систем сбора и хранения хронологической информации, позволяющая вычислять данные характеристики при использовании различного оборудования и осуществлять подбор оборудования и каналов связи на основе требуемых временных характеристик; методика организации хранения хронологических данных позволяющая, определять целесообразность применения технологии партицирования хронологических данных для конкретной системы; методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологической информации с несколькими центрами обработки данных; методика оптимального выбора конфигурации распределенной информационной системы сбора и хранения хронологической информации с несколькими центрами обработки данных, позволяющая принимать управленческие решения по выбору конфигурации распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки данных.

СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в изданиях рекомендованных ВАК при Минобрнауки РФ

1. Атрощенко, В. А. К вопросу сбора данных электроэнергетических систем [Электронный ресурс] / В. А. Атрощенко, А. В. Фишер, Р. А. Дьяченко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ). — 2012,— № 84(10). - Режим доступа: http://ej.kubagro.ru/2012/10/pdi/65.pdf

2. Дьяченко, Р. Моделирование систем сбора и передачи данных с применением цветных сетей Петри [Электронный ресурс] / P.A. Дьяченко, A.B. Фишер, В.В. Богданов // Фундаментальные исследования.— 2013,- № 11(6).- С. 1122-1126. - Режим доступа: http://rae.ru/fs/?section= content&op=show_article&article_id= 10002528

3. Фишер, А. В. Организация хранения хронологических данных в базах данных систем мониторинга и прогнозирования [Электронный ресурс] / А. В. Фишер, Р. А. Дьяченко, И. С. Лоба // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ).— 2012.— № 79(5). — Режим доступа: 11ир://е].киЬа§го.ги/агсЫуе.а5р?п=79

Публикации в других изданиях

4. Фишер, А. В. Разработка алгоритма системы построения визуального представления структуры базы данных / А. В. Фишер, Р. А. Дьяченко // Сборник научных трудов факультета КТАС КубГТУ. — Краснодар: Издательский Дом - Юг, 2010,-№ 3,- С. 138-143.

5. Фишер, А. В. Создание системы автоматизации построения диаграмм / А. В. Фишер, Р. А. Дьяченко, В. А. Атрощенко, Н. А. Брагин // Автоматизированные информационные и электроэнергетические системы: материалы I Межвузовской научно-практической конференции (15 - 17 сентября 2010 года) / ФГБОУ ВПО КубГТУ. - Краснодар: Издательский Дом - Юг, 2010. -С. 156-157.

6. Фишер, А. В. Применение графовых алгоритмов поиска в системах автоматического построения диаграмм / А. В. Фишер, Р. А. Дьяченко, Н. Д. Чиг-ликова // Сборник научных трудов факультета КТАС КубГТУ — Краснодар: Издательский Дом - Юг, 2010. - № 2. — С. 46-48.

7. Фишер, А. В. Программа для визуализации баз данных. ОпИпеОсиаВазеУииаНяа^г (ОИВУ) II свидетельство о государственной регистрации программы для ЭВМ № 2011615203. ФИПС. Зарегистрировано 01.07.11.

8. Фишер, А. В. Общие принципы построения систем мониторинга и прогнозирования параметров энергетических комплексов / А. В. Фишер, Р. А. Дьяченко, И. С. Лоба // Сборник научных трудов факультета КТАС КубГТУ. — Краснодар: Издательский Дом - Юг, 2012, — № 4, — С. 150-154.

9. Фишер, А. В. Организация хранения хронологических данных / А. В. Фишер, Р. А. Дьяченко, И. С. Лоба, Р. Р. Черный // Научные чтения имени профессора Н.Е. Жуковского. Сборник научных статей II Международной научно-практической конференции. — Краснодар: Филиал Военного учебно-научного центра Военно-воздушных сил «Военно-воздушная академия им. проф. Н.Е. Жуковского и Ю.А. Гагарина», 2012,— С. 136-141.

10. Фишер, А. В. К вопросу хранения данных описанных общей информационной моделью (CIM) / А. В. Фишер, Р. А. Дьяченко, И. С. Лоба, В. В. Богданов // Научные чтения имени профессора Н.Е. Жуковского. Сборник научных статей III Международной научно-практической конференции. — Краснодар: Филиал Военного учебно-научного центра Военно-воздушных сил «Военно-воздушная академия им. проф. Н.Е. Жуковского и Ю.А. Гагарина», 2013.-С. 391-394.

11. Фишер, А. В. Разработка UML диаграммы развертывания систем сбора и хранения хронологической информации / А. В. Фишер, Р. А. Дьяченко, М. В. Руденко, Р. X. Багдасарян // Научные чтения имени профессора Н.Е. Жуковского. Сборник научных статей III Международной научно-практической конференции. — Краснодар: Филиал Военного учебно-научного центра Военно-воздушных сил «Военно-воздушная академия им. проф. Н.Е. Жуковского и Ю.А. Гагарина», 2013. - С. 234-236.

Подписано в печать 12.02.2014. Печать трафаретная. Формат 60x84 Vie- Усл. печ. л. 1,35. Тираж 100 экз. Заказ № 1114. Отпечатано в ООО «Издательский Дом-Юг» 350072, г. Краснодар, ул. Московская 2, корп. «В», оф. В-120, тел. 8-918-41-50-571 e-mail: olfomenko@yandex.ru Сайт: http://id-yug.com

Текст работы Фишер, Антон Владиславович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

04201 456388 На пРавах рукописи

Фишер Антон Владиславович

РАЗРАБОТКА МЕТОДИЧЕСКОГО АППАРАТА СИСТЕМНОГО АНАЛИЗА ПРИ ИСПОЛЬЗОВАНИИ ХРОНОЛОГИЧЕСКОЙ ИНФОРМАЦИИ

05.13.01 - Системный анализ, управление и обработка информации (информационные и технические системы)

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель канд. техн. наук, доцент Дьяченко Роман Александрович

Краснодар - 2014

Оглавление

Введение............................................................................4

Глава 1 Методика определения временных характеристик систем сбора и хранения хронологических данных..................................18

1.1 Постановка задачи исследования............................................18

1.2 Предлагаемое решение задачи определения временных характеристик 18

1.3 Описание структуры системы сбора и хранения хронологических данных ............................................................................19

1.4 Построение цветной сети Петри систем сбора и хранения хронологических данных...............................21

1.5 Выводы....................................39

Глава 2 Методика организации хранения хронологических данных . . 41

2.1 Системы хранения хронологических данных...............41

2.2 Структура модели хранения данных....................43

2.3 Алгоритм визуализации структуры хранилища данных.........45

2.4 Применение технологии партицирования при проектировании систем хранения данных...............................50

2.5 Имитационное моделирование технологии партицирования с применением цветных сетей Петри........................60

2.6 Выводы....................................74

Глава 3 Надежность систем сбора и хранения хронологических данных 75

3.1 Надежность простой системы сбора и хранения хронологических данных....................................77

3.2 Надежность системы сбора и хранения хронологических данных с несколькими центрами сбора данных......................................81

3.3 Надежность системы сбора и хранения хронологических данных с дублированием хранилища данных....................85

3.4 Методика улучшения показателей надежности..............89

3.5 Выводы....................................90

Глава 4 Методики оптимального выбора конфигурации и структурирования распределенной информационной системы сбора и хранения хронологических данных с несколькими центрами обработки дан-

ных ....................................... 92

4.1 Методика распределения центров сбора данных по центрам обработки данных для однотипных каналов связи................92

4.2 Методика распределения центров сбора данных по центрам обработки данных с использованием нескольких типов каналов связи.....96

4.3 Выводы....................................100

Заключение....................................102

Список использованных источников.....................104

Приложение А. Процедуры программы расчета оптимального выбора конфигурации распределенной информационной системы сбора и хранения данных с несколькими центрами обработки данных ...110

Приложение Б. Процедура создания таблиц для проведения экспериментов .....................................131

Введение

В настоящее время широко применяются информационные системы сбора и хранения хронологических данных. В частности, такие системы применяются в сфере ЖКХ, информационных системах газораспределения, информационных системах энергокластеров и в других областях. Построение таких систем сопровождается сложными процессами проектирования, оценки работоспособности решения, целесообразности его применения для каждого конкретного случая, а также управленческими решениями, связанными с выбором из предложенных возможных конфигураций системы. Описанные сложности создают необходимость применения проверенных методик, предоставляющих инструменты для проектирования и внедрения таких систем, позволяющих получить наиболее приемлемую конфигурацию конечной системы, удовлетворяющую технические, временные и финансовые ограничения.

Таким образом, разработка методик, позволяющих упростить разработку систем сбора и хранения хронологических данных, на достаточном уровне достоверно определить характеристики такой системы до её введения в эксплуатацию, являются важной задачей.

Информационные системы сбора и хранения хронологических данных применяются на автоматизированных системах коммерческого учёта электроэнергии (АСКУЭ). АСКУЭ это система энергоучета, позволяющая производить учёт потребления электроэнергии и тепла на различных объектах жилого, коммерческого и производственного назначения. Системы АСКУЭ могут учитывать потребление энергоресурсов на различных уровнях (уровне дома, предприятия, районов, города, населенного пункта с единым диспетчерским и финансовым центрами).

Рассмотрим различные структурные схемы внедрения системы АСКУЭ. Структурная схема системы АСКУЭ, применяемая в жилом доме, изображена на рисунке 1, где ТУ - точка учета контролируемого параметра (счетчик); К -контроллер, отвечающий за сбор и временное хранение собираемых показаний, собранные данные передаются в центр обработки информации после их сбора с контроллера с помощью специального устройства. Системы АСКУЭ на уровне дома позволяют в дальнейшем, при расширении системы, легко интегрироваться

в систему следующего уровня (уровня района, города, области или края).

Рисунок 1 - Пример структурной схемы системы АСКУЭ жилого дома или

предприятия

Структурная схема системы АСКУЭ, применяемая в рамках населенного пункта, изображена на рисунке 2, где ТУ - конечная точка учета контролируемого параметра (счетчик); УСПД - устройство сбора и передачи данных, обеспечивает сбор и обработку информации, поступающей от ТУ, а также ее передачу по телекоммуникационному каналу связи к ЦОД; ЦОД - центр обработки данных, обеспечивает обработку собранной информации, передачу её хранилищу; ХД - хранилище собранных данных. Данная информационная система включает в себя системы уровня дома и может быть интегрирована в информационную систему уровня края (области).

Структурная схема системы АСКУЭ, демонстрирующая распределенную систему, расположенную на территории области или края, изображена на рисунке 3, где ТУ - конечная точка учета контролируемого параметра (счетчик); УСПД - устройство сбора и передачи данных, обеспечивает сбор и обработку информации, поступающей от ТУ, а также ее передачу по телекоммуникационному каналу связи к ЦОД; ЦОД - центр обработки данных, обеспечивает обработку собранной информации, передачу её хранилищу; ХД - хранилище собранных данных. ЦОДы соединены между собой телекоммуникационными каналами для обеспечения синхронизации данных, обеспечения общего управления системой

Рисунок 2 - Пример структурной схемы системы АСКУЭ населенного пункта

в целом. Как правило, внедрение таких систем осуществляется на существующих инфраструктурных объектах энергокомплекса, что создает задачу оптимального распределения всех элементов системы на существующих объектах.

Рисунок 3 - Пример структурной схемы системы АСКУЭ края, области

Система обеспечивает дистанционный сбор информации о потреблении энергоресурсов, её обработку и хранение. Принципиальная схема АСКУЭ при-

ТК АРМ

УСПД БП

Рисунок 4 - Пример принципиальной схемы системы АСКУЭ

ведена на рисунке 4, где ПП - первичные преобразователи, электросчетчики рекомендованных типов (от индукционных, снабженных устройствами формирования импульсов, до электронных с устройством формирования цифровой информации); УСПД - устройство сбора и передачи данных, должно обеспечивать сбор и обработку информации, поступающей от ПП, а также ее передачу по телекоммуникационному каналу связи ТК на автоматизированное рабочее место АРМ; ТК - телекоммуникационный канал (проводной или радио), должен обеспечивать надежную информационную связь между УСПД, центральным вычислительным устройством и автоматизированным рабочим местом; ЦВУ - центральное вычислительное устройство, должно выполнять следующие функции: обработку, хранение, ввод, отображение и вывод информации на печать; запоминание и хранение информации; формирование астрономического времени и календаря; содержание интерфейсов запроса и приема информации от УСПД по телекоммуникационным каналам, а также интерфейсов связи с локальными сетями персональных компьютеров; АРМ - автоматизированное рабочее место, должно позволять получать необходимую информацию об энергопотреблении

предприятия в реальном масштабе времени; функционально АРМ должно соответствовать ЦВУ; БП - блок питания, должен осуществлять основное и резервное питание УСПД и не допускать сбоев в работе при переходе от одного вида питания на другое; ЭП ЦВУ - электрическое питание ЦВУ, должно осуществляться от сборок бесперебойного питания.

Система разделяется на два уровня, к нижнему уровню относятся программы и оборудование, работающие на объекте учёта, а к верхнему уровню относится часть системы, расположенная в центре обработки данных либо в офисах контролирующей организации. Система состоит из двух информационных комплексов: информационно-измерительный комплекс (ИИК), это часть системы от проводника электроэнергии до точки сбора показаний потребления, и информационно-вычислительный комплекс (ИВК) - часть системы от точки сбора показаний потребления до центра обработки данных либо контролирующей организации.

К компонентам информационно-вычислительного комплекса относятся:

1) устройства сбора и передачи данных (УСПД);

2) контролеры удаленного сбора данных (КУСД);

3) каналы связи между электросчётчиками и устройствами сбора и передачи данных;

4) программное обеспечение верхнего уровня;

5) серверы верхнего уровня;

6) коммуникационная среда и каналы связи между устройствами сбора и передачи данных и серверами верхнего уровня (переход с нижнего уровня на верхний);

7) система обеспечения единого времени;

8) автоматизированные рабочие места диспетчеров и администраторов системы;

9) каналы связи верхнего уровня между серверами и автоматизированные рабочие местами смежных пользователей информации.

Системы АСКУЭ выполняют функции автоматического контроля данных о текущем энергопотреблении по каждой точке учета на заданных интервалах, хранение собранной информации в хранилище данных, обеспечение контроля за соблюдением лимитов энергопотребления, обеспечение тарифного учёта потребления электроэнергии, контроль параметров электроэнергии, вывод расчетных параметров на терминал и на устройство печати, ведение единого системного времени, сведение баланса электроэнергии по расчетной группе на этапе наладки системы и в процессе ее эксплуатации.

Применение систем АСКУЭ позволяет позволяет получить ряд преимуществ, таких как отсутствие необходимости в ручном снятии показаний множества точек учета, облегчение ведения учёта электроэнергии, облегчение прогнозирования затрат на электроэнергию, контроль качества электроэнергии, ведение журналов событий, происходящих в системе, возможность автоматической передачи данных о количестве потреблённой электроэнергии в энергосбытовую организацию. Система предоставляет возможность анализа потребления, что позволяет выявить допущенные просчеты в организации энергопотребления, разработать соответствующие мероприятия по снижению расходов.

АСКУЭ позволяет экономить энергоресурсы и финансы предприятия при минимальных денежных затратах на внедрение такой системы. Величина экономического эффекта для предприятия от использования АСКУЭ достигет в среднем 15 — 30% от среднегодового потребления энергоресурсов, период окупаемости затрат на внедрение АСКУЭ составляет 2 — 3 квартала. Современные АСКУЭ являются измерительным инструментом, позволяющим с экономической точки зрения подойти к организации энергообеспечения. Система позволит разрабатывать и осуществлять комплекс мероприятий по энергосбережению, своевременно его корректировать, обеспечивая динамическую оптимизацию затрат на энергоресурсы в условиях изменяющейся экономической среды. АСКУЭ является основой системы энергосбережения современных промышленных предприятий [1].

В настоящее время АСКУЭ предприятия является необходимым механизмом, без которого невозможно решать проблемы расчетов за энергоресурсы с их поставщиками, непрерывной экономии энергоносителей и снижения доли энергозатрат в себестоимости продукции предприятия. С внедрением системы

снижается степень человеческого участия в процессе работы энергокомплекса, часть операций передается системе. Это в свою очередь исключает принятие ошибочных управленческих решений, связанных с человеческим фактором, повышает надежность системы энергообеспечения в целом. Также управленческие решения, принимаемые системой, являются гораздо оперативнее решений, принятых человеком, особенно в стрессовых аварийных ситуациях. Система, работающая с большим количеством поступающей измерительной информации, способна выявлять все отклонения показателей от нормы в автоматическом режиме и информировать оператора или руководство только по ключевым, требующим вмешательства проблемам.

Наличие систем типа АСКУЭ требует создания соответствующих методик, предоставляющих инструменты для их проектирования и внедрения, позволяющих получать наиболее приемлемые конфигурации конечной системы. При этом полученная система должна удовлетворять всем техническим, временным и финансовым ограничениям, заданным перед проектированием.

Рисунок 5 - Пример принципиальной схемы системы сбора и хранения

хронологических данных

Пример принципиальной схемы системы сбора и передачи данных представлен на рисунке 5, где обозначения ТУ - точки учета (конечные устройства учета, счетчики); УСПД - устройства сбора и передачи данных, отвечающие

за опрос ТУ, получение показаний и отправку результатов к серверу; сервер -главная вычислительная машина, на которой работает программное обеспечение инициации сбора данных и передачи результатов к хранилищу данных; хранилище данных - вычислительная машина на которой работает программное обеспечение, организующее хранение собранной информации и предоставляющее доступ к ней; каналы связи - различного рода коммуникационные каналы, такие как выделенные проводные линии, беспроводные (радиочастотные), радиорелейные линии, инфракрасные, спутниковые каналы и каналы, построенные на базе сети Интернет. Также в последнее время активно осваиваются новые среды передачи информации, к ним относят распределенные силовые линии питания низкого, среднего и высокого напряжения. Преимуществами таких каналов являются низкая стоимость установки (не требуется прокладка специальных проводных линий связи) и быстрота настройки коммутационной сети. Любой из перечисленных каналов связи имеет свои преимущества и недостатки.

Существуют два варианта развертывания информационных систем (ИС) сбора и хранения хронологических данных [2]:

- создание полностью новой системы с изменением всей структуры существующего комплекса;

- создание информационной системы в рамках существующей структуры.

В современных условиях второй вариант развертывания ИС сбора и хранения данных является наиболее целесообразным с экономической и технической точек зрения.

Основой ИС являются два основных типа структурных элементов:

1) ЦОД - центр обработки данных (вычислительный центр обработки темпоральной информации [3] элементов системы, включающий хранилище данных, как правило располагается в местах с развитой инфраструктурой, в населенных пунктах). Несколько ЦОД могут объединяться в единую распределённую ИС обработки данных;

2) ЦСД - центр сбора данных. Представляет собой систему сбора данных конкретного элемента, состоит из устройства сбора и передачи данных и

цифровых счетчиков (для систем газоснабжения и энергоснабжения располагается на подстанциях).

Таким образом, для конкретной системы формируется возможные места размещения ЦОД и возможные места размещения ЦОД. В этих условиях задача оптимального распределения ЦСД по ЦОД является актуальной, а методы её решения востребованы в современных условиях развертывания систем сбора и хранения данных [4].

Актуальность темы исследования. С каждым годом растет количество окружающей нас измерительной аппаратуры, используемой в различных системах сбора и хранения данных. Следовательно, увеличивается количество данных, генерируемых этой аппаратурой. Растущие производительные мощности вычислительной техники позволяют обрабатывать большее количество информации за единицу времени, что в свою очередь требует использования более производительных систем хранения, а также оптимизации подходов к организации сбора и хранения данных. Эти изменения создают необходимость качественного системного анализа области, позволяющего принимать верные решения в процессе внедрения таких систем и обеспечивающего их бесперебойн�