автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы

кандидата технических наук
Попова, Наталия Александровна
город
Пенза
год
2013
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы»

Автореферат диссертации по теме "Модели и алгоритмы проблемно-ориентированной информационно-аналитической системы"

На правах рукописи

ПОПОВА Наталия Александровна

МОДЕЛИ И АЛГОРИТМЫ ПРОБЛЕМНО-ОРИЕНТИРОВАННОЙ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ

Специальность 05.13.17 — Теоретические основы информатики

Автореферат диссертации на соискание ученой степени кандидата технических наук

ПЕНЗА 2013

005536059

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет».

Научный руководитель — доктор технических наук, профессор

Макарычев Петр Петрович

Официальные оппоненты: Лебедев Виктор Борисович,

доктор технических наук, профессор кафедры «Информационное обеспечение управления и производства» ФГБОУ ВПО «Пензенский государственный университет»; Васин Леонид Анатольевич, кандидат технических наук, заведующий кафедрой «Информационно-вычислительные системы» ФГБОУ ВПО «Пензенский государственный университет архитектуры и строительства»

Ведущая организация - ОАО «Научно-производственное

предприятие "Рубин"» (г. Пенза)

Защита диссертации состоится 21 ноября 2013 г., в 15 часов, на заседании диссертационного совета Д 212.186.04 в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Пензенский государственный университет».

Автореферат разослан ¿^¿у^йД^/' 2013 г.

Ученый секретарь

диссертационного совета Гурии Евгений Иванович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Информационно-аналитические системы (НАС) представляют особый класс информационных систем, предназначенных для хранения, обработки и анализа данных. Эффективное хранение данных обеспечивается наличием в составе ИАС множества источников данных. Обработка и объединение данных выполняются инструментальными средствами извлечения, преобразования и загрузки данных. Анализ данных осуществляется с использованием инструментальных средств оперативного и интеллектуального анализа.

ИАС, как правило, реализуются в виде надстройки над функционирующей информационной системой предприятия или организации и размещаются на различных уровнях управления. Создание ИАС предполагает большую детализацию и более сложную аналитическую обработку данных по сравнению с OLTP-системами, ориентированными на фиксацию повседневной деятельности. В связи с этим архитектура современных ИАС содержит следующие уровни: сбор и первичная обработка данных; извлечение, преобразование и загрузка данных; складирование данных; оперативное представление данных, оперативный и интеллектуальный анализ данных в процессе принятия управленческих решений.

Существует два подхода к реализации ИАС. Первый подход основан на платформенно-базированных решениях, предложенных ведущими компаниями Oracle, Microsoft, СА, SAP, SAS и др. Второй подход предполагает реализацию ИАС на основе смешанного решения, при котором инструменты анализа и СУБД выбираются из числа программных продуктов различных компаний (Cognos, Business Objects и BaseGroup Labs). Преимущество второго подхода состоит в возможности обеспечения более высокой функциональной эффективности системы. Однако применение программных продуктов различных производителей затрудняет решение задач, связанных с формированием структуры транзакционной базы данных и хранилища данных, извлечением, преобразованием и загрузкой данных, разработкой моделей и алгоритмов оперативного, интеллектуального анализа данных.

Как правило, большинство ИАС реализуется на основе многомерного представления данных в OLTP-(on-line transaction processing) и OLAP-(on-line analytical processing) системах. Это обусловлено требованиями сокращения временных затрат на реализацию доступа, обеспечения целостности данных. Существенный вклад в развитие модельных представлений баз и хранилищ данных для ИАС внесли: У. Г. Инмон, Э. Ф. Код, К. Дж. Дейт, Б. А. Кулик, С. Д. Кузнецов, В. И. Мунерман и др. Известны модельные представления структур данных на основе различных интерпретаций: логики классов и отношений, теоретико-множественных представлений, одноместных и многоместных предикатов, алгебры кортежей и тензорной алгебры.

Впервые тензорные методы как средство формализованного описания данных были упомянуты в работе Л. Е. Петрова (1976), посвященной разработке матричного представления реляционного языка баз данных. Тензорный подход применялся для проектирования банков данных и систем управления базами данных разработки информационных систем, методов анализа программ (А. Е. Арменский, 1986, 1989).

Существенный вклад в развитие методов оперативного и интеллектуального анализа данных внесли: Г. Пятецкий-Шапиро, А. И. Арастумов, О. И. Ларичев, И. Д. Мандель, В. А. Дюк и др.

Несмотря на значительные успехи в области создания ИАС, имеет место проблема модельных представлений данных при разработке структур хранения, процедур первичной обработки, оперативного и интеллектуального анализа данных. Первый аспект проблемы связан с недостаточной развитостью средств формализованного описания структур и процедур обработки данных на основе заданных классов объектов, отношений и измерений многомерного предметного пространства. Второй аспект проблемы связан с теоретическим обоснованием моделей анализа накопленных данных, принятия решений с учетом свойств объектов и шкал измерений многомерного пространства, третий аспект - с установлением соответствий между модельными представлениями хранения и анализа данных с функциями аналитической платформы, используемой при создании ИАС.

Цель диссертационной работы - разработка и исследование модельных представлений данных на основе тензорной методологии, моделей и алгоритмов вербального анализа данных; обоснование выбора технологической платформы и системы управления базами данных.

Задачи, решаемые в работе:

- теоретическое обоснование модельных представлений структур баз и хранилищ данных па основе построения математических моделей классов объектов и отношений между классами в предметной области с применением тензорной методологии;

-разработка математических моделей и алгоритмов оперативного и интеллектуального анализа данных для оценки состояний объектов в процессе деятельности с использованием средств информационно-аналитической системы;

- обоснование выбора технологической платформы для создания информационно-аналитической системы и разработка концептуальных моделей предметной области, отражающих ее проблемную ориентацию;

-разработка пилотного проекта информационно-аналитической системы на основе выбранных технологической платформы, системы управления базами данных и проведение экспериментов но оценке состояний объектов.

Объектом исследования являются процессы сбора, накопления, предварительной обработки, загрузки и анализа данных при создании информационно-аналитической системы.

Предметом исследования являются математические модели классов, объектов и компонент (сущностей); модели и алгоритмы обработки и анализа данных информационно-аналитической системы.

Соответствие паспорту научной специальности. Область исследования соответствует п. 3 «Исследование методов и разработка средств кодирования информации в виде данных. Принципы создания языков описания данных, языков манипулирования данными, языков запросов. Разработка и исследование моделей данных и новых принципов их проектирования» и п. 5 «Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений».

Методы исследования основаны на алгебре индексных объектов, теории вербального анализа решений, методах оперативного и интеллектуального анализа данных, методах концептуального моделирования в методологии АМБ, реляционном и объектно-реляционном подходах к описанию данных.

Научная новизна работы:

1. Разработаны математические модели баз и хранилищ данных информационно-аналитической системы, отличающиеся заданием классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде индексных объектов (тензоров) первой и второй валентности, что обеспечивает формализованное описание процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

2. Разработаны модель и алгоритм классификации состояний объектов управления, отличающиеся реализацией механизма цепных покрытий множества векторных оценок, предъявляемых эксперту в процессе вербального анализа данных, что позволяет строить полную и непротиворечивую классификацию средствами информационно-аналитической системы.

3. Предложена модель оценки состояния объектов управления методом сравнения с заданным экспертом эталоном, отличающаяся представлением показателей состояния в виде вектора многомерного метрического пространства, что позволяет формировать отклонения состояния по каждому показателю и интегральную оценку состояния объекта средствами информационно-аналитической системы.

4. Предложена динамическая модель изменений в распределении объектов управления по классам в виде системы дифференциальных уравнений, отличающаяся заданием параметров модели с учетом значений показателей текущего состояния объектов, что позволяет прогнозировать рас-

пределение объектов по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Практическая значимость исследований. Разработан пилотный проект ИАС на базе аналитической платформы Deductor, обеспечивающей сбор, предварительную обработку и анализ данных о деятельности аспирантуры вуза и информационную поддержку принятия решений по управлению процессом подготовки специалистов высшей квалификации.

Тензорная интерпретация базисов многомерных пространств данных, классов и объектов, операций и отношений, процедуры классификации состояний объектов управления методом вербального анализа может быть использована при проектировании ИАС с применением концептуального и математического моделирования.

Достоверность и обоснованность. Обоснованность и достоверность результатов работы определяются корректным использованием строгих и апробированных методов исследования и подтверждаются практическим применением полученных результатов при разработке ИАС на основе программных продуктов различных производителей: Deductor, Firebird и SQL Manger for InterBase and Firebird. Создание ИАС на основе базисных решений подтверждается актами внедрения и апробацией на всероссийских и международных научно-технических конференциях.

Основные результаты, выносимые на защиту:

1. Математические модели баз и хранилищ данных информационно-аналитической системы на основе представления классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде тензоров (индексных объектов) первой и второй валентности для формализованного описания процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

2. Модель и алгоритм классификации состояний объектов управления на основе механизма цепных покрытий множества векторных оценок для реализации полной и непротиворечивой классификации методом вербального анализа.

3. Модель интегральной оценки состояния и оценки отклонений состояния по каждому показателю объекта управления на основе сравнений с эталоном и представлением показателей состояния в виде вектора многомерного метрического пространства.

4. Динамическая модель, задаваемая в виде системы дифференциальных уравнений, для прогнозирования распределений объектов управления по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Реализация и внедрение результатов работы. Результаты диссертационного исследования использованы при разработке ИАС поддержки процесса подготовки специалистов высшей квалификации на базе аналитической платформы Deductor. Разработанная ИАС внедрена в Пензен-

ском государственном университете, Пензенском государственном технологическом университете, Саранском филиале Российского университета кооперации, ООО «Научно-производственное предприятие "Пульс"», что подтверждается актами внедрения.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях: «Университетское образование» (г. Пенза, 2007, 2008, 2011, 2013); «Новые информационные технологии в научных исследованиях и образовании» (г. Рязань, 2008); «Компьютерное моделирование естественно-научных и социальных проблем» (г. Пенза, 2008); «Информационные системы и технологии в образовании и социально-экономической сфере» (г. Королев, 2008, 2009); «Системный анализ в проектировании и управлении» (г. Санкт-Петербург, 2008, 2009); «Новые информационные технологии в образовании» (г. Екатеринбург, 2009).

Публикации. По теме диссертационного исследования опубликовано 16 печатных работ: 4 статьи — в издании из перечня ВАК, 12 - в материалах российских и международных конференций.

Личный вклад. Автором выполнен основной объем исследований: проведен анализ, сформулированы и решены задачи создания моделей данных, моделей и алгоритмов анализа данных, решение которых обеспечивает достижение цели и составляет новизну, практическую значимость полученных результатов.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 121 наименования и пяти приложений. Объем работы — 141 страница основного текста, включая 42 рисунка и 6 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации; сформулированы цель и задачи исследования; показаны научная новизна и практическая значимость полученных результатов; приведены сведения об апробации работы и публикациях.

В первой главе дан обзор существующих подходов к разработке НАС, выполнен анализ средств формализованного описания структур и процессов обработки. Обосновано применение тензорного исчисления при формализованном описании моделей данных, процедур интеллектуального анализа данных. Приведен обзор технологий построения информационно-аналитических систем.

В диссертации рассмотрен современный подход к разработке информационно-аналитических систем, основанный на разделении систем оперативной обработки транзакций, с использованием которых организуется сбор данных, и систем оперативной аналитической обработки данных, с использованием которых организуется анализ данных. Выделены основ-

ные классы ИАС хранения и анализа корпоративных данных. Представлен обзор существующих вариантов организации хранения данных ИАС, процессов извлечения, преобразования и загрузки данных.

Выполнен анализ средств формализованного описания моделей данных и моделей обработки данных при ETL-процессах. Показано, что модель предметной области на основе логики классов и отношений может быть представлена с помощью нескольких интерпретаций: теоретико-множественной, логики предикатов, алгебры кортежей, тензорного исчисления. Дан обзор способов модельного представления индексных объектов: классическое тензорное исчисление; метод тензорного анализа Г. Крона; тензоры системотехники (тензорси) Г. Н. Чижухина и В. П. Панферова. Особенность метода Г. Крона состоит в использовании /¡-матриц для описания классов и отношений в многомерном пространстве. Подход, разработанный в области дискретной системотехники, предполагает представление объектов в виде тензорси, описывающих множество пар отношений в виде функционального графика. В результате проведенного анализа определены условия для применения тензорного исчисления при формализованном описании моделей данных.

В диссертации рассмотрены методы интеллектуального анализа дан-пых в информационно-аналитической системе. Обосновано применение метода вербального анализа данных для принятия решения в слабоструктурированных и неструктурированных предметных областях. Данные методы позволяют строить полную непротиворечивую классификацию для различных объектов, характеризуемых любыми комбинациями оценок по критериям, без преобразования качественных суждений в количественные. Проанализированы основные аналитические платформы для реализации ИАС. Обоснован выбор аналитической платформы Deductor Studio в качестве основы построения ИАС.

Вторая глава посвящена разработке концептуальной и математической моделей структур данных информационно-аналитической системы: представлены модели классов и объектов информационно-аналитической системы; определены инварианты в пространствах данных для решения расчетных задач.

Выполнено построение концептуальной модели предметной области с использованием системно-онтологического подхода. При разработке онтологии объекта использован стандарт онтологического исследования IDEF5. При построении онтологии процессов и онтологии задач использованы нотации методологии ARIS. В результате анализа предметной области выделены классы ИАС, свойства классов, состояния классов, отношения между классами, процессы и подпроцессы.

В диссертации показано, что формализованные представления многомерного пространства данных, включая модельные представления типа «Звезда» и «Снежинка», могут быть заданы в виде индексных объектов второй валентности Q^ р:

р

к р г ■У к

а г ' 1 0 -1 -1 0 0 0 и

0 1 0 0 0 0 0 р

0 0 1 0 -1 -1 0 г

1 0 0 0 1 0 0 0

0 0 0 0 1 0 0 к

0 0 0 0 0 1 0 а

-1 -1 0 0 0 0 1 (и,0

где а, (5 - скользящие индексы.

Индексный объект описанный выражением (1), представляет собой базис предметного пространства данных «Снежинка» с размерностью, равной семи. Для детального описания всех объектов рассматриваемого многомерного предметного пространства (сущностей) введен набор фиксированных индексов: И,р,г,в,к,с1,(п,1), соответствующих классам предметной области Н,Р,Я,Б,К,0,Х. В этом случае объекты модели можно представить в виде индексных объектов первой валентности, содержащих наборы фиксированных индексов и один скользящий индекс. Наличие первичного ключа задается единицей со знаком «+», наличие внешнего ключа -единицей со знаком «-». Например, класс И модели данных, определяемый понятием «Аспирант», представлен как индексный объект:

б*,р=[1 0 -1-1 0 0 0]. (2)

Поскольку в выражении (2) скользящие индексы р,к,<1,(п,0 имеют нулевое значение, то возможно использование сокращенной записи индексного объекта (2^. В этой записи нижний символ /г рассматривается как фиксированный индекс и соответствует первичному ключу, верхние символы г, ^ также соответствуют фиксированным индексам и внешним ключам, но в данной записи рассматриваются как метки, определяющие действия с индексным объектом.

Показана возможность преобразования базисов предметных пространств. Например, преобразование базиса пространства «Снежинка» в базис пространства «Звезда» имеет вид:

где Г™ — тензор преобразования базы пространства данных «Снежинка» в базу пространства «Звезда», имеющий валентность, равную двум.

На основе тензорной методологии разработана модель классов объектов: «Аспирант» % «Научный руководитель» «Научная специальность» О/1, «Диссертационный совет» (¿л, «Кафедра» £)к, «Научная степень» , «Запись» 2,';/' и др.

Разработана модель объектов информационно-аналитической системы, согласно которой класс объектов «Аспирант» можно представить в виде совокупности функциональных графиков. При этом представлении класса объектов определяется и закон формирования пар функциональных графиков (Л, г) и (И,.ч) из множеств Я, Л, где Я - множество аспирантов,

Я - множество руководителей, 5 - множество научных специальностей. В диссертации предложено рассматривать представление классов объекта

как объединение двух функциональных графиков ^ Кроме

первичного и внешних ключей сущность «Аспирант» содержит набор атрибутов а\,а2,аЪ,...,аЫ, характеризующих множество свойств. В этом случае индексный объект имеет вид:

= Ч ииI? и 1? и...и^ = (а\,а2,аЗ,...,аЛО*"5.

При построении модели данных НАС использованы понятия индексный объект соотношений ->+*|а2 :Ь = а\ + а2 и индексный объект предикатов 5Н = {0,1} . На их основе предложены реализации операций реляционной алгебры, исчисления кортежей, алгебры доменов. Например, сложный запрос к хранилищу данных реализуется в два этапа:

- операция «слияние» (а1,а2)г/-(Ы,Ь2)Г = (а\,а2,Ь\,Ь2)1у,

-простой запрос {а\,а2МУКг = ${а\,а2,Ь\,Ь2)1г • Рг{а\,а2,ЬХ),

где 5 - префикс, отражающий формирование факта; Рг - оператор отношений для описания операции «проекция».

На основе результатов проведенного исследования сделаны выводы об эффективности применения тензорной методологии, обеспечивающей формализованное описание структур данных на уровне компонент и системном уровне. Определены инварианты в пространствах данных:

- объем данных для описания одного и того же набора измерений в различных предметных пространствах фиксирован;

- объем данных, хранимых в таблицах мер различных предметных пространств, без учета структуры функциональных зависимостей неизменен.

Определение инвариантов позволяет осуществлять расчет объема хранимой информации при любом заданном базисе предметного пространства и выполнять преобразование одной структуры данных в другую без потери данных. Расчет объема хранимой информации производится в два этапа На первом этапе выполняется расчет применительно к примитивной структуре данных. На втором этапе осуществляется расчет объема данных при за-

данном базисе предметного пространства. На основе этих вычислений можно вести поиск оптимальной структуры хранилища данных с применением вертикальной и горизонтальной нормализации.

В третьей главе решаются задачи анализа и поддержки принятия решений средствами информационно-аналитической системы; предложена модель управления деятельностью аспиранта по состояниям; представлены математическая модель процесса классификации состояний, алгоритм решения задачи классификации состояний, модель анализа деятельности аспиранта, динамическая модель деятельности аспиранта.

Модель управления деятельностью аспиранта представлена в виде множества кортежей:

где (I — дата проведения анализа; _/ — идентификатор объекта; а, — ключевой показатель деятельности аспиранта (магистранта); п - количество показателей, используемых при решении задачи; т — количество объектов.

Задача классификации состояний аспирантов определена как задача порядковой классификации многокритериальных альтернатив и формально представлена следующим образом:

Т - свойство, отвечающее целевому критерию задачи («состояние аспиранта»);

К = {ЛГ1, АГ2,АГ^} - множество критериев, по которым оценивается каждый аспирант (средний балл вступительных экзаменов, количество публикаций, количество участий в конференциях, количество патентов и свидетельств, количество страниц диссертационной работы);

X ={хкч} - шкала оценок по критерию К,г упорядоченных по убыванию характерности для свойства Т; = - число значений оценок

на шкале д-го критерия;

У = X, х Х2 х...х1„ -пространство состояний аспирантов, подлежащих классификации. Каждое состояние аспиранта описывается набором оценок по критериями представляется в виде векторной оценки у б У, где V = >'Л,), уч равно номеру оценки из множества Хц;

С = {С!,С2,...,СД/} - множество классов решений, упорядоченных по убыванию выраженности свойства Т («отличные показатели для защиты», «хорошие показатели для защиты», «зона риска»).

Требуется, основываясь на предпочтениях руководителя, построить отображение множества допустимых объектов У" во множество классов С: Р \Уа —>С, которое должно быть полным и удовлетворять свойству непротиворечивости:

Для решения данной задачи использован метод вербального анализа решений, основанный на использовании цепных покрытий множества векторных оценок.

После классификации состояния аспиранта и установления цепочки изменений состояний необходимо провести анализ состояния. Для этого предложена реализация метода сравнения с эталоном. При этом последовательность действий следующая:

- выявление показателей деятельности объектов;

- установление значений эталонного объекта на основе анализа показателей;

- сопоставление показателей деятельности объекта с эталонным объектом;

- выявление показателей работы объекта, требующих доработки;

- выводы и рекомендации по выполнению намеченных планов.

В диссертации определен вектор Нк = {гк1,■ ■.,гкт) как состояние субъекта, полученное в результате одного шага с порядковым номером к при стремлении к цели. При этом 1Ук - вектор-состояние субъекта, соответствующий достижению цели в результате всех выполненных шагов до к-го шага включительно, имеет вид:

ы

После выполнения заданного количества шагов к определяется отношение проекции вектора 1Ук на вектор А = (а1,...,а,„) к модулю вектора А, желаемое конечное состояние субъекта (цель):

8 = (А,Щ)/\л\2.

Величина 5 может принимать значения в интервале [0,1]. Цель достигается полностью, если 5 = 1.

Для формирования вектора-цели выбраны и проанализированы авторефераты защитившихся аспирантов Пензенского государственного университета по разным специальностям и направлениям. Анализ авторефератов произведен по следующим показателям: количество публикаций в журналах, рекомендованных ВАК, количество монографий и публикаций в иных журналах, количество тезисов конференций, количество патентов и свидетельств и т.д. На основе этих показателей сформированы эталоны в виде среднеарифметических значений, максимальных значений, значений моды и медианы.

Для прогноза поведения групп аспирантов в течение одного учебного года предложена динамическая модель деятельности аспирантов. Для случая непрерывного времени модель имеет вид:

—^ = -Я.(дг,(')+ I М, + »К, Со).

где х,(/0) = .г"; X, уронснь подготовленности аспирантов фуниы г, к обучению; ц( / - параметры. характеризующие переход аспиранта из группы .г, в группу .г,: п параметр, характеризующий сохранность общей численности аспирантов в группах (100 %).

Графики изменений в численности групп аспирантов приведены на рис. I. Начальное распределение аспирантов но группам происходит но ито>-ам вступительных экзаменов: *,(»,) = 55%. *,(»,) = 43%. ,гЗ(/|)=2% и г^/,) 0%. Расчеты выполнены при следующих значениях параметров: Х,=Х4= 4=0.0653; =0,0549; X, =0.0074; ц, , = -0.0104; ц, -0.0577;

з = О.ООСЮ, кошрые определены но результатам вступительных испытаний. оценок знаний но специальным дисциплинам и наличию научных публикаций и изобретений.

» Л«».!..«

Рис. I. Графики изменений численности групп аспиратой

Для определения (коррекции) параметров процесса, характеризующих деятельность аспиринов в конце учебного года, разработка с не г см а линейных ал1ебранчсских уравнений:

"- 48 45 0 0 П, -л»

-45 -45 7 0 Ни -п.

-7 0 -7 -10 мЬ -

0 0 0 7

-л»

-Л» |

(3)

где ¿и,)=*(1х,и)/<Л;1 = 1„ к = 1.2.....

Процесс вычислений значений параметров ц*,. ц*}. ц}, в соответствии с выражением (3) является сходящимся и может рассматриваться

как разновидность решения системы дифференциальных уравнений методом последовательных приближений.

Четверти I лава посвящена разработке и исследованию информационно-аналитической системы поддержки управления деятельностью аспирантов. Разработаны структуры транзакционной базы данных и реляционного хранилища данных. Решены задачи оперативно! о и интеллектуального анализа данных средст вами 1Хч1ис1ог.

Архитектура ЛИС приведена на рис. 2. В состав информационно-аналитической системы входяг операционная база данных, предназначенная для сбора и хранения данных об аспирантах и научных руководителях хранилище данных, содержащее а1рсгированныс данные но итогам отчетного года; модули оперативного и интеллектуального анализа данных.

Рис. 2. Архитектур* информационно-аналитической системы

Операционная вД предназначена для хранения информации об аспирантах и соискателях, научных руководителях, результатах вступительных и кандидатских экзаменов, итогах ежегодной аттестации, публикациях. тезисах докладов, патентах и актах внедрения результатов исследований.

Приветен гример реализации классификации состояний аспирантов но результатам вступительных экзаменов методом вербального анализа с применением разработанной ИЛС. В соответствии с предложенным алгоритмом ноете определения классов, критериев и оценок но критериям система после доватслыю выбирает объекты из множества всевозможных многокритсри альных описаний состояний аспирантов и предъявляет эксперту для классификации (рис. 3).

Рис. 3. Задание классов н критериев

После того, как эксперт отнесет объект к идиому из классов, система нмиолмяст процедуру распространения но доминированию. Таким обра-эом, эксперт, отвечая на предлаг аемые вопросы, неявно формирует решающее правили классификации. Показано, что дли построения полной классификации необходимо задан, серию вопросов. Количеств вопросов определяется политикой эксперта и выбранной стратегией ответов. 11»стройку системы классификации предложено осуществлять при смене 'жеиерта (решающего правила), а также при изменении кршериев и оценок состояний объектов. Полученные н результате классификации множество всех возможных состояний объекта и соответствующие им классы импортируются в НАС. Сиегсма сопоставляет значения показателей аспирантов из хранилища данных с итогами классификации.

Программа позволяет анализировать состояния аспирантов после каждого гола обучения и присваивать ему класс состояния по его показателям за соответствующий год. На основании этого можно установит!, последовательность смены состояний аспиранта в процессе обучения (рис 4).

И 0><Ь.1И - С;-,—............

»• г^ааи Ц, Мт втт «-

о^'и #11« к- •• » ш ■ - о % в т • ®

Ш е. - »] '«»мм______________ _ _ _ _

>

Рис. 4. Изменения состояний аспирантов но голам обучения

С применением ИЛС реализована модель оценки состояния объектов управления методом сравнения с заданным эталонным состоянием. Осуществлена обработка данных для построения динамической модели изменений в распределении объектов управления по классам.

аV и* ■»• » Я • * т - «1 "« » м в•

В заключении сформулированы основные результаты диссертационной работы.

Приложения к диссертации содержат: листинги программ, примеры реализации оперативного, интеллектуального анализа с применением ИАС и акты внедрения.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Разработаны математические модели баз и хранилищ данных информационно-аналитической системы, отличающиеся заданием классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде тензоров (индексных объектов) первой и второй валентности, что обеспечивает формализованное описание процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

2. Разработаны модель и алгоритм классификации состояний объектов управления, отличающиеся реализацией механизма цепных покрытий множества векторных оценок, предъявляемых эксперту, что позволяет строить полную и непротиворечивую классификацию средствами аналитической платформы Deductor.

3. Предложена модель оценки состояния объектов управления методом сравнения с заданным экспертом эталоном, отличающаяся представлением показателей состояния в виде вектора многомерного метрического пространства, что позволяет формировать отклонения состояния по каждому показателю и интегральную оценку состояния объекта средствами аналитической платформы Deductor.

4. Предложена динамическая модель изменений в распределении объектов управления по классам в виде системы дифференциальных уравнений, отличающаяся заданием параметров модели с учетом значений показателей текущего состояния объектов, что позволяет прогнозировать распределение объектов по состояниям в заданном интервале времени с использованием метода последовательных приближений.

5. Теоретически обоснована возможность представления моделей классов, объектов, сущностей, базисов многомерных пространств данных в виде тензоров первой и второй валентности при анализе объемов хранимой информации в базах и хранилищах данных, разработке алгоритмов извлечения, преобразования и загрузки данных.

6. На основе аналитической платформы Deductor, предлагаемой российской компанией BaseGroup Labs, и свободно распространяемой СУБД Firebird разработана проблемно-ориентированная ИАС поддержки управления процессом подготовки специалистов высшей квалификации в вузе.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, рекомендованных ВАК РФ

1. Попова, Н. А. Управление деятельностью аспирантов в вузе / Н. Л. Попова, П. П. Макарычсв // Известия высших учебных заведений. Поволжский регион. Технические науки.-2011.-№2(18).-С. 67-75.

2. Попова, II. А. Динамическая модель деятельности аспирантов для автоматизации функций управления / Н. Л. Попова, П. П. Макарычев // В мире научных открытий. - 2012. - № 8(32). - С. 152-166.

3. Попова, Н. Л. Модель деятельности аспирантов для автоматизированной системы управления / П. П. Макарычев, II. Л. Попова И Известия высших учебных заведений. Поволжский регион. Технические науки. - 2012. - № 4(24). — С. 29-36.

4. Попова, Н. А. Построение моделей данных с применением тензорной методологии / Н. Л. Попова // Современные проблемы науки и образования. — 2013. -№ 5. - URL : http://www.science-education.rU/l 11-10146.

Публикации в других изданиях

5. Федосеева, Н. А Онтологическое исследование системы стратегического управления вузом / Н. А. Федосеева // Университетское образование : сб. ст. XI Междунар. науч.-метод. конф. - Пенза, 2007. - С. 278-280.

6. Попова, Н. Л. Стратегическое управление подготовкой специалистов высшей квалификации в вузе / Н. А. Попова // Университетское образование: сб. ст. XII Междунар. науч.-метод. конф. Пета, 2008. - С. 487 489.

7. Попова, Н. А. Система управления подготовкой специалистов высшей квалификации в вузе / Н. А. Попова // Новые информационные технологии в научных исследованиях и образовании : материалы XIII Всерос. науч.-техн. конф. студентов, молодых ученых и специалистов. - Рязань : Изд-во Рязан. гос. радио-техн.ун-та, 2008. - 4.1. - С. 90-91.

8. Попова, Н. А. От онтологии до базы знаний системы управления подготовкой специалистов высшей квалификации / Н. А. Попова // Компьютерное моделирование естественно-научных и социальных проблем : сб. ст. II Междунар. науч.-техн. конф. молодых специалистов, аспирантов и студентов. - Пенза, 2008.-С. 192-194.

9. Попова, П. А. От онтологии до базы знаний системы управления знаниями / Н. А. Попова // Информационные системы и технологии в образовании и социально-экономической сфере : сб. тр. II Всерос. науч.-практ. конф. - Королев, 2008.-С. 98-102.

10. Попова, Н. Л. Управление знаниями в современном вузе: от онтологии до базы знаний / Н. А. Попова // Альманах современной науки и образования. -2008.-№7(14).-С. 138-139.

11. Попова, Н. А. Управление подготовкой специалистов высшей квалификации в вузе / Н. Л. Попова, П. П. Макарычев // Системный анализ в проектировании и управлении : тр. XII Междунар. науч.-практ. конф. - СПб. : Изд-во Политехи. ун-та, 2008. - Ч. 3. - С. 91-94.

12. Попова, Н. А. Система мониторинга и управления аспирантами в вузе / П. А. Попова // Новые информационные технологии в образовании : материалы Междунар. науч.-практ. конф. - Екатеринбург, 2009. - Ч. 2. - С. 191-193.

13. Попова, Н. А. Архитектура системы управления аспирантами в вузе / Н. А. Попова // Информационные системы и технологии в образовании и социально-экономической сфере : сб. тр. III Всерос. науч.-практ. конф. - Королев МО; Ярославль : Изд-во «Канцлер», 2009. - С. 73-75.

14. Попова, Н. А. Автоматизированная система контроля и управления деятельностью аспирантов / Н. А. Попова, П. П. Макарычев // Системный анализ в проектировании и управлении : тр. XIII Междунар. науч.-практ. конф. — СПб. : Изд-во Политехи, ун-та, 2009. - Ч. 2. - С. 369-372.

15. Попова, Н. А. Модель управления аспирантами по состояниям / Н. А. Попова // Университетское образование : сб. ст. XV Междунар. науч.-метод, конф. / под ред. В. И. Волчихина, P.M. Печерской. - Пенза: Изд-во ПТУ, 2011. - С. 287-289.

16. Попова, Н. А. Построение моделей классов и объектов с применением тензорной методологии / П. П. Макарычев, П. А. Попова // Университетское образование : сб. ст. XVII Междунар. науч.-метод. конф. / под ред. В. И. Волчихина, Р. М. Печерской. - Пенза : Изд-во ПГУ, 2013. - С. 457-458.

МОДЕЛИ И АЛГОРИТМЫ ПРОБЛЕМНО-ОРИЕНТИРОВАННОЙ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ

Специальность 05.13.17 - Теоретические основы информатики

Редактор Н. А. Сидельникова Технический редактор С. В. Денисова Компьютерная верстка С. В. Денисовой

Распоряжение № 23/2013 от 14.10.2013.

Подписано в печать 16.10.2013. Формат 60x841/16. Усл. печ. л. 1,04. Тираж 100. Заказ №828.

Издательство ПГУ. 440026, Пенза, Красная, 40. Тел./факс: (8412) 56-47-33; e-mail.'iicft/jpnzgu.ru

Научное издание

Попова Наталия Александровна

Текст работы Попова, Наталия Александровна, диссертация по теме Теоретические основы информатики

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

04201452428

ПОПОВА НАТАЛИЯ АЛЕКСАНДРОВНА

МОДЕЛИ И АЛГОРИТМЫ ПРОБЛЕМНО-ОРИЕНТИРОВАННОЙ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ

Специальность 05.13.17 - Теоретические основы информатики

Диссертации на соискание ученой степени кандидата технических наук

Научный руководитель: доктор технических наук профессор Макарычев П.П.

ПЕНЗА 2013

СОДЕРЖАНИЕ

Введение .................................................................................................4

1 АНАЛИЗ МЕТОДОВ И СРЕДСТВ ПОСТРОЕНИЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ СИСТЕМ..............................................................11

1.1 Концептуальное представление информационно-аналитических систем...... 11

1.2 Модельные представления объектов предметной области с применением математической логики ...................................................................... 16

1.3 Модельные представления данных на основе тензорной методологии..........22

1.4 Методы анализа данных в информационно-аналитических системах.........28

1.5 Концепции построения проблемно-ориентированных информационно-

аналитических систем..........................................................................35

Выводы ............................................................................................41

2 КОНЦЕПТУАЛЬНЫЕ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДАННЫХ НА ОСНОВЕ ТЕНЗОРНОЙ МЕТОДОЛОГИИ................................................43

2.1 Концептуальная модель предметной области информационно-аналитической системы...........................................................................................43

2.2 Тензорная модель классов и отношений предметной области..................51

2.3 Тензорная модель объектов информационно-аналитической системы........55

2.4 Операции с индексными объектами информационно-аналитической системы.............................................................................................60

2.5 Анализ структуры на основе многомерного представления данных...........64

Выводы...........................................................................................68

3 МОДЕЛИ И АЛГОРИТМЫ АНАЛИЗА, КЛАССИФИКАЦИИ И УПРАВЛЕНИЯ................................................................................... 71

3.1 Модель управления деятельностью аспиранта по состояниям...................71

3.2 Математическая модель процесса классификации состояний....................75

3.3 Алгоритм решения задачи классификации состояний .............................80

3.4 Разработка модели анализа деятельности аспиранта.................................84

3.5 Динамическая модель деятельности аспиранта .....................................88

Выводы...........................................................................................92

4 РАЗРАБОТКА И ИССЛЕДОВАНИЕ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ ............................................................94

4.1 Разработка информационно-аналитической системы на основе концепции проблемной ориентации .....................................................................94

4.2 Решение задач оперативного анализа данных средствами аналитической платформы Deductor.......................................................................... 102

4.3 Вербальный анализ данных на основе разработанных моделей и алгоритмов.......................................................................................107

4.4 Интеллектуальный анализ данных методом эталонного сравнения .......... 112

Выводы ..........................................................................................116

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.................................................118

СЛОВАРЬ ТЕРМИНОВ.......................................................................120

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ......................................129

ПРИЛОЖЕНИЕ А. РЕЗУЛЬТАТЫ АНАЛИЗА СТРУКТУР ДАННЫХ

СРЕДСТВАМИ MATHCAD.................................................................142

ПРИЛОЖЕНИЕ Б. ЛИСТИНГ ПРОГРАММЫ ДЛЯ ПОСТРОЕНИЯ

КЛАССИФИКАЦИИ МЕТОДОМ ВЕРБАЛЬНОГО АНАЛИЗА....................147

ПРИЛОЖЕНИЕ В. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКОЙ

МОДЕЛИ СРЕДСТВАМИ MATHCAD ...................................................156

ПРИЛОЖЕНИЕ Г. РАЗРАБОТКА СТРУКТУРЫ ТРАНЗАКЦИОННОЙ БАЗЫ

ДАННЫХ ....................................................................................... 160

ПРИЛОЖЕНИЕ Д. АКТЫ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ.........................................................166

ВВЕДЕНИЕ

Актуальность темы. Информационно-аналитические системы (ИАС) представляют особый класс информационных систем, предназначенных для хранения, обработки и анализа данных. Эффективное хранение данных обеспечивается наличием в составе ИАС множества источников данных. Обработка и объединение данных выполняются инструментальными средствами извлечения, преобразования и загрузки данных. Анализ данных осуществляется с использованием инструментальных средств оперативного и интеллектуального анализа.

ИАС, как правило, реализуются в виде надстройки над функционирующей информационной системой предприятия или организации и размещаются на различных уровнях управления. Создание ИАС предполагает большую детализацию и более сложную аналитическую обработку данных по сравнению с OLTP-системами, ориентированными на фиксацию повседневной деятельности. В связи с этим архитектура современных ИАС содержит следующие уровни: сбор и первичная обработка данных; извлечение, преобразование и загрузка данных; складирование данных; оперативное представление данных, оперативный и интеллектуальный анализ данных в процессе принятия управленческих решений.

Существует два подхода к реализации ИАС. Первый подход основан на платформенно-базированных решениях, предложенных ведущими компаниями Oracle, Microsoft, СА, SAP, SAS и др. Второй подход предполагает реализацию ИАС на основе смешанного решения, при котором инструменты анализа и СУБД выбираются из числа программных продуктов различных компаний (Cognos, Business Objects и BaseGroup Labs). Преимущество второго подхода состоит в возможности обеспечения более высокой функциональной эффективности системы. Однако применение программных продуктов различных производителей затрудняет решение задач, связанных с формированием структуры транзакционной базы данных и хранилища данных, извлечением,

преобразованием и загрузкой данных, разработкой моделей и алгоритмов оперативного, интеллектуального анализа данных.

Как правило, большинство ИАС реализуется на основе многомерного представления данных в OLTP-(on-line transaction processing) и OLAP-(on-line analytical processing) системах. Это обусловлено требованиями сокращения временных затрат на реализацию доступа, обеспечения целостности данных. Существенный вклад в развитие модельных представлений баз и хранилищ данных для ИАС внесли: У. Г. Инмон, Э. Ф. Код, К. Дж. Дейт, Б. А. Кулик, С. Д. Кузнецов, В. И. Мунерман и др. Известны модельные представления структур данных на основе различных интерпретаций: логики классов и отношений, теоретико-множественных представлений, одноместных и многоместных предикатов, алгебры кортежей и тензорной алгебры.

Впервые тензорные методы как средство формализованного описания данных были упомянуты в работе А. Е. Петрова (1976), посвященной разработке матричного представления реляционного языка баз данных. Тензорный подход применялся для проектирования банков данных и систем управления базами данных разработки информационных систем, методов анализа программ (А. Е. Арменский, 1986,1989).

Существенный вклад в развитие методов оперативного и интеллектуального анализа данных внесли: Г. Пятецкий-Шапиро, А. И. Арастумов, О. И. Ларичев, И. Д. Мандель, В. А. Дюк и др.

Несмотря на значительные успехи в области создания ИАС, имеет место проблема модельных представлений данных при разработке структур хранения, процедур первичной обработки, оперативного и интеллектуального анализа данных. Первый аспект проблемы связан с недостаточной развитостью средств формализованного описания структур и процедур обработки данных на основе заданных классов объектов, отношений и измерений многомерного предметного пространства. Второй аспект проблемы связан с теоретическим обоснованием моделей анализа накопленных данных, принятия решений с учетом свойств объектов и шкал измерений многомерного пространства, третий аспект — с

установлением соответствий между модельными представлениями хранения и анализа данных с функциями аналитической платформы, используемой при создании ИАС.

Цель диссертационной работы - разработка и исследование модельных представлений данных на основе тензорной методологии, моделей и алгоритмов вербального анализа данных; обоснование выбора технологической платформы и системы управления базами данных.

Задачи, решаемые в работе:

-теоретическое обоснование модельных представлений структур баз и хранилищ данных на основе построения математических моделей классов объектов и отношений между классами в предметной области с применением тензорной методологии;

- разработка математических моделей и алгоритмов оперативного и интеллектуального анализа данных для оценки состояний объектов в процессе деятельности с использованием средств информационно-аналитической системы;

- обоснование выбора технологической платформы для создания информационно-аналитической системы и разработка концептуальных моделей предметной области, отражающих ее проблемную ориентацию;

- разработка пилотного проекта информационно-аналитической системы на основе выбранных технологической платформы, системы управления базами данных и проведение экспериментов по оценке состояний объектов.

Объектом исследования являются процессы сбора, накопления, предварительной обработки, загрузки и анализа данных при создании информационно-аналитической системы.

Предметом исследования являются математические модели классов, объектов и компонент (сущностей); модели и алгоритмы обработки и анализа данных информационно-аналитической системы.

Соответствие паспорту научной специальности. Область исследования соответствует п. 3 «Исследование методов и. разработка средств кодирования

информации в виде данных. Принципы создания языков описания данных, языков манипулирования данными, языков запросов. Разработка и исследование моделей данных и новых принципов их проектирования» и п. 5 «Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений».

Методы исследования основаны на алгебре индексных объектов, теории вербального анализа решений, методах оперативного и интеллектуального анализа данных, методах концептуального моделирования в методологии АШБ, реляционном и объектно-реляционном подходах к описанию данных.

Научная новизна работы:

1. Разработаны математические модели баз и хранилищ данных информационно-аналитической системы, отличающиеся заданием классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде индексных объектов (тензоров) первой и второй валентности, что обеспечивает формализованное описание процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

2. Разработаны модель и алгоритм классификации состояний объектов управления, отличающиеся реализацией механизма цепных покрытий множества векторных оценок, предъявляемых эксперту в процессе вербального анализа данных, что позволяет строить полную и непротиворечивую классификацию средствами информационно-аналитической системы.

3. Предложена модель оценки состояния объектов управления методом сравнения с заданным экспертом эталоном, отличающаяся представлением показателей состояния в виде вектора многомерного метрического пространства, что позволяет формировать отклонения состояния по каждому показателю и интегральную оценку состояния объекта средствами информационно-аналитической системы.

4. Предложена динамическая модель изменений в распределении объектов управления по классам в виде системы дифференциальных уравнений, отличающаяся заданием параметров модели с учетом значений показателей текущего состояния объектов, что позволяет прогнозировать распределение объектов по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Практическая значимость исследований. Разработан пилотный проект ИАС на базе аналитической платформы Deductor, обеспечивающей сбор, предварительную обработку и анализ данных о деятельности аспирантуры вуза и информационную поддержку принятия решений по управлению процессом подготовки специалистов высшей квалификации.

Тензорная интерпретация базисов многомерных пространств данных, классов и объектов, операций и отношений, процедуры классификации состояний объектов управления методом вербального анализа может быть использована при проектировании ИАС с применением концептуального и математического моделирования.

Достоверность и обоснованность. Обоснованность и достоверность результатов работы определяются корректным использованием строгих и апробированных методов исследования и подтверждаются практическим применением полученных результатов при разработке ИАС на основе программных продуктов различных производителей: Deductor, Firebird и SQL Manger for InterBase and Firebird. Создание ИАС на основе базисных решений подтверждается актами внедрения и апробацией на всероссийских и международных научно-технических конференциях.

Основные результаты, выносимые на защиту:

1. Математические модели баз и хранилищ данных информационно-аналитической системы на основе представления классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде тензоров (индексных объектов) первой и второй валентности для формализованного

описания процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных.

2. Модель и алгоритм классификации состояний объектов управления на основе механизма цепных покрытий множества векторных оценок для реализации полной и непротиворечивой классификации методом вербального анализа.

3. Модель интегральной оценки состояния и оценки отклонений состояния по каждому показателю объекта управления на основе сравнений с эталоном и представлением показателей состояния в виде вектора многомерного метрического пространства.

4. Динамическая модель, задаваемая в виде системы дифференциальных уравнений, для прогнозирования распределений объектов управления по состояниям в заданном интервале времени с использованием метода последовательных приближений.

Реализация и внедрение результатов работы. Результаты диссертационного исследования использованы при разработке ИАС поддержки процесса подготовки специалистов высшей квалификации на базе аналитической платформы ОеёисШг. Разработанная ИАС внедрена в Пензенском государственном университете, Пензенском государственном технологическом университете, Саранском филиале Российского университета кооперации, ООО «Научно-производственное предприятие "Пульс"», что подтверждается актами внедрения.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях: «Университетское образование» (г.Пенза, 2007, 2008, 2011, 2013); «Новые информационные технологии в научных исследованиях и образовании» (г. Рязань, 2008); «Компьютерное моделирование естественно-научных и социальных проб-лем» (г. Пенза, 2008); «Информационные системы и технологии в образовании и социально-экономической сфере» (г. Королев, 2008, 2009); «Системный анализ в

проектировании и управлении» (г. Санкт-Петербург, 2008, 2009); «Новые информационные технологии в образовании» (г. Екатеринбург, 2009).

Публикации. По теме диссертационного исследования опубликовано 16 печатных работ: 4 статьи - в издании из перечня ВАК, 12 - в материалах российских и международных конференций.

Личный вклад. Автором выполнен основной объем исследований: проведен анализ, сформулированы и решены задачи создания моделей данных, моделей и алгоритмов анализа данных, решение которых обеспечивает достижение цели и составляет новизну, практическую значимость полученных результатов.

1 АНАЛИЗ МЕТОДОВ И СРЕДСТВ ПОСТРОЕНИЯ ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ ИНФОРМАЦИОННО-

АНАЛИТИЧЕСКИХ СИСТЕМ

Данная глава посвящена анализу методов и средств, применяемых при разработке проблемно-ориентированных информационно-аналитических систем. Приведен результат анализа средств формализованного описания структур и процессов обработки с помощью теоретико-множественной интерпретацией, логики предикатов, алгебры кортежей. Обосновано применение тензорного исчисления при формализованном описании моделей данных, процедур интеллектуального анализа данных. Выполнен анализ технологий разработки ПАС на основе базированных и смешенных решений.

1.1 Концептуальное представление информационно-аналитических систем

Внедрение информационно-аналитических систем (ИАС) обеспечивает автоматизацию аналитических работ для принятия управленческих решений. ИАС объединяют, анализируют и хранят как единое целое информацию, извлекаемую как из учетных баз данных организации, так и из внешних источников. В настоящее время ИАС является одним из наиболее в�