автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Разработка системы автоматизированного мониторинга на основе технологии OLAP

кандидата технических наук
Гудков, Павел Анатольевич
город
Пенза
год
2005
специальность ВАК РФ
05.13.10
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка системы автоматизированного мониторинга на основе технологии OLAP»

Автореферат диссертации по теме "Разработка системы автоматизированного мониторинга на основе технологии OLAP"

На правах рукописи

ГУДКОВ Павел Анатольевич

РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЗИРОВАННОГО МОНИТОРИНГА НА ОСНОВЕ ТЕХНОЛОГИИ OLAP

Специальность 05.13.10 — Управление в социальных и экономических системах (технические науки)

Автореферат диссертации на соискание ученой степени кандидата технических наук

ПЕНЗА 2005

Работа выполнена в Пензенском государственном университете.

Научный руководитель — заслуженный деятель науки РФ,

доктор технических наук, профессор Бершадский А. М.

Официальные оппоненты: заслуженный деятель науки РФ,

доктор технических наук, профессор Камаев В. А.; доктор педагогических наук, профессор Зайнущинова Л. X.

Ведущая организация — Исследовательский центр проблем

качества подготовки специалистов (г. Москва).

Защита диссертации состоится 25 июня 2005 г., в 10 часов, на заседании диссертационного совета ДМ 212.009.03 в Астраханском государственном университете по адресу: 414056, г. Астрахань, ул. Татищева, 20а.

Отзывы на автореферат в двух экземплярах, заверенные гербовой печатью, просим направлять ученому секретарю диссертационного совета по адресу: 414056, г. Астрахань, ул. Татищева, 20а, АГУ, диссертационный совет.

С диссертацией можно ознакомиться в библиотеке Астраханского государственного университета.

Автореферат разослан 24 мая 2005 г.

Ученый секретарь

диссертационного совета

доктор технических наук,

профессор

Петрова И. Ю.

у.З г/У

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время во многих сферах человеческой деятельности остро стоят вопросы информационного наблюдения, оценивания, контроля и управления, или, иными словами, информационного мониторинга. Для существующих методов мониторинга характерны недостаточные оперативность и степень учета окружающих факторов (невозможность совместного анализа больших групп параметров в их системном единстве), а также их высокая трудоемкость. Особую актуальность проблема мониторинга приобретает тогда, когда информация об исследуемой предметной области сложно структурирована и отражает различные стороны функционирования каких-либо объектов.

Данная работа направлена на разработку технологий мониторинга социально-экономических систем с использованием многомерных баз данных (МБД) и технологии OLAP (Online Analytical Processing) на примере региональной системы образования. В частности, решаются задачи предварительной подготовки данных, автоматизированного формирования МБД и последующего анализа информации.

Цель и задачи исследования. Целью диссертационной работы является исследование проблемы мониторинга и анализа информации с использованием технологии OLAP, а также разработка системы автоматизированного мониторинга на основе данной технологии и методики ее применения на примере данных образовательной статистики. Для достижения поставленной цели необходимо решить следующие задачи:

1. Анализ существующих методов мониторинга и поиск путей повышения качества мониторинга.

2. Разработка модели представления данных в МБД и эффективных методов подготовки данных для анализа.

3. Разработка автоматизированной системы мониторинга. Определение её структуры и функций входящих в неё модулей. Данная система должна состоять из серверной части для создания и ведения МБД, а также OLAP-клиента, предоставляющего пользователям, не имеющим специальных знаний, возможность проведения анализа информации.

4. Экспериментальные исследования различных этапов анализа информации на основе МБД и технологии OLAP, включая и те, которые касаются предварительной подготовки данных.

5. Апробация разработанной системы в конкретной предметной области. Создание и заполнение МБД информацией по образовательным учреждениям Пензенской области с последующим ее анализом.

6. Разработка рекомендаций для автоматизированного проектирования структуры МБД на основе визуального конструктора - мастера создания МБД, ввода исходных данных и проведения анализа информации.

Методы исследования. При решении поставленных задач использовались методы структурного и системного программирования, автоматизированного проектирования, принципы модульного и объектно-ориентированного проектирования, принципы и методы построения трансляторов, теории баз данных, методы математической статистики.

Научная новизна. Основные результаты диссертационной работы, выносимые на защиту, состоят в следующем:

1. Разработана технология проведения мониторинга, позволяющая повысить его эффективность, осуществить анализ больших групп параметров в их системном единстве.

2. Предложена архитектура универсальной системы автоматизированного мониторинга, которая позволяет организовать данные для их анализа на основе технологии OLAP и провести собственно анализ этих данных. Отличительной особенностью данной системы является то, что пользователь может работать с ней, не имея специальных знаний.

3. Разработана методика автоматизированной подготовки и анализа данных. Отличительной особенностью предлагаемого подхода является наличие автоматизированных этапов очистки информации и поиска закономерностей.

4. Предложены алгоритмы, позволяющие в реальном времени редактировать многомерный куб. Они отличаются от аналогов отсутствием жесткой привязки к структуре МБД.

5. Разработана методика визуального проектирования структуры МБД, что позволяет автоматизировать процесс создания необходимой структуры в соответствии с требованиями, предъявляемыми к БД в конкретной предметной области.

6. Предложены методы интеграции технологий OLAP и ГИС (геоинформационные системы) с целью отображения необходимой информации на электронных географических картах.

Практическая ценность. Предложенная технология мониторинга социально-экономических систем с использованием технологии OLAP позволяет устранить недостаточную оперативность анализа данных существующих методов мониторинга, их высокую трудоемкость и недостаточную степень учета окружающих факторов.

Разработанные алгоритмы формирования МБД существенно сокращают сроки подготовки данных для их последующего анализа с использованием технологии OLAP.

Разработана программная реализация системы автоматизированного мониторинга на основе технологии OLAP, имеющая в своем составе подсистемы формирования структуры МБД, ввода и редактирования данных, просмотра и анализа информации (клиентская часть) и др. Разработанное программное обеспечение (ПО) функционирует на платформе Win32 (Windows 95/98/Me/NT/2000/XP/2003).

Даны практические рекомендации по использованию разработанной системы, предложена последовательность и описано содержание этапов подготовки и анализа информации.

На основании теоретических и экспериментальных исследований доказана эффективность применения технологии OLAP для мониторинга и анализа состояния системы образования.

Внедрение результатов работы. Основные теоретические и практические результаты диссертационной работы использованы при разработке клиент/серверного ПО системы автоматизированного мониторинга.

Результаты работы также использовались при создании прототипа системы мониторинга в рамках следующих НИР, выполненных на кафедрах САПР и ГМУ Пензенского государственного университета: «Научно-технический мониторинг сферы науки, а также ведущих

отраслей Пензенской области, прогнозная оценка их развития...», программа «Научное, научно-методическое, материально-техническое и информационное обеспечение системы образования», подпрограмма «Информационные технологии в образовании» (договор №4.5.2(43.0) 151.34), «Разработка геоинформационной системы Российского портала открытого образования» (договор № 1694/5 от 4.10.2002 г.).

Разработанная система внедрена в органах управления образованием Пензенской и Воронежской областей, а также в сетевой лаборатории анализа и мониторинга окружающей среды МПР России по Пензенской области.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах: VI, УП, VIII, IX международных научно-методических конференциях "Университетское образование" (г. Пенза, 2002-2005 гг.), V Всероссийской научно-технической конференции "Информационные технологии в науке, проектировании и производстве" (г. Нижний Новгород, 2002 г.), IV Международной научно-технической конференции "Информационные технологии и системы в образовании, науке, бизнесе" (г. Пенза, 2002 г.), I научно-методической конференции "Инновации в образовании" (г. Пенза,

2003 г.), XXX юбилейной международной конференции и I Международной конференции молодых ученых "Информационные технологии в науке, образовании, телекоммуникации, бизнесе" (гг. Ялта-Гурзуф, 2003 г.), Международном юбилейном симпозиуме "Актуальные проблемы науки и образования (АПНО-2003)" (г. Пенза, 2003 г.), XXXI Международной конференции "Информационные технологии в науке, образовании, телекоммуникации и бизнесе" (гг. Ялта-Гурзуф, 2004 г.), Международной конференции "Информационные технологии в образовании, технике и медицине" (г. Волгоград,

2004 г.), Межрегиональной научно-практической конференции "Проблемы качества повышения квалификации работников образования" (г. Воронеж, 2004 г.), научно-технических конференциях профессорско-преподавательского состава Пензенского государственного университета (2000-2005 гг.).

Публикации. По материалам диссертации опубликовано 14 печатных работ. В работах, выполненных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежит: в [1] - разработка системы, предназначенной для проведения анализа состояния системы образования, описание характерных особенностей и перспектив применения таких систем; в [5,7,12] - разработка программной оболочки OLAP-клиента, обеспечивающего анализ информации в рамках общей системы мониторинга, использующей технологии OLAP и ГИС, в [11, 13] - описание технической реализации и аспектов практического применения разработанной системы мониторинга на основе технологии OLAP.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 143 наименования, приложения, содержащего акты внедрения. Основная часть работы изложена на 163 машинописных страницах, содержит 39 рисунков и 6 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цели и задачи исследования, отражена научная новизна и приведены основные практические результаты работы.

В первой главе рассматриваются существующие методы мониторинга и технология оперативного анализа данных. Мониторинг любой системы сводится к трем основным этапам:

1. Инвентаризация и сбор первичной информации. Общепринятые методы сбора первичной информации заимствуются из арсенала социологии, статистики, психологии, этнографии и т. п.

2. Аналитическая и статистическая обработка. Недостатком общепринятых в настоящее время подходов является то, что вся совокупность данных обрабатывается в них как разрозненное множество. Традиционные методы не учитывают того факта, что между любого рода явлениями и событиями могут существовать неявные причинно-следственные связи, взаимовлияющие факторы, скрытые тенденции. Подход к проблеме аналитической и статистической обработки данных на основе технологии OLAP преодолевает этот недостаток

традиционных методов, позволяя перевести мониторинг на качественно более высокий уровень.

3. Этап представления результатов. Данный этап также является одним из слабых мест традиционных способов мониторинга. Он имеет особую важность, поскольку направлен, в первую очередь, на поддержку деятельности лиц, принимающих решения. То, насколько наглядно и оперативно будут сформированы отчеты мониторинга, определяет правильность, актуальность и своевременность принимаемых решений. Технология OLAP позволяет рассматривать проблему представления результатов мониторинга с принципиально новых и расширенных позиций. Наиболее существенными преимуществами по сравнению с традиционными системами являются:

• высокая степень наглядности результатов мониторинга;

• лёгкость формирования отчётов, разработкой которых могут заниматься даже пользователи, не обладающие специальными знаниями и навыками;

• соответствие принципу системного единства. Пользователь избавлен от необходимости самостоятельно разрабатывать технологию и правила совмещения разнотипной информации, собирать ее воедино из разрозненных и по-разному структурированных массивов данных и бумажных отчетов.

Проанализированы аспекты применения системы в конкретной предметной области на примере системы образования. Рассмотрены структурные и управленческие уровни иерархий образовательных учреждений, а также схема отчетности образовательных учреждений для организации процесса мониторинга. Сделан вывод о целесообразности применения технологии OLAP для мониторинга системы образования.

Во второй главе анализируются общепринятые подходы к организации данных, а также возможности применения многомерных моделей хранения и представления данных для эффективного использования ЭВМ в задачах мониторинга и управления.

Роль информации становится все более важной в современном обществе. Она приобретает решающее значение практически в любой сфере научно-технической деятельности. Особенно ценной явля-

ется та информация, которая представлена в динамике своего развития и изменения. До недавнего времени было осуществлено множество попыток разработать либо математическую, либо эвристическую модель сбора, хранения, представления и обработки слабоструктурированной информации. Большой объем доступной информации может даже затруднить решение проблемы без наличия эффективного инструментария автоматизированной обработки этой информации. Приблизиться к цели представилось возможным лишь с появлением мощных вычислительных систем, средств телекоммуникации и соответствующих периферийных устройств. Таким образом, скорость обработки информации стала соизмерима со скоростью ее внутренней динамики. После этого основной задачей явился поиск такой оптимальной компьютерной модели, которая с максимальной эффективностью решала бы конфликт между противоречивыми критериями скорости и качества, объема и наглядности обработки данных. Создание такой модели обеспечивает технология OLAP.

Термин OLAP (оперативный анализ данных) обозначает методы, которые дают возможность пользователям МБД в реальном времени генерировать описательные и сравнительные сводки данных и получать ответы на различные аналитические запросы. Концепция OLAP была описана в 1993 г. Э. Ф. Коддом, который сформулировал 12 определяющих принципов OLAP. Позже определение Э. Ф. Кодда было переработано в так называемый тест FASMI (Fast Analysis Shared Multidimensional Information), требующий, чтобы OLAP-приложение предоставляло возможности быстрого анализа разделяемой многомерной информации. Это определение впервые было сформулировано в начале 1995 г. и с тех пор не нуждалось в пересмотре.

OLAP-средства сосредоточены на обеспечении многомерного анализа информации. Для достижения этого используются многомерные модели хранения и представления данных. Данные организованы в кубах (или гиперкубах), которые определены в многомерном пространстве, состоящем из отдельных измерений. Каждое измерение включает множество уровней детализации информации (aggregation levels). Типичные операции OLAP включают операции изменения уровня детализации представления информации (продвижение вверх и вниз по иерархии измерений), выбора определенных частей

куба и переориентации многомерного представления данных на экране.

Проведено сравнение основных подходов к реализации концепции OLAP с использованием метода непосредственной оценки и метода парных сравнений. Были учтены такие показатели, как модель представления многомерного пространства, поддержка уровней иерархий, языков запросов, аспекты физического представления данных в БД и др. Каждому из рассмотренных подходов был поставлен в соответствие векторный критерий Q = {Qu Q2, ..., Qs). Введя функцию полезности t/(Q), мы каждому векторному критерию можем поставить в соответствие численное значение полезности этого критерия. Процедура образования функции полезности называется свертыванием (объединением) векторного критерия оптимальности.

Щ Q)=thQr 0)

г=1

Здесь X, > 0 являются весовыми коэффициентами, которые задают в количественной шкале предпочтение г'-ro критерия по сравнению с другими критериями. Величина X, определяет важность ¿-го частного критерия оптимальности. При этом более важному критерию приписывается более высокий вес, а общая важность всех кри-

S

териев принимается равной единице ( = 1 ).

¿=1

Непосредственная оценка представляет собой процедуру приписывания объектам числовых значений в шкале интервалов. Эти значения соответствуют степени влияния того или иного объекта на результат. В процессе оценивания эксперт должен поставить в соответствие каждому объекту точку на числовой оси.

Используя метод парных сравнений, можно получить более точные результаты. Парное сравнение представляет собой процедуру установления предпочтения объектов при сравнении всех возможных пар. В отличие от метода непосредственной оценки, при котором осуществляется упорядочение всех объектов сразу, парное сравнение представляет для экспертов более простую задачу.

Количественные суждения о парах объектов представляются в виде матрицы размером пх п:

где ау - количественная оценка предпочтения объекта; и ~ число объектов;

г, у - номера строк и столбцов в матрице сравнений. Элементы а9 определены по следующим правилам:

1. Если йц = а, то о,,- = На, аф 0.

2. Если суждения г и у имеют одинаковую важность, то ау = ал = 1. Итак, матрица А имеет вид

Сравнение объектов во всех возможных парах не дает полного упорядочения всех объектов. Поэтому после расчета матрицы сравнений необходимо вычислить по ней весовые коэффициенты

Для обработки результатов группового экспертного оценивания использовался типовой итерационный алгоритм.

Рассчитав значения функций полезности для каждого из рассмотренных подходов, можно увидеть, что наибольшего значения они достигают при использовании стандарта OLE DB для OLAP, который был разработан Microsoft. Таким образом, при создании системы автоматизированного мониторинга является целесообразным придерживаться датой технологии.

Третья глава посвящена разработке специального информационного и программного обеспечения системы автоматизированного мониторинга. Общая структура предлагаемой системы анализа ин-

А = (aij), (i,j= 1,2, ... ,п),

А =

1 «12 - аы 1/ап 1 ... а2п ...... 1 ...

УЧп У°2п - 1

(2)

формации представлена на рис. 1. В разработанной системе можно выделить следующие основные компоненты:

• подсистему формирования структуры МБД;

• подсистему ввода и редактирования данных;

• подсистему переноса информации в МБД;

• подсистему взаимодействия с клиентской частью;

• подсистему просмотра и анализа информации (клиентская часть).

Базы данных

Подсистема формирования

структуры многомерной базы данных

Формирование типовых

Подсистема просмотра и анализа информации

Подсистема ввода и редактирования данных

XML-файл описания структуры

Промежуточная база данных

Подсистема взаимодействия с клиентской частью

Подсистема

переноса информации в многомерную базу данных

OLAP-сервер

Многомерная база данных

Рис. 1. Структура системы анализа информации

Подсистема формирования структуры МБД позволяет визуально проектировать её структуру подобно тому, как Microsoft Access позволяет формировать структуру реляционной базы данных. Пользователь может легко изменять эту структуру под какие-либо конкретные особенности хранимой информации. Применение данной под-

системы позволяет пользователю, не имеющему специальных знаний, создать или изменить структуру МБД. Кроме того, это ускоряет работу и позволяет устранить ошибки, которые могли бы возникнуть при создании необходимой структуры вручную.

Подсистема ввода и редактирования данных предназначена для создания промежуточной базы данных, на основе которой будет ♦ формироваться МБД. В качестве исходных данных используются

табличные данные в формате Microsoft Excel, а также XML-файл, г созданный описанной выше подсистемой формирования структуры

i МБД, хранящий описание её структуры. Возможен приём информа-

ции из ранее созданных БД, что позволяет распараллелить процесс занесения информации между несколькими пользователями. Данная подсистема также может использоваться для редактирования данных и их предварительного просмотра (для этого не требуется наличие OLAP-сервера).

Подсистема переноса информации в МБД позволяет полностью автоматизировать процесс формирования структуры МБД и заполнения её информацией.

Подсистема взаимодействия с клиентской частью необходима для обеспечения сетевого взаимодействия с последней. Помимо работы в сети, возможен локальный режим работы. Благодаря наличию данной подсистемы не требуется устанавливать никакого специального программного обеспечения на стороне клиента. Кроме того, эта подсистема предоставляет клиенту дополнительные возможности, например, загрузку запросов с сервера. Данная подсистема выполняется на стороне сервера.

Подсистема просмотра и анализа информации обеспечивает для пользователя дружественный интерфейс. Пользователь может просматривать информацию в виде таблиц, диаграмм, гистограмм. Имеется возможность проведения статистических расчетов, а также отображение информации на электронной географической карте. Важной особенностью является то, что анализ не требует от пользователя владения специальными навыками и знаниями. , Разработанная система предоставляет возможность использования

в качестве OLAP-сервера Microsoft SQL Server Analysis Services. Данный компонент является полнофункциональным OLAP-сервером

и входит в состав Microsoft SQL Server. Если по каким-либо причинам пользователь не желает или не может использовать этот продукт (например, при использовании неподходящей версии ОС Windows), то возможна конфигурация системы на использование разработанного OLAP-сервера, применение которого вместо стандартного позволит уменьшить число компонентов системы автоматизированного мониторинга и тем самым существенно упростить работу с ней пользователя. Кроме того, разработанный OLAP-сервер обеспечивает следующие преимущества по сравнению с OLAP-сервером, реализованным Microsoft:

• возможность работы с любой версией ОС Windows;

• не требуется проводить процедуру инсталляции ПО;

• меньший занимаемый объем на диске (более чем в 100 раз);

• более высокая производительность (в 1,5-2 раза).

В четвертой главе обсуждаются вопросы, посвященные методологическим и прагматическим аспектам применения разработанной системы. Описываются разработанные алгоритмы формирования МБД, а также последовательность этапов проведения анализа информации.

Перед тем, как загрузить информацию в МБД, её следует извлечь из разных источников, очистить, преобразовать и консолидировать (рис. 2). В дальнейшем эта информация должна периодически обновляться. Применительно к анализируемым данным по системе образования Пензенской области такие обновления происходят один раз в год.

Но лишь очень немногие источники данных обеспечивают удовлетворительный контроль информации. Поэтому, прежде чем заносить информацию в БД, обязательно требуется выполнить её очистку. Очистка предусматривает заполнение отсутствующих значений, корректировку опечаток, определение стандартных сокращений и форматов, замену синонимов стандартными идентификаторами и т. д. Следует отметить, что полученная при выполнении очистки информация может использоваться для выявления ошибок в источниках данных и последующего повышения качества содержащейся в них информации.

Рис. 2. Этапы подготовки данных для анализа

После очистки данных необходимо преобразовать всю полученную информацию в формат, который будет отвечать требованиям используемого программного продукта (OLAP-сервера). Процедура преобразования приобретает особую важность, когда необходимо объединить данные, поступившие из нескольких разных источников (консолидация информации).

Этап загрузки информации в МБД заключается в создании необходимой структуры данных и заполнении её информацией, полученной на предыдущих этапах подготовки данных.

Разработанная система позволяет автоматизировать весь процесс подготовки данных. Для очистки данных служит разработанная подсистема, которая интегрируется в Microsoft Excel и позволяет проводить контроль исходных табличных данных. Подсистему очистки данных целесообразно применять, когда происходит занесение информации из печатных источников, поскольку в процессе распознавания часто возникают различные неточности.

Процесс загрузки информации в многомерную базу данных полностью автоматизирован и выполняется системой без участия пользователя.

При анализе информации пользователь может выбрать её из МБД различными способами:

- выбрав из списка заранее разработанных запросов требуемый запрос. Предусмотрена возможность пополнения данного списка типовыми запросами, которые формируются в автоматизированном режиме;

- воспользовавшись разработанным компонентом визуального построения запросов. Получившийся запрос затем можно сохранить в списке стандартных запросов;

- набрав запрос непосредственно в окне запросов. Выборка информации осуществляется с помощью SQL запросов со специальными расширениями MDX (Multidimensional Expressions).

Например, пользователя интересует, как сильно различаются оценки по математике, полученные в школе на выпускных экзаменах и на вступительных экзаменах в вуз (или при проведении единого государственного экзамена), и как эта разница зависит от образовательного уровня педагогических работников школ. Если стандартного запроса, который выдаст требуемую информацию, нет, то будет целесообразным воспользоваться мастером создания запросов. Пользователю необходимо указать, какие данные ему требуются: разница средних баллов по математике и, например, процент педагогов, имеющих высшее образование. Кроме того, нужно указать, по каким группам образовательных учреждений требуется получить материалы: по отдельной школе, по всем школам населённого пункта, по всем школам района или по всем школам области. В рассматриваемом примере выбраны школы Пензенской области, сгруппированные по районам. Так как используемый для хранения данных многомерный куб содержит три измерения, то необходимо также конкретизировать оставшееся измерение - время, указав, например, 2000 год. Выбор указанных элементов приводит к автоматической генерации следующего запроса:

select

поп empty {[РARAMS].[Разница по предметам].[математика (письменно)], [PARAMS].[Состав педагогических кадров школ].[Имеют образование - высшее, %]} on columns,

поп empty {[OBJECTS].[Районы].children} on rows from Penza where [TIME].[2000]

В результате выполнения этого запроса пользователь получит таблицу с интересующими его данными. Для облегчения обнаружения зависимостей можно рассчитать коэффициент корреляции, который в данном случае составляет -0,44. Расчёт коэффициентов корреляции, как и многих других вычислений, полностью автоматизиро-

ван. Отрицательный коэффициент корреляции свидетельствует об обратной зависимости (т. е. чем больше учителей в школе имеют высшее образование, тем меньше разница в оценках).

Для наглядного представления информации можно отобразить её на географической карте, для чего предусмотрены механизмы совместного функционирования среды ГИС (геоинформационные системы) и OLAP. Весь процесс отображения информации на карте полностью автоматизирован. Допустим, пользователя интересует распределение абитуриентов по различным вузам, а также процент их поступления в вузы. В этом случае после реализации соответствующего запроса пользователь может отобразить результирующие данные на электронной географической карте. При этом, подведя указатель мыши к интересующему его объекту, пользователь может ознакомиться с детальной информацией по объекту (например, узнать точное число абитуриентов, поступающих в каждый вуз из данного района). Кроме того, возможно изменение режима визуализации данных с целью учёта особенностей отображаемой информации.

Таким образом, в течение нескольких секунд пользователь может выбрать необходимые ему данные и наглядно их представить.

В заключении формулируются основные полученные результаты.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. В целях устранения недостатков существующих методов мониторинга, выявленных при их анализе, предложено использовать технологию OLAP. Сформулированы задачи, требующие своего решения в рамках данной работы (разработка моделей данных, эффективных методов сбора первичных данных, приложений по осуществлению многомерного анализа), которые обусловливают ее актуальность и практическую значимость.

2. Проведено сравнение основных подходов к реализации концепции OLAP с использованием метода непосредственной оценки и метода парных сравнений. Были учтены такие показатели, как модель представления многомерного пространства, поддержка уровней иерархий, языков запросов, аспекты физического представления данных в БД и др. Сделан вывод о целесообразности

использования стандарта OLE DB для OLAP, разработанного Microsoft.

3. Сформулированы и решены следующие задачи, возникающие при создании систем автоматизированного мониторинга на основе технологии OLAP:

- автоматизированное формирование структуры МБД с помощью разработанного компонента визуального проектирования;

- организация процесса автоматизированного занесения информации в БД для ее последующего анализа;

- отображение МБД в реляционную БД с возможностью занесения и редактирования данных и метаданных в реальном времени;

- автоматическое отображение информации на географических картах, не требующее от пользователя проведения сложных операций по обеспечению соответствия названий географических данных с данными многомерного куба.

4. Разработана и реализована система автоматизированного мониторинга, имеющая в своём составе следующие основные компоненты:

- подсистема создания и заполнения МБД. Многомерность реализована на концептуальном уровне, для хранения информации используются реляционные БД. Реализован автоматизированный прием данных из стандартных табличных форм;

- OLAP-клиент, позволяющий пользователям, не имеющим специальных знаний, проводить анализ информации. Данный продукт отличается от существующих аналогов наличием мастера запросов, который позволяет визуально выбирать необходимую информацию из МБД, и возможностью отображения результатов на географической карте. Кроме того, реализованы различные методы прогнозирования информации;

- сервер OLAP, обеспечивающий выполнение всех основных видов запросов. Данный сервер удовлетворяет концепции ROLAP и характеризуется наличием следующих дополнительных свойств: высокая производительность, мобильность, простота установки и использования.

5. Рассмотрена последовательность, и описано содержание этапов проведения анализа информации с помощью разработанной системы мониторинга. Данные этапы включают извлечение информации, ее очистку, преобразование, объединение данных из различных источников и занесение их в МБ Д.

6. Разработано несколько проектов с помощью созданной системы мониторинга информации, в том числе создана БД по образовательным учреждениям Пензенской области. На примере создания запросов к этой БД показаны возможности применения разработанной системы.

7. Исследования работы с системой мониторинга информации показали, что применение разработанной системы, а также визуального конструктора структуры МБД даёт возможность провести более глубокий анализ информации, на порядок сократить сроки анализа и снизить трудоёмкость процесса.

Основные публикации но теме диссертации

1. Гудков П. А. Использование многомерных баз данных для анализа состояния системы образования / П. А. Гудков, Т. А. Макурина // Университетское образование: Сб. материалов VI Междунар. науч,-метод. конф. - Пенза, 2002. - С. 106-108.

2. Гудков П. А. Система анализа состояния образовательных учреждений на основе технологии OLAP // Вестник молодых ученых 11111У им. В. Г. Белинского: Сб. науч. ст. студентов и аспирантов университета. - Пенза, 2002. - С. 60-62.

3. Гудков П. А. Автоматизированная система анализа статистической информации на основе многомерных баз данных // Информационные технологии в науке, проектировании и производстве: Сб. материалов V Всерос. науч.-техн. конф. - Н. Новгород, 2002. - С. 7.

4. Гудков П. А. Разработка информационно-аналитической системы для мониторинга состояния научной и производственной сферы региона // Информационные технологии и системы в образовании, науке, бизнесе: Материалы IV Междунар. науч.-техн. конф. -Пенза, 2002. - С. 23-24.

5. Бождай А. С. Интеграция технологий OLAP и ГИС для поддержки процесса управления в системе образования / А. С. Бождай,

П. А. Гудков, А. И. Дударенко // Университетское образование: Сб. материалов VII Междунар. науч.-метод. конф. - Пенза, 2003. - С. 503 -505.

6. Гудков П. А. Визуализация пространственных данных в системах анализа информации // Инновации в образовании: Материалы I науч.-метод. конф. - Пенза, 2003. - С. 31 -32.

7. Интеграция технологий OLAP и ГИС для поддержки процесса управления в системе образования / А. М. Бершадский, А. С. Бождай, П. А. Гудков, А. И. Дударенко // Информационные технологии в науке, образовании, телекоммуникации, бизнесе: Материалы XXX юбилейной Междунар. конф. и I Междунар. конф. молодых ученых, Украина, Крым, 19-28 мая. - Ялта-Гурзуф, 2003. - С. 273-274.

8. Гудков П. А. Анализ возможности организации удаленного доступа к базам данных при разработке информационно-аналитических систем // Вестник молодых ученых ПГГГУ им. В. Г. Белинского: Сб. науч. ст. студентов, аспирантов и молодых сотрудников университета. - Пенза, 2003. - С. 47-49.

9. Гудков П. А. Особенности организации данных в системах анализа информации // Актуальные проблемы науки и образования: Тр. Междунар. юбилейного симпозиума (АПНО-2003): В 2-х т. - Т. 2 / Под ред. д.т.н., проф. М. А. Щербакова. - Пенза, 2003. - С. 442-443.

10. Гудков П. А. Применение OLAP-технологий в информационно-аналитических системах // Университетское образование: Сб. материалов VTIT Междунар. науч.-метод. конф. - Пенза, 2004. - С. 92-93.

11. Многомерная геоинформационная аналитическая система для поддержки принятия решений в сфере регионального образования / А. М. Бершадский, A.C. Бождай, П. А. Гудков, А. И. Дударенко// Успехи современного естествознания. - 2004. - № 5. - Прил. № 1. -С. 275-276.

12. Интеграция технологий OLAP и ГИС для мониторинга системы образования / А. М. Бершадский, А. С. Бождай, П. А. Гудков, А. И. Дударенко // Информационные технологии в образовании, технике и медицине: Материалы Междунар. конф., 18-22 октября. -Волгоград, 2004. - Т. 3. - С. 22-24.

13. Бершадский А. М. Использование технологии OLAP для мониторинга региональной системы образования / А. М. Бершадский,

А. С. Бождай, П. А. Гудков // Проблемы качества повышения квалификации работников образования: Материалы Межрегион, науч,-практ. конф. - Воронеж, 2004. - С. 136 - 139.

14. Гудков П. А. Автоматизированная очистка информации при создании многомерных баз данных // Университетское образование: Сб. материалов IX Междунар. науч.-метод, конф. - Пенза, 2005. -С.96-97.

Гудков Павел Анатольевич

Разработка системы автоматизированного мониторинга на основе технологии OLAP

Специальность 05.13.10 — Управление в социальных и экономических системах (технические науки)

Редактор Т. Н. Судовчихина Технический редактор Н. А. Вьялкова

Корректор Ж. А. Лубенцова Компьютерная верстка С. П. Черновой

ИД № 06494 от 26.12.01 Сдано в производство 16.05 05. Формат 60х84'/16. Бумага писчая. Печать офсетная. Усл. печ. л 1,16. Заказ № 333. Тираж 100.

Издательство Пензенского государственного университета. 440026, Пенза, Красная, 40.

ч

»12909

РНБ Русский фонд

2006-4 13511

Оглавление автор диссертации — кандидата технических наук Гудков, Павел Анатольевич

Введение.

1. Информационный мониторинг и технология оперативного анализа данных.

1.1. Основные методы мониторинга.

1.2. Технология OLAP и системы поддержки принятия решений.

1.3. Организация процесса мониторинга на примере системы образования.

Выводы.

2. Организация данных в задачах мониторинга и управления.

2.1. Особенности применения стандартных БД.

2.2. OLAP-системы.

2.3. Выбор подхода к организации многомерных данных.

Выводы.

3. Разработка специального информационного и программного обеспечения системы мониторинга.

3.1. Этапы разработки автоматизированной системы мониторинга.

3.2. Особенности использования компонента Analysis Services.

3.3. Разработка ПО системы автоматизированного мониторинга.

Выводы.

4. Методические и практические аспекты применения разработанной системы.

4.1. Этапы проведения анализа информации.

4.2. Выборка информации из многомерных баз данных.

4.3. Организация взаимодействия с пользователем.

4.4. Технология работы с OLAP-компонентом.

Выводы.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Гудков, Павел Анатольевич

В настоящее время во многих сферах человеческой деятельности остро стоят вопросы информационного наблюдения, оценивания, контроля и управления — или, иными словами, информационного мониторинга. Для существующих методов мониторинга характерны недостаточные оперативность и степень учета окружающих факторов (невозможность совместного анализа больших групп параметров в их системном единстве), а также высокая трудоемкость. Особую актуальность проблема мониторинга приобретает тогда, когда информация об исследуемой предметной области сложно структурирована и отражает различные стороны функционирования каких-либо объектов.

Данная работа направлена на разработку технологий мониторинга социально-экономических систем с использованием многомерных баз данных (МВД) и технологии OLAP (Online Analytical Processing) на примере региональной системы образования. Технология OLAP позволяет усовершенствовать методы мониторинга, в частности, перевести их на качественно более высокий уровень. При этом практическую значимость и актуальность приобретают автоматизированное проектирование структуры МВД, организация процесса автоматизированного занесения информации в базу данных (БД) для её последующего анализа, отображение МВД в реляционную БД, автоматическое отображение информации на географических картах и т. д. Необходимо также предусмотреть возможность проведения анализа информации пользователями, не имеющими специальной квалификации.

При использовании технологии OLAP информация, как правило, агрегируется и представляется в виде многомерного куба, стороны которого соответствуют различным аналитическим разрезам (аспектам, по которым проводится анализ массива данных). При этом существенно повышается скорость ответа на пользовательские запросы.

Система, основанная на технологии OLAP, будет особенно полезна при работе с большими объёмами данных. В частности, её можно использовать региональным образовательным учреждениям, которым ежегодно требуется проводить обработку множества отчетных данных.

Согласно приказу №1711 от 24.06.1998 Министерства общего и профессионального образования РФ, Министерство образования России наметило и уже реализовало ряд мер в системе статистического наблюдения, выдвигаемых очередным этапом реформирования российского образования, а именно, разработку проблемы мониторинга образования, создания системы показателей и индикаторов, интегрированных в международное образовательное пространство.

Помимо использования основанного на технологии OLAP программного обеспечения для мониторинга системы образования, можно выделить следующие перспективные области его применения: системы автоматизированного проектирования, корпоративное управление и планирование, социально-экономические и политические исследования, медицина и здравоохранение, охрана окружающей среды, управление использованием природных ресурсов, рекламная и консалтинговая деятельность и др.

Цель и задачи исследования

Целью диссертационной работы является исследование проблемы мониторинга и анализа информации с использованием технологии OLAP, а также разработка системы автоматизированного мониторинга на основе данной технологии и методики ее применения на примере данных образовательной статистики. Для достижения поставленной цели необходимо решить следующие задачи: 1. Анализ существующих методов мониторинга и поиск путей повышения качества мониторинга.

2. Разработка модели представления данных в МБД и эффективных методов подготовки данных для анализа.

3. Разработка автоматизированной системы мониторинга. Определение её структуры и функций входящих в неё модулей. Данная система должна состоять из серверной части для создания и ведения МБД, а также OLAP-клиента, предоставляющего пользователям, не имеющим специальных знаний, возможность проведения анализа информации.

4. Экспериментальные исследования различных этапов анализа информации на основе МБД и технологии OLAP, включая и те, которые касаются предварительной подготовки данных.

5. Апробация разработанной системы в конкретной предметной области. Создание и заполнение МБД информацией по образовательным учреждениям Пензенской области с последующим ее анализом.

6. Разработка рекомендаций для автоматизированного проектирования структуры МБД на основе визуального конструктора - мастера создания МБД, ввода исходных данных и проведения анализа информации.

Основные методы исследования

При решении поставленных задач использовались методы структурного и системного программирования, автоматизированного проектирования, принципы модульного и объектно-ориентированного проектирования, принципы и методы построения трансляторов, теории баз данных, методы математической статистики.

Научная новизна исследования. Разработана технология проведения мониторинга, позволяющая повысить его эффективность, осуществить анализ больших групп параметров в их системном единстве.

Предложена архитектура универсальной системы автоматизированного мониторинга, которая позволяет организовать данные для их анализа на основе технологии OLAP и провести собственно анализ этих данных. Отличительной особенностью данной системы является то, что пользователь может работать с ней, не имея специальных знаний.

Разработана методика автоматизированной подготовки и анализа данных. Отличительной особенностью предлагаемого подхода является наличие автоматизированных этапов очистки информации и поиска закономерностей.

Предложены алгоритмы, позволяющие в реальном времени редактировать многомерный куб. Они отличаются от аналогов отсутствием жесткой привязки к структуре МБД.

Разработана методика визуального проектирования структуры МБД, что позволяет автоматизировать процесс создания необходимой структуры в соответствии с требованиями, предъявляемыми к БД в конкретной предметной области.

Предложены методы интеграции технологий OLAP и ГИС (геоинформационные системы) с целью отображения необходимой информации на электронных географических картах.

Практическая значимость. Предложенная технология мониторинга социально-экономических систем с использованием технологии OLAP позволяет устранить недостаточную оперативность анализа данных существующих методов мониторинга, их высокую трудоемкость и недостаточную степень учета окружающих факторов.

Разработанные алгоритмы формирования МБД существенно сокращают сроки подготовки данных для их последующего анализа с использованием технологии OLAP.

Разработана программная реализация системы автоматизированного мониторинга на основе технологии OLAP, имеющая в своем составе подсистемы формирования структуры МБД, ввода и редактирования данных, просмотра и анализа информации (клиентская часть) и др. Разработанное программное обеспечение (ПО) функционирует на платформе Win32 (Windows 95/98/Me/NT/2000/XP/2003).

Даны практические рекомендации по использованию разработанной системы, предложена последовательность и описано содержание этапов подготовки и анализа информации.

На основании теоретических и экспериментальных исследований доказана эффективность применения технологии OLAP для мониторинга и анализа состояния системы образования.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах: VI международная научно-методическая конференция "Университетское образование" (Пенза, 2002 г.), V Всероссийская научно-техническая конференция "Информационные технологии в науке, проектировании и производстве" (Нижний Новгород, 2002 г.), IV международная научно-техническая конференция "Информационные технологии и системы в образовании, науке, бизнесе" (Пенза, 2002 г.), VII международная научно-методическая конференция "Университетское образование" (Пенза, 2003 г.), I научно-методическая конференция "Инновации в образовании" (Пенза, 2003 г.), XXX юбилейная международная конференция и I международная конференция молодых ученых "Информационные технологии в науке, образовании, телекоммуникации, бизнесе" (Ялта-Гурзуф, 2003 г.), международный юбилейный симпозиум "Актуальные проблемы науки и образования (АПНО-2003)" (Пенза, 2003 г.), VIII международная научно-методическая конференция "Университетское образование" (Пенза, 2004 г.), XXXI международная конференция "Информационные технологии в науке, образовании, телекоммуникации и бизнесе" (Ялта-Гурзуф, 2004 г.), международная конференция "Информационные технологии в образовании, технике и медицине" (Волгоград, 2004 г.), межрегиональная научно-практическая конференция "Проблемы качества повышения квалификации работников образования" (Воронеж, 2004 г.), IX международная научно-методическая конференция "Университетское образование" (Пенза, 2005 г.), научно-технические конференции профессорско-преподавательского состава

Пензенского государственного университета (2000-2005 гг.).

Публикации. По материалам диссертации опубликовано 14 печатных работ.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 143 наименования, приложения, содержащего акты внедрения. Основная часть работы изложена на 163 машинописных страницах, содержит 39 рисунков и 6 таблиц.

Заключение диссертация на тему "Разработка системы автоматизированного мониторинга на основе технологии OLAP"

Основные результаты теоретических и экспериментальных исследований, приведенных в диссертационной работе в соответствии с поставленной целью, могут быть сформулированы следующим образом:

1. Проведенный анализ существующих методов мониторинга показал их недостаточную оперативность, высокую трудоемкость, недостаточную степень учета окружающих факторов (невозможность совместного анализа больших групп параметров в их системном единстве).

2. В целях устранения выявленных недостатков предложено использовать технологию OLAP. Сформулированы задачи, требующие своего решения в рамках данной работы (разработка моделей данных, эффективных методов сбора первичных данных, приложений по осуществлению многомерного анализа), которые обуславливают ее актуальность и практическую значимость.

3. Проведено сравнение основных подходов к реализации концепции OLAP с использованием метода непосредственной оценки и метода парных сравнений. Были учтены такие показатели, как модель представления многомерного пространства, поддержка уровней иерархий, языков запросов, аспекты физического представления данных в БД и др. Сделан вывод о целесообразности использования стандарта OLE DB для OLAP, разработанного Microsoft.

4. Сформулированы и решены следующие задачи, возникающие при создании систем автоматизированного мониторинга на основе технологии OLAP:

- Автоматизированное формирование структуры МБД с помощью разработанного компонента визуального проектирования.

- Организация процесса автоматизированного занесения информации в БД для ее последующего анализа.

- Отображение МБД в реляционную БД с возможностью занесения и редактирования данных и метаданных в реальном времени. - Автоматическое отображение информации на географических картах, не требующее от пользователя проведения сложных операций по обеспечению соответствия названий географических данных с данными многомерного куба.

5. Разработана система, позволяющая создавать и вести МБД. Многомерность реализована на концептуальном уровне, для хранения информации используются реляционные БД. Реализован автоматизированный прием данных из стандартных форм статистической отчетности. Описана архитектура системы и детализированные схемы ее основных компонентов.

6. Разработан OLAP-клиент, позволяющий пользователям, не имеющим специальных знаний, проводить анализ информации. Данный продукт отличается от существующих аналогов наличием мастера запросов, который позволяет визуально выбирать необходимую информацию из МБД, и возможностью отображения результатов на географической карте. Кроме того, реализованы различные методы прогнозирования информации.

7. Разработан сервер OLAP, обеспечивающий выполнение всех основных видов запросов. Данный сервер удовлетворяет концепции ROLAP и характеризуется наличием следующих дополнительных свойств: высокая производительность, мобильность, простота установки и использования.

8. Предложен и реализован более эффективный подход к созданию и заполнению МБД по сравнению с методом, использующимся в традиционных системах OLAP. Данный подход основан на принципе изначального создания необходимой структуры в реляционной БД для моделирования многомерных кубов данных, вместо преобразования уже существующих схем.

9. Рассмотрена последовательность и описано содержание этапов проведения анализа информации с помощью разработанной системы мониторинга. Данные этапы включают извлечение информации, ее очистку, преобразование, объединение данных из различных источников и занесение их в МБД.

10. Разработано несколько проектов с помощью созданной системы мониторинга информации, в том числе создана БД по образовательным учреждениям Пензенской области. На примере создания запросов к этой БД показаны возможности применения разработанной системы.

11. Исследования работы с системой мониторинга информации показали, что применение разработанной системы, а также визуального конструктора структуры МБД, даёт возможность провести более глубокий анализ информации, на порядок сократить сроки анализа и снизить трудоёмкость процесса.

Заключение

Библиография Гудков, Павел Анатольевич, диссертация по теме Управление в социальных и экономических системах

1. Автоматизированная система государственной статистики. / Под ред. Волкова С. И., Романова А. Н. М.: Статистика, 1979 г., 307 с.

2. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. -М.: ЮНИТИ, 1998 г.

3. Армстронг Р. Семь этапов оптимизации производительности хранилища данных // Открытые системы, №1, 2002 г.

4. Артемьев В. Что такое Business Intelligence? // Открытые системы, №4, 2003 г.

5. Архангельский С. И. Лекции по научной организации учебного процесса в высшей школе. -М.: «Высшая школа», 1976 г., 200 с.

6. АСГС. Теория и практика. / Под ред. Эйдельмана М. Р., Рахманова М. К. -М.: Финансы и статистика, 1983 г., 170 с.

7. Батищев Д. И. Методы оптимального проектирования.: Учеб. пособие для вузов. -М.: Радио и связь, 1984 г.

8. Батоврин В. К., Сандлер Е. А. Обработка экспериментальных данных: Учеб. пособие // Моск. институт радиотехники, электр. и авт. М.: МИРЭА, 1992 г.

9. Батыгин Г. С. Обоснование научного подхода в прикладной социологии. М., Мысль, 1986 г., 211 с.

10. Бессонов Б. Н. Образование прорыв в XXI век. - М., сб. «Синергетика и образование», изд-во «Гнозис», 1997 г., стр. 4-13.

11. Бождай А. С. Разработка системы мониторинга образования в регионе на основе геоинформационной технологии // Диссертация на соискание ученой степени кандидата технических наук, Пенза, 2000 г.

12. Божко В. П., Брага В. В., Бубнова Н. Г. и др. Информатика: данные, технология, маркетинг. // Под. ред. А. Н. Романова — М.: Финансы и статистика, 1991 г., 224 с.

13. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений. Пер. с англ. -М.: Бином, 1998 г.

14. Васильев В., Журко Д. "Тяжелая" информация "легкая" ГИС // ArcReview, №4, 2003 г., стр. 21.

15. Васильев В. Н., Сигалов А. В. Информационные технологии в учебном процессе СПбГИТМО // Материалы Международной конференции-выставки "Информационные технологии в непрерывном образовании" // Петрозаводск, 1995 г.

16. Вебер М. Основные социологические понятия. // Избр. произв. М., 1990 г., стр. 601-628.

17. Вендров А. М. Проектирование программного обеспечения экономических информационных систем. М.: Финансы и статистика, 2000 г.

18. Волков И., Галахов И. Архитектура современной информационно-аналитической системы, Директор ИС, №3, 2002 г.

19. Гершунский Б. С. Философия образования для XXI века (в поисках практико-ориентированных образовательных концепций). М., «ИнтерДиалект+», 1997 г., 297 с.

20. Гудков П. А. Автоматизированная система анализа статистической информации на основе многомерных баз данных. "Информационные технологии в науке, проектировании и производстве" — сборник материалов V Всероссийской научно-технической конференции.

21. Нижний Новгород, 2002 г., стр. 7.

22. Гудков П. А. Визуализация пространственных данных в системах анализа информации. "Инновации в образовании" материалы I научно-методической конференции. - Пенза, 2003 г., стр. 31-32.

23. Гудков П. А. Применение OLAP-технологий в информационно-аналитических системах. "Университетское образование" сборник материалов VIII Международной научно-методической конференции. -Пенза, 2004 г., стр. 92-93.

24. Гудков П. А. Система анализа состояния образовательных учреждений на основе технологии OLAP. "Вестник молодых ученых ПГПУ им. В.Г.Белинского" — сборник научных статей студентов и аспирантов университета. Пенза, 2002 г., стр. 60-62.

25. Гудков П. А., Макурина Т. А. Использование многомерных баз данных для анализа состояния системы образования. "Университетское образование" сборник материалов VI Международной научно-методической конференции. - Пенза, 2002 г. стр. 106-108.

26. Гуляев А. И. Временные ряды в динамических базах данных. — М.: Радио и связь, 1989 г.

27. Дейт К. Дж. Введение в системы баз данных, 7-е издание.: Пер. с англ. М.: Издательский дом «Вильяме», 2001 г.

28. Джой Манди (под редакцией Ральфа Кимбалла) К вопросу об OLAP // Intelligent Enterprise, №22 (87), 2003 г.

29. Дунаев С. Б. Доступ к базам данных и техника работы в сети. Практические приёмы современного программирования. М.: ДИАЛОГ-МИФИ, 2000 г.

30. Дылян Г. Д. Управление процессом информатизации общего среднего образования в республике Беларусь // Информатика и образование, №7, 2003 г.

31. Дылян Г. Д., Ратобыльская Э. С. Моделирование процесса управления комплексной информатизацией системы образования района (города) // Информатика и образование, №3, 2003 г.

32. Залялов Ш. Р., Меркулов Е. Ю. Разработка методов оперативной обработки и анализа данных информационно-аналитической системы комитета по финансовому мониторингу Российской федерации //

33. Научная сессия МИФИ 2003, Москва, 2003: Сборник научных трудов. Т. 12. Информатика и процессы управления. Компьютерные системы и технологии. М.: Изд-во МИФИ, 2003 г., стр. 48-49.

34. Информационный сайт поддержки разработчиков систем на основе Business Objects, http://www.businessobjects.com/

35. Информационный сайт поддержки разработчиков систем на основе IBM DB2 Alphablox for Unix and Windows, http://www-306.ibm.com/software/data/db2/alphablox/

36. Информационный сайт поддержки разработчиков систем на основе продукции фирмы Cognos, http://www.cognos.com/

37. Информационный сайт поддержки разработчиков систем на основе продукции фирмы Microsoft, http://www.microsoft.com/

38. Информационный сайт поддержки разработчиков систем на основе продукции фирмы MicroStrategy, http://www.microstrategy.com/

39. Ким В. Три основных недостатка современных хранилищ данных // Открытые Системы, №2, 2003 г.

40. Кинелев В. Г. Образование и цивилизация. М., «Проблемы информатизации высшей школы», №2(6), 1996 г., стр. 7-14.

41. Костюк В. Н. Информация как социальный и экономический ресурс. — М.: «Магистр», 1997 г., 340 с.

42. Кравченко А. И. Введение в социологию. М.: Новая школа, 1995 г., 144 с.

43. Кузнецов С., Артемьев В. Обзор возможностей применения ведущих СУБД для построения хранилищ данных (Data Warehouse) // http://www.olap.ru/.

44. Кулагин В. П. Геоинформационные технологии новый шаг на пути совершенствования системы управления образованием // IV Всероссийской конференции «Геоинформатика и образование» (Форум ГИС 2000). -М.: ГИС-Ассоциация, 2000 г., стр. 5-8.

45. Кулагин В. П., СимоновА. В. Итоги и перспективы МНТП «Геоинформационные системы». // Тезисы докладов конференции «Телематика'99», Санкт-Петербург, 1999 г., стр. 23-25.

46. Кулагин В. П., Цветков В. Я., Булгакова Т. В. Особенности использования технологий OLAP для задач образовательной статистики // Вопросы Интернет-образования, №9, 2002 г.

47. Курейчик В. М., Нужнов Е. В. Возможности совершенствования образовательного процесса на основе информационных технологий // Труды Всероссийской конференции «Интеллектуальные информационные системы», Воронеж, 1999 г.

48. Львович Э. М., Фролов В. Н. Оптимизационная модель информационного обеспечения системы регионального управления. // Труды Всероссийской конференции «Интеллектуальные информационные системы», Воронеж, 1999 г., стр. 3.

49. Майоров A. Data Mining на службе у таможни, Открытые системы, №Ю, 2002 г.

50. Мартин Дж. Организация баз данных в вычислительных системах. — М.: Мир, 1989 г.

51. Методологические основы создания АСГС. / Под ред. Сиськова В. И. -М.: Статистика, 1977 г., 233 с.

52. Мешков А., Тихомиров Ю. Visual С++ и MFC. Программирование для Windows NT и Windows 95: в трёх томах. СПб.: BHV - Санкт-Петербург, 1997 г.

53. Некрасов В. Мобильный OLAP // Открытые системы, №5, 2003 г.

54. Некрасова О. JI. Новые информационные технологии в управлении качеством образовательного процесса в колледже // Информатика и образование, №11, 2003 г.

55. Норенков И. П. Основы автоматизированного проектирования: Учеб. для вузов. 2-е изд., перераб. и доп. М.: Изд-во МГТУ им. Н. Э. Баумана, 2002 г.

56. Основы социологии. Курс лекций. / Отв. редактор А. Г. Эфендиев. — М.: Об-во «Знание», 1993 г., 384 с.

57. Пархоменко А. В., Кузовенкова Н. А., Шинкарук О. В. Автоматизированная система анализа финансово-экономических показателей деятельности предприятия // Радюелектрон. 1нформат. Укр, №1, 2003 г., стр. 95-98.

58. Радугин А. А., Радугин К. А. Социология: курс лекций. М.: Центр, 1997 г., 160 с.

59. РыковА. С. Методы системного анализа: многокритериальная и нечеткая оптимизация, моделирование и экспертные оценки. М.: Экономика, 1999 г.

60. Сахаров А. А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Express Server). СУБД, №3, 1996 г.

61. Смирнова Г. Н., Сорокин А. А., Тельнов Ю. Ф. Проектирование экономических информационных систем. М.: Финансы и статистика, 2001 г.

62. Стулов А. Особенности построения информационных хранилищ // Открытые системы, №4, 2003 г.

63. Сураджит Чаудхури, Умешвар Дайал, Венкатеш Ганти Технология баз данных в системах поддержки принятия решений // Открытые системы, №1,2002 г.

64. Тихонов А. Н., Богатырь Б. Н. Моделирование и концептуальное проектирование процессов информатизации сферы образования. — М., «Проблемы информатизации высшей школы», №1-2(7-8), 1997 г., стр. 9-12.

65. Тюрин Ю. Н., Макаров А. А Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. - М.: ИНФРА-М, 2003 г.

66. Хонекамп Д., Вилькен П. Введение в профессиональное программирование под Windows // Пер. с нем. М.: ЭКОМ., 1996 г.

67. Ширяев Д., Аншелес В., Мочалин В. Сбор и обработка информации для принятия управленческих решений // Открытые системы, №4, 2001 г.

68. Шураков В. В., Дайитбегов Д. М., Мизрохи С. В., Ясеновский С. В. Автоматизированное рабочее место для статистической обработки данных. -М.: Финансы и статистика, 1990 г., 165 с.

69. Ядов В. А. Социологическое исследование: методология, программа, методы. М.: «Высшая школа», 1987 г., 436 с.

70. Todd Abel. Microsoft Office 2000: Create Dynamic Digital Dashboards Using Office, OLAP, and DHTML // MSDN Magazine, July, 2000.

71. R. Agrawal, A. Gupta, S. Sarawagi. Modeling Multidimensional Databases. IBM Research Report, IBM Almaden Research Center, September 1995.

72. AnkerstM., Berchtold S., KeimD. A. Similarity Clustering of Dimensions for an Enhanced Visualization of Multidimensional Data // University of Munich, AT&T Laboratories, Martin Luther University.

73. Arbor Software Corporation. Arbor Essbase. http://www.arborsoft.com/ essbase.html, 1996.

74. F. Baader, U. Sattler. Description Logics with Concrete Domains and Aggregation. Proc. Of the 13th European Conference on Artificial Intelligence (ECAI-98). 1998.

75. E. Baralis, S. Paraboschi, E. Teniente. Materialized View Selection in a Multidimensional Database. In 23rd VLDB Conference, Athens, August 1997.

76. Bob Beauchemin. Using OLE DB and ADO 2.5 to Represent Nonlinear, Nonrelational Types of Data // Microsoft Systems Journal, November, 1999.

77. Andrew Brust. Write Useful and Complex Queries with MDX // Visual Basic Programmer's Journal, July, 2000.

78. L. Cabbibo, R. Torlone. A Logical Approach to Multidimensional Databases. In 6th EDBT, 1998.

79. L. Cabbibo, R. Torlone. Querying Multidimensional Databases. 6th DBPL Workshop, 1997.

80. L. Cabbibo, R. Torlone. From a Procedural to a Visual Query Language for OLAP. In 10th SSDBM Conference, Italy, July 1998.

81. Codd E. F., Codd S. В., Salley С. T. Providing OLAP (Online Analytical Processing) to User-Analysts: An IT Mandate, available from Arbor Software Corp.- 1993.

82. George Colliat. OLAP, Relational, and Multidimensional Database Systems. SIGMOD Record, Vol. 25, No. 3, September 1996.

83. Edmund X. Dejesus Dimensions of Data, Byte Archive, April 1995.

84. Dino Esposito. With Further ADO: Coding Active Data Objects 2.0 with Visual Studio 6.0 // Microsoft Systems Journal, February, 1999.

85. M. Gebhardt, М. Jarke, S. Jacobs. A Toolkit for Negotiation Support Interfaces to Multidimensional Data. In Proc. Of the 1997 ACM SIGMOD Conf., Arizona, USA, 1997.

86. David Geer, Federated Approach Expands Database-Access Technology. IEEE Computer, May 2003.

87. Mike Gilbert. Office 2000: A First Look // Microsoft Office and VBA Developer, August, 1998.

88. F. Gingras, L. Lakshmanan. nD-SQL: A Multi-dimensional Language for Interoperability and OLAP. Proceedings of the 24th VLDB Conference, N. York, August 1998.

89. J.Gray, A. Bosworth, A. Layman, H. Pirahesh. Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tabs, and Sub-Totals. Proceedings of ICDE '96, New Orleans, February 1996.

90. M. Gyssens, L. V. S. Lakshmanan. A Foundation for Multi-Dimensional Databases. In 23rd VLDB Conference, Athens, August 1997.

91. James P. Ignizio. Introduction to expert systems: the development and implementation of rule-based expert systems, McGraw-Hill, Inc., 1991.

92. Informix, Inc.: The INFORMIX-MetaCube Product Suite. http://www.informix.com/informix/products/newplo/metabro/ metabro2.htm, 1997.

93. KeimD. A., AnkerstM. Visual Data Mining and Exploration of Large Databases //Tutorial at PKDD'2001, Freiburg, Germany, 2001.

94. Ralph Kimball. A Dimensional Modeling Manifesto // DBMS and Internet Systems, August 1997.

95. Ralph Kimball. Data Warehouse Architect // DBMS and Internet Systems, August 1997.

96. R. Kimball. The Data Warehouse Toolkit: Practical techniques for building dimensional data warehouses. John Wiley. 1996.

97. Leslie Koorhan. Data Warehouses, OLAP, and You // Fox Talk, July, 2000.

98. W. Lehner, J. Albrect, H. Wedekind. Normal Forms for Multidimensional Databases. In 10th SSDBM Conference, Italy, July 1998.

99. W. Lehner. Modeling Large Scale OLAP Scenarios. In 6th EDBT, 1998.

100. H. Lenz, A. Shoshani. Summarizability in OLAP and Statistical databases. In 9th SSDBM Conference, 1997.

101. C.Li, X.Sean Wang. A Data Model for Supporting On-Line Analytical Processing. CIKM 1996.

102. Metadata Coalition: Meta Data Interchange Specification, (MDIS Version 1.1), August 1997, available at http://www.he.net/~metadata/ standards/

103. Microsoft Corp. OLEDB for OLAP February 1998. Available at http://www.microsoft.com/data/oledb/olap/

104. Microsoft SQL Server 7.0 Resource Guide // Microsoft Corporation, 1999.

105. MicroStrategy, Inc. MicroStrategy's 4.0 Product Line. http://www.strategy.com/launch/40arcl .htm, 1997.

106. MicroStrategy, Inc. Relational OLAP: An Enterprise-Wide Data Delivery Architecture. White Paper, http://www.strategy.com/wpail.htm, 1995.

107. Multiple Hierarchies per Dimension // SQL Server Magazine, September, 1999.

108. Carl Nolan. Manipulate and Query OLAP Data Using ADOMD and MDX, Part II: Writing the App // Microsoft Systems Journal, September, 1999.

109. Carl Nolan. Manipulate and Query OLAP Data Using ADOMD and Multidimensional Expressions // Microsoft Systems Journal, August, 1999.

110. OLAP Council. OLAP AND OLAP Server Definitions. 1997 Available at http://www.olapcouncil.org/research/glossaryly.htm

111. OLAP Council. The APB-1 Benchmark. 1997. Available at http://www.olapcouncil.org/research/bmarkly.htm

112. OLE DB Programmer's Reference, Microsoft Corporation.

113. G. Ozsoyoglu, M. Ozsoyoglu, F. Mata. A Language and a Physical Organization Technique for Summary Tables. In SIGMOD Conference,1. Austin, Texas, May 1985.

114. G. Ozsoyoglu, M. Ozsoyoglu, V. Matos. Extending Relational Algebra and Relational Calculus with Set-Valued Attributes and Aggregation Functions. ACM TODS 12(4), 1987.

115. M. Rafanelli, F. L. Ricci. A functional model for macro-databases. SIGMOD Record, March 1991, 20(1).

116. Red Brick Systems, Inc. Red Brick Warehouse 5.0. http://www.redbrick.com/rbs-g/html/whouse50.html, 1997.

117. Sunita Sarawagi. Indexing OLAP Data. Data Engineering Bulletin 20(1): 36-43 (1997).

118. Shoshani. OLAP and Statistical Databases: Similarities and Differences. Tutorials of PODS, 1997.

119. Ken Spencer. SQL Server 7.0, Visual InterDev 6.0, and You //.Microsoft Interactive Developer, October, 1998.

120. Ken Spencer. SQL Server 7: Is It for You? // Visual Basic Programmer's Journal, May, 1998.

121. Stanford Technology Group, Inc. Designing the Data Warehouse on Relational Databases, http://www.informix.com/informix/coфinfo/zines/ whitpprs/stg/metacube.htm, 1996.

122. The Microsoft Data Warehousing Strategy, Microsoft Corporation, July 11, 1998.

123. The Repository Renaissance // SQL Server Magazine, June, 1999.

124. Tomsen M. Build Reliable and Scalable N-tier Applications that Run on Both Windows NT and Unix // Microsoft Systems Journal, December, 1998.

125. TPC: TPC Benchmark D. Transcation Processing Council. February 1998. Available at http://www.tpc.org/dspec.html

126. Using the Microsoft Repository // SQL Server Magazine, March, 2000.

127. P. Vassiliadis. Modeling Multidimensional Databases, Cubes and Cube Operations. In 10th SSDBM Conference, Italy, July 1998.

128. Panos Vassiliadis, Timos Sellis. A Survey on Logical Models for OLAP Databases, National Technical University of Athens, 1999.

129. Karen Watterson. OLAP Clients for Microsoft OLAP Services // Microsoft SQL Server Professional, December, 1999.

130. Mark van de Wiel. Gaining on Business Intelligence, Oracle Magazine, May -June 2003.