автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Многомерное представление и обработка данных в информационной системе анкетирования

кандидата технических наук
Афонин, Александр Юрьевич
город
Пенза
год
2011
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Многомерное представление и обработка данных в информационной системе анкетирования»

Автореферат диссертации по теме "Многомерное представление и обработка данных в информационной системе анкетирования"



На правах рукописи

АФОНИН Александр Юрьевич

МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ДАННЫХ В ИНФОРМАЦИОННОЙ СИСТЕМЕ АНКЕТИРОВАНИЯ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (приборостроение)

Автореферат диссертации на соискание учёной степени кандидата технических наук

О янв да

ПЕНЗА 2011

004619232

Диссертационная работа выполнена в государственном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» на кафедре «Математическое обеспечение и применение ЭВМ».

Научный руководитель - доктор технических наук, профессор

Макарычев Пётр Петрович.

Официальные оппоненты: доктор технических наук, профессор

Якимов Александр Николаевич; кандидат технических наук, доцент Дроиедин Владимир Викторович.

Ведущая организация - ОАО «Научно-производственное предприятие "Рубин"» (г. Пенза).

Защита диссертации состоится 10 февраля 2011 г., в 14 часов, на заседании диссертационного совета Д 212.186.04 в государственном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.

С диссертацией и авторефератом можно ознакомиться в библиотеке государственного образовательного учреждения высшего профессионального образования «Пензенский государственный университет» и на сайте www.pnzgu.ru.

Автореферат разослан « 3» января 2011 г.

Учёный секретарь диссертационного совета доктор технических наук,

профессор Смогунов В. В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Анкетирование является одной из основных форм учета мнений респондентов в социологических, психологических, экономических, педагогических и других исследованиях. Независимо от цели процесс анкетирования разделяют на четыре этапа: подготовка анкет, проведение анкетирования (сбор данных), обработка собранных данных, анализ результатов опроса и принятие на их основе решений. При использовании «бумажного» подхода проведения анкетирования на всех этапах требуются значительные материальные и временные затраты. Применение информационных технологий позволяет снизить эти затраты, повысить оперативность и результативность анкетирования.

Современные информационные системы анкетирования характеризуются накоплением большого объема информации, сложностью процедур анализа данных, возможностью осуществления удаленного опроса респондентов. К настоящему времени имеется ряд систем, обеспечивающих поддержку проведения анкетирования, таких как «АНКЕТЕР», «1С: Предприятие. Оценка персонала», «Анкетирование», «Degree Sure» и др. Разработка данных информационных систем стала возможной в результате развития теории моделей реляционных и многомерных данных, математических методов исследования информационных систем и Web-технологий.

Значительный вклад в решение проблемы создания современных информационных систем, в том числе и систем анкетирования, содержащих эффективные инструментальные средства сбора и обработки данных, внесли Г. Уильман, И. Ф. Кодд, Дж. Маккенел, Т. Л. Саати, А. Бергер, А. А. Барсегян и др. В развитие математических и имитационных методов исследования характеристик информационных систем наибольший вклад внесли Дж. Уолрэнд, А. К. Эрланг, А. А. Марков, В. В. Крылов, В. Г. Ба-шарин, В. Л. Брейдо, Б. С. Лившиц и др.

Несмотря на широкое применение информационных технологий и систем при проведении анкетирования, остаются нерешенными две проблемы. Первая проблема связана с разработкой многомерных моделей данных в терминах измерений, фактов и их отношений. Сложность решения данной проблемы обусловлена:

-недостаточной изученностью процессов контроля и управления, реализуемых с применением анкетирования респондентов, методов системного, оперативного и интеллектуального анализа данных;.

- высокими требованиями к качеству данных, которое достигается выбором организации процессов в системе первичного сбора, формы описания и хранения данных, процедуры проверки качества данных;

-требованиями завершенности предварительной обработки, неизменности и независимости данных, которые определяются критериями качества анкетирования, ограничениями на объем и типы данных, используемыми программными средствами анализа.

Вторая проблема связана с обеспечением приемлемых характеристик информационных систем анкетирования на начальных этапах проектирования, когда возможно проведение только модельных экспериментов с использованием положений теории сетей массового обслуживания и одного из ее направлений - теории телетрафика. Данная проблема обусловлена отсутствием эффективных методов оценки степени соответствия имитационной модели реальным процессам в информационной системе, для описания которых она разрабатывается. В связи с этим проверка адекватности в первую очередь основывается на профессиональном опыте и творческой интуиции разработчика. Нерешенность данной проблемы также не дает возможности однозначно реализовать процедуры проверки устойчивости и чувствительности имитационной модели. Отсутствие перечисленных оценок не позволяет судить о влиянии изменений параметров и входных воздействий на закономерности поведения информационной системы анкетирования.

Необходимость решения названных проблем применительно к процессу создания информационных систем анкетирования определяет актуальность данного диссертационного исследования.

Целью диссертационной работы является обоснование и исследование процессов сбора, предварительной обработки, многомерного представления данных и проведения статистического, оперативного и интеллектуального анализа в информационной системе анкетирования с клиент-серверной архитектурой.

В соответствии с целью исследования решены задачи:

- анализа процессов анкетирования и разработки концепции построения информационной системы анкетирования для проведения потребительского мониторинга, экспертных опросов, тестирования компетенций;

-теоретического обоснования многомерного представления данных в информационной системе анкетирования для реализации процессов сбора, хранения и обработки информации;

-исследования характеристик информационной системы анкетирования с архитектурой «клиент-сервер» методами теории систем и сетей массового обслуживания;

-разработки и исследования методики предварительной обработки анкет, проведения оперативного и интеллектуального анализа данных информационной системы анкетирования;

- разработки архитектуры, серверных и клиентских приложений информационной системы анкетирования на базе корпоративной компьютерной сети вуза и проведения экспериментов.

Объектом исследования является информационная система анкетирования с функциями редактирования анкет, опроса респондентов, предварительной обработки, анализа данных и оперативного представления результатов в режиме удаленного доступа.

Предметом исследования являются процессы сбора и обработки информации при проведении анкетирования, закономерности функционирования клиент-серверных систем.

Методы исследования основаны на теории информационных систем, теории оперативного и интеллектуального анализа данных, теории информационных процессов и систем, теории математического и имитационного моделирования, методах объектно-ориентированного проектирования и анализа.

Научная новизна работы заключается в следующем:

1) предложено многомерное представление данных в информационной системе анкетирования с поддержкой опроса различных групп респондентов, которое отличается описанием свойств измерительных шкал и иерархий измерений с использованием исчисления предикатов;

2) разработана методика оценки адекватности, устойчивости и чувствительности имитационной модели информационной системы анкетирования в режиме удаленного доступа, отличающаяся реализацией метода предельных точек на основе построения графа достижимости;

3) предложен алгоритм функционирования модуля редактирования анкет в режиме удаленного доступа, отличающийся формированием вопросов полузакрытого типа при проведении экспертного опроса;

4) с применением метода анализа иерархий разработана методика предварительной обработки и анализа данных информационной системы анкетирования, полученных с использованием номинальных и порядковых измерительных шкал.

Практическая значимость исследований. Полученные в диссертации теоретические и практические результаты позволяют значительно расширить функциональные возможности информационной системы анкетирования в режиме удаленного доступа к ресурсам как организаторов, так и респондентов. Предложенная методика предварительной обработки и анализа результатов анкетирования дает возможность оперативно представлять результаты анкетирования в числовой и графической формах средствами информационной системы. Методика построения имитационных моделей обеспечивает оценку проектировщиком адекватности, устойчивости и чувствительности модели серверных систем методом предельных точек.

Реализация и внедрение результатов работы. Результаты диссертационного исследования применяются в Пензенском государственном университете для проведения потребительского мониторинга качества образовательного процесса среди преподавателей, студентов, выпускников, аспирантов и сотрудников университета.

Материалы диссертационной работы были использованы при создании учебного пособия «Оперативный и интеллектуальный анализ данных», предназначенного для студентов, обучающихся по образовательным про-

граммам направлений 230100 «Информатика и вычислительная техника» и 230200 «Информационные системы».

Достоверность полученных результатов основана на использовании современных математических методов и технологий анализа данных и компьютерного моделирования. Научные положения, теоретические выводы и практические рекомендации, содержащиеся в диссертации, обоснованы и подтверждены результатами эксплуатации информационной системы анкетирования.

Результаты, выносимые на защиту:

-многомерное представление данных в информационной системе анкетирования на основе исчисления предикатов, обеспечивающее реализацию модулей сбора, предварительной обработки, хранения, оперативного и интеллектуального анализа в режиме удаленного доступа;

- методика оценки характеристик информационных систем анкетирования, позволяющая проводить исследование функционирования системы с применением методов математического и имитационного моделирования на этапе проектирования;

-алгоритм функционирования модуля редактирования анкет, дающий возможность организовать работу с вопросами полузакрытого типа в режиме удаленного доступа при проведении экспертного опроса;

-методика предварительной обработки и анализа данных информационной системы анкетирования с использованием метода анализа иерархий;

- информационная система анкетирования, поддерживающая создание и редактирование анкет, процессы одновременного опроса различных групп респондентов в режиме удаленного доступа, сбор, обработку и хранение результатов анкетирования.

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях: «Технологии Microsoft в теории и практике программирования» (Нижний Новгород, 2006 г.); VII Международной научно-технической конференции «Новые информационные технологии и системы» (Пенза, 2006 г.); XI Международной научно-практической конференции «Университетское образование» (Пенза, 2007 г.); VIII Всероссийской выставке научно-технического творчества молодежи (Москва, 2008 г.); II Всероссийской научно-практической конференции с международным участием «Перспективы развития информационных технологий» (Новосибирск, 2010 г.); Международной научно-практической конференции «Информатизация образования» (Пенза, 2010 г.); IV Всероссийской научно-практической конференции с международным участием «Проблемы и перспективы развития образования в России» (Новосибирск, 2010 г.); II Международной научной заочной конференции «Актуальные вопросы современной техники и технологии» (Ли-

пецк, 2010 г.); IX Международной научно-технической конференции «Новые информационные технологии и системы» (Пенза, 2010 г.).

Публикации. По теме диссертационного исследования опубликовано 14 печатных работ: 1 статья в издании из перечня ВАК, 11 - в материалах российских и международных конференций, 1 учебное пособие, 1 свидетельство о регистрации информационной системы.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 131 наименования и 6 приложений. Объем работы: 127 страниц основного текста, включающего 40 рисунков, 1 таблицу и 47 страниц приложений.

Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи исследования, показаны научная новизна и практическая значимость результатов диссертационного исследования, приведены сведения об апробации работы и публикациях.

В первой главе дан обзор существующих информационных систем анкетирования, определен их компонентный состав, выполнен анализ методов обработки данных информационной системы анкетирования.

Анкетирование используется в случаях, когда невозможно измерить какую-либо характеристику объекта с помощью измерительного инструмента. Это предъявляет к процессам сбора, хранения, обработки и визуализации данных определенные требования. В число доминирующих требований при проектировании систем подобного рода входят фиксация результатов проведенных опросов в базе данных, проведение предварительной обработки данных, сбор статистических данных на этапе прохождения анкетирования, построение отчетов по результатам анкетирования. Выделяют три типа вопросов, используемых в анкетах: открытого, полузакрытого (полуоткрытого) и закрытого типов.

При проведении анкетирования исследователь, как правило, работает с двумя типами измерительных шкал: номинальными и порядковыми. Количество меток для названных шкал непостоянно и может варьироваться в пределах одной анкеты. Для номинальных шкал при предварительной обработке данных допустимо использовать операции проверки на совпадение (несовпадение) двух измерений:

где Х/,Ху - записи разных измерений.

Для порядковых шкал допустимо применять не только операции проверки на совпадение, но и установки предпочтительности перед х):

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

0)

С(х,- *,) = {!:(*,• -*,)>0; 0:(х-Х])<0}. (2)

Над результатами операций (1) и (2) при проведении системного, статистического, оперативного и интеллектуального анализа данных можно выполнять более сложные преобразования.

В диссертации показано, что системы анкетирования, представленные в настоящее время на рынке, в своем большинстве поставляются в рамках корпоративных платформ, либо являются узкоспециализированными и рассчитаны на работу с определенными программно-аппаратными комплексами, либо обладают ограниченным набором средств анализа и визуализации собранной информации.

Современные подходы к анализу информации основываются на многомерном представлении данных с учетом формул (1), (2). Реализация многомерного представления данных в информационных системах базируется на концепциях сбора информации (OLTP - On-line Transaction Processing), преобразования (ETL - Extraction Transformation Loading), оперативного анализа данных (OLAP - On-line Analytical Processing).. Перечисленные концепции поддерживаются ведущими компаниями: Microsoft, Oracle, IBM, BaseGroup и пр. В соответствии с этими концепциями разработчик должен представлять область данных в виде совокупности трех областей: операционной базы данных, промежуточной области и хранилища данных. Операционные базы применяются для сбора и накопления данных, хранения справочной информации. Промежуточная область используется при реализации процессов ETL. Нормативно-справочная информация (справочники) переносится в процессе загрузки данных, затем загружается таблица фактов и формируются агрегаты. Хранилище данных предназначено для организации долговременного хранения информации.

Информационные системы анкетирования должны удовлетворять требованиям теста FASMI (Fast Analysis of Shared Multidimensional Informational), сформулированного на основе правил, предложенных И. Ф. Код-дом. Из множества требований этого теста можно выделить относящиеся к представлению и обработке данных информационной системы анкетирования:

- многомерное концептуальное представление данных с поддержкой иерархий и множественных иерархий;

-поддержка статистического, оперативного и интеллектуального анализа данных независимо от используемого программного приложения, визуализации результатов в доступном для конечного пользователя виде;

- многопользовательский доступ к данным анкетирования и результатам анализа с поддержкой механизмов блокировки.

В диссертации отмечено, что для моделирования информационных систем класса «клиент-сервер» наибольшее распространение получили подходы, основанные на положениях теории систем и сетей массового обслуживания, теории сетей Петри. Анализ информационной системы анали-

тическими методами выполняется на основе дискретных и непрерывных цепей Маркова. При представлении используются классические, стохастические и раскрашенные сети Петри. При этом применяются аналитические методы и методы имитационного моделирования.

Во второй главе выполнено теоретическое обоснование многомерного представления данных анкетирования, разработаны концептуальные модели информационной системы анкетирования, предложена методика оперативного анализа и подготовки данных для последующей обработки.

В составе измерений выделено четыре группы. Первая группа включает в себя измерения, определяемые на основе анализа структурной организации университета. Группа содержит следующие измерения: «респондент», «группа респондентов», «кафедра», «факультет», «университет», «время проведения анкетирования» и др. Эти измерения необходимы при анализе данных всех анкет, которые используются в системе анкетирования университета и фиксируются в транзакционной базе данных. Вторую группу составляют измерения, формируемые на основе вопросов, содержащихся в социально-паспортной статистике анкеты: «должность», «ученая степень», «возраст», «пол», «курс обучения», «специальность» и т.д. При проведении оперативного и интеллектуального анализа эти измерения могут быть использованы и как факты. Третью группу составляют измерения, определяемые основной частью анкеты и формируемые на основе вопросов закрытого типа, например: «Насколько Вы удовлетворены доступностью информации о жизни университета?». Количество меток на шкале этих измерений определяется разработчиком анкеты. Четвертая группа формируется на основе многомерного представления данных анкеты и определяется лицом, выполняющим анализ.

В случае иерархии измерений с тремя уровнями структура измерения «группа респондентов -> кафедра —> факультет» представляется в виде:

г{Л) = {<х,у,2>\Р(х,у,г)}, (3)

где г.— отношение со схемой Л; <х,у,г > - упорядоченная последовательность кортежей; Р(х, у, г) - тернарный предикат первого порядка, определяемый на основе высказываний относительно измерения; •* = {*1> *2> ••■> хт)> У = {У\> Уг> ■■•> У*)> г = (21> 2г,->гч) -кортежи переменных, представляющих имена совокупностей (атрибутов) уровней измерения «группа респондентов», «кафедра», «факультет» соответственно.

Тернарный предикат Р(х, у, г) в диссертации представляется в виде логического произведения двух бинарных и одного унарного предикатов:

Р(х,у,г) = Р,(х„х2, ■■■,хт,у)лР2(у1,у2, ...,.>>„,г)лР,(г1,22,..„г,), (4) где у, г - переменные, представляющие совокупности имен уровней измерений «кафедра», «факультет» соответственно.

На основе формул (3), (4) осуществляется декомпозиция отношения и задается система отношений:

'г(Д.) = {<*, у (*,*)},

■г^) = {<у,г >\р2(у,г)), (5)

_/■(*,) = {< г >|7> (г)}, где Л), Я2, /?з - схемы отношений; Рп / = 1,2 - бинарные предикаты; Р3 - унарный предикат; у, г - переменные, представляющие совокупность имен уровней измерения «кафедра», «факультет» соответственно.

Для иерархии измерений с двумя уровнями «вопрос анкеты -» анкета» отношение на множестве атрибутов задается в виде:

г(Д4) = {<*,о|Р4(й,С)}, (6)

где Ь - кортеж атрибутов уровня измерения «вопрос анкеты»; с - кортеж атрибутов уровня измерения «анкета», Рц(Ь,с) - бинарный предикат, применение которого определяется высказыванием относительно имен совокупностей анкеты.

С учетом формул (3) и (6) отношение для измерения мер (фактов) записывается следующим образом:

г{Я5) = [(1,х,Ь,а1,а2,...,ат^]Р{1,х,Ь,а1,а2, ...,ая)], (7)

где I - некоторая дата в измерении «время»; х - переменная, представляющая совокупность имен уровня измерения «группа респондентов»; Ь -переменная, представляющая совокупность имен уровня измерения «вопрос анкеты»; а,,а2,..., ат - имена переменных, представляющих совокупности ответов на вопрос анкеты; т - число вариантов ответов.

Системный граф структуры данных, определенный выражениями (3), (5) и (7), изображен на рисунке 1.

В соответствии с выбранными множествами измерений в диссертации для системы разработаны две многомерные модели данных. Первая модель данных содержит измерения из первой группы и факты, в качестве которых использованы измерения второй группы. Данная модель позволяет выполнять статистические процедуры для подготовки оперативного отчета о результатах проведенного анкетирования. Вторая модель данных построена с использованием измерений всех четырех групп.

Модель допускает выполнение операций детализации, проекции, среза и консолидации при обработке данных. Если измерения получены с использованием номинальной шкалы, то в таблице фактов регистрируется количество совпадений по к-му варианту ответа на вопрос анкеты:

• (8)

где п - общее число ответов на вопрос анкеты.

В случае порядковой шкалы в хранилище данных дополнительно регистрируются ранги вариантов ответов:

Дальнейшая обработка данных выполняется на основе пк и включает операции поиска выборочной медианы, расчета коэффициентов ранговой корреляции, процедуры статистического и интеллектуального анализа.

Для предварительной обработки результатов анкетирования также предлагается использовать метод анализа иерархий. Применение данного метода позволяет на основе матриц парных сравнений, проводимых экспертами, сформировать вектор приоритетов и получить интегральную оценку (рисунок 2). Для определения весовых коэффициентов в процессе ранжирования вопросов анкеты могут привлекаться эксперты, что позволяет снизить субъективную составляющую оценки.

Для получения интегральной оценки мнений респондентов, заполнивших анкету с номером к, используется формула

т mg

4 = ЁРЛ7 = 5>2>./*7' к = \, 2, 3,..., (10)

где - количество совпадений или ранг варианта ответа на вопрос анкеты; <Ху - весовой коэффициент, отражающий приоритетность ответа; Р,. - весовой коэффициент, отражающий приоритетность вопроса в анкете.

Приведенная интегральная оценка позволяет сравнивать различные группы респондентов. При необходимости получения информации о мнениях всех групп респондентов факультета или кафедры аналитик имеет возможность учесть вклад в оценку качества образовательных услуг каждой из групп опрашиваемых. С этой целью методом парных сравнений определяются весовые коэффициенты ук, характеризующие приоритетность анкет.

После расчета оценок \т на уровне кластеров вопросов аналитик может провести кластерный анализ данных анкетирования для оценки распределений мнений, например, по кафедрам.

Использование многомерного хранилища данных позволяет применять ОЬАР-анализ к данным анкетирования, агрегировать и сравнивать результаты анкетирования с учетом свойств измерительных шкал. Использование иерархических измерений позволяет при проведении ОЬАР-анализа получать различные срезы данных. Основным измерением в модели данных является время (дата проведения анкетирования). При проведении опроса с заданной периодичностью системный аналитик получает возможность отслеживать динамику мнений респондентов по изучаемой проблеме.

Третья глава посвящена разработке методики анализа информационной системы анкетирования методом имитационного моделирования. Предложены модели различных узлов сетей массового обслуживания (включая узлы с различными дисциплинами обслуживания), узлов слияния и разветвления информационных потоков, генераторов заявок в виде сетей Петри. Представлена процедура построения непрерывных моделей в виде цепей Маркова с применением графа достижимости сетей Петри.

Модель содержит три источника заявок, формируемых пользователями клиентских терминалов в процессе анкетирования, сервер приложений и сервер баз данных. Каждый источник генерирует поток заявок одного типа, включая заявки на получение статического содержимого сайта (изображения, статические НТМЬ-страницы, стилевые таблицы); заявки на получение информации из базы данных; заявки сохранения информации в базе данных. Имитационная модель информационной системы анкетирования в виде раскрашенной стохастической сети Петри приведена на рисунке 3. Для моделирования обработки сервером заявок разного типа в мо-

дель введена раскраска в виде маркеров различной формы <Т ♦ ■ •>. Маркеры, обозначенные кружком, отражают состояния занятости ресурса сервера приложений - обработки запросов каналами сервера приложений.

Рисунок 3 - Модель У/еЪ-сервера в виде сети Петри

Переходы сети Петри 1г, /3 ассоциированы с источниками заявок, интенсивность поступления которых на входы сервера приложений А.,, Х2, А.3 соответственно. Множество М каналов сервера разбито на подмножество загруженных каналов М, и подмножество свободных каналов М2. При этом Л/,пЛ/2=0 и М =(М, иЛ/г). Моменты инициирования обработки заявок сервером приложений имитируются переходами еА, ..., /18. При поступлении очередной заявки в момент времени х} запускается канал обслуживания К1/еМ2 с наименьшим номером. Время запуска канала Кч определяется временем х\ = ту. Окончание обслуживания заявок имитируется переходами /20,..., /33 . Время окончания обслуживания заявки с раскраской / каналом К задается выражением

Ч = + ' = 1.2,3, (11)

где р, - интенсивность обслуживания заявки с раскраской У.

Разработанная в диссертации методика анализа свойств имитационной модели предполагает проведение предварительных вычислительных экспериментов. Методика реализована на основе метода предельных точек. В соответствии с данным методом проведение вычислительных экспериментов выполняется для вариантов исходных значений параметров модели, обеспечивающих ее функционирование в выбранных режимах. Выбор режимов осуществляется из условия достижения конечных результатов имитации, которые могут быть подтверждены аналитическими методами. Методика обеспечивает проведение исследования «непрерывности»

реакции модели по отношению к исходным данным, на устойчивость, чувствительность и адекватность.

Для подтверждения результатов имитации аналитическими методами предполагаются однородность потока заявок и отсутствие раскраски в модели. В результате модель преобразуется в стохастическую сеть Петри, в которой циркулирует однородный ординарный поток заявок с экспоненциальным распределением. Для преобразованной сети Петри строится граф достижимости. Построение выполняется на основе матричного описания <Р, Т, /, О, М>, где Р - множество вершин; Т - множество переходов; I- функция входов; О - функция выходов; М- матрица маркировки.

На основе графа достижимости исследуется логика функционирования процессов, выявляются циклы в модели. Вершины графа достижимости, связанные отношениями мгновенного перехода модели из одного состояния в другое, склеиваются.

На основе графа достижимости строится непрерывная цепь Маркова. Система дифференциальных уравнений непрерывной модели, адекватной имитационной модели \УеЬ-сервера, имеет вид:

«Н» (/)/* = ХР0 (/) - (X + ц)Р{ (<) + 2 ц/> (/),

• ар2(/)/а/=^(/)-(х+2ц)р2(/)+зцР3(0, (12)

где п - число каналов обслуживания; Р - вероятность обработки запроса (-каналом обслуживания (г = 0,1, 2, ..., и).

Система (12) позволяет рассчитать основные характеристики системы: вероятность простоя, вероятность отказа, абсолютную пропускную способность системы, среднее число занятых каналов. Результаты аналитического расчета сравниваются с результатами имитационного моделирования, и осуществляется настройка отдельных узлов математической модели. По умолчанию \Veb-cepBep настроен для работы с 15 одновременными соединениями, поэтому и = 15. Интенсивность поступления заявок на обслуживание А, = 10 определена исходя из собранной статистики работы промежуточного варианта системы. Средняя интенсивность обслуживания заявок ц = 2,5. Среднее время обработки одной заявки сервером приложений равно 0,4 с. Сравнение результатов имитационного и аналитического моделирования системы позволяет сделать выводы о корректности построенной имитационной модели. Среднее время обслуживания заявки 0,4 и 0,40 с; загрузка системы 4 и 3,8; среднее число заявок в системе 3,9 и 3,8 для аналитической и имитационной моделей соответственно. Полученная

модель настраивается с учетом разнородности потока заявок, различных типов входных потоков.

С использованием функции Хэвисайда в диссертации решена задача визуализации трафика в различных узлах системы. График трафика на выходе узла обслуживания с интенсивностями поступления заявок Я,, =5 с-1, Л2=2с"', Х3=Зс~' и средними временами обслуживания /,=0,15 с, (2 = 0,35 с, = 0,75 с приведен на рисунке 4.

и и 12

ю

5(1) 8 б, 4 2 0

10 20 30 40 50 60 70 80 90 100

i

Рисунок 4 - График трафика на выходе узла обслуживания

Результаты анализа системы массового обслуживания в среде МаЛСАБ позволили сделать предварительные выводы о возможной загрузке. При заданных характеристиках системы каналы с 10 по 15 остаются незагруженными. Опытная эксплуатация показала устойчивость функционирования модулей. Было проведено нагрузочное тестирование системы, в результате которого была собрана необходимая информация для проведения корректировки распределения нагрузки между модулями в целях повышения скорости обработки запросов и отказоустойчивости системы.

В четвертой главе приведено описание разработанной системы. Информационная система обеспечивает конструирование анкет (возможно использование предопределенных видов ответов, формирование новых); создание учетных записей групп пользователей и назначение им определенных прав на анкеты; администрирование процесса анкетирования; регистрацию и хранение собранных и проанализированных данных; формирование статистики прохождения анкетирования и отчетов по результатам проводимого опроса.

При разработке концептуальной модели поведения пользователей в системе выделены группы и сформулированы требования с учетом решаемых задач. Ограничение доступа пользователей к системе представляет собой групповую модель наделения прав. В соответствии с этой моделью каждый пользователь, зарегистрированный в системе, может быть членом нескольких групп и получать доступ в соответствии с назначенными правами.

К основным достоинствам информационной системы анкетирования на основе Web-технологий следует отнести:

- исключение этапов распечатки анкет, последующего ручного ввода информации для проведения анализа;

- оперативность при подведении итогов и их опубликовании;

- расширение территориального охвата респондентов при проведении удаленного анкетирования;

- возможность контроля процесса прохождения анкетирования;

- возможность оперативного редактирования текстов анкет (например, исправление орфографических ошибок).

Система рассчитана на эксплуатацию в сетях с поддержкой протокола HTTP. На стороне клиента необходимо наличие Web-браузера, поддерживающего JavaScript. Это требование позволяет проводить анкетирование на любом современном компьютере, вне зависимости от установленной операционной системы. Серверная часть системы рассчитана на работу под управлением Web-сервера Resin. В качестве сервера базы данных могут быть использованы MS SQL Server 2000/2005/2008, MySQL и Firebird. К аппаратной части системы предъявляются требования в зависимости от максимально возможной планируемой загрузки. Использование версии Resin для Linux/Unix либо для Windows позволяет разворачивать систему на серверах, функционирующих под управлением этих операционных систем.

В заключении сформулированы основные результаты диссертационной работы.

Приложения содержат акты внедрения системы, листинги динамических и имитационных моделей в математическом пакете MathCAD, функциональные и информационные модели, результаты проведенных экспериментов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

Основные результаты диссертационной работы состоят в следующем:

1) предложено многомерное представление данных в информационной системе анкетирования, обеспечивающее реализацию модулей сбора, предварительной обработки, хранения, оперативного и интеллектуального анализа в режиме удаленного доступа;

2) разработана методика оценки характеристик информационной системы анкетирования для проведения предварительного анализа загрузки системы;

3) предложен алгоритм функционирования модуля 'редактирования анкет, позволяющий организовать работу с вопросами полузакрытого типа в режиме удаленного доступа при проведении экспертного опроса;

4) разработана методика предварительной обработки и анализа данных информационной системы анкетирования с использованием метода анализа иерархий;

5) предложен алгоритм функционирования модуля управления процессами создания и редактирования анкет, проведения опроса респондентов, создания и распределения прав доступа к информационному ресурсу между группами пользователей;

6) разработана информационная система анкетирования на основе Web-технологий, поддерживающая создание, редактирование опросов, одновременное прохождение множества анкет различных групп респондентов в режиме удаленного доступа, сбор, обработку и хранение результатов анкетирования.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в изданиях, рекомендованных ВАК России

1 Афонин, А. Ю. Система анкетирования на основе Web-техноло-гий / А. Ю. Афонин, П. П. Макарычев // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 3. - С. 33-39.

2 Свидетельство об отраслевой регистрации № 9506 в Отраслевом фонде алгоритмов программ на разработку «Система мониторинга удовлетворенности потребителей качеством образовательных услуг» / А. Ю. Афонин.-Опубл. 25.11.2007.

Публикации в других изданиях

3 Афонин, А. Ю. Организация импорта и экспорта данных при хранении на MS SQL Server / А. Ю. Афонин, П. П. Макарычев // Технологии Microsoft в теории и практике программирования : материалы конф. / под ред. проф. Р. Г. Стронгина. - Н. Новгород: Изд-во Нижегор. гос. ун-та, 2006.-С. 24-25.

4 Афонин, А. Ю. Администрирование и анализ данных средствами SQL Server / А. Ю. Афонин, Е. Н. Прошкина // Новые информационные технологии и системы : тр. VII Междунар. науч.-техн. конф. - Пенза: Ин-форм.-изд. центр ПТУ, 2006. - Ч. 1. - С. 207-210.

5 Афонин, А. Ю. Мониторинг удовлетворенности преподавателей и студентов деятельностью вуза / А. Ю. Афонин, П. П. Макарычев // Новые информационные технологии и системы : тр. VII Междунар. науч.-техн. конф. - Пенза : Информ.-изд. центр ПТУ, 2006. - Ч. 2. - С. 178-180.

6 Афонин, А. Ю. Система мониторинга удовлетворенности качеством образовательных услуг / А. Ю. Афонин, П. П. Макарычев // Университетское образование: сб. ст. XI Междунар. науч.-метод. конф. - Пенза : ПДЗ, 2007-С. 30-31.

7 Афонин, А. Ю. Система мониторинга удовлетворенности качеством образовательных услуг / А.Ю.Афонин, П.П.Макарычев // Актуальные проблемы высшего профессионального образования в России : материалы межвуз. науч.-пракг. конф. - Елабуга: Изд-во ЕГПУ, 2007. - С. 30-32.

8 Афонин, А. Ю. Методология проектирования систем потребительского мониторинга вуза / А. Ю. Афонин // Перспективы развития информационных технологий : сб. материалов II Ежегод. всерос. науч.-практ. конф. с междунар. участием. - Новосибирск : Изд-во «СИБПРИНТ», 2010. -С. 242-246.

9 Афонин, А. Ю. Методология разработки систем потребительского мониторинга / А.Ю.Афонин // Информатизация образования. Поволжье - 2010 : тр. всерос. науч.-метод. конф. - Пенза : Изд-во ПГУ, 2010. -С. 23-24.

10 Афонин, А. Ю. Оперативный и интеллектуальный анализ данных : учеб. пособие / П. П. Макарычев, В. Б. Механов, А. Ю. Афонин. -Пенза : Изд-во ПГУ, 2010. - 156 с.

11 Афонин, А. Ю. Система потребительского мониторинга вуза / А. Ю. Афонин // Проблемы и перспективы развития образования в России : сб. материалов IV Междунар. науч.-практ. конф. / под общ. ред. С. С. Чернова. - Новосибирск: Изд-во НГТУ, 2010. - С. 141-145.

12 Афонин, А. Ю. Анализ данных потребительского мониторинга вуза методом анализа иерархий / А. Ю. Афонин, П. П. Макарычев // Актуальные вопросы современной техники и технологии : сб. докл. II Междунар. науч. заоч. конф. / под ред. А. В. Горбенко, С. В. Довженко. - Липецк: Изд. центр «Де-факто», 2010. - С. 12-14.

13 Афонин, А. Ю. Аналитическое и имитационное моделирование Web-cepeepa / А. Ю. Афонин, П. П. Макарычев // Новые информационные технологии и системы : тр. IX Междунар. науч.-техн. конф. - Пенза : Изд-во ПГУ, 2010. - Ч. 2. - С. 94-99.

14 Афонин, А. Ю. Тестирование программного обеспечения посредством фаззинга / А. Ю. Афонин // Новые информационные технологии и системы : тр. IX Междунар. науч.-техн. конф. - Пенза: Изд-во ПГУ,

2010.-Ч. 2.-С. 113-118.

Научное гадание

АФОНИН Александр Юрьевич

МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ДАННЫХ В ИНФОРМАЦИОННОЙ СИСТЕМЕ АНКЕТИРОВАНИЯ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (приборостроение)

Редактор Е. П. Мухина Компьютерная верстка М. Б. Жучковой

Подписано в печать 28.12.2010. Формат 60x84'/16. Усл. печ. л. 1,16. Тираж 100. Заказ № 825.

Издательство ПГУ 440026, Пенза, Красная, 40.

Оглавление автор диссертации — кандидата технических наук Афонин, Александр Юрьевич

ОГЛАВЛЕНИЕ.

ВВЕДЕНИЕ.

1 АНАЛИЗ ПРЕДСТАВЛЕНИЯ И ОБРАБОТКИ , ДАННЫХ

В'ИНФОРМАВДОННОЙ СИСТЕМЕ АНКЕТИРОВАНИЯ.

1.1 Анализ процессов анкетирования и измерительных шкал.

1.2ГОбзор существующих информационных систем, анкетирования1.

1.3 Многомерное .представление данных в информационной, системе.

1.4 Обзор методов и алгоритмов анализа данных анкетирования».

1.5 Анализ 'УУеЬ-технологий создания информационных систем'.

Выводы.

2 МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ В ИНФОРМАЦИОННОЙ" СИСТЕМЕ АНКЕТИРОВАНИЯ.

2.1 Концептуальная модель процесса анкетирования в стандарте ГОЕР.

2.2 Обоснование многомерной модели данных.

2.3 Реляционные модели транзакционной базы данных и хранилища данных.

2.4 Оперативный анализ данных методом анализа иерархий.

2.5 Алгоритм работы с полузакрытыми вопросами.

Выводы.

3 АНАЛИЗ ИНФОРМАЦИОННОЙ СИСТЕМЫ АНКЕТИРОВАНИЯ

МЕТОДОМ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ:.

3:1 Математическая модель системы анкетирования с клиент-серверной архитектурой.

3.2 Анализ адекватности информационной системы.

3.3 Модель узла обработки заявок с множеством входных потоков.

3.4 Модель узла обработки заявок с разветвлением выходного потока.

3.5 Построение и исследование имитационной модели.

Выводы.

4 РАЗРАБОТКА И ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОЙ СИСТЕМЫ АНКЕТИРОВАНИЯ.

4.1 Архитектура информационной системы анкетирования.

4.2 Основные модули информационной системы.

4.3 Организация анкетирования с использованием ИСА.

4.4 Оперативный анализ данных мониторинга средствами ИС.

4.5 Кластерный анализ данных мониторинга средствами информационной системы.

Выводы.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Афонин, Александр Юрьевич

Актуальность темы. Анкетирование является одной из основных форм учета мнений респондентов в социологических, психологических, экономических, педагогических и> других исследованиях. Независимо от цели процесс анкетирования разделяют на четыре этапа: подготовка анкет, проведение анкетирования* (сбор данных), обработка собранных данных, анализ результатов опроса и принятие на их основе решений. При1 использовании «бумажного» подхода проведения анкетирования^ на всех этапах требуются значительные материальные и временные затраты. Применение информационных технологий позволяет снизить эти затраты, повысить оперативность и результативность анкетирования.

Современные информационные системы анкетирования характеризуются накоплением большого объёма информации, сложностью процедур анализа данных, возможностью осуществления удаленного опроса респондентов. К настоящему времени имеется ряд систем, обеспечивающих поддержку проведения анкетирования, таких как «АНКЕТЕР», «1С: Предприятие. Оценка персонала», «Анкетирование», «Digsee Sure» и др. Разработка данных информационных систем стала возможной в результате развития теории моделей реляционных и многомерных данных, математических методов исследования информационных систем и Web-технологий.

Значительный вклад в решение проблемы создания современных информационных систем, в том числе и систем анкетирования, содержащих эффективные инструментальные средства сбора и обработки данных, внесли Г. Уильман, И. Ф. Кодд, Дж. Маккенел, Т. JI. Саати, А. Бергер, А. А. Барсегян и др. В развитие математических и имитационных методов исследования характеристик информационных систем наибольший вклад внесли Дж. Уолрэнд, А. К. Эрланг, А. А. Марков, В. В. Крылов, В. Г. Башарин, В. JI. Брейдо, Б. С. Лившиц и др.

Несмотря на широкое применение информационных технологий и систем при проведении анкетирования, остаются' нерешенными две проблемы. Первая проблема связана с разработкой многомерных моделей' данных в терминах измерений; фактов-и их отношений. Сложность решения данной проблемы обусловлена:

-недостаточной1 изученностью процессов контроля и управления; реализуемых с применением анкетирования респондентов, методов системного, оперативного и интеллектуального анализа данных;

-высокими требованиями к качеству данных, которое достигается выбором организации процессов в системе первичного сбора, формы описания и хранения данных, процедуры проверки качества данных;

- требованиями завершенности предварительной обработки, неизменности и независимости данных, которые определяются критериями • качества анкетирования, ограничениями на объём и типы данных, используемыми программными средствами анализа.

Вторая проблема связана с обеспечением приемлемых характеристик информационных систем анкетирования на начальных этапах проектирования, когда возможно проведение только модельных экспериментов с использованием положений теории- сетей массового обслуживания и одного из её направлений - теории телетрафика. Данная проблема обусловлена отсутствием эффективных методов оценки степени соответствия имитационной модели реальным процессам в информационной системе, для описания которых она разрабатывается. В связи с этим проверка адекватности в первую очередь основывается на профессиональном опыте и творческой интуиции разработчика. Нерешенность данной проблемы также не дает возможности однозначно реализовать процедуры проверки устойчивости и чувствительности имитационной модели. Отсутствие перечисленных оценок не позволяет судить о влиянии изменений параметров и входных воздействий на закономерности поведения информационной системы анкетирования.

Необходимость решения названных проблем применительно к процессу создания информационных систем анкетирования определяет актуальность данного'диссертационного исследования.

Целью диссертационной работы является обоснование и исследование процессов сбора, предварительной обработки, многомерного представления данных и проведения^ статистического, оперативного и интеллектуального анализа в информационной системе анкетирования с клиент-серверной архитектурой.

В "соответствии с целью исследования решены задачи:

- анализа процессов анкетирования и разработки концепции построения информационной системы анкетирования для проведения потребительского мониторинга, экспертных опросов, тестирования компетенций;

-теоретического обоснования многомерного представления данных в информационной' системе анкетирования для реализации процессов сбора, хранения и обработки информации;

- исследования характеристик информационной системы анкетирования с архитектурой «клиент-сервер» методами теории систем и сетей массового обслуживания;

-разработки и исследования методики предварительной обработки анкет, проведения оперативного и интеллектуального анализа данных информационной' системы анкетирования;

- разработки архитектуры, серверных и клиентских приложений информационной системы анкетирования на базе корпоративной компьютерной сети вуза и проведения экспериментов.

Объектом исследования является информационная система анкетирования с функциями редактирования анкет, опроса респондентов, предварительной обработки, анализа данных и оперативного представления результатов в режиме удаленного доступа.

Предметом исследования являются процессы сбора и обработки информации при проведении анкетирования, закономерности функционированияклиент-серверных систем.

Методы исследования основаны на теории- информационных систем, теории оперативного! и интеллектуального анализа данных, теории информационных процессов и систем, теории математического и имитационного^ моделирования, методах объектно-ориентированного проектирования и анализа.

Научная новизна работы заключается в следующем:

1) предложено многомерное представление данных в информационной системе анкетирования с поддержкой опроса различных групп респондентов, которое отличается описанием свойств измерительных шкал и иерархий измерений с использованием исчисления предикатов;

2) разработана методика оценки адекватности, устойчивости и чувствительности имитационной модели информационной системы анкетирования в режиме удаленного доступа, отличающаяся реализацией метода предельных точек на основе построения графа достижимости;

3) предложен алгоритм функционирования модуля редактирования анкет в режиме удаленного доступа, отличающийся формированием вопросов полузакрытого типа при проведении экспертного опроса;

4) с применением метода анализа иерархий разработана методика предварительной обработки и анализа данных информационной системы анкетирования, полученных с использованием номинальных и порядковых измерительных шкал.

Практическая значимость исследований. Полученные в диссертации теоретические и практические результаты позволяют значительно расширить функциональные возможности информационной системы анкетирования в режиме удаленного доступа к ресурсам как организаторов, так и респондентов. Предложенная методика предварительной обработки и анализа результатов анкетирования дает возможность оперативно представлять результаты анкетирования в числовой и графической формах средствами информационной системы. Методика построения имитационных моделей обеспечивает оценку проектировщиком адекватности, устойчивости нечувствительности модели серверных систем методом предельных точек.

Реализация» и внедрение результатов работы:. Результаты диссертационного исследования применяются в Пензенском-государственном университете для проведения потребительского мониторинга качества образовательного процесса сред» преподавателей, студентов, выпускников, аспирантов и сотрудников университета.

Материалы диссертационной работы были использованы при-создании учебного пособия «Оперативный и интеллектуальный анализ данных», предназначенного для студентов, обучающихся по* образовательным программам направлений 230100 «Информатика и вычислительная техника» и-230200 «Информационные системы».

Достоверность полученных результатов основана на использовании современных математических методов и технологий анализа данных и компьютерного моделирования. Научные положения, теоретические выводы и практические рекомендации, содержащиеся в диссертации, обоснованы и подтверждены результатами- эксплуатации информационной системы анкетирования.

Результаты, выносимые на защиту:

- многомерное представление данных в информационной системе анкетирования на основе исчисления предикатов, обеспечивающее реализацию модулей сбора, предварительной обработки, хранения, оперативного и интеллектуального анализа в режиме удаленного доступа; методика оценки характеристик информационных систем анкетирования, позволяющая- проводить исследование функционирования системы с применением . методов математического и имитационного моделирования на этапе проектирования;

- алгоритм функционирования модуля редактирования анкет, дающий возможность организовать работу с вопросами полузакрытого типа в режиме удаленного доступа при проведении экспертного опроса;

- методика предварительной обработки и анализа данных информационной» системы^ анкетирования! с использованием метода анализа иерархий;

-информационная система анкетирования, поддерживающая?создание и редактирование анкет, процессы одновременного опроса различных групп респондентов в режиме удаленного доступа, сбор, обработку и хранение результатов анкетирования.

Апробация работы. Основные результаты диссертационной- работы докладывались, и обсуждались на следующих конференциях: «Технологии Microsoft в теории и практике программирования» (Нижний Новгород, 2006 г.); VII Международной научно-технической конференции «Новые информационные технологии и системы» (Пенза, 2006 г.); XI Международной научно-практической конференции «Университетское образование» (Пенза, 2007 г.); VIH Всероссийской выставке научно-технического творчества молодежи (Москва, 2008 г.); II Всероссийской научно-практической конференции с международным участием «Перспективы развития информационных технологий» (Новосибирск, 2010 г.); Международной научно-практической конференции «Информатизация образования» (Пенза, 2010 г.); IV Всероссийской научно-практической конференции с международным участием «Проблемы и перспективы развития образования в России» (Новосибирск, 2010 г.); II Международной научной заочной конференции «Актуальные вопросы современной техники и технологии» (Липецк, 2010 г.); IX Международной научно-технической конференции «Новые информационные технологии и системы» (Пенза, 2010 г.).

Публикации. По теме диссертационного исследования опубликовано 14 печатных работ: 1 статья в издании из перечня ВАК, 11 - в материалах российских и международных конференций, 1 учебное пособие, 1 свидетельство о регистрации информационной системы.

Структура и объём работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 131 наименования и 6 приложений. Объём работы: 127 страниц основного текста, включающего 40 рисунков, 1 таблицу и 47 страниц приложений.

Заключение диссертация на тему "Многомерное представление и обработка данных в информационной системе анкетирования"

Основные результаты диссертационной работы состоят в следующем:

1) предложено многомерное представление данных в информационной системе анкетирования, обеспечивающее реализацию модулей сбора, предварительной обработки, хранения, оперативного и интеллектуального* анализа в- режиме удаленного доступа. На основе предложенного-многомерного представления сформированы^ две модели хранилища данных, предоставляющие возможность накопления- статистической информации о прохождении анкетирования и результатов проводимых опросов;

2) разработана методика оценки характеристик информационной системы анкетирования для проведения1 предварительного анализа-загрузки системы. Разработана методика анализа свойств имитационной модели, которая заключается в подходе к построению аналитической модели, адекватной имитационной с целью проверки на основе метода предельных точек;

3) предложен алгоритм функционирования модуля редактирования анкет, позволяющий» организовать работу с вопросами полузакрытого типа в режиме удаленного доступа при проведении экспертного опроса;

4) разработана методика предварительной обработки и анализа данных информационной системы анкетирования с использованием метода анализа иерархий;

5) предложен алгоритм функционирования, модуля управления процессами создания' и редактирования анкет, проведения опроса респондентов, создания и распределения прав доступа к информационному ресурсу между группами пользователей;

6) разработана информационная система анкетирования на основе "\¥еЬ-технологий, поддерживающая создание, редактирование опросов, одновременное прохождение множества анкет различных групп респондентов в режиме удаленного доступа, сбор, обработку и хранение результатов анкетирования.

ЗАКЛЮЧЕНИЕ

Библиография Афонин, Александр Юрьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Abello, A*. Understanding Analysis Dimensions in a Multidimensional. Object-Oriented' Model / A. Abello,- J. Samos, F. Saltor // 3rd" International* Workshop on«Design and Management of Data*Warehouses (DMDW). SwissLife. -2001.-P: 4.1-4.9.

2. Cavaness, G. Programming Jakarta Struts / C. Cavaness O'Reilly, 2004. -550 p. - ISBN: 0-596-00651-9.

3. Davis, W. S. The Information System* Consultant's Handbook. Systems Analysis and Design. / William S. Davis, David C. Yen*. CRC Press, 1998. - 800 p.-ISBN 0849370019

4. Deitel; P. Java How to Program, 7th Edition / P. Deitel Prentice Hall, 2007. - 1596 p. - ISBN 978-0-13222-220-4.

5. Ford, N. Art of Java Web Development Struts, Tapestry, Commons, Velocity, JUnit, Axis, Cocoon, InternetBeans, Webwork / N. Ford. - Manning, 2003. - 624 p. - ISBN 978-1-93239-406-1.

6. Hightower, R. Mastering Resin / R. Hightower, J. D. Gradecki. Wiley, 2003. - 408 p. - ISBN 978-0-47143-103-9.

7. Inmon, W. H. Building the Data Warehouse. Fourth Edition / William H. Inmon. -Wiley, 2005. 576 p. - ISBN 978-0-76459-944-6.

8. Inmon, W. H. DW 2.0: The Architecture for the Next Generation^ of Data Warehousing / William H. Inmon. Morgan Kaufmann, 2008. - 400 p. - ISBN 978-0-1237-4319-0.

9. J2EE. Разработка бизнес-приложений / П. Аллен, Дж. Бамбара, М. Ашнаульт, Зияд Дин, Т. Гарбен, Ш. Смит. СПб.: ДиаСофт, 2002. - 736 е.— ISBN 5-93772-045-8.

10. Jain, А. К. Algorithms for clustering data / А. К. Jain, R. C. Dubes. -Prentice Hall, 1988. 320 p. - ISBN 0-13-022278-X.

11. MacLennan, J. Data Mining with Microsoft SQL Server 2008 / J. MacLennan, ZhaoHui Tang, B. Crivat Wiley, 2008. - 672 p. - ISBN 978-0470277744.

12. Алгазинов, Э. К. Анализ и компьютерное моделирование информационных процессов и систем / Э. К. Алгазинов, A. A. Сирота;: под общ. ред. д.т.н. А. А. Сироты. М. : Диалог-МИФИ, 2009. - 416 с. - ISBN 978-5-86404-233-5.

13. Арлоу, Д. UML 2 и Унифицированный; процесс. Практический объектно-ориентированный анализ и проектирование / Д. Арлоу, А. Нейштадт. 2-е изд: — Пер: с англ. — СПб: : Символ-Плюс, 2007. — 624 с. — ISBN 978-5-93286-094-6.

14. Афонин, А. Ю. Администрирование и анализ данных средствами; SQL Server- / А. Ю. Афонин, E. Н. Прошкина // Новые информационные технологии и системы: тр: VII Междунар. науч.-техн. коиф. Пенза: Информ.-изд. центр ПТУ, 2006. - Ч: 1. - С. 207-210.

15. Афонин, А. Ю. Аналитическое и имитационное моделирование Web-сервера / А. Ю. Афонин, П. П. Макарычев // Новые информационные технологии и системы.: тр. IX Междунар. науч.-техн. конф. — Пенза : Изд-во ПГУ, 2010. Ч: 2. - С. 94-99.

16. Афонин, А. Ю. Методология« разработки систем потребительского мониторинга / А. Ю. Афонин // Информатизация образования. Поволжье -2010 : тр. всерос. науч.-метод. конф.- Пенза: Изд-во ПГУ, 2010. С. 23-24.

17. Афонин, А. Ю. Система анкетирования на основе Web-технологий / А. Ю: Афонин, П. П. Макарычев.// Известия высших учебных заведений. Поволжский регион. Технические науки. 2010. - № 3. - С. 33-39.

18. Афонин, А. Ю. Система мониторинга удовлетворенности качеством образовательных услуг / А.Ю.Афонин, П: П.Макарычев // Университетское образование: сб. ст. XI Междунар. науч.-метод. конф. Пенза: ПДЗ, 2007 - С. 30-31.

19. Афонин,А.Ю. Система потребительского мониторинга вуза/ А.Ю. Афонин // Проблемы и перспективы развития образования в России : сб. материалов JV Междунар. науч.-практ. конф. / под общ. ред. С. С. Чернова. -Новосибирск : Изд-во НГТУ, 2010. С. 141-145.

20. Афонин, А. Ю. Тестирование программного обеспечения посредством фаззинга / А. Ю. Афонин // Новые информационные технологии и системы : трг IX Междунар. науч.-техн. конф. Пенза : Изд-во ПГУ, 2010.-4:2.-С. 113-118.

21. Беляевский, И. К. Маркетинговое исследование: Учебное пособие. / И. К. Беляевский. М.: Московский' государственный университет экономики, статистики и информатики, 2004. — 414 с.

22. Билункский, А. В. Теория случайных процессов / А. В. Билункский, А. Н. Ширяев. Mi :ФИЗМАТЛИТ, 2005. - 408 с. - ISBN 5-9221-0335-0.

23. Буч, Г. Язык UML. Руководство пользователя / Г. Буч, Д. Рамбо, А. Джекобсон Пер. с англ. - ДМК, 2000. - 432 с. - ISBN 5-94074-334-Х.

24. Вендров, А. М. CASE-технологии. Современные методы и средства проектирования информационных систем / А. М. Вендров. М. : Финансы и статистика, 1998. - 176 с.

25. Вентцель, Е. С. Теория вероятностей / Е. С. Вентцель. М.: Наука, 1964.-576 с.

26. Википедия. Свободная энциклопедия Электронный ресурс. Режим доступа: Ы1р://ги^1к1ре<11а.ог§/ш1к1/Заглавнаястраница, свободный.

27. Висков, А. В., Фомин М. Б. Средства описания многомерных моделей данных / А. В. Висков, М. Б. Фомин // Вестник РУДН. Серия прикладная и компьютерная математика. М.: Изд-во РУДН, 2003. - Т. 2, № 1. - С. 128-139.

28. Всеобщий менеджмент качества. Учебное пособие / А. А.Колесников, И. Ф. Козин, С. А. Кожевников, В: С. Соболев, С. А. Степанов, А. Ю. Щербаков; под общей ред. С. А. Степанова. СПб. : Изд-во СПбЕЭТУ «ЛЭТИ», 2001.-200 с.

29. B. Г. Горский, А. А. Гриценко, А. И. Орлов // Автоматика и телемеханика. 2000.-№3.-С. 159-167.

30. ГОСТ 34.003 90. Информационная технология. Комплекс стандартов на автоматизированные системы: Автоматизированные системы: Термины и определения. - М: : Изд-во стандартов, 1991. - 23 с.

31. ГОСТ Р ИСО 9000-2001. Системы менеджмента качества. Основные положения и словарь. М.: Изд-во стандартов, 2001. - 26 с.

32. ГОСТ Р ИСО 9001-2001. Системы менеджмента качества. Требования. М.: Изд-во стандартов, 2001. - 2Г с.

33. ГОСТ Р* ИСО 9004-2001. Системы менеджмента качества. Рекомендации по улучшению деятельности. -М.: Изд-во стандартов, 2001.-45 с.

34. Гранд М. Шаблоны проектирования в Java / М. Гранд. М. : Новое знание, 2004. - 560 с. - ISBN 5-94735-047-5.

35. Дейтел, X. М. Как программировать на Java: Книга 2. Файлы, сети, базы данных. / X. М. Дейтел, П. Дж. Дейтел. — Пер. с англ. — М. : Бином-Пресс, 2005 г. 672 с. - ISBN 5-9518-0127-3.

36. Дейтел, X. М. Технологии программирования на Java 2: Книга 1. Графика, JavaBeans, интерфейс пользователя / X. М. Дейтел, П. Дж. Дейтел,

37. C. И. Сантри. Пер. с англ. - М.: ООО «Бином-Пресс», 2003 г. - 560 с. -ISBN 5-9518-0017-Х.

38. Дубров, А. М'. Многомерные статистические методы: Учебник / А. М. Дубров, В. С. Мхитарян, JI. И. Трошин. М. : Финансы и статистика, 2005. — 352 с. - ISBN 5-279-01945-3.

39. И 151.0:30.01-2006. Система менеджмента качества. Мониторинг удовлетворенности качеством, образовательных услуг. Планирование, организация, проведение и методы оценки. Пенза : Изд-во ПензГУ - 2006.

40. Избачков, Ю. Информационные системы. Учебник для вузов. / Ю. Избачков, В: Петров. 2-е изд. - СПб.*: Питер, 2006; - 656 с. - ISBN 5-469-00641-7.

41. Капелюк, 3. А. Потребительский мониторинг удовлетворенности качеством образовательных услуг в вузе /. 3. А. Капелюк, С. G. Донецкая, JI.M. Струминская // Стандарты и качество. 2006. - № 1. - С. 62-66.

42. Карпова, Т. С. Базы данных: модели, разработка, реализация / Т. С. Карпова. СПб.: Питер, 2001. - 304 с. - ISBN 5-272-00278-41

43. Клигер, С. А. Шкалирование при сборе и анализе социологической информации / С. А. Клигер, Mi С. Косолапов, Ю. Н. Толстова. М. : Наука. 1978.-107 с.

44. Когаловский, М. PI Перспективные технологии информационных систем / М. Р: Когаловский. М.: ДМК Пресс; М.: Компания АйТи, 2003. - 288 с.

45. Коналлен, Дж. Разработка Web-приложений с использованием UML: Пер. с англ. / Дж. Коналлен. М.: Издательский дом «Вильяме», 2001». - 288 с.

46. Краткий терминологический словарь в области управлениям качеством высшего и среднего профессионального образования. — СПб., СПбГЭТУ «ЛЭТИ», 2005.-63 с.

47. Кренке, Д. Теория и практика,построения баз данных / Д. Кренке. 9-е изд. - СПб.: Питер, 2005. - 864 с. - ISBN 5-94723-583-8.

48. Крылов, В. В. Теория телетрафика и ее приложения / В. В. Крылов, С. С. Самохвалова. СПб.: БХВ-Петербург, 2005. - 288 с. - ISBN 5-94157-569-6.

49. Кудрявцев, Е. М. Mathcad 2000 Pro / Е. М. Кудрявцев. М. : ДМК Пресс, 2001. - 576 с. - ISBN 5-94074-006-5.12 Г»

50. Ларман, К.,Применение UML и шаблонов проектирования / К. Ларман. 2-е изд. : Пер. с англ. - М.: Издательский дом! "Вильяме", 2004. - 624 с.

51. Ларснон, Б. Разработка бизнес-аналитики в.Microsoft SQL Server 2005 / Б. Ларснон: СПб. : Питер, 2008. - 684с.

52. Леоненков, А. В. Самоучитель UML / А. В. Леоненков. 2-е издание -СПб.: БХВ-Петербург, 2004. - 432 с. - ISBN 5-94157-342-1.

53. Ломов, А. Ю. HTML, CSS, скрипты: практика создания сайтов / А. Ю. Ломов. СПб.: БХВ-Петербург, 2006. - 416 с. - ISBN 5-94157-698-6.

54. Макарычев, П. П. Оперативный и интеллектуальный анализ данных: учеб. пособие / П. П. Макарычев, В. Б. Механов, А. Ю. Афонин. Пенза»: Изд-во ПТУ, 2010.-156 с.

55. Маклаков, С. В. Создание информационных систем: с AllFussion Modeling Suite / С. В. Маклаков. М.: ДИАЛОГ-МИФИ, 2003. - 432 с. -ISBN 5-86404-181-5.

56. Макленнен, Д. Microsoft SQL Server 2008: Data Mining интеллектуальный> анализ, данных; / Д. Макленнен; Ч. Ганг, . Б; Криват. - СПб.: БХВ-Петербург, 2009i-720 c: -ISBN978-5-9775-00M-l,

57. Малыхина,. М. 11. Базы; данных, основы, проектирование;', использование / М. П. Малыхина. СПб. : БХВ-Петербург, 2004: - 512 с.

58. Мандель, И. Д. Кластерный анализ- / И.Д. Мандель. Mi : Финансы и статистика, 1988. - 176 с. - ISBN 5-279-00050-7. '

59. Мешалкин, Л. Д. Статистические методы анализа экспертных оценок / Л. Д. Мешалкин. // Ученые записки по статистике. Ж 29: Ml: Наука; 1977. — С. 215-219 «

60. МИ 2356-96 ГСИ. Шкалыизмерений. Основные положения. Термины И' определения. М.: ВНИИФТРИ. - 34 с.

61. Миллер, Б. М. Теория ? случайных процессов в примерах и задачах / Б. М. Миллер, А. Р. Панков; М:: ФИЗМАТЛИТ, 2002.- 320 с. - ISBN 5-9221-0206-0.

62. Наследов, А. Д. Математические методы психолопвеского исследования. Анализ и интерпретация данных / А. Д. Наследов Учебное пособие. 3-е изд:, стереотип; - СПб. : Речь, 20081. - 392 с. - ISBN 5-9268-0275-7.

63. Нечаева, Е. Г. Статистика объектов нечисловой? природы и анализ данных о научном потенциале / Е. Г. Нечаева, А. И. Орлов, А. В. Соколов // Социология: 4М-№ 5-6, 1995.-С .118-136:

64. Нильсен, Я. Дизайн Web-страниц; Анализ удобства и простоты использования 50 узлов / Я. Нильсен, М. Тахир. М; : Вильяме, 2002. - 336 с. -ISBN 5-8459-0315-7.

65. Нугаева, К. Р. Информационная система поддержки принятия решений при управлении качеством образовательного процесса университета на основе онтологии: дис.канд. техн. наук: 05.13.10 / К. Р: Нугаева. Уфа, 2007: - 226 с.

66. Нуждин,. В. Н. Стратегическое управление качеством образования: Учеб. пособие / В. Н. Нуждин, Е. Г. Кадамцева. Иваново : Иван. гос. энерг. ун-т., 2002. - 88 с.

67. Орлов; А. И. Математические методы- исследования и теория измерений / А. И. Орлов // Заводская лаборатория. Диагностика материалов -2006. -Т.72, №1. С.67-70.

68. Орлов, А. Ш, Нечисловая- статистикам/ А. Ш Орлов. М.: МЗ-Пресс, 2004;-513 с.85: Орлов, А. И. Прикладная статистика. Учебник / А. И. Орлов. — М. : Экзамен, 2004. 483 с. - ISBN 5-472-01122-1.

69. Орлов, А. И. Экспертные оценки / А. И. Орлов // Заводская лаборатория. 1996: - Т.62, № 1. - С.54-60.

70. Орлов, А. Й; Экспертные оценки. Учебное пособие / А. И.! Орлов: —М;: 2002.-31 с."88; Орлов, С. Технологии разработки программного .обеспечения: Учебник / С. Орлов. СПб.: Питер, 2002. - 464 с.

71. Оутей, М. Эффективная работа: SQL Server 2000 / М. Оутей, П. Конте. СПб. : Питер; Киев : Изд. группа BHV, 2002. - 992 с.

72. Перегудов, Ф. И. Введение в системный анализ / Ф; И. Перегудов, Ф. П. Тарасенко; Учеб; пособие для вузов. - М. : Высш. шк., 1989; - 367 с.

73. Питерсон, Дж. Теория сетей Петри и моделирование систем / Джеймс Питерсон. Пер. с англ. - М: Мир, 1984. - 264 с.

74. Практические рекомендации по выбору типовой модели системы управления качеством образования для вузов и ссузов. СПб. : СПбГЭТУ «ЛЭТИ», 2005. - 209 с.

75. Преображенский, Б. Г. Синергетический подход к анализу и синтезу образовательных систем / Б. Г. Преображенский, Т. О. Толстых // Университетское управление: практика и анализ. 2004. — №г3(31). - С. 7-12.

76. Прошкина, Е. Н. Алгоритмы и методики анализа информации' в* системе управления качеством образования: дис.канд. техн. наук: 05.13.10 / Прошкина Елена Николаевна: Пенза, 2007. - 201 с.

77. Саати, Т. Принятие решений. Метод анализа иерархий / Т. Саати: — Пер. с англ. -М.: Радио и связь, 1993.-315 с. ISBN 5-256-00443-3.

78. Самохина, М. М. Социолог в библиотеке, или библиотекарь как социолог: практическое пособие для тех, кто хочет и любит исследовать / М. М. Самохина. М. : Рос. гос. юнош. б-ка., 2008. - 194 с.

79. Семененко, М. Г. Математическое моделирование в MathCad / М. Г. Семененко. М.: Альтекс-А, 2003. - 208 с. - ISBN 5-94271-012-0.

80. Смирнова, Г. Н. Проектирование экономических информационных систем: Учебник / Г. Н. Смирнова, А. А.Сорокин, Ю. Ф.Тельнов. М.: Финансы и статистика, 2003. - 512 с. - ISBN 5-279-02295-0.

81. Советов, Б. Я. Моделирование систем. Учебник для вузов / Б. Я. Советов, С. А. Яковлев. Изд. 4-е, стереотип./ 5-е, стереотип. - М.: Высшая школа, 2007. - 343 с. - ISBN 978-5-06-003860-6.

82. Спирли, Э. Корпоративные хранилища данных. Планирование, разработка и реализация. Т.1 / Э. Спирли. М. : Издательский дом "Вильяме", 2001. - 400 с. - ISBN 5-8459-0191-Х.

83. Сухарев, М. Г. Методы прогнозирования. Учебное пособие / М. Г. Сухарев. М. : РГУ нефти и газа, 2009 г., 208 с.

84. Технологии анализа данных: Data Mining, Visual-Mining; Text Mining, OLAP / A. Al Барсегян, M. С. Куприянов, B.B. Степаненко, И.И. Холод; 2-е изд., перераб. идоп.-СПб. : БХВ-Пегербург, 2008.-384 с.-ISBN978-5-94157-99Г-41

85. Толстова, Ю. Hl Анализ социологических данных. Методология, дескриптивная статистика; изучение связей между номинальными« признаками / Ю. Н. Толстова. Ml : Научный мир, 2000.- 352с.

86. Тюрин, Ю. Н. Анализе данных; на компьютере / Ю. Н. Тюрин, А. А. Макаров; под ред. В. Э1 Фигурнова. 3-е изд., перераб. и?доп. - М. : ИНФРА-М, 2003. - 544 с. - ISBN 5-16-001316-4.

87. Учебник по статистике StatSoft Электронный ресурс. Режим доступа: http ://www.statistica.ru

88. Фаронов, В. В. Создание приложений с помощью С#. Руководство программиста / В. В. Фаронов. М: ЭКСМО, 2008. - - 576 с.

89. Федеральныйг закон Российской Федерации от 27 июля 2006 г. № 149-ФЗ Об информации, информационных технологиях и о защите информации: принят Гос. Думой 8 шол. 2006 г. : одобрен Советом Федерации 14 июл. 2006 г.

90. Федотова, Д. Э:. CASE-технологии: Практикум / Д. Э. Федотова;. Ю. Д. Семенов, К. Н; Чижик. М. : Горячая линия - Телеком, 2005. - 160 с.

91. Флэнаган, Д. JavaScript. Подробное руководство / Д. Флэнаган. 4-е издание. - СПб. : Символ-Плюс, 2004. - 960 с.

92. Хованов, Н. В. Математические основы теории шкал измерения качества / Hi В.' Хованов: Л. : Изд-во ЛГУ, 1982. — 185 с.

93. Холл, М., Браун Л. Программирование для WEB. Библиотека профессионала / М. Холл, Л. Браун. Пер. с англ. — М. : Издательский дом «Вильяме», 2002. - 1264 с. - ISBN 5-8459-0237-1.

94. Хорстманн, К. С. Java 2/ Библиотека профессионала, том 1. Основы / Кей С. Хорстманн, Гари Корнелл. — 7-е изд., пер. с англ. — М: : Издательский дом «Вильяме», 2007. 896 с. - ISBN 978-5-8459-0970-1.

95. Чаплыгин, В. В. Стационарные характеристики системы массового обслуживания G/MSP/1/oo с поступлением заявок группами ограниченного объема / В. В. Чаплыгин // Информационные процессы Т. 6 - № 2,2006 - С. 144-152.

96. Чернышов, В. Н. Теория систем и системный анализ : учеб. пособие / В. Н. Чернышов, А. В. Чернышов. Тамбов : Изд-во Тамб. гос. техн. ун-та, 2008. - 96 с. - ISBN 978-5-8265-0766-7.

97. Чубукова, И.А. Data Mining. Электронный ресурс. / Чубукова, И.А. -Режим доступа: http://www.intuit.ru/department/database/datamining/, сводный.

98. Швецов, В. И. Базы данных / В. И. Швецов. Интернет-университет информационных технологий - М. : ИНТУИТ.ру, 2004. - 176 с.

99. Шеннон, Р. Имитационное моделирование систем. Искусство и наука. / Р. Шеннон. М.: Мир, 1978. - 418 с.

100. Ядов, В. А. Социологическое исследование: методология, программа, методы / В. А. Ядов. — Самара : Изд-во "Самарский университет", 1995 330 с.

101. Ядов, В. А. Стратегия и методы качественного анализа данных / В. А. Ядов // Социология 4М: методология, методы, математические модели, 1991, № 1.-С. 14-31.

102. Ядов, В. А. Стратегия социологического исследования / В. А. Ядов. -М.: Академкнига ИКЦ, 2003. 596 с.