автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Специальное математическое обеспечение краткосрочного прогнозирования на основе нейросетевого моделирования и анализа многомерного лага

кандидата технических наук
Крючкова, Ирина Николаевна
город
Воронеж
год
2007
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Специальное математическое обеспечение краткосрочного прогнозирования на основе нейросетевого моделирования и анализа многомерного лага»

Автореферат диссертации по теме "Специальное математическое обеспечение краткосрочного прогнозирования на основе нейросетевого моделирования и анализа многомерного лага"

На правах рукописи

иизи5Б770

КРЮЧКОВА Ирина Николаевна

СПЕЦИАЛЬНОЕ МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ И АНАЛИЗА МНОГОМЕРНОГО ЛАГА

Специальность: 05.13.11 - Математическое и программное обеспечение

вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Воронеж - 2007

003056770

Работа выполнена в Воронежском государственном техническом университете

Научный руководитель доктор технических наук, профессор

Кравец Олег Яковлевич

Официальные оппоненты: доктор технических наук, профессор

Подвальный Евгений Семенович;

кандидат технических наук, доцент Яскевич Ольга Георгиевна

Ведущая организация Сгарооскольский технологический

институт (филиал) Московского института стали и сплавов (технологического университета)

Защита состоится 26 апреля 2007 г. в 10 00 часов в конференц-зале на заседании диссертационного совета Д 212.037.01 Воронежского государственного технического университета по адресу: 394026, г. Воронеж, Московский просп., 14.

С диссертацией можно ознакомиться в библиотеке Воронежского государственного технического университета

Автореферат разослан 26 марта 2007 г.

Ученый секретарь /Л / ¿-М^

диссертационного совета ^ Питолин В.М.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

При решении задач, связанных с большими системами, особое внимание уделяется построению адекватных моделей, учитывающих такие особенности, как стохастичность, нестационарность, отсутствие полного математического описания объекта исследования. Ввиду невозможности построения математической модели, описывающей все аспекты функционирования таких систем, основной задачей становится исследование определенных параметров, которые характеризуют поведение сложной динамической системы и выявление влияющих на эти параметры факторов, целенаправленное изменение которых позволяет обеспечить требуемое направление развития процессов системы. Основой решения данной задачи является разработка моделей поведения сложной системы с учетом влияния различных факторов, позволяющих предсказывать значения контролируемого параметра и планировать развитие процесса на основе выявленных закономерностей.

В настоящее время вопросам прогнозирования показателей, описываемых временными рядами, уделяется значительное внимание. Теоретическим аспектам прогнозирования временных рядов посвящены работы А. В. Прасолова, в которых подробно исследованы математическая модель и проблемы исследования многомерных временных рядов с применением методов статистического анализа. Немалый интерес исследователей вызывает возможность применения нейросетевых методов анализа и прогнозирования параметров сложных систем, описанных многомерными временными рядами, в частности, В.Г. Царегород-цева, П.Е. Родионова, С.О. Восьмирко. Известно большое число публикаций, посвященных различным методам прогнозирования для широкого класса задач: прогнозирование на финансовых рынках (Я.Г. Бучаев, А.И. Галушкин, А.А.Ежов); прогнозирование событий в многомерных временных рядах, описывающих космофизические данные (Ю. С. Шугай, С. А. Доленко); прогнозирование грузооборота на железной дороге (И. А. Лаптев) и др. Для исследования поведения систем, описанных временными рядами, традиционно используются статистические методы, включая методы многофакторного анализа, с учетом требований к объему, однородности, полноте статистических выборок и известных законов распределения исследуемых признаков. Величина запаздывания может быть оценена по величине кросскорреляции, однако такой расчет проводится для пар временных рядов и обобщение указанного метода для произвольного количества факторов, значимо влияющих на исследуемую величину, отсутствует. Именно указанные ограничения традиционных методов прогнозирования привели к использованию для построения прогнозов методов нейросетевого анализа, не накладывающих строгих ограничений на исходные данные и не требующих полного формального описания функционирования системы.

В этой связи актуальность темы исследования продиктована необходимостью дальнейшего развития математических и инструментальных средств,

применяемых для нейросетевого анализа параметров сложных систем, описывающихся временными рядами с учетом запаздывания влияния значимых факторов с целью получения наиболее точного прогноза, используемого в контуре принятия решений системы управления.

Диссертационная работа выполнена в рамках основного научного направления Воронежского государственного технического университета - «Вычислительные системы и программно-аппаратные электротехнические комплексы».

Цель работы. Целью диссертационной работы является разработка специального математического и программного обеспечения принятия решений в сложных системах с многомерным входом и запаздывающим выходом на основе реализации методов нейросетевого моделирования и прогнозирования.

Для достижения указанной цели исследования необходимо решить следующие задачи:

1. Провести анализ и сформулировать проблемы нейросетевого прогнозирования поведения сложных систем, изменение параметров которых описывается временными рядами, с учетом запаздывания.

2. Осуществить формальную постановку задачи построения вектора оптимальных временных лагов в нейросетевом базисе с учетом ограниченного количества наблюдений.

3. Провести алгоритмизацию построения вектора оптимальных временных лагов и верификацию разработанных алгоритмов.

4. Реализовать специальное программное обеспечение системы прогнозирования многомерных временных рядов с учетом временных лагов (для решения задачи прогнозирования набора в высшие учебные заведения).

Методы исследования. При выполнении работы использованы методы математического моделирования, информационных технологий, статистического анализа, теории искусственных нейронных сетей.

Научная новизна работы. В результате проведенного исследования были получены результаты, характеризующиеся научной новизной:

• формализованное описание задачи построения прогнозирующей нейро-сети в контуре принятия решений, отличающееся учетом вектора временных лагов и позволяющее установить однозначное соответствие наборов входных и выходных параметров;

в алгоритм оптимизации параметров нейросети, обеспечивающий построение вектора оптимальных временных лагов, отличающийся ранжированием входов, описывающих историю влияющего фактора, в порядке уменьшения чувствительности нейросети;

• алгоритм функционирования линии задержки на входе нейросети, отличающийся учетом найденных временных лагов для каждой независимой переменной и позволяющий сформировать корректные множества для обучения, тестирования нейросети и получения уточненного прогноза;

« состав и структура специального программного обеспечения системы прогнозирования в контуре принятия решений, позволяющего повысить точ-

ность планирования показателей набора студентов и эффективность планирования деятельности негосударственного вуза, отличающаяся учетом запаздывания влияния значимых факторов.

Практическая значимость работы. Предложенный в работе комплекс алгоритмов нейросетевого прогнозирования многомерных временных рядов на основе анализа многомерного лага обеспечивает получение уточненных прогнозов контролируемого параметра сложной системы, повышение эффективности планирования развития процессов в системе, уменьшение корректив, вносимых в расчетные показатели. Учет отсроченного влияния факторов позволяет планировать управляющие воздействия на систему таким образом, чтобы получить требуемое значение контролируемого параметра в заданной временной точке. Использование современных информационных технологий в контуре принятия решений системы управления сложным объектом позволяет планировать позитивные изменения факторов, регулируемых в рамках системы, обеспечивая компенсацию негативного влияния внешних факторов.

Реализация и внедрение результатов работы. Основные результаты диссертации реализованы в Международном институте компьютерных технологий при создании системы прогнозирования набора студентов, обеспечивающей получение краткосрочного прогноза количества студентов и определения состава значимо влияющих на набор факторов.

Эффектом от внедрения результатов диссертации стало уменьшение корректив, вносимых ежегодно по результатам работы приемной комиссии МИКТ, в утвержденную нагрузку преподавателей и штатное расписание, более четкое планирование профориентационной деятельности и ценовой политики вуза, выявление наиболее существенных факторов, влияющих на количественные характеристики набора в негосударственный вуз, и определение мероприятий, снижающих влияние негативных факторов.

Апробация работы. Основные положения диссертации докладывались и обсуждались на Всероссийской научно-технической конференции «Информационные технологии» (Воронеж, 2005), Международной научно-практической конференции «Составляющие научно-технического прогресса» (Тамбов, 2005), Всероссийской конференции «Новые технологии в научных исследованиях, проектировании, управлении, производстве» (Воронеж, 2005), XI Международной открытой научной конференции «Современные проблемы информатизации» (Воронеж, 2006), IV Всероссийской научно-технической конференции "Вузовская наука - региону" (Вологда, 2006), III ежегодной межвузовской научно-практической конференции «Тенденции развития современных информационных технологий, моделей экономических, правовых и управленческих систем» (Рязань, 2006).

Публикации. Основные результаты диссертации опубликованы в 12 научных работах, в том числе 1 - в изданиях, рекомендованных ВАК РФ. В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежит в: [1] - алгоритм оптимизации вектора временных лагов; [2] - состав факторов, значимо влияющих на количественные показатели

набора; [4, 10] - исследование качественного поведения критерия оптимальности временного лага; [5] - постановка задачи нейросетевого моделирования набора в негосударственный вуз; [6] - способы кодирования нечисловых переменных на этапе предобработки исходных данных; [7] - способ реализации модуля сдвига и структура линии задержки; [9] - способ верификации процедуры поиска оптимальных временных лагов и результаты вычислительных экспериментов; [11, 12] - методы и технологии создания компонент системы прогнозирования.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 123 наименований и приложения. Основная часть работы изложена на 119 страницах, содержит 7 таблиц и 40 рисунков.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность диссертационного исследования, дается его краткая характеристика, формулируются цели и задачи исследования, научная новизна и практическая значимость основных результатов, приводятся сведения об апробации и внедрении работы.

В первой главе рассматриваются особенности моделирования и прогнозирования параметров сложных систем, характеризующихся комплексным составом факторов, влияющих на исследуемую величину, определены пути повышения точности прогнозирования ключевых параметров и выявления неявных закономерностей протекания процессов, приведен обзор математических методов прогнозирования временных рядов.

Моделирование сложной системы в общем случае может преследовать разнообразные цели, для достижения которых решаются комплексы задач, поэтому круг исследуемых моделей сложной системы ограничен такими, которые позволяют на основе анализа некоторого параметра, описывающего значимую характеристику системы, прогнозировать значение данного параметра, характеризующего и состояние системы в целом. В связи с этим обоснована необходимость рассмотрения существующих методов прогнозирования временных рядов и определения возможности их применения к прогнозированию некоторой характеристики сложной системы на основе наблюдений и предположений о влиянии на рассматриваемую величину некоторых факторов, доступных для наблюдения.

Показано, что для прогнозирования многомерных временных рядов в условиях ограниченного объема выборок, наличия пропусков в данных, значительных отклонений законов распределений погрешностей исследуемых величин от нормального, наиболее применимы методы нейросетевого анализа, основанные на рассмотрении исследуемой системы как «черного ящика» с доступными для наблюдений входами и выходами. Модель исследуемой системы в этом случае строится в процессе адаптации параметров нейросети к исходным данным, называемом обучением.

Если влияние значимого фактора на прогнозируемую величину проявляется по прошествии некоторого времени, называемого временным лагом, это существенно усложняет задачу прогнозирования. Для определения величины временного лага используют величину кросскорреляции пар временных рядов. Однако обобщения данного метода для произвольного количества независимых переменных не существует. Существующие нейросетевые методы анализа временных рядов также разработаны в предположении, что значения входов и выходов однозначно определяются в один момент времени.

Поэтому задача прогнозирования поведения сложной системы с ограниченным временем наблюдений и запаздыванием контролируемого параметра относительно влияющих факторов не сводится ни к одной из стандартных задач прогнозирования и требует учета ее основных особенностей: многомерности исходных данных, ограниченности экспериментальных выборок, наличия временных лагов по отдельным факторам.

Сделан вывод о целесообразности разработки моделей неоднородного нейросетевого анализа и алгоритмов построения вектора оптимальных временных лагов, позволяющих преодолеть ограничения, накладываемые на исходные данные в плане полноты, объема выборки и одновременности наблюдений.

Во второй главе осуществлена постановка задачи оптимизации параметров прогнозирующей нейронной сети, учитывающая наличие многомерного лага, проведена формальная постановка задачи построения вектора оптимальных лагов в одно- и многомерной задачах прогнозирования временных рядов методами регрессионного и нейросетевого анализа, предложена обобщенная структура прогнозирующей нейросети с учетом многомерного лага. Приведены результаты верификации предложенных моделей. Получен ряд теоретических результатов, являющихся основой алгоритма оптимизации многомерного лага.

Задача прогнозирования временного ряда в нейросетевом логическом базисе рассматривается в следующей формулировке. Имеются М временных рядов X], Х2,...ХМ по N наблюдений в каждом. Имеется исследуемая переменная Y - такой же по параметрам временной ряд, зависящий от рядов наблюдений. Необходимо построить и обучить нейросеть, реализующую отображение Y=q> (Хь Х2,...ХМ) с заданной степенью точности, на массиве исходных данных, содержащих значения наблюдений в моменты времени tis (i=0,l.....N-1). Обученная сеть используется для предсказания значения Y(t +Ду) на основе значений X(tN-Ax).

Обучение двухслойной нейронной сети при наличии временного лага представляет собой процесс поиска решения задачи минимизации целевой функции, называемой функцией ошибки, в виде: IN к м

min E=iX(yp-fp(Xwi?-(f(SwS;).(xj(t-Aj))))))2, (1)

1 p=1 ¡=1 j=0

где N - количество обучающих примеров, М - количество входов, W;/1' - вес i-го нейрона скрытого слоя, wki(2) - вес i-ro нейрона выходного слоя, К — количество нейронов в скрытом слое, х0 = 1, w0(l) = 1, \v0(2) = 1, А, - временной лаг для j-

го входа, хД1 - Д;) - смещенное на величину временного лага значение независимой переменной.

Согласно следствию из теоремы Колмогорова - Арнольда - Хехт-Нильсена, для любого множества пар входных-выходных векторов произвольной размерности существует однородная двухслойная нейронная сеть с последовательными связями, с сигмоидальными функциями активации и с конечным числом нейронов, которая для каждого входного вектора формирует соответствующий ему выходной вектор. Поэтому в качестве функции активации нейронов используется сигмокда:

Сформулируем ограничения на А^

1. Временной лаг А, должен быть неотрицательным, что определяется физическим смыслом задачи. Действительно, изменение независимой переменной в момент времени 1+1 не может влиять на значение зависимой переменной в момент времени I, отсюда Д, > 0.

2. Смещение точки наблюдений в сторону более ранних времен не должно приводить к выходу за нижнюю границу исходного временного ряда, так как явление, описываемое данным временным рядом, может отсутствовать в этот момент как таковое, и экстраполированные значения не будут иметь физического смысла. Следовательно, - Д;) е Х^

Добавление в выражение целевой функции переменной ^ не позволяет использовать для обучения ни один из стандартных алгоритмов, основанных на подборе весовых коэффициентов, так как наличие временного лага приводит к неопределенности выбора обучающих векторов. Следовательно, в связи с невозможностью одновременного определения оптимального временного лага и обучения сети (то есть решения задачи аппроксимации) необходимо рассматривать нахождение многомерного лага как отдельную оптимизационную задачу.

В диссертационном исследовании задача построения прогнозирующей нейросети с учетом запаздывания сведена к задаче построения вектора оптимальных временных лагов и задания с его помощью смещенных значений независимых переменных хДг - Д,), входящих в выражение (1). Тогда задача в постановке (1) может быть решена как стандартная задача обучения нейросети одним из известных методов, например, методом обратного распространения ошибки, реализованным практически во всех программных средствах нейросе-тевого моделирования.

Пусть учитываемые «прошлые» значения независимой переменной X, описываются подмножеством входов Sj = {х,(0, х^ - 1),... х,(1 - Д5),... х,(1 -двухслойной нейросети типа «многослойный персептрон» структуры М* - К -1. Здесь К - количество нейронов в скрытом слое, Д3 - временной лаг, Ь; - глубина выборки по ьму фактору, М* - количество входов нейросети, определяемое по формуле:

м

М* = £(1 + Ь;), (3)

¡=1

где М - количество учитываемых факторов. Данная формула позволяет определить состав входов при произвольной глубине погружения для каждого фактора. При Ь = О значения независимых переменных в предыдущие моменты времени не включаются в состав входного вектора.

Тогда чувствительность нейросети к удалению входа, соответствующего значению независимой переменной Х|(1 - Д5), может быть описана модулем абсолютной ошибки прогнозирования в виде:

EÄis =

К м

(4)

=1 }=0

где ЕД;5 - ошибка прогнозирования при удалении входа, соответствующего значению ьго фактора в момент времени г - Д5, - веса нейронов обученной сети; х^ - значение _)-го входа нейросети, ур - наблюдаемое значение прогнозируемого параметра в момент времени г.

В формуле (4) - элемент матрицы исключений, определяемый как

Л1 =

Ч

0,j = s+£(l + h;);

(5)

IjVs+XO + hi). k=]

Матрица исключений X'Sj введена для обеспечения возможности обнуления весов связей входа, соответствующего лагу Д5.

Для набора входов x/s, являющегося подмножеством входного вектора (x0,...xj) и описывающего историю изменения i-oro фактора, выполняется следующее соотношение:

xis =x'(t-As), (6)

где As - временной лаг, s = 0,.. .h¡.

Оптимальным будем считать такое значение временного лага Д5, при котором удаление соответствующего входа приведет к получению максимальной ошибки прогнозирования: JEaís x„eX¡ > max,

Максимальная глубина исторической выборки по каждому фактору не должна превышать половину длины исходного временного ряда. Временной лаг Д3 должен быть неотрицательным, поэтому

О < As < N/2. (8)

Окончательно задача оптимизации многомерного лага с учетом (2), (5), (б) и (8) выглядит так:

Е, =

Ур

к

Г=1

(24«2><!>-х*

3=0 N

х'ЧХ,

-»тах,

(9)

¡=1

Нелинейный характер функции (2), входящей в выражение (9), неопределенность выбора глубины выборки по каждому фактору, возрастающая при увеличении количества учитываемых факторов и глубин выборок размерность задачи требуют разработки специального нейросетевого алгоритма, учитывающего описанные ограничения.

Принципиальная возможность применения анализа чувствительности для нахождения оптимального многомерного временного лага была подтверждена в ходе вычислительного эксперимента, описанного ниже.

Анализ чувствительности проводился на тестовых данных, полученных расчетом значений наборов функций нескольких переменных с известным запаздыванием по некоторым переменным. В рассматриваемом ниже примере функция имеет вид (10):

У(0 = 10 + -

(Х1(1) + М)-1п(Х4(1))-Хз(1з) Х6(1) + 2,5Х5(15)

-0,44Х707) + Х8,

(Ю)

18 16 14 12 10 8 6 4 2 0

**жжжжжж»г**ж-'

ж^жжж^жж^яжжж**** жж*

о

XI Х6

10

■ Х2 Х7

20 - ХЗ Х8

30

- Х4

- У

40 - Х5

Рис. 1, Взаимное расположение восьми рядов значений независимых переменных X,((),... Х8({) и зависящей от них переменной У

Взаимное расположение рядов исходных данных ХЬ...Х8 и зависящей от них функции У, использованных в одной из серий эксперимента, приведены на рис.1.

Вариации параметров уравнения (9) породили набор нейросетей, обобщенная структура которых представлена на рис. 2.

В табл. 1 представлены значения ошибок обучения, обобщения и прогнозирования, полученные в ходе вычислительного эксперимента.

Таблица I

Качество обучений кейросетк и прогноза V

Набор входных переменных $.0. Кайо (на обучающем м ¡тожестве) |.0. Яапо (на контрольном множестве) МАРЕ, %

0.240844 0Л 84005 2.78

Х|(0, хг(0, Хз(М), х4(0, Х,(1-3), Х7(1-2), Хе(1) 0.09965 0.199094 1.37

Выборочные результаты анализа чувствительности набора нейросетей приведены на рис. 3. В рядах, изначально не обладавших временным лагом, например, Х/0, наибольшая чувствительность отмечена для входов Х^Хрис.З, а). Для рядов Х3(0, Х;(1), Х?(1) наиболее чувствительными оказались входы (Д3=1, Да=3, Д7=2) (рис.3, б).

Рис. 2. Обобщенная структура нейросети после оптимизации вектора временных лагов

§0.6 л

§0.4

ж

в

5 0.2 Й

>1

о

аамМ

ХЩ Х4(Щ ХЦЩ Х4Ц-1) Х4(1-3)

5 С од

1 в 0.3

о я 0.2

1 0.1

В" 0

б)

Анализ ошибок обучения, обобщения и прогнозирования на исходных и смещенных рядах, приведенных в табл. ], позволил сделать вывод О существенном снижении ошибки обучения и ошибки прогнозирования на смещенных рядах при практически неизменной ошибке обобщения, что свидетельствует об эффективности предложенного алгоритма и отсутствии структурных эффектов в изменении качества прогноза.

В третьей главе осуществлена алгоритмизация процедур неоднородного нейро-сетевого и регрессионного анализа, позволяющих построить вектор оптимальных

временных лагов значимых независимых переменных. В ходе решения основной задачи прогнозирования решены следующие подзадачи*.

ХЩ ХЗС-2) ХЗ(1-4) ХЗ(1-1) Х3(1-3)

Рис. 3. Выборочные результаты анализа чувствительности входов, отражающих историю изменения независимых переменных

Начало

Выбор очередной переменной для анализа

Процедура коррекции структуры и обучения сети

Процедура оценки чувствительности

Ранжирование

Определение М, соответствующего наивысшему рангу, Л,=А1

Запись значений временных лагов /

Конец

Рис.4. Алгоритм определения вектора оптимальных лагов

- определение вектора оптимальных лагов;

- сдвиг исходных временных рядов на величину найденных лагов.

Для определения оптимального временного лага по каждому временному фактору предложена процедура оценки чувствительности нейросети к значениям независимой переменной в различных временных точках с увеличением глубины погружения по анализируемому фактору. Максимальная глубина погружения определяется как N¡/2, где -. длина временного ряда ьй независимой переменной. Алгоритм представлен на рис. 4. Анализ чувствительности проводился по следующей схеме.

1 этап. Определение максимальной глубины погружения.

2 этап. Построение и обучение набора нейросетей с различным составом входов: глубина погружения исследуемого ряда принимается максимальной, остальные ряды представлены одним входом на ряд.

3 этап. Определение временного лага для каждого ряда с помощью анализа чувствительности нейросети к удалению входа.

После определения оптимальных временных лагов была построена новая совокупность данных, использованная для обучения сети методом обратного распространения ошибки и получения прогнозного значения зависимой переменной.

Найденные значения оптимальных временных лагов использовались для сдвига временных рядов независимых переменных и построения скорректированного множества исходных данных по следующей схеме:

1) определение максимального из найденных оптимальных лагов;

2) сдвиг каждого ряда на величину оптимального лага данной независимой переменной;

3) выбор тактики продолжения процесса: редукция рядов исходных данных на величину максимального лага или дополнение недостающих значений.

Сдвиг рядов исходных

Нз входы нейросети

А(Д,-ДМ)

результаты наблюдений ° «виртуальные» данные

Рис. 5. Принцип действия линии задержки

У X, X,

{

Х111-1 Хп

Рабочая

зона нейросе тевого анализа

1

'шах

Рис. 6. Формирование редуцированного множества исходных данных

данных осуществляется с помощью линии задержки, принцип действия которой представлен на рис. 5. Здесь х (1к) ~ значение г-й независимой переменной в к-ой временной точке, Л(Д 1... Дм) - вектор оптимальных временных лагов.

Для получения уточненной выборки для обучения и прогноза предлагается следующий алгоритм.

Шаг 1. Выбирается первый параметр X/.

Шаг 2. Выбирается соответствующий временной лаг Д/.

Шаг 3. Если значение временного лага Д, равно нулю, то значения г-ой независимой переменной в выбранные моменты времени переносятся в результирующую выборку без изменений. Иначе ряд сдвигается. Если значение X,- в момент /-А отсутствует, то выбирается тактика редукции или дополнения временного ряда, и в соответствии с выбранным вариантом получают укороченные (рис. 6) или дополненные ряды наблюдений.

Шаг 4. Присвоение нового значения X; в каждой временной точке.

Дополнение недостающих данных велось с использованием одной из трех тактик получения «виртуальных» значений.

Тактика I - производится дополнение временного ряда данными непосредственных наблюдений в данной точке.

Тактика II - дополнение временного ряда расчетными данными по выбранному алгоритму (средним по ряду, средним по соседним значениям, заполнение нулями).

Рис.6 иллюстрирует построение редуцированной матрицы исходных данных. Ограничением этого способа продолжения процесса служит необходимость поддержания количества обучающих примеров на уровне, достаточном для обучения нейронной сети.

Укрупненный алгоритм построения скорректированной выборки с дополнением пропущенных значений представлен на рис. 7.

Тактика сохранения подразумевает наличие в рядах исходных данных пропущенных значений, которые должны быть заполнены до начала процедур обучения и прогнозирования. При выборе тактики дополнения временного ряда необходимо учитывать особенности предметной области рассматриваемой задачи.

Таким образом, разработанный алгоритм оптимизации многомерного лага на основе анализа чувствительности с применением линии задержки на входе

Рис. 7. Укрупненный алгоритм расчета смещенных значений входов нейронной сети

нейросети позволяет учесть отсроченное влияние значимых факторов на прогнозируемую величину и устранить неопределенность в выборе вектора входных данных при обучении, тестировании нейросети и получении прогноза.

В четвертой главе рассматриваются результаты программной реализации разработанных алгоритмов для Международного института компьютерных технологий. Приведены описание и функциональная структура системы прогнозирования количественных показателей набора в негосударственный вуз, структура специального программного обеспечения, а также пользовательского интерфейса. Также приведены результаты практической апробации алгоритма поиска оптимальных лагов.

Система прогнозирования количественных показателей набора в негосударственный вуз предназначена для получения краткосрочного прогноза количества вновь набранных студентов. Она состоит из взаимозависимых подсистем, каждая из которых выполняет специфические функции и влияет на работу связанных с ней подсистем. В качестве ядра системы выбран пакет нейросете-вого анализа Statistics Neural Networks 4.0 (блок А2 на рис. 9), взаимодействие ядра с остальными подсистемами происходит на уровне данных в формате .xls. Для хранения данных выбрана реляционная база данных под управлением СУБД MS Access.

Укрупненная функциональная модель системы прогнозирования, соответствующая стандарту IDIEFÖ , представлена на рис. 8, структура специального программного обеспечения - на рис. 9.

Механизм дополнения временных рядоа

Статистически

данные

наблюдений

зависимой

величины

Алгоритм преобразования Преобразованные iданныег

Заданный уровень Точности прогноза

Предобработка данных (кодирование, шкали рованне, •заполнение пропусков)

Данные наблюдений влияющих факторов

Рис. 8.

\д „ОбучэкццйЕ. \ множество

Предварительный статистический анализ_К'

Тестовое множество

ч

Контрольн множество

ТОЧНОСТ!

прогнозг Ü1

Предвари лагов

Обучение нейросети A3

Л

гельныи вектор

Оптимизирована ые веса

Определение многомерного

лага _A4

Вектор оптимальных лагов

Сдвинутые ряды

Сдвиг временных рядов а;

Г

- Пропущенные данные

Краткосрочный

протоз

значения

зависимой

величины

Прогнозирование

на смещенных ¡-временных рядах

___ А6

Стандартный пакет

4 нейроанализа

Укрупненная функциональная модель системы прогнозирования

Модуль предобработки данных (блок А1, рис. 9) представляет собой программный модуль, осуществляющий преобразование результатов статистических наблюдений и экспертных оценок нечисловых параметров к виду, пригодному для использования этих значений в качестве входов нейросети. Выбор ал-

модуль предобработки данных

предобработанные данные

Обучающе в, тестовое, контрольн )в множеств;

Данные

реальных

наблюдений

БД

наблюдений

выбранные алгоритмы

ручного

ввода Решение о

достаточносп статистичв£1 анализа

A3

Подсистема статистического анализа

Краткосрочный статистический прогноз

1

■jfr™ 1 +

А5

Пол ьзоватсльскин интерфейс

Ошибка

лддел и ро в а н ия

А2

(Подсистема нейроаналнза и

Данные для

Модуль «Сдвиг временных рядов»

Сдвинутые данные для прогнозирования

Краткосрочный нейрепрогиоэ

Рис. 9. Структура специального программного обеспечения

горитма для преобразования определяется природой данных и может корректироваться пользователем. Также в функции рассматриваемого модуля входит предварительное определение ширины временного окна и формирование массива исходных данных для подсистемы нейросетевого анализа.

Подсистема статистического анализа блок (A3, рис. 9) предназначена как для быстрого получения краткосрочного прогноза, так и для предварительного определения вектора оптимальных лагов для ускорения получения нейросетевого прогноза.

Модуль сдвига (блок А5, рис. 9) реализован с помощью языка запросов к базе данных и реализует алгоритм, представленный на рис. 7.

Пользовательский интерфейс системы (блок А5, рис. 9) реализует функции взаимодействия с СУБД, выбора расчетных алгоритмов, отображения результатов работы модулей А1, A3, А4.

Специальное программное обеспечение разработано в среде визуального программирования Delphi версии 7.0 с применением методов объектно-ориентированного программирования. Компоненты системы «Линия задержки для моделирования смещенных временных рядов» и «Определение вектора оптимальных лагов для моделирования смещенных временных рядов» прошли государственную регистрацию в ФАП ВНТИЦ.

В ходе предварительного анализа выделены следующие факторы, выступающие в роли независимых переменных: демографическая ситуация в регионе (Xi); относительная цена обучения за учебный год (Х2); соотношение стоимости обучения и уровня благосостояния населения в регионе (Х3); востребованность специалистов на рынке труда (X»); уровень требований к поступающим в вуз (Х5); конкуренция на образовательном рынке (Х6); формы обучения, принятые в вузе (Х7); наличие альтернатив высокорейтинговым специальностям (Х8); наличие аспирантуры (Х9); уровень оплаты труда специалистов (Х!0); престиж

вуза (Хп); наличие у образовательного учреждения государственной аккредитации (Х,2).

Исследования проводились на базе Международного института компьютерных технологий (г. Воронеж). Информационную базу моделирования и прогнозирования составили абсолютные значения количества абитуриентов по каждой специальности за период 1995-2006 гг., а также статистические данные открытой печати, характеризующие сферу образования, занятость и благосостояние населения региона. Целью прогнозирования являлось получение абсолютной величины количества абитуриентов по каждой специальности. Точность прогнозирования оценивалась по данным о количестве абитуриентов, представленным Приемной комиссией МИКТ.

Структура нейросети определялась с использованием генетического алгоритма, реализованного стандартными средствами пакета нейросетевого анализа Statistica Neural Networks 4.0. Из исследованного набора, содержавшего 150 двух- и трехслойных нейросетей с различным количеством нейронов в скрытом слое, окончательно выбрана сеть структуры 9-12-1, характеризующаяся наименьшей погрешностью. Общее количество весов данной сети равно 120. Из модели исключены входы Х8, Х9, Хю, Хп как наименее значимые. Исходный массив данных содержал 162 обучающих примера. Было выделено обучающее множество из 130 примеров, тестовое и контрольное множества содержали по 16 примеров. Для достижения приемлемого уровня обобщения была применена реализованная в Statistica Neural Networks 4.0. процедура редукции, основанная на присвоении нулевых значений наименьшим весам связей нейросети. Обучение проводилось методом обратного распространения ошибки стандартными средствами указанного нейропакета с кросс-проверкой и перемешиванием наблюдений.

Как следует из приведенных в табл. 2 результатов нейросетевого и регрессионного анализа, учет оптимальных временных лагов повышает адекватность как нейросетевой, так и регрессионной модели.

Таблица 2

Процентная погрешность прогнозирования при использовании регрессионной и

нейросетевой моделей на исходных и смещенных данных

Метод получения результирующих данных Количество потенциальных абитуриентов, чел. Процентная погрешность МАРЕ = (|Y-Y"|)/Y, %

Фактическое значение, Y 141 -

Прогнозное значение, Y* Регрессионная модель (без учета лага) 179 27

Регрессионная модель (с учетом лага) 157 11

Нейросетевая модель (без учета лага) 130 8

Нейросетевая модель (с учетом лага) 136 4

Нейросетевая модель оказалась более чувствительна к наличию даже минимального временного лага. При проведении множественного корреляционного анализа единичный лаг по фактору Хз обнаружен не был. Полученные значения временных лагов сведены в табл. 3.

Таблица 3

Значения временных лагов Д^ полученные в ходе нейросетевого анализа

Номер фактора ] 1 2 3 4 5 6 7 и

Значение временного лага Д^ 2 0 1 2 0 2 0 0

лет

На основе полученных результатов были сделаны выводы о существовании отсроченного влияния факторов Хь Х3, Хд, Х6 на количественные показатели набора.

Отсроченное влияние возросшей конкуренции может быть объяснено неинформированностью потенциальных абитуриентов в первые два года после появления на рынке образовательных услуг нового участника.

Двухгодичный лаг между1 уменьшением количества выпускников и снижением показателей набора менее очевиден, но можно предположить, что его существование обусловлено призывом части потенциальных абитуриентов на воинскую службу, а также тем, что значительную часть студенческого контингента негосударственного вуза составляют недобившиеся успеха абитуриенты бюджетных отделений государственных вузов.

Предполагалось, что снижение востребованности специалистов определенного направления сказывается на количестве абитуриентов по прошествии 5 лет, что можно объяснить определенной «инерцией» предпочтений потенциальных потребителей и заказчиков образовательных услуг. Найденное значение временного лага для этого фактора значительно меньше (2 года), что можно объяснить возросшей информированностью участников рынка труда и осознанной потребностью потенциальных потребителей и заказчиков образовательных услуг в получении профессии, востребованной на рынке.

Временной лаг между изменением платежеспособного спроса и набором объясняется тем, что решение о покупке образовательной услуги делается на основе доходов семьи, по крайней мере, за год до совершения самой покупки.

Найденные значения оптимальных лагов не противоречат закономерностям предметной области, а их учет повышает точность прогнозирования практически вдвое.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Осуществлена формальная постановка и анализ задачи построения прогнозирующей нейронной сети с учетом временных лагов. Обоснована необходимость нахождения многомерного временного лага как решения отдельной оптимизационной задачи.

2. Сформулирована задача поиска оптимального временного лага, минимизирующего ошибку предсказания нейросети. Предложен и обоснован метод для построения алгоритма поиска оптимального временного лага на основе анализа чувствительности нейросети к удалению входа, описывающего значение независимой переменной во временной точке, соответствующей оптимальной величине временного лага.

3. Осуществлена алгоритмизация построения оптимального многомерного лага и верификация предложенного алгоритма.

4. Предложен алгоритм функционирования линии задержки, позволяющий учесть найденные значения временных лагов для каждой независимой переменной и сформировать корректные множества для обучения, тестирования нейросети и получения уточненного прогноза.

5. Структурированы компоненты специального программного обеспечения системы многомерных временных рядов с учетом временных лагов. Разработаны программные средства системы прогнозирования набора студентов в высшее учебное заведение.

6. Исследованы особенности прогнозирования количественных показателей набора студентов и определен состав факторов, оказывающих значимое влияние на рассматриваемый показатель и временной лаг по каждому из факторов.

7. Основные теоретические и практические результаты диссертации реализованы в Международном институте компьютерных технологий при создании системы прогнозирования набора студентов. Эффектом от внедрения результатов диссертации стало уменьшение корректив, вносимых ежегодно по результатам работы приемной комиссии МИКТ, в утвержденную нагрузку преподавателей и штатное расписание, более четкое планирование профориента-ционной деятельности и ценовой политики вуза, выявление наиболее существенных факторов, влияющих на количественные характеристики набора в негосударственный вуз, и определение мероприятий, снижающих влияние негативных факторов. Модули, предназначенные для определения величины запаздывания и сдвига временных рядов, зарегистрированы в ФАП ВНТИЦ.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ:

Публикации в изданиях, рекомендованных ВАК РФ

1. Кравец О.Я., Крючкова И.Н. Оптимизация параметров прогнозирующей нейронной сети // Системы управления и информационные технологии: науч.-техн. журнал. - 2006. № 2.1(24). - С. 154 - 159.

Статьи и материалы конференций

2. Крючкова И.Н., Кравец О.Я. Исследование особенностей нейросетевого моделирования социально-экономических процессов на смещенных временных ря-дач // Информационные технологии моделирования и управления. - 2005. № 4(22).-С. 494-501.

3. Кравец О.Я., Крючкова И.Н. Исследование чувствительности нейросетевой модели к наличию временного лага в задаче прогнозирования временных рядов // Территория науки. - 2006. № 1. - С.75-83.

4. Авдеева В.М., Крючкова И.Н., Кравец О.Я. Нейросетевое прогнозирование налоговых поступлений на смещенных временных рядах // Информационные технологии моделирования и управления. - 2006. № 9(34). - С. 1122 - 1130.

5. Крючкова И.Н., Кравец О.Я. О задаче прогнозирования устойчивого развития негосударственного ВУЗа // Составляющие научно-технического прогресса: сб. материалов междунар. науч.-практ. конф. - Тамбов: Першина, 2005. - С. 111-

6. Крючкова И.Н. Системный анализ данных для задачи прогнозирования набора в негосударственное высшее учебное заведение на основе нейросетевых технологий // Информационные технологии: материалы всерос. науч.-техн. конф. -Воронеж: Изд-во «Научная книга». - 2005. - С. 69-70.

7. Крючкова И.Н., Кравец О.Я. Подход к нейросетевому прогнозированию набора в высшее учебное заведение // Новые технологии в научных исследованиях, проектировании, управлении, производстве: труды всерос. конф. Воронеж, 2005. -

8. Крючкова И.Н., Чурикова C.B. Особенности препроцессирования данных в задаче нейросетевого прогнозирования набора в негосударственный ВУЗ // Вузовская наука - региону: материалы IV всерос. науч.-техн. конф. - Вологда: ВоГТУ, 2006.-С. 230-232.

9. Крючкова И.Н., Старикова Т.И. Алгоритм сдвига временных рядов с учетом оптимальных лагов в задаче нейросетевого прогнозирования набора в негосударственный ВУЗ // Тенденции развития современных информационных технологий, моделей экономических, правовых и управленческих систем: ст. конф. - Рязань: Изд-во РФ МЭСИ, 2006. - С. 150-154.

Ю.Крючкова И. Н. Структура линии задержки в задаче прогнозирования набора в вуз // Современные проблемы информатизации в информационных системах и телекоммуникациях: сб. тр.- Воронеж: Изд-во «Научная книга». — 2006. - Вып.11. - С.328 - 329.

П.Крючкова И.Н., Старикова Т.И. Программа «Линия задержки для моделирования смещенных временных рядов». - ФАП ВНТИЦ. Per. N50200601117 от 03.07.2006.

12. Крючкова И.Н., Дюнина Т.Г. Программа «Определение вектора оптимальных лагов для моделирования смещенных временных рядов». - ФАП ВНТИЦ. Per. ■ N50200601119 от 03.07.2006.

114.

С. 26-27.

Подписано в печать 19.03.2007. Формат 60x84/16. Бумага для множительных аппаратов. Усл.печ.л. 1,0. Тираж 90 экз. Заказ № /У/*.

ГОУ ВПО «Воронежский государственный технический университет» 394026 Воронеж, Московский просп., 14

Оглавление автор диссертации — кандидата технических наук Крючкова, Ирина Николаевна

Содержание.

Введение.

1. Проблемы и перспективы нейросетевою моделирования и прогнозирования поведения сложных систем, описываемых мнотмерными временными рядами.

1.1. Обзор методов построения прогностических моделей и их применение к исследованию поведения многомерных стохастических объектов, описываемых временными рядами.

1.2 Сложность задачи прогнозирование в условиях неполной информации.

Нейронные сети как инструмент решения нечетких задач.

1.3. Выбор архитектуры искусственной нейронной сети и алгоритма обучения для решения задачи прогнозирования многомерных временных рядов.

1.4 Цель и задачи исследования.

2. Оптимизация параметров про1 позирующей нейронной сети с учетом запаздывания выхода относительно многомерного входа.

2.1. Формализация задачи построения пейросети для ненулевого запаздывания.

2.2. Определение величины запаздывания для одной независимой переменной (входа).

2.3 Верификация методики определения многомерного лага па основе анализа чувствительности нейросети в задаче про1 нозирования многомерных временных рядов.

2 4 Выводы по главе 2.

3. Структурный синтез базы данных для системы прогнозирования.

3.1 Формирование информационной базы для прогнозирования. Предварительная обработка статистических данных и определение состава входов нейросети.

3.2. Алгоритмизация процедур неоднородною нейросетевого анализа.

3.3. Алгоритмизация процедур множественною рефессионного анализа с оптимизацией вектора запаздываний для значимых факторов.

3.4. Выводы по главе 3.

4. Программная реализация системы прогнозирования набора в высшее учебное заведение.

4 1. Структура системы и механизмы взаимодействия ее компонент.

4.2. Применение методов нейросетевого анализа для поддержки принятия решений при управлении сложными сииемами.

4 3. Прогнозирование набора в негосударственный вуз на основе традиционных нейросетевых процедур.

4.4. Сравнение результатов прогнозирования на основе нейроеетей с результатами статистического анализа.

4.5. Результаты оптимизации вектора запаздываний и сравнение с традиционными (нулевое запаздывание) результатами статистического и нейросетевого прогнозирования.

4.6. Выводы по главе 4.

Основные результаты работы.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Крючкова, Ирина Николаевна

Актуальность темы.

При решении задач, связанных с большими системами, особое внимание уделяется построению адекватных моделей, учитывающих такие особенности, как стохастичность, нестационарность, отсутствие полного математического описания объекта исследования. Ввиду невозможности построения математической модели, описывающей все аспекты функционирования таких систем, основной задачей становится исследование определенных параметров, которые характеризуют поведение сложной динамической системы и выявление влияющих на эти параметры факторов, целенаправленное изменение которых позволяет обеспечить требуемое направление развития процессов системы. Основой решения данной задачи является разработка моделей поведения сложной системы с учетом влияния различных факторов, позволяющих предсказывать значения контролируемого параметра и планировать развитие процесса на основе выявленных закономерностей.

В настоящее время вопросам прогнозирования показателей, описываемых временными рядами, уделяется значительное внимание. Теоретическим аспектам прогнозирования временных рядов посвящены работы А. В. Прасолова [83], в которых подробно исследованы математическая модель и проблемы исследования многомерных временных рядов с применением методов статистического анализа. Немалый интерес исследователей вызывает возможность применения пейросетевых методов анализа и прогнозирования параметров сложных систем, описанных многомерными временными рядами, в частости, В.Г. Царегородцева [103], Г1.Е. Родионова [85], С.О. Восьмирко [17]. Известно большое число публикаций, посвященных различным методам прогнозирования для широкого класса задач: прогнозирование на финансовых рынках (Бучаев Я. Г. [13], Галушкин А. И. [18], Ежов А. А. [26]); прогнозирование событий в многомерных временных рядах, описывающих кос-мофизические данные (Ю.С.Шугай, С.А.Доленко [105]), прогнозирование грузооборота на железной дороге (И. А. Лаптев [58]) и др. Для исследования поведения систем, описанных временными рядами, традиционно используются статистические методы, включая методы многофакторного анализа, с учетом требований к объему, однородности, полноте статистических выборок и известных законов распределения исследуемых признаков. Величина запаздывания может быть оценена по величине кросскорреляции, однако такой расчет проводится для пар временных рядов и обобщение указанного .метода для произвольного количества факторов, значимо влияющих на исследуемую величину, отсутствует. Именно указанные ограничения традиционных методов прогнозирования привели к использованию для построения прогнозов методов нейросетевого анализа, не накладывающих строгих ограничений на исходные данные и не требующих полного формального описания функционирования системы.

В этой связи актуальность темы исследования продиктована необходимостью дальнейшего развития математических и инструментальных средств, применяемых для нейросетевого анализа параметров сложных систем, описывающихся временными рядами с учетом запаздывания влияния значимых факторов с целью получения наиболее точного прогноза, используемою в контуре принятия решений системы управления.

Диссертационная работа выполнена в рамках основного научного направления Воронежского государа венного техническою университета -«Вычислительные системы и программно-аппаратные электротехнические комплексы».

Цель работы.

Целью диссертационной работы является разработка математического и специального программного обеспечения принятия решений в сложных системах с многомерным входом и запаздывающим выходом на основе реализации методов нейросетевого моделирования и прогнозирования.

Для достижения указанной цели исследования необходимо решить следующие задачи:

1 Провести анализ и сформулировать проблемы нейросетевого прогнозирования поведения сложных систем, изменение параметров которых описывается временными рядами, с учетом запаздывания.

2. Осуществить формальную постановку задачи построения вектора оптимальных временных лагов в пейросетевом логическом базисе с учетом ограниченного количества наблюдений.

3. Провести алгоритмизацию построения вектора оптимальных временных лагов и верификацию разработанных алгоритмов.

4. Реализовать специальное программное обеспечение системы про-I нозирования многомерных временных рядов с учетом временных лагов (для решения задачи прогнозирования набора в высшие учебные заведения).

Методы исследования. При выполнении работы использованы методы математического моделирования, информационных технологий, статистического аиализа, теории искусственных нейронных сетей.

Научная новизна работы. В результате проведенного исследования были получены результаты, характеризующиеся научной новизной:

• формализованное описание задачи построения прогнозирующей ней-росети в контуре принятия решений, отличающееся учетом вектора временных лагов и позволяющее установить однозначное соответствие наборов входных и выходных параметров;

• алгоритм оптимизации параметров нсйросети, обеспечивающий построение вектора оптимальных временных лагов, отличающийся ранжированием входов, описывающих историю влияющего фактора, в порядке уменьшения чувствительности нейросети;

• алгоритм функционирования линии задержки на входе нейросети, отличающийся учетом найденных временных лагов для каждой независимой переменной и позволяющий сформировать корректные множества для обучения, тестирования нейросети и получения уточненною прог ноза;

• состав и структура специального программного обеспечения системы прогнозирования в контуре принятия решений, позволяющего повысить точность планирования показателей набора студентов и эффективность планирования деятельности негосударственного вуза, отличающаяся учетом запаздывания влияния значимых факторов.

Практическая значимость работы. Предложенный в работе комплекс алгоритмов нейросетевого прогнозирования многомерных временных рядов на основе анализа многомерного лага обеспечивает получение уточненных прогнозов контролируемого параметра сложной системы, повышение эффективности планирования развития процессов в системе, уменьшение корректив, вносимых в расчетные показатели. Учет отсроченного влияния факторов позволяет планировать управляющие воздействия на систему таким образом, чюбы получить требуемое значение контролируемого параметра в заданной временной точке. Использование современных информационных технологий в контуре принятия решений системы управления сложным объектом позволяет планировать позитивные изменения факторов, регулируемых в рамках системы, обеспечивая компенсацию негативного влияния внешних факторов Реализации и внедрение результатов работы. Основные результаты диссертации реализованы в Международном институте компьютерных технологий при создании системы прогнозирования набора студентов, обеспечивающей получение краткосрочного прогноза количества студентов и определения состава значимо влияющих на набор факторов.

Эффектом от внедрения результатов диссертации стало уменьшение корректив, вносимых ежегодно по результатам работы приемной комиссии МИКТ, в утвержденную нагрузку преподавателей и штатное расписание, более четкое планирование профориентационной деятельности и ценовой полигики вуза, выявление наиболее существенных факторов, влияющие на количественные характеристики набора в негосударственный вуз, и определение мероприятий, снижающих влияние негативных факторов.

Апробация работы. Основные положения диссертации докладывались и обсуждались на Международной научно-практической конференции «Составляющие научно-технического прогресса» (Тамбов, 2005), Всероссийской научно-технической конференции «Информационные технологии» (Воронеж, 2005), Всероссийской конференции «Новые технологии и научных исследованиях, проектировании, управлении, производстве» (Воронеж, 2005), XI Международной открытой научной конференции «Современные проблемы информатизации в информационных системах и телекоммуникациях» (Воронеж, 2006), III межвузовской научно-практической конференции «Тенденции развития современных информационных технологий, моделей экономических, правовых и управленческих систем» (Рязань, 2006), IV всероссийской научно-технической конференции «Вузовская наука - региону» (Вологда, 2006).

Публикации. Основные результаты диссертации опубликованы в 12 научных работах, в том числе I - в издании, рекомендованном ВАК РФ. В работах, опубликованных в соавторстве, лично соискателю принадлежит в: [51] - состав факторов, значимо влияющих на количественные показатели набора; [52] - постановка задачи нейросетевого моделирования набора в негосударственный вуз; [3, 50] - исследование качественного поведения критерия оптимальности временною лага; [53] - способ реализации модуля сдвига и структура линии задержки; в [55] - способы кодирования переменных на этапе предобработки исходных данных; в [42] - алгоритм оптимизации вектора временных лагов; [41] - способ верификации процедуры поиска оптимальных временных лагов и результаты вычислительных экспериментов; [47, 54] - методы и технологии создания компонент системы прогнозирования.

Структура п объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 124 наименований и приложения. Основная часть работы изложена на 119 страницах, содержит 7 таблиц и 40 рисунков.

Заключение диссертация на тему "Специальное математическое обеспечение краткосрочного прогнозирования на основе нейросетевого моделирования и анализа многомерного лага"

Основные результаты работы

В ходе проведении диссертационных исследований автором были получены следующие результаты.

1. Осуществлена формальная постановка и анализ задачи построения прогнозирующей нейронной сети с учетом временных латв. Обоснована необходимость нахождения многомерного временного лага как решения отдельной оптимизационной задачи.

2. Сформулирована задача поиска оптимального временного лага, минимизирующего ошибку предсказания нейросети. Предложен и обоснован метод для построения алгоритма поиска оптимального временного лага на основе анализа чувствительности нейросети к удалению входа, описывающего значение независимой переменной во временной точке, соответствующей оптимальной величине временного лага.

3. Осуществлена алгоритмизация построения оптимального многомерною лаг а и верификация предложенного алгоритма.

4. Предложен алгоритм функционирования линии задержки, позволяющий учесть найденные значения временных лагов для каждой независимой переменной и сформировать корректные множества для обучения, тестирования нейросети и получения уточненного прогноза.

5. Структурированы компоненты специального программного обеспечения системы многомерных временных рядов с учетом временных лагов. Разработаны программные средства системы прогнозирования набора студентов в высшее учебное заведение.

6. Исследованы особенности прогнозирования количественных показателей набора студентов и определен состав факторов, оказывающих значимое влияние на рассматриваемый показатель и временной лаг по каждому из факторов.

7. Основные теоретические и практические результаты диссертации реализованы в Международном институте компьютерных технологий при создании системы прогнозирования набора студентов. Эффектом от внедрения результатов диссертации стало уменьшение корректив, вносимых ежегодно по результатам работы приемной комиссии МИК'Г, в утвержденную нагрузку преподавателей и штатное расписание, более четкое планирование профориентационной деятельности и цеповой политики вуза, выявление наиболее существенных факторов, влияющие на количественные характеристики набора в негосударственный вуз, и определение мероприятий, снижающих влияние негативных факторов.

Библиография Крючкова, Ирина Николаевна, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Абовский 1.. П., Максимова О. М. 11ейросетсвая модель прогнозирования. - 1Шр:///1и!коу. vvallst.nl/neu2002/abovski.litni.

2. Абовский П. П., Максимова О. М. Эффективный нейросетевой метод пошагового про! позирования и ею применение к многомерным задачам // НЕЙРОКОМПЬЮТЕРЫ, №8-9, 2003. С. 112 - 126.

3. Авдеева В. М., Крючкова И. П., Кравец О. Я. Нейросстевое прогнозирование налоговых поступлений на смещенных временных рядах // Информационные технологии моделирования и управления, № 9(34), 2006.- С. 1122-1130.

4. Айвазян С, А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998. - 1022 с.

5. Баранов В. А. Общие вопросы методологии и научного прогнозирования. -X, 1992.-230 с.

6. Барский А. Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2004. - 176 с.

7. Белоконь А., Владимирский Б. Устойчивое развитие университетов: подходы к принятию управленческих решений// Вестник высшей школы, № 6, 2003. С.З - 8.

8. Беляков А. Г., Маидель А. С., Борзенко Н. И. и др. Экспертно-статистические системы прогнозирования коротких временных рядов и имитационно-оценочное моделирование // Проблемы управления, №3, 2003 г. С. 30-38.

9. Бес гене Д., ван ден Берг В., Вуд Д. Нейронные сети и финансовые рынки. Принятие решений в торговых операциях. М.: ТВП, 1997.

10. Ю.Бобылев С. Н., Гнрусов Э. В., Перелет Р. А. Экономика устойчивого развития. М.: Ступени, 2004. - 303 с.

11. Бучаев Я. Г. Системное моделирование конъюнктуры фондового рынка // Весгиик ФА, №1(29), 2004. С. 53-63.

12. Веденина О., Яцепко В. Современное состояние негосударственных вузов России // Вопросы статистики, № 1, 1999. С. 45-50.

13. Воскапян М. Откуда берутся ИТ-специалисты. // Intelligent Enterprise, №1 (111),2005.-С. 28-32.

14. Востров Г. И., Любченко В. В., Полякова М. В. Моделирование временных рядов с использованием вей влет-сетей. // Искусственный интеллект, вып. 3, 2000.-С. 207-214.

15. Галушкин А. И. Теория нейронных сетей. М.: ИПЖР. -2000. -416 с.

16. Гилев С. Е. Алгоритм оценки вторых производных целевой функции в ходе обучения нейронных сетей методом типа backpropagation // Нейрокомпьютеры, № 4,2002. С. 57- 63.

17. Глазычев В. JI. Высшее образование в России. Аналитический доклад (http://wvvvv.glazychev.ni/projects/obrdocl/2004obrdocl.htm)

18. Головко В. А. Нейронные сети: обучение, организация и применение. -М.: ИПРЖР, 2001.-256 с.

19. Горбань А. Нейроипформатика и ее приложения (http://www.osp.ru/os/1998/04/05.htm)

20. Горелова Г. В. Теория вероятностей и математическая статистика в примерах и задачах с применением Excel. Ростов н/Д : Феникс, 2006. - 475 с.

21. Давыдов А. Социальное неблагополучие: зависимость объективных и субъективных оценок, НС! I (http://www.nns.ru/analit/pol/table.html).

22. Денежные доходы и расходы населения Воронежской области за 2002 -2005 гг. : аналитическая записка // Территор. орган Федерал, службы гос. стат. по Воронеж, обл. Воронеж, 2004. - 26 с.

23. Ежов А. А., Шумский С. А. Нейрокомпьютинг и его применения в экономике и бизнесе (http://neuroschooI.narod.ru/books/ezshncmp.htmI).

24. Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. чл.-корр. РАН И. И. Елисеевой. М.: Финансы и статистика, 1998. -368 с.

25. ЗО.Жабко А. П., Зубов Н. В., Прасолов А. В. Методы исследования систем с последействием. Л., 1984, 238 с.

26. Зайцев Ф. С. Применение нейронных сетей в задачах математического моделирования тороидальной плазмы // Доклады Российской Академии наук, Т. 393, №2, 2003. —С. 173-175.

27. Кабальное Ю.С., Дюльдина Э.В., Исмагилова Э.М. Нейросетевая модель прогнозирования выполнения стратегии качества обучения. // Известия Челябинского научного центра, вып. 1 (22), 2004. -С. 31-36.

28. Каллан Р. Основные концепции нейронных сетей.: Пер. с англ. М.: Издательский дом «Вильяме», 2003. - 288 с.

29. Коваленко В. М., Махотило К.В. Нейросетевая модель прогнозирования потребления газа в жилищно-бытовом секторе // Вестн. Национального тенхн. ун-та «ХПИ», т. 1, № 12. Харьков: НТУ «ХП1», 2002. - С.299-301.

30. Колемаев В. А., Калинина В.Н. Теория вероятностей и математическая статистика: Учебник / Под ред. В.А. Колемасва. М.: ИНФРА-М, 1999. -302 с.

31. Константинова О. Г. Формирование финансовых ресурсов системы профессионального образования (1Шр://онтют1-1.1105(1'пй.рагк|'пё.гп/геас1сг.а5р?потег=497).

32. Концепция модернизации российского образования на период до 2010 года // Учительская газета, №31,2002.

33. Корн Г., Корн Т. Справочник по математике (для научных работников и инженеров). М.: Наука, 1974. - 532 с.

34. Котов, В. Б., Политова С. В. Нейронные системы для моделирования причинности // Радиотехника и электропика, т.49, № 12,2004. С. 1452-1462.

35. Кравец О. Я. Гибридные алгоритмы оптимизации моделей множественной регрессии на основе кросскорреляции // Информационные технологии моделирования и управления, №4(22), 2005. С. 548-554.

36. Кравец О. Я., Крючкова И. II. Исследование чувствительности нейросете-вой модели к наличию временного лага в задаче прогнозирования временных рядов // Территория науки, № 1, 2006. С.75-83.

37. Кравец О. Я., Крючкова И. Н. Оптимизация параметров прогнозирующей нейронной сети //Системы управления и информационные технологии, №2.1(24), 2006.-С. 154- 159.

38. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов/ Под ред. проф. Н.Ш. Кремера. М.: ЮНИТП-ДАНА, 2003. - 311 с.

39. Крисилов В. А., Чумичкип К. В., Кондратюк А. В. Представление исходных данных в задачах нейросетевою про1 нозирова-ния (1шр:/А\г\\г\у.1|'Ьгагулпер1т1".п.^а1а/5С"епИ*Пс-5е55юп5/2003/ыепго1/184.pdf.)

40. Круглов В. В., Борисов В. В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия Телеком, 2002. - 382 с.:ил.

41. Крыжановский, Б. В., Магомедов Б. М., Микаэлян А.Л. Доменная модель нейронной сети // Доклады Российской Академии наук, 401, № 4, 2003. С. 462-466.

42. Крючкова И. Н., Дюнина Т. Г. Программа «Определение вектора ошимальных лагов для моделирования смещенных временных рядов». -ФАГ. ВНТИЦ. Per. N50200601119 от 03.07.2006.

43. Крючкова И. Н. Структура линии задержки в задаче прогнозирования набора в вуз // Современные проблемы информатизации в информационных системах и телекоммуникациях: Сб. трудов. Вып.П. Воронеж: Издательство «Научная книга», 2006. - С.328 - 329.

44. Крючкова И. И., Кравец О. Я. Исследование особенностей иейросечевого моделирования социально-экономических процессов на смещенных временных рядах // Информационные технологии моделирования и управления, №4(22), 2005. С. 494 - 501.

45. Крючкова И. Н., Старикова Т. И. Программа «Линия задержки для моделирования смешенных временных рядов». ФАП ВНТИЦ Per. N50200601117 от 03.07.2006.

46. Кукип А. В., Санькова Т. А. Прогнозирование изменения контингента студентов как необходимый фактор планирования ресурсного обеспечения вуза // Университетское управление, № 4(23), 2002. С. 65-69.

47. Куприянов, М. С., Нестерук Л. Г. Вопросы технической реализации ней-росетевых информационных систем // Известия вузов. Приборостроение, т. 46, №7,2003.-С. 63-69.

48. Лаптев И. А. Применение нейронных сетей с Gamma-памятыо для прогнозирования значений временных рядов // BKCC-CONNECT!, № 4, 2004.(http.7/www.connect.rn/jounial.asp?jid=329).

49. Лукашенко М. А. Высшее учебное заведение на рынке образовательных услуг: актуальные проблемы управления. М.: Маркет ДС, 2003. - 358 с.

50. Математические методы в экономике: Учебник / Под общ. ред. д.э.н., проф. Л. В. Сидоровича; МГУ им. М.В. Ломоносова. М.: Издательство «Дело и Сервис», 2004.

51. Мотории В. И. Критерии и методы декомпозиции динамики макроэкономических показателей: Препринт WP2/2005/02. М.: ГУ ВШЭ, 2005. -60 с.

52. Назаров Л. В., Лоскутов Л. И. Нейросетевые алгоритмы прогнозирования и оптимизации систем. М,: Наука и Техника, 2003.

53. Назаров Л. Е., Чухланцев А. А., Назарова 3. Т. Применение многослойных нейронных сетей для оценки влажности почвы по СВЧ радиометрическим измерениям // Информационные технологии, №4, 2004. С. 23-28.

54. Нейроинформатика / А. Н. Горбань, В. Л. Дунин-Барковский, А. II. Кир-дин и др. Новосибирск: Наука. Сибирское отделение РАН, 1998. - 296 с.

55. Пейронные сети. STATISTICA Neural Networks: Пер. с англ. М.: Горячая линия - Телеком, 2002. - 382 с.:ил.

56. Образование и культура в Воронежской области: стат.сб. // Воронеж, обл. комитет гос. стат. Воронеж, 1998. - 36 с.

57. Образование и культура в Воронежской области: стат.сб. // Воронеж, обл. комитет гос. стат. Воронеж, 1999. - 39 с.

58. Образование и культура в Воронежской области: стат.сб. // Воронеж, обл. комитет гос. стат. Воронеж, 2001. - 39 с.

59. Образование и культура в Воронежской области: стат.сб. // Воронеж, обл. комитет гос. стат Воронеж, 2003. - 40 с.

60. Образование и культура в Воронежской области: стат.сб. // Территор. ор-I ан Федерал, службы I ос. стат. по Воронеж, обл. Воронеж, 2004. - 68 с.

61. Образование и культура в Воронежской области: сгат.сб. //Территор. орган Федерал, службы гос. стат. по Воронеж, обл. Воронеж, 2005. - 68 с.

62. Образовательная политика России на современном этапе. Доклад Государственному Совету Российской Федерации // Высшее образование сегодня. 2001, №2.С. VI.78.0совский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2004. - 344 с.

63. Островский II. Критерии устойчивого развития: муниципальные аспекты (http://www.n-t.org/tp/ns/kur.html).

64. Павлов А. Н., Яисон И. Б., Анищенко В. С. Применение статистических методов при решении задачи глобальной реконструкции // Письма в ЖТФ, г. 23, №8, 1997.-С.7-13.

65. Пауков Д. Прогнозирование с помощью искусственных нейронных сетей (http://paukoff.fromru.com/neuro/wneuro/index.html).

66. Прасолов А. В. Математические модели динамики в экономике. СПб.: Изд-во СПбГУЭФ, 2000. - 247 с.

67. Пугачева Е. Г., Соловьенко К. Н. Высшая школа: стратегия выживания или стратегия развития? // Университетское управление, № 2(21), 2002. -С. 59-62.

68. Родионов П. Е. Извлечение знаний из эмпирических данных, представленных временными рядами. (http://iu5.bmstu.ru/-philippoviclia/rrS/IST4b/ITS4/Rodionov.htm).

69. Родионов П. Е. Методика извлечения знаний в задачах анализа рядов динамики с использованием нейронных сетей. : Дис. . канд. техн. наук : 05.13.17: М., 2003.

70. Российский статистический ежегодник. 2004: Стат.сб./Росстат. М., 2004. - 725 с.

71. Россия в цифрах, 2002: Крат.стат. сб./ Госкомстат России. М., 2002.

72. Савельев Л. Новый вызов? // Высшее образование в России, №1, 2002. С. 113.

73. Советов Б. Я., Яковлев С. А. Моделирование систем: Учеб. для вузов. -М.: Высш. шк., 2001.-343 с.

74. Статистика: Учеб.иособие / Под ред. проф. М. Р. Ефимовой. М.1 ИНФРА-М, 2000.-336 с.

75. Тейл Г. Прикладное экономическое прогнозирование. М.: Прогресс, 1970.-509 с.

76. Терехов С. А. Типовые задачи для информационного моделирования с использованием нейронных сетей. Снежинск, 2000 (1шр://а11Те.паго11.п1/1сс1иге5/1а5к5/1"т1ех.1Пт1).

77. Титова Н. Л., Бадаева О. Н. Совершенствование процессов разработки и принятия управленческих решений в высших учебных заведениях- схема исследования // Университетское управление, №5-6(33), 2004. С. 143-161.

78. Уоссерман Ф. Нейрокомпьютерная техника: теория и практика. М.: Мир, 1992.

79. Усков Л. А., Кузьмин А. В. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая лошка. М.: Горячая линия -Телеком, 2004. - 143 с.:ил.

80. Феклистов И. Ф, Золин П. М. Статистические проблемы качества ресурсного потенциала вузов России // Университетское управление, № 4(32) 2004. С. 7-18.

81. Хайкин С. Нейронные сети: полный курс. М.: ООО «И.Д. Вильяме», 2006.-1104 с.

82. Ходасевич Г. Б. Обработка экспериментальных данных на ЭВМ. Часть!. Обработка одномерных данных. СПб.: СПбГУТ, 2002.

83. Царегородцев В.Г. Оптимизация предобработки данных: константа Липшица обучающей выборки и свойства обученных нейронных сетей // Нейрокомпьютеры: разработка, применение, №7,2003. С.3-8.

84. Цареюродцев В.Г. Определение оптимального размера нейросети обратного распространения через сопоставление средних весов синапсов // Материалы XIV Международной конференции по нейрокибернетике, Рос-тов-на-Допу, 2005. С.60-64.

85. Шугай Ю. С., Доленко С. А., Персианцев И. Г., Орлов 10. В. Нейросе-гевой алгоритм прогнозирования событий в многомерных временнЕпх рядах и его применение для анализа космофизических данных. (1тр:/^ичу.пе11горго.ес1.г11/Рарег8/81шуа1г118.рс10

86. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. -ЮПИТИ-ДАНА, 2003.

87. Akhmetov Daourcn F., Dote Yasuhiko, Ovaska Seppo J. Fuzzy neural network with general parameter adaptation for modeling of monlinear time-series // IEEE Trans. Neural Networks, vol. 12, no 1, 2001. pp. 148-151.

88. Cao Fei-Long, Xu Zong-Ben. Neural network approximation for multivariate periodic functions: estimates on approximation order // J. Comput., 24, no 9, 2001.-pp. 903-908.

89. Clielani A. B., Rao C. V. C., Phadke K. M., Hasan M. Z. Prediction of sulphur dioxide concentration using artificial neural networks // Environ. Model. Softw. (, vol. 17, no. 2,2002.-pp. 161-168.

90. Costa M. Pasero E. Artificial neural systems for verglass forecasting // IEEE, vol. 1,2001.-pp. 258-262.

91. Fukunaga Y., Inouc H., Narihisa H. Efficient hybrid neural network for chaotic time series prediction //Trans. Inst. Electron. Inf. Commun., vol. J85D-II, no. 4,2002. pp. 689-694.

92. Jong Hoon Kim, Yong Hyup Kim. A predictor-corrector method for structural nonlinear analysis // Comput. Methods Appl. Mech., vol. 191, no. 8-10, 2001.-pp. 959-974.

93. Kon M., Plaskota L. Complexity of neural network approximation with limited information: a worst case approach //J. Complexity, vol. 17, no. 2, 2001. -pp. 345-365.

94. Leustean L. Liquid flow time series prediction using feedforward neural networks and Rprop learning algorithm // Stud. Inf. Control (Romania), vol. 10, no 4,2001.-pp. 287-299.

95. Perez P., Reyes J. Prediction of particulate air pollution using neural techniques//Neural Comput. Appl., vol. 10, no. 2,2001. pp.165-171.

96. Shukla K.K. Neuro-genetic prediction of software development effort // Inf. And Software Technol., 42, № 10,2000. pp. 701-713.

97. Staniewski P. Prediction in time scries: Treshold models and neural nets. -Proc. 12lh Int. Conf. Syst. Sci., Wroclaw, 12-15 Sept., 1995, vol. 1, 1995. pp. 311-318.

98. Tadeusicvvicz R., Lula P. Neural networks analysis of time series data I I Informatica, 25, no. 1,2001. pp. 3-10.

99. Takens F. Detecting strange attractors in turbulence, I I Vol. 898 of Lecture Notesin Mathematics, 1981. pp. 366-381.

100. Vassiliadis Stamatis, Zhang Ming, Delgado-Frias Jose G. Elementary function generators for neural-network emulators. IEEE Trans. Neural Networks. 2000. 11, №6, pp. 1438-1449.

101. Zhang G.P. An investigation of neural networks for linear time-series forecasting. Comput. Res., vol. 28, no. 12,2001. - pp. 1183-1202.

102. Zliu Hanxi, Aoyama Tomoo. An iterative expression of the function: in case of the neural network. Mem. Fac. Eng. Miyazaki Univ., № 29, 2000. - pp. 145-156.