автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Система поддержки принятия решений при анализе временных рядов

кандидата технических наук
Журов, Александр Викторович
город
Красноярск
год
2007
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Система поддержки принятия решений при анализе временных рядов»

Автореферат диссертации по теме "Система поддержки принятия решений при анализе временных рядов"

На правах рукописи

Журов Александр Викторович

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ АНАЛИЗЕ ВРЕМЕННЫХ РЯДОВ

05 13 01 - Системный анализ, управление и обработка информации

Автореферат

диссертации на соискание ученой степени кандидата технических наук

ООУ А * —

Красноярск - 2007

003173276

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Красноярский государственный аграрный университет»

Научный руководитель кандидат физико-математических наук,

доцент Кузнецов Александр Алексеевич

Официальные оппоненты доктор технических наук,

профессор Семенкин Евгений Станиславович

доктор технических наук, профессор Дулесов Алексей Сергеевич

Ведущая организация Томский государственный педагогический университет

Защита состоится 15 ноября 2007 года в 14 часов на заседании диссертационного совета Д212 249 02 при Сибирском государственном аэрокосмическом университете им ак МФ Решетнева по адресу 660014, г Красноярск, пр им газ «Красноярский рабочий», 31

С диссертацией можно ознакомиться в библиотеке Сибирского государственного аэрокосмического университета

Автореферат разослан 15 октября 2007 года.

Ученый секретарь диссертационного совета

ИВ Ковалев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Одной из основных составляющих прогнозирования является информационно-математическое моделирование, включающее в себя как частный случай анализ временных рядов

Все современные теории прогнозировании в той или иной степени используют математический аппарат, связанный с понятием временного ряда Поэтому задача изучения анализа временных рядов актуальна как отдельная фундаментальная проблема, так и прикладная проблема конкретного частного случая (оценка параметров зависящих от времени технологических процессов, рынок ценных бумаг и т д)

Моделями, в основе которых лежат временные ряды занимались такие известные ученые как С А Айвазян, ИВ Бестужев-Лада, А И Орлов, ЕМ Четыркин, Дж Бокс, Р Браун, Г Джекинсон, С Хольт, П Уинтерсидр

Особую роль в современном менеджменте (принятии решений) играет стратегическое прогнозирование, включающее выработку главной цели бизнеса, прогнозирование как предвидение результатов развития, происходящего под воздействием существующих факторов, перспективное планирование в качестве системы мер, необходимых для преодоления отклонения прогнозируемых итогов от установленных параметров

Органической частью планирования является составление прогнозов, показывающих возможные направления 'будущего развития экономических, финансовых, социальных и промышленных структур, рассматриваемой в тесном взаимодействии с окружающей средой Вся как плановая, так и практическая работа в организации связана с необходимостью прогнозирования Каждый менеджер и специалист по планированию должен владеть основными навыками и технологией прикладного информационно-математического прогнозирования для принятия грамотных, обоснованных решений

Цель диссертационного исследования состоит в создании системы поддержки принятия решений, основанной на анализе временных рядов, для повышения эффективности прогнозов

Поставленная в диссертации цель достигается путем решения следующих задач

• анализа известных моделей и методов прогнозирования,

• модификации имеющихся моделей для осуществления более эффективных прогнозов,

• разработки комплексной системы прогнозирования, в основе которой лежит анализ временных рядов,

• содержательной реализации указанной системы на рынке цен вторичного жилья г Красноярска

з

Методы исследования. Основные теоретические и прикладные результаты работы получены на основе методологии системного анализа, а также информационных технологий и методов фундаментальной и прикладной математики

Научная новизна работы:

1 Разработан метод подбора параметров в моделях экспоненциального сглаживания для осуществления более эффективных прогнозов

2 Разработана методика построения взвешенного прогноза, основанная на результатах прогноза отдельно взятых моделей

3 Разработана комплексная система прогнозирования, основанная на анализе временных рядов

4 Реализована процедура анализа и прогнозирования цен на вторичном рынке жилья г Красноярска Показано, что наиболее эффективным методом прогнозирования является взвешенный прогноз

Значение для теории. Результаты, полученные при выполнении диссертационной работы, являются развитием моделей и методов прогнозирования

Практическая ценность. Разработанная в диссертации система прогнозирования временных рядов позволяет анализировать и прогнозировать показатели в социальных, экономических, финансовых и промышленных структурах Архитектура разработанной системы позволяет предотвратить потерю информации, что важно для достоверного прогноза в данных структурах

Реализация результатов работы. Полученные в диссертационной работе результаты внедрены

1) в работу компании «Брокер Кредит Сервис» (г Красноярск),

2) в учебный процесс ФГОУ ВПО «Красноярский государственный аграрный университет»

На защиту выносятся:

1 Метод подбора параметров в моделях экспоненциального сглаживания для осуществления более эффективных прогнозов

2 Методика построения взвешенного прогноза, основанная на результатах прогноза различных моделей

3 Комплексная система прогнозирования, основанная на анализе временных рядов

4 Результаты реализации процедуры анализа и прогнозирования цен на вторичном рынке жилья г Красноярска

Апробация работы Основные положения и результаты работы прошли всестороннюю апробацию на международных и всероссийских научных, научно-практических и научно-технических конференциях В том числе, на международной конференции «Аграрная наука на рубеже веков» (2006 г, Красноярск), межрегиональной конференции «Актуальные проблемы строительства» (2006 г, Красноярск), всероссийской конференции «Актуальные социально-экономические проблемы развития АПК» (2007 г, Красноярск), международной конференции «Студент и научно-технический прогресс» (2007 г, Новосибирск), международной конференции «Решетневские чтения» (2007 г, Красноярск)

Диссертационная работа неоднократно обсуждалась на научных семинарах Красноярского государственного аграрного университета и Сибирского государственного аэрокосмического университета

Публикации. По материалам диссертации опубликовано 8 работ (2 из них по списку ВАК) Полный список публикаций представлен в конце автореферата

Общая характеристика диссертации. Работа состоит из введения, трех глав, заключения и библиографического списка, включающего 57 наименований

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении дана общая характеристика проблемы, обоснована актуальность выбранной темы, определены цель и задачи исследования Сформулированы основные положения, выносимые на защиту, научная новизна, теоретическая и практическая значимость полученных результатов

В первой главе рассматриваются основные определения, а также цели и задачи анализа временных рядов

Ряд наблюдений

х{Н)ЛЬ\ Л(ы) С1)

анализируемой случайной величины £(/), произведенных в последовательные моменты времени . , называется временным рядом

Совокупность существующих методов и моделей исследования таких рядов зависимых наблюдений называется анализом временных рядов

Главная цель анализа временных рядов состоит в описании по возможности простых и экономично параметризованных моделей, адекватно описывающих имеющиеся ряды наблюдений и составляющих базу для решения, в первую очередь, следующих задач

• вскрытие механизма генезиса наблюдений, составляющих анализируемый временной ряд;

• построение оптимального (т, е наиболее точного) прогноза для будущих значений временного ряда,

• выработка стратегии управления и оптимизации анализируемых

процессов

Выделим 4 основных группы факторов, под воздействием которых формируются значения элементов временного ряда

(A) Долговременные, формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака х(7) Обычно эта тенденция описывается с помощью той -или иной неслучайной функции / (0> как

правило, монотонной Эту функцию называют функцией тренда или просто -трендом

(Б) Сезонные, формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака Обозначим результат действия сезонных факторов в виде неслучайной функции Поскольку эта функция должна быть периодической (с периодами, кратными "сезонам"), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи

(B) Циклические (конъюнктурные■), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической, демографической или астрофизической природы (волны Кондратьева, демографические "ямы", циклы солнечной активности и т п) Результат действия циклических факторов будем обозначать с помощью неслучайной функции цг(г)

(Г) Случайные (нерегулярные), не поддающиеся учету и регистрации Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов а, следовательно, и необходимость интерпретации х(1),д:(2), ,х{Ы) как наблюдений, произведенных над случайными величинами, соответственно, £(1),£(2), Будем обозначать результат воздействия случайных факторов с помощью случайных величин ("остатков", "ошибок")

Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов Аддитивная архитектурная схема влияния факторов А, Б, В, Г на формирования значений х(/), которая означает правомерность представления значений членов временного ряда в виде разложения

= + + ' = 12, ,Н (2)

Выводы о том, участвуют или нет факторы данного типа в формировании значений могут базироваться как на анализе содержательной сущности задачи (т е быть априорно-экспертным по своей природе), так и на специальном статистическом анализе исследуемого временного ряда

б

Отправляясь от приведенного выше аддитивного разложения временного ряда х(г), можно дать общую формулировку базисной цели его статистического анализа по имеющейся траектории анализируемого временного ряда х(?) требуется решить следующие задачи

(I) определить, какие из неслучайных функций /тр{[)> <р(() и у/{/)

присутствуют в разложении (2),

(II) построить "хорошие" оценки для тех неслучайных функций, которые присутствуют в разложении (2),

(ш) подобрать модель, адекватно описывающую поведение "случайных остатков" £■(/), и статистически оценить параметры этой модели

Успешное решение задач (1)~(ш), обусловленных базисной целью статистического анализа временного ряда, является основой для достижения конечных прикладных целей исследования, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда

В главе 2 рассматривается системный подход к анализу временных рядов Приступая к анализу дискретного ряда наблюдений, расположенных в хронологическом порядке, следует, в первую очередь, убедиться, действительно ли в формировании значений этого ряда участвовали какие-либо факторы, помимо чисто случайных При этом под «чисто случайными» понимаются лишь те случайные факторы, под воздействием которых генерируются последовательности взаимно не коррелированных и одинаково распределенных случайных величин, обладающих постоянными (не зависящими от времени) средними значениями и дисперсиями Ответ на поставленный вопрос получают, проводя статистическую проверку соответствующей гипотезы с помощью «критериев серий»

Если в результате проверки такой статистической гипотезы выяснилось, что имеющиеся наблюдения взаимно зависимы и неодинаково распределены (те образуют действительно временной ряд), то приступают к подбору подходящей модели для этого ряда Множество моделей, в рамках которого ведется этот подбор, ограничивается обычно тремя классами моделей

• модели авторегрессии и проинтегрированного скользящего среднего (АРПСС-модели),

• адаптивные модели одно-, двух-, трехпараметрического экспоненциального сглаживания (метод Брауна, метод Хольта, метод Хольта-Уинтерса),

• модели, основанные на кривых роста

Далее рассматриваются методы оценок параметров моделей, их адекватности и точности Для того чтобы модель была адекватна, необходимо выполнение следующих условий для величины ошибки

• случайность колебаний е($),

• соответствие распределения s(i) нормальному закону распределения,

• равенство математического ожидания e(t) нулю,

• независимость значений уровней e(t)

В моделях экспоненциального сглаживания подбор параметров предлагается осуществлять методом минимизации относительной суммарной погрешности

В случае однопараметрического сглаживания

Ун 1 +(1 -а)у„ где х, - наблюдаемые значения и у, - прогнозируемые значения Здесь, при

t> 2 все получаемыеyt будут зависеть оту\ и а Пусть a =—,(j = 0,1,2, ,«) и

и

Л -{У\1)>У\г\ >У\Р)1 У\г)} Введем функцию суммарной относительной погрешности

¡=i

Затем, находим минимум функции S

y,{yiP)><Zj)-x,

5(у,(р)а.)= mm

./=0,1,2, ,л /7=1,2,

В дальнейшем будем использовать jy, '1 и

В случае двухпараметрического сглаживания

At = оэсг + (1 - + ),

в^т-А-о+о-т-л

Пусть а (/,£ = 0,1,2, ,п), А^Ц™^, ,AXW, А^>} и

и и

.=fR.O) R.<2> р(9)

f№ J (2)

погрешности

Z?/^} Введем функцию суммарной относительной

После чего, находим минимум функции 5

S(Aip = mm S{Aï(p\Bx(ci\aJ,fik)

j=0,1,2, ,n k=0,l,2, ,n P=U2, ,rA 9=1,2, ,rB

В дальнейшем будем использоватьj , к*, А\(р ) и B\(q*) В случае трехпараметрического сглаживания

А = а-^— + (1 - аХА,_г + В,_х ),

t~T

Bt=j3(Al~At_l) + (l-j3)Bt-u

ct = У^г + 0 ~ y)ct-T

Пусть« =—, Pk=-, ys=- (j,k,s = 0,1,2, ,и),

À-(Àm À(2) j(P) ¿ы

СА={СДСЛ .СД, СД'} (А=1,2, ,7) Введем функцию суммарной относительной погрешности

.yAAÏ'KBÏ'fi.CpKaj.h.Yj-x,

i=i

После чего, находим минимум функции S

S{A^ \СНЬ \ar>pk„y,)= mm S{A^ ,aj,J3k,ys)

j к s о 12 ,n

к=0 I 2 n 5=0,1,2, p=l 2 r„ 9=1,2, Л уЛ=1,2, ,rc

В дальнейшем будем использовать/, A:*, s", и i3i(g*) и Ch( v/,*) (й=1,2, ,7)

Для оценки точности прогнозных свойств модели используется ретроспективный прогноз - подход, основанный на выделении участка из ряда последних уровней исходного временного ряда

Затем строится прогноз на будущее для адекватных моделей После чего вычисляется взвешенный прогноз, учитывающий прогнозные значения каждой из адекватных моделей

Рассмотрим два подхода построения взвешенного прогноза, учитывающего прогнозные значения и ошибки каждой из моделей

Пусть для прогнозирования значений временного ряда (1) используются различные методы и модели МъМ2, ,Мк Будем считать, что применительно к ряду (1) данные методы являются адекватными Пусть, также известно, что в результате проведения п экспериментов в прошлом, модель М1 обеспечивала наилучший прогноз т, раз На основе ретроспективного прогноза для каждой модели М3 (/=1,2, , к) рассчитаем относительную ошибку прогноза дJ для ряда

(1) Затем вычислим прогнозные значения у(~'\+1 (/=1,2, ) по каждому методу Ц

1. Взвешенный прогноз на основе матрицы парных сравнений. На

основе значений от, и и вычислим матрицу парных сравнений Ркхк, значения

которой равны р 5 =

_т1_

Ркхк ~

От] / т1 т2 / Щ

тх / тк т21тк

тк/т\ Щ/ тк

Далее рассчитаем весовые коэффициенты щ для каждой модели М}

к

2 А

«=1 _

ш = -

; к к

£

(3)

Нетрудно проверить, что ¿те =1 )=1

После чего получаем взвешенный прогноз

к

уш = £ ч>

2) Взвешенный прогноз на основе ошибок ретроспективного прогноза. Вычислим суммарную относительную ошибку

к

5 = £ 5, М

Весовые коэффициенты щ в данном случае будут равны

5-8,

{к-1)5

Нетрудно убедиться, что £ м/ =1 Взвешенный прогноз осуществляем по

/=1

формуле (3)

Общая схема комплексного анализа временных рядов представлена на

рис 1

ю

Рисунок 1 Общая схема комплексного анализа временных рядов

Номер квартала (начиная с 1 кварэла 2002 г)

Рисунок 2 График динамики значений цен за 1 м2 на вторичном рынке жилья г Красноярска

В третьей главе в качестве иллюстрации построенной системы анализа временных рядов рассматривается анализ цен на вторичном рынке жилья г Красноярска В качестве данных были взяты значения цен за один квадратный за период с 1 квартала 2002 года по 2 квартал 2007 года Данные были получены в Территориальном органе федеральной службы государственной статистики по Красноярскому краю

График динамики значений цен за 1 м2 на вторичном рынке жилья г Красноярска приведен на рис 2

Используя ретроспективный прогноз, было получено, что наилучшими моделями для прогноза являются АРПСС(2,0,1) и метод двухпараметрического экспоненциального сглаживания (метод Хольта), относительные погрешности ретроспективного прогноза которых равны 1,4% и 0,45%, соответственно

Взвешенный ретроспективный прогноз, позволил повысить точность прогноза Его ошибка составила 0,1%

Отметим, что все вычисления были проведены с использованием программ MS Excel, Statistica и MatLab

В заключении приведены основные результаты и выводы, полученные в ходе выполнения диссертационной работы

В результате анализа существующих методов и моделей прогнозирования, была создана комплексная система прогнозирования,

составными элементами которой являются как отдельно взятые известные модели (а также их модификации), так и вновь созданные методы прогнозировагия

К научно новым результатам, полученным в работе, мы относим следующее метод подбора параметров в моделях экспоненциального сглаживания для осуществления более эффективных прогнозов, методику построения взвешенного прогноза, основанную на результатах прогноза отдельно взятых моделей, разработку комплексной системы прогнозирования, основанной на анализе временных рядов

Работы автора по теме диссертации

1 Ширяева ТА, Кузнецова ЕМ, Шлешсин АК, Журов А В Применение стохастических моделей для прогнозирования динамики мировых рыночных цен на алюминий и медь Мат системы, выпуск 3 КрасГАУ, 2005, с 114-120

2 Ширяева Т А, Кузнецова, Журов А В , Студенский А Г Прогнозирование в модели скользящего среднего MA(q) Мат системы, выпуск 4 КрасГАУ, 2005, с 115-126

3 Кузнецов А А, Журов А В Об одном доказательстве основной теоремы теории игр Актуальные социально-экономические проблемы развития АПК, выпуск 1 КрасГАУ, 2006, с 129-133

4 Бородина Е В, Журов А В К вопросу о нахождении константы в методе экспоненциального сглаживания при анализе временных рядов Материалы XLV Междунар студ конф «Студент и научно-технический прогресс» Математика Новосибирский гос ун-т, 2007, с 73-74

5 Кузнецов А.А., Журов А.В. К вопросу о выборе констант в методах экспоненциального сглаживания при анализе временных рядов. Вестник СибГАУ, № 3, СибГАУ, 2007, с. 76-77

6 А В Журов Модификация метода наименьших квадратов при анализе временных рядов Мат системы, выпуск 6 КрасГАУ, 2007, с 59-60

7 Кузнецов А А, Журов А В Модель анализа временных рядов с учетом инфляции Труды междунар конф «Решетневские чтения», СибГАУ, 2007, с 28-29

8 Кузнецов А.А., Журов А В. Взвешенный прогноз на основе временных рядов. Вестник СибГАУ, № 4, СибГАУ, 2007, с. 62-63.

Санитарно-эпидемиологическое заключение № 24 49 04 953 П 000381 09 03 от 25 09 2003 г Подписано в печать 12 10 2007 Формат 60x84/16 Бумага тип №1 Офсетная печать Объем 1,0 п л Тираж 100 экз Заказ №1193 Издательство Красноярского государственного аграрного университета 660017, Красноярск, ул Ленина, 117