автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Разработка алгоритмов и процедур повышения точности факторного прогнозирования на основе эволюционной стратегии поиска прогнозирующего описания актуального процесса
Автореферат диссертации по теме "Разработка алгоритмов и процедур повышения точности факторного прогнозирования на основе эволюционной стратегии поиска прогнозирующего описания актуального процесса"
На
|писи
А
ГОРЕЛОВ Андрей Александрович
РАЗРАБОТКА АЛГОРИТМОВ И ПРОЦЕДУР ПОВЫШЕНИЯ ТОЧНОСТИ ФАКТОРНОГО ПРОГНОЗИРОВАНИЯ
НА ОСНОВЕ ЭВОЛЮЦИОННОЙ СТРАТЕГИИ ПОИСКА ПРОГНОЗИРУЮЩЕГО ОПИСАНИЯ АКТУАЛЬНОГО ПРОЦЕССА
Специальность 05.13.18 -"Математическое моделирование, численные методы и комплексы программ"
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Рязань 2005
Работа выполнена на кафедре вычислительной и прикладной математики ГОУВПО «Рязанская I осударственная радиотехническая академия».
Научный руководитель: доктор технических наук, профессор
Белов Владимир Викторович
Официальные оппоненты: доктор технических наук, профессор
Шибанов Александр Петрович
кандидат физико-математических наук, доцент Абрамов Владимир Викторович
Ведущая организация: Закрытое акционерное общество
НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ИНТРОСКОПИИ МНПО «СПЕКТР»
Защита состоится " 7 " окгября 2005 г. в 11 часов на заседании диссертационного совета Д212.211.02 в ГОУВПО "Рязанская государственная радиотехническая академия" по адресу 390005, г. Рязань, ул. Гагарина, 59/1.
С диссергацисй можно ошакомиться в библиотеке ГОУВПО "Рязанская государственная радиотехническая академия".
Автореферат разослан " 7 " сентября г
Ученый секрс1арь
диссертационного совета Д212.211.02 кандидат технических наук, доцент И.А^Телков
л
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы диссертационной работы. Перманентная потребность в повышении эффективности и действенности управленческих решений и организационных планов достаточно очевидна. Конкурентная борьба на рынке товаров и услуг, стремление максимизировать прибыль предприятия и минимизировать издержки производства, желание локализовать и уменьшить последствия аварий и техногенных катастроф стимулируют работы, нацеленные на повышение точности и надежности прогноза процессов различной физической и социальной природы, представленных временными рядами данных. Подавляющее большинство социально-экономических процессов, рассматриваемых на государственном уровне, могут быть категорированы как процессы с преобладающей детерминированной составляющей. Для моделирования и прогнозирования данных процессов широко используются такие методы, как классический и специальный регрессионный анализ, искусственные нейронные сети, эволюционные стратегии, системы одновременных уравнений, метод выявления и экстраполяции тенденций, метод «Гусеница», различные виды авторегрессий и так далее.
Одновременно с этим в настоящее время практически отсутствует математическое и программное обеспечение, нацеленное на автоматическое построение наилучшего формализованного описания проблемного социально-экономического процесса в классе всех возможных описаний. Создание такого обеспечения сопряжено с необходимостью разработки методов поиска наилучшего описания. Эти методы должны включать:
1) средства квалификации проблемного процесса и определения адекватного класса методов для его моделирования;
2) векторные показатели качества аппроксимации процесса;
3) алгоритмы многокритериального поиска решения в различных классах методов моделирования.
Успешное решение поставленных проблем позволит существенно повысить эффективность создания прогнозирующих моделей, применяемых для анализа и прогноза показателей социально-экономической сферы. Полученные результаты найдут широкое применение при создании информационно-аналитических систем в соответствии с концепциями оперативной аналитической обработки (OLAP) и интеллектуального анализа данных (Intelligent data analysis). Принципиально новыми элементами разрабатываемой концепции моделирования и прогнозирования проблемных процессов являются внедрение и интенсификация использования процедур альтернативного моделирования и обобщения альтернативных результатов; механизмов мониторинга состояния информационного обеспечения, процессов решения задач прогноза, актуализации моделей, идентификация параметров которых становится возможной по мере накопления статистического материала.
•»ОС. НАЦИОНАЛЬНАЯ Ê БИБЛИОТЕКА I
Актуальной темой современной теории моделирования и npoiиодирования процессов остаётся задача оценки коэффициентов множественной регрессии в различных «специальных» условиях, которая неявно основывается на предположении существования жестих причинно-следственных отношений между факторными признаками и результативным признаком. Ото предположение и порождает традиционные подходы к семантической интерпретации коэффициентов множественной регрессии. В то же время в реальных условиях для про)нозирования процессов достаточно только косвенных причинно-следственных связей, порожденных наличием общих закономерностей в процессах изменения факторных и результативных признаков; примером сказанного может служить метод прогнозирования на основе сценарных условий
Сценарные моделирование и прогнозирование основаны на делении социально-экономических показателей на две группы (факторные и результативные показатели, или признаки) и построении модели зависимости вторых показателей от первых Детение на указанные группы достаточно условно, жес!ких руководящих принципов осуществления такого деления пет, хотя определенная традиция уже сформировалась
К факторным показателям огносяг те, которые считают условно управ-тяемыми, i е. планируемыми Протнозирование этих показателей осуществляется, главным образом, экспертным путем. Конечно же, при этом \ioiyr использоваться и методы математического моделирования, включая метод выявления и экстраполяции тенденций, аппроксимирующие дифференциальные уравнения, системы одновременных разностных уравнений, искусственные нейронные сети, метод «Гусеница» и т.д
Группу рс зультативных (проблемных) показателей образуют многочисленные прочие показатели Моделирование и ripoi нозированис этих показателей также могут осуществляться различными методами, но при прогнозе на основе сценарных условий обычно применяется линейная множественная ретрсссия, в которой в качестве регрессоров используются факторные экзо-генно задаваемые «управляемые» («входные») показатели.
В насюяшее время многие социально-экономические процессы в Российской Федерации представлены временными рядами, имеющими короткую длину актуальной части - от 10 до 30 значений В таких условиях результаты протноза, полученные по разным методам, как правило, существенно отличаются друг от друга Кроме тою, ни один из существующих методов решения задачи прогноза не обладает явными преимуществами и не может быть использован как предпочтительный Способом преодоления данной проб темы может служить одновременное использование нескольких альтернативных методов, таких как регрессионный анализ, метод выявления и экстраполяции тенденций, метод прогноза поведения процесса и г д., в сочетании с процедурой сот ласования (обобщения) альтернативных результатов прогноза
Существует множество параметров, оценивающих качество прогноза, но практически все они являются показателями качества аппроксимации и, основываясь на предположении, что прогнозируемый процесс не меняет своего поведения в дальнейшем, используются как показатели прогнозирования. Использование показателей аппроксимации в качестве показателей прогнозирования не является очевидным, но из-за отсутствия последних - это наиболее ' приемлемое решение. Все это подтверждает необходимость введения новых показателей качества прогноза.
В настоящее время в области моделирования процессов чётко обозначилась актуальность задачи повышения уровня автоматизации процессов построения прогнозирующих описаний. Создание средств высокоуровневого моделирования и прогнозирования позволит расширить и интенсифицировать применение современных высокоэффективных методов разработки прогноза, что, в свою очередь, позволит повысить качество и своевременность принимаемых управленческих решений и планов.
При разработке теории и методов моделирования и прогнозирования процессов охватывается широкий круг математических и прикладных проблем, в развитие которых значительный вклад внесли российские и зарубежные ученые: А.Н. Тихонов, M.J1. Лидов, Е,3. Демиденко, С.А Айвазян, B.C. Мхитарян, B.C. Степанов, Т. Андерсен, Дж. Бендит, Дж. Бокс, Д. Бриллинд-жер, И. Вучков, Г. Дженкинс, М. Джонсон, М. Кендэл, Б. Монтгомери, А. Пирсол, А. Стьюарт, Г. Уолкер, К. Чатфилда, II. Дрейпер, Г. Смит, А. Алберт, Дж, Себер, Ф. Уоссермен, Дж. Форрестер и др. В разработку современных концепций организации хранения, представления и автоматизированного анализа данных наибольший вклад внесли Дж. Тыоки, Э. Кодд, В. Инмон.
Задача повышения уровня автоматизации неотрывно связана с задачей автоматического выбора адекватных прогнозирующих описаний проблемных процессов, для решения которой необходима разработка средств квалификации, многоальтернативного моделирования и обобщения альтернативных результатов, интерпретации и формирования итогового отчёта.
Многоальтернативное моделирование и процедуры обобщения результатов альтернативного прогноза необходимы не только для осуществления возможности автоматического поиска адекватной прогнозирующей модели, но и для решения проблемы углубления степени извлечения информационного содержимого из имеющегося статистического материала, поэтому, несмотря на обилие существующих методов прогнозирования процессов с детерминированной составляющей, в контексте проблемы разработки многоальтернативных прогнозов сохраняется актуальность задач разработки новых и улучшения известных методов построения прогнозирующих описаний. Актуальностью этих задач обусловлен выбор цели и задач диссертационной работы.
Цель и задачи диссертационной работы. Основной целью диссертационной работы является повышение точности и надёжности прогнозирования
процессов с преобладающей детерминированной составляющей за сче! повышения эффективности и уровня автоматизации процедур построения адекватных формализованных описаний и их применения для решения задач прогноза.
Поставленная цель работы включает решение следующих задач:
1. Разработка методики автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии.
2 Разработка векторного показателя качества - совокупности показателей, по которым осуществляется сравнение вариантов описания завйсимо-сж проблемного показателя от факторных признаков, а также способа применения векторного показателя качества для сравнения частных описаний, то есть способа многокритериального сравнения вариантов модели.
3. Разработка программного комплекса, реализующего предложенную методику поиска лучшей регрессионной модели.
4. Разработка способа автоматического определения наилучшего описания процесса в методе выявления и экстраполяции тенденций.
5. Разработка альтернативных алгоритмов автоматического построения математических моделей, основанных на эвристической самоорганизации, отличающихся структурой интегрирующего ядра, оптимизацией частных приближений и способом формирования популяции описаний.
Научная новизна диссертационной работы. В рамках диссертационной работы были получены следующие научные результаты:
1. Предложена методика построения модели линейной множественной регрессии, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию, что повышает полноту анализа вариантов и объективность получаемых результатов.
2. Предложена совокупность показателей качества прогнозирующих описаний, включающая показатели структурной и параметрической устойчивости модели, что гарантирует выбор среди возможных альтернатив описания с наибольшей прогностической силой.
3. Разработан способ автоматического определения наилучшего описания процесса в методе выявления и экстраполяции, обеспечивающий автоматический выбор адекватного описания и автоматическое определение наилучшей по критерию минимума среднеквадратической ошибки длины обучающей последовательности.
4. Разработаны алгоритмы автоматического построения математических моделей, основанные на методе эвристической самоорганизации, отличающиеся возможностью изменения структуры штгарирующе! о ядра (полиномы 2-й степени, дифференциальные уравнения 2-го порядка, искусственные нейронные сети), оптимизацией частных приближений и способом формиро-
вания популяции описаний, что обеспечивает повышение показателей качества формируемых алгоритмических описаний моделируемых процессов за счёт синтеза структуры модели, наиболее адекватной составу факторных признаков и специфике изучаемого процесса.
5. Предложена методика разработки прогноза социально-экономических показателей, отличающаяся применением альтернативных прогнозирующих моделей, что обеспечивает наиболее полное использование информационного содержимого имеющихся статистических данных.
Практическая значимость диссертационной работы. Полученные результаты являются существенной, но всё же начальной частью реализации концепции создания математических и программных средств для интегрированной высокоуровневой системы моделирования и прогнозирования социально-экономических процессов, обеспечивающей высокий уровень доступности современных методов прогнозирования широкому кругу аналитиков и управленцев. Основные результаты нашли отражение в программах:
^ "Маут" - программа интеллектуальной аппроксимации и прогнозирования процессов с детерминированной составляющей;
^ "№игоМаР" - программа моделирования зависимостей скалярной величины от векторного аргумента и прогнозирования экономических процессов на основе технологии искусственных нейронных сетей;
"Рас<:_рг" - программа эвристического поиска решения, предназначена для автоматического построения линейной фаюорной прогнозирующей модели процесса изменения во времени показателей социально-экономической сферы.
Основные положения, выносимые на защиту.
1. Методика автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии, предназначенная для прогнозирования методами сценарных условий и легированных переменных.
2. Понятие и способ применения векторного показателя качества в процессе поиска «наилучших» прогнозирующих описаний.
3. Программный комплекс, реализующий предложенную методику поиска лучшей регрессионной модели.
4. Способ автоматического определения «наилучшего» описания процесса в методе выявления и экстраполяции тенденций.
5. Алгоритмы автоматического построения математических моделей, основанные на эвристической самоорганизации, включающие процедуры оптимизации частных приближений, решения аппроксимирующих дифференциальных уравнений и синтеза искусственных нейронных сетей как механизма интеграции частных приближений.
Методы исследования. При выполнении работы использовались теория математического моделирования, методы вычислительной и прикладной ма-
тематики, статистическое и имитационное моделирование, эвристическое программирование.
Апробация работы. По теме диссертации сделаны доклады на 10-й международной научно-технической конференции «Проблемы передачи v обработки информации в сетях и системах телекоммуникаций», Рязань, 2001 г.; 11 -м международном научно-техническом семинаре «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2002 г.; 12-й международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г; 13-й международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; VII международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права», Москва, 2004 г.
Внедрение результатов. Результаты диссертационной работы внедрены: в Федеральной службе государственной статистики Российской Федерации; в учебный процесс студентов специальностей 220400, 351400 в Рязанской государственной радиотехнической академии Внедрённый программный продукт имеет свидетельство №5020050719 от 27.05.05 об официальной peí истрации программы «Программа эвристического поиска решения» (краткое название "FactJPr" vl.l) для ЭВМ в Отраслевом фонде алгоритмов и программ (ОФАП) Государственного координационного центра информационных технологий Минобразования России.
Публикации. Основные результаты диссертации опубликованы в 8 пе-чаiных работах, получены 3 свидетельства о регистрации программы для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и трех приложений. Основной текст содержит 170 страниц, 29 таблиц, 12 рисунков Список литературы состоит из 136 наименований. Приложения выполнены на 8 страницах.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении дана краткая характерно жка решаемой проблемы, обоснована актуальность 1емы, сформулированы цели исследования, показана ее прак!ическая ценное ib. Сформулированы основные положения, выносимые на защиту.
В первой главе определяются и рассматриваются вопросы, связанные с прогнозированием процессов с детерминированной составляющей. В настоящее время разработано и используется значительное количество методов прогнозирования, однако существующие методы прогнозирования, как правило, не нацелены на автомагическое построение наилучшего формализованного описания проблемного процесса в классе всех возможных описаний.
Среди методов построения всех возможных регрессий наиболее распространенными являются методы выметания, симметричного выметания, Фер-нивала и преобразования Хаусхольдера и Гивснса, а также метод построения пошаговой регрессии.
Метод пошаговой регрессии состоит в том, что на каждом шаге производится либо включение в модель, либо исключение из модели какого-то одного регрессора. В этой процедуре мы имеем два F -уровня — назовем их
Fm и F0UT ■ На каждом шаге один из регрессоров исключается, если при его удалении RSS увеличивается на величину, не большую чем умноженное на F0UT значение средней остаточной суммы квадратов RSS/(n—p). Другими словами, регрессор исключается на данном шаге, если F -отношение для проверки гипотезы в используемой в этот момент модели регрессии не превышает значения F0UT Если такому условию удовлетворяет несколько регрессоров, то выбирается тот из них, для которого увеличение RSS оказывается наименьшим. Если указанному условию не удовлетворяет ни один из регрессоров, то в модель включают регрессор, введение которого уменьшает RSS на величину, не меньшую чем умноженное на р значение средней остаточной суммы квадратов, подсчитанной после включения данного регрессора в модель. Процедура начинается с того, что мы подбираем (30, а затем пытаемся ввести в модель какой-нибудь регрессор. К сожалению, эта процедура приводит к единственному подмножеству и не предлагает альтернативных хороших подмножеств.
Важной задачей построения прогнозирующей системы является выбор тех уравнений регрессии, которые являются достаточно хорошими с точки зрения прогноза. При этом необходим метод, с помощью коюрого можно было бы сравнивать не только уравнения с одинаковым числом регрессоров, но и уравнения, мало похожие друг на друга как в отношении числа, так и в отношении состава регрессоров. Для этой цели употребляются различные методы сравнения, среди них:
• коэффициент детерминации R2 = ]|Г (i^ - Y)7 /^(Y, -Y)7;
• скорректированный коэффициент детерминации R] =\-[\-R2}\—-—];
п-р
RSS
• Ср-стагистика Мэлоуса С =—.- + 2р-п ;
р <5^
• MSEP-критерий (MSEP — mean square error of prediction^
где p — число параметров (г. е. число регрессоров плюс единица из-за ро )_ уравнения; п - количество наблюдений; ЯЖ^-остаточная сумма квадратов; подстрочный индекс р служит для обозначения того, что рассматривается
модель с р параметрами (т. е. модель, включающая р0 и р 1 других коэффициентов Р).
Выбор критерия во многом зависит oi того, каким образом модель собираются использовать. При сравнении моделей рекомендуется всегда вычислять не одну, а несколько мер. Описанные выше кршерии прогноза являются показателями, отражающими точность локальной аппроксимации (RSS, и учитывающими возрастание дисперсии оценок при увеличении количества оцениваемых параметров (модифицированный R2, Ср-статистика Мэло-уса, MSEP-кригерий, мера Мэлоуса). Все эти критерии отражают слепень согласования значений факторных признаков с результативным признаком на конкретном локальном наборе данных. При этом согласованность значений на одном наборе данных не гарантирует согласованности на другом наборе. Более того, согласованность на полном наборе данных не гарантирует согласованности на подмножестве набора. Главная цель оценки пригодности модели для решения задачи прогнозирования состоит в выяснении вопроса: найденная модель - это описание действительного соотношения между результативными и факторными признаками или же это чисто локальное согласование данных? Назовем этот вопрос основным вопросом квалификации описания (модели) процесса. Одним из достаточно эффективных способов решения основного вопроса квалификации является использование новых показателей, характеризующих устойчивость модели.
Во второй главе диссертационной работы предложены модифицированные методы группового учета аргументов.
Модифииированный алгоритм МГУАоп
Анализ известных методов построения математических моделей по результатам эксперимента показал, что МГУА остается достаточно эффективным средством создания математического описания процессов. Однако классические варианты МГУА базируются на фиксированных структурах опорных полиномов. При переходе на новый ряд в качестве аргументов используются лучшие приближения предыдущего ряда. Такой способ организации селекции изначально имеет методическое ограничение точности восстановления функций. Для улучшения свойств восстановления функций предлагается следующим образом модифицировать метод группового учета аргументов. Для обеспечения возможности быстрого восстановления зависимостей от одного аргумента необходимо ввести дополнительный этап формирования приближений от одиночных аргументов. Для обеспечения возможности точного восстановления простейших зависимостей от одиночных и парных аргументов, а также для повышения точности приближения функции в общем случае необходимо осуществлять подбор оптимальной степени полинома частного приближения, а не использовать "опорный" полином.
С учетом изложенного схему формирования набора аргументов улучшенного алгоритма можно изобразить в следующем виде:
Шар. О: £ —» Рт;
Шаг \: Р{0> * Р10) —>
Шаг 2 : (Р10) * Р°>) & (Р0) * Рт) -> Р(2);
Шаг г: *Р^)&(Р(Г']) *Р{гА)) Р{г);
где символ -> означает отображение вектора аргументов в вектор частных приближений функции; у(* - операция полуумножения векторов, результатом которой является упорядоченное множество упорядоченных пар, первый элемент которых принадлежит вектору VI, а второй - вектору у2; у,& У2 - операция объединения векторов (элементы V! дополняются элементами у2).
Данный алгоритм автопостроения модели обеспечивает достаточно точное восстановление законов и приемлемую для многих приложений аппроксимацию процессов. Однако он имеет следующие существенные недостатки. Во-первых, он требует большого объема памяти для хранения нарастающего объема частных приближений, используемых в качестве аргументов последующих шагов алгоритма. Во-вторых, он не отсевает несущественные факторы. Случайные проявления их влияния на изучаемый процесс могут негативно влиять на последующие приближения, понижая точность аппроксимации. Избавиться от указанных недостатков можно с помощью механизмов отбрасывания плохих промежуточных приближений.
На г-м шаге построения модели в качестве аргументов используются результаты (г-2)-го и (М)-го шагов алгоритма. Используя показатель погрешности приближения (г-1)-го шага ем, можно отбросить "плохие" аргументы К таковым можно отнести частные приближения, показатель е* погрешности которых заметно меньше (например, не менее чем в два раза) . Операцию выбора лучших приближений обозначим как 2?е5?(/5), где Р - вектор при-
Е
ближений, е - отбраковывающее значение погрешности приближения.
С учетом изложенного схему формирования набора аргументов улучшенного алгоритма можно изобразить в следующем виде:
1 «г-1
г = 2,3,...
Модифицированный алгоритм МГУАдп
Чтобы улучшить качество получаемых описаний, главным образом за счет повышения точности решения задач прогнозирования, предлагается в процессе реализации многорядных построений использовать не полиномиальные, а дифферальные частные приближения.
Схему формирования аргументов нового алгоритма автопостроения модели на основе дифферальных приближений и эвристической селекции можно изобразить в виде:
Шаг 0:ДГ->£(0);
Шаг1:Ве^фт*П(0))^От;
ч
Шаг г : ВезЦф1"1* «В(г'п)& * 0(гЧ))) г = 2,3,...
где £)'0), £>(|>, Ь{г) ,г = 2,3,... - векторы последовательных дифферальных приближений.
Традиционно для приближенного представления процессов используются полиномы, параметры которых оцениваются методом наименьших квадратов. Полиномиальные модели хороши тем, что во многих случаях обеспечивают приемлемую точность представления процесса и построить их достаточно просто. Однако они имеют один радикальный недостаток - плохо представляют динамику процесса при его восстановлении по отсчетам с ошибками, в том смысле, что с ростом порядка полинома и уменьшением погрешности приближения к заданным точкам увеличивается погрешность представления производных процесса Это приводит к ухудшению интерполяционных и экстраполяционных свойств модели.
Рассмотрим скалярный процесс как простую функцию времени у=ДЦ и поставим задачу восстановления этой функции по совокупности заданных отсчетов процесса. Используем в качестве внешнего дополнения предположение о том, что наблюдаемый процесс описывается линейным дифференциальным уравнением с постоянными коэффициентами п-го порядка
В общем случае это предположение не справедливо и поэтому можно
л-1
утверждать, что разность £„(/) = /(п){<)-не будет тождественно
]'о
равна нулю. Очевидно, что эту разность можно использовать как показатель точности представления рассматриваемого процесса решением дифференциального уравнения с постоянными коэффициентами. В качестве показателя
точности аппроксимации целесообразно использовать ее эффективное значение - средний квадрат на всем промежутке наблюдения: — _ >1-1 8г„ (г, ,?„,«) = ¡62„ № = |(/«"> (Г) - £ а, /0) (/))г А н
Конфоль качества аппроксимации по последней из учитываемых производных объясняется тем, что младшие производные, безусловно, приближаются более точно, то есть контролируется наибольшая из возможных погрешностей. Для нахождения компонентов вектора коэффициентов а необходимо решить относительно ап,а/,..., а„.у следующую систему линейных уравнений:
л-1
9а! =Ь„ ¿ = 0,1,..., л-1, гдеу„ - ]/<ч(/)/0)(ОЛ,Ь, = =
'I 'I
После того как коэффициенты \>1р Ъ, определены, в качестве приближения к рассматриваемому процессу используется функция g(t), являющаяся
Л~1
решением дифференциального уравнения: g^■")(t) = ^Г|aJg(J)(t).
у-0
В целом алгоритм построения модели с помощью дифференциальных приближений, когда искомая функция находится как решение дифференциальных уравнений, дает хорошие результаты и является действенным инструментом при прогнозировании процессов с преобладающей детерминированной составляющей.
Модифицированный алгоритм МГУАнс
Суть метода группового учета аргументов на основе самоорганизующихся искусственных нейронных сетей состоит в следующем: вместо вычисления полинома g частное приближение вычислялся на основе механизма нейронных сетей. В каждом последующем ряде селекции в качестве аргументов могут выступать как сами базовые аргументы, так и нейронные сети, полученные в предыдущем ряде селекции. В результате после выполнения г-го ряда селекции получим сложную комбинацию нейронных сетей.
В третьей главе разработаны: 1) методика автоматического поиска прогнозирующей функции для прогнозирования методом экстраполяции тенденций; 2) методика построения «наилучшей» прогнозирующей линейной множественной регрессии, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию для прогнозирования методами сценарных условий и легированных переменных.
Метод экстраполяции тенденций Для реализации поиска прогнозирующей модели определяется множество приближающих функций'
где F - множество приближающих функций;
f[i\t, = - ¿-я приближающая функция, т.е. формула, опреде-
ляющая структуру и параметры г'-й приближающей функции;
С - вектор параметров г'-й приближающей функции;
4 = - количество применяемых приближающих функций.
В этом множестве выделяется подмножеово функций, обладающих следующими свойствами: 1) для них могут быть определены селектирующие критерии; 2) для вычисления их параметров по заданным отсчётам не требуются начальные приближения. Такие функции в практике исследования социально-экономических процессов используются, если возникает необходимость разработки прогноза при малом объёме исходных данных.
Автоматическое определение вида функциональной зависимости, основанное на использовании характеристических отношений, представляющих собой формулы, имеющие постоянные значения при всех значениях аргумента (времени), может быть осуществлено следующим образом.
Реализуется двухэтапная проверка гипотезы о виде функциональной зависимости, адекватной прогнозируемому процессу. На первом шаге:
1) вычисляются выборочные среднеквадратичные отклонения S;, ..., Sf соответствующих характеристических отношений du d2, d где % - количество альтернативных описаний;
2) находится наименьшее из них: sf min(s;, ч2, ■ ■ •> s0>
3) функция № к объявляется кандидатом на использование в качестве приближающей функции.
На втором шаге проверяется статистическая гипотеза Но: M[c4J = const против альтернативы Я|:°М[^] / const. Если гипотеза принимается, решение считается найденным, в противном случае выдаётся заключение об отсутствии во множестве приближающих функций элемента, адекватного прогнозируемому процессу.
В данной главе показано, что показатель прогностической силы необходимо использовать в качестве критерия при сравнении конкурентных описаний, предназначенных для решения задачи прогнозирования. Один из возможных способов оценки прогностической силы модели основывается на использовании тестовой последовательности данных. Суть этого способа состоит в следующем.
Имеющаяся последовательность наблюдений (/„ у,), i = 1, 2,..., п, где t, -отсчеты времени, у, - отсчеты наблюдаемого процесса y^yiti), разбивается на две части - обучающую и проверочную (тестовую). Обучающая часть данных используется для синтеза конкурирующих описаний и оценки их параметров. С помощью этих описаний вычисляется прогноз значений тестовой последовательности. Точность прогноза проверочных данных используется в качест-
ве показателя прогностической силы модели. По этому показателю и выбирается наиболее подходящая для прогнозирования модель. Перед тем как использовать эту модель для реального прогноза, её параметры пересчитывают-ся по данным, включающим и неиспользованную ранее тестовую последовательность. Когда структура процесса достаточно устойчива, можно предложить правило: длина пт тестовой последовательности выбирается равной глубине прогноза пР - числу шагов по времени, на которые осуществляется прогноз. Длина П1 обучающей последовательности принимается равной п - пт. Смысл величин п, пР, пт, дополнительно поясняется рис. 1.
Обучающая последовательность Тестовая
объемом »1 последовательность
объемом пг*пр
Точка прогноза /
1 II Л ■
Оптимальный объем обучающей последовательности Ыа II »1 Г лубнка время прогноза ир
Полное количество наблюдений и
Рис. 1. Схема использования имеющегося объема выборки
Методы сценарных условий и лагированных переменных. При использовании метода сценарных условий набор регрессоров выбирается из множества первичных показателей, входящих в сценарные условия прогнозирования. Если используется метод-лагированных переменных, то в состав потенциальных регрессоров включается всё множество первичных показателей, задержанных по времени от одного до трёх учётных временных интервалов. Главная проблема решаемой задачи состоит в нахождении адекватных регрессоров, обеспечивающих наилучшие показатели качества прогноза.
На этапе предварительных исследований путем обработки статистических данных социально-трудовой сферы и статистического моделирования социально-экономических процессов установлено следующее: 1) при построении моделей многих проблемных показателей необходимо учитывать лаги факторов, поскольку значения результативного показателя иногда более коррелированы с предыдущими, а не с текущими значениями факторного показателя; эта особенность обусловливает существенное расширение списка потенциальных регрессоров модели - исходный список пополняется сдвинутыми вперед по времени показателями и, как следствие, усложняет применение переборных алгоритмов поиска лучшей модели; 2) невозможно указать единый критерий качества прогнозирующей модели, поскольку модель с хорошими показателями качества аппроксимации процесса может оказаться неустойчивой, её прогнозирующие способности в этом случае весьма сомнительны; 3) отношение (широко используемый показатель прогности-
ческой силы линейной регрессии) является одной из характеристик качества аппроксимации, оно прямо не связано с показателями устойчивости модели и поэтому в общем случае не может использоваться для оценки её прогнозирующих способностей.
Эти факты в сочетании с тем, что объем статистических данных (по годам) невелик, обусловили неприменимость известных методов нахождения «лучших» моделей множественной регрессии. Для нахождения адекватных факторов потребовалась разработка новой методики поиска лучшей в некотором смысле модели, основанной на использовании векторного показателя качества, сформированного из набора традиционных показателей качества аппроксимации процесса и показателей устойчивости модели как важных показателей ее прогнозирующих способностей.
Параметрическая и структурная устойчивость
Определение. Пусть ХУ[1], ХУ[2], ..., ХУ[Ь] - различные подмножества заданной выборки данных ХУ независимых переменных х,, х2, ..., и соответствующих значений функции у, А[1], Л[2], ..., А[Ь], А[\/] - векторы коэффициентов заданной линейной множественной регрессии с регрессорами хи Х2, .... Хр.1, найденные на подмножествах ХУ[1], ХУ[2], ..., ХУ[Ь] и на полной выборке ХУ соответственно. Показатели параметрической устойчивости ЛМР-модели вычисляются по формулам:
етах=тах<з ; * = с* = Аг, , гдее, = ¡^100%; а, = Ь^ХJ>
/>£о V «о I«,! V 1=1
кТа!.-
1
л2
5Х
^ У
. В указанных формулах етш - максимальное откло-
нение параметров модели; Е - среднее отклонение параметров модели; е* -среднее геометрическое отклонение параметров модели; е, - относительное отклонение /-го параметра от его среднего значения; а, - среднеквадратиче-ское (эффективное) значение /-го параметра модели; л-, - выборочное стандартное отклонение /-го параметра модели от его среднего значения; а1:, = 0; р- \, параметры модели; ]-я оценка /-го параметра модели; к=Ь+] -
количество оценок параметров модели, получаемых для оценки устойчивости модели. ■
Определение. Пусть ХУ[1], ХУ[2].....ХУ(Ъ] - различные подмножества
заданной выборки данных ХУ независимых переменных х,, х2, ..., хт и соответствующих значений функции .у; Х[1], Х[2], ..., Х[Ь], Х[УУ] - множества актуальных регрессоров, найденные на подмножествах ХУ[1], ХУ[2], ..., ХУ[Ь]
и на полной выборке XY соответственно. Показатель <; структурной устойчивое I и ЛМР-модели вычисляется по формуле:
<; = |Х [ 1 ]пХ [2]n .. nX [LI nX [VJ | /1 X [VJ | ■
Важнейшей особенностью данной формулы является то, что для её вычисления необходимо многократное решение задачи выявления множества актуальных регрессоров. Числитель формулы представляет собой количество независимых переменных, вошедших во все описания, найденные но выборкам XY[1], XY[2], .. , XYfL] и XY, а знаменатель - количество независимых переменных, вошедших в описание, найденное по полной выборке XY. Предложенный показатель структурной устойчивости для описаний в виде линейной множественной регрессии обладает следующим свойством: 0<q<l. При этом значение с-0 свидетельствует о полной структурной неустойчивости описания, a q=l - об абсолютной его устойчивости.
Определение Р.сли существует Ттах такое, что при всех Т>Тта1 состав вектора X (t0,T) актуальных в некотором смысле С регрессоров величины у
по переменным множества X на промежутке (0 < t £ /0 + Т не зависит от начального момент времени to, то элементы t вектора Xp(tü,T)
назовём структурно устойчивыми актуальными в смысле С регрессорами величины у по переменным множества ХВ
Векторный показатель качества
Компоненты векторного показателя качества прогнозирующего описания: 1) относительное остаточное среднеквадратическое отклонение Sr; 2) коэффициент детерминации R], характеризующий относительную точность аппроксимации вариативной части процесса; 3) статистика Дарбина-Уотсона (Durbin J., Watson G.S.) DW, характеризующая коррелированность невязок; чем менее коррелированны невязки, тем более DW близка к 2; 4) отношение 9 = F/Fp,(^n_p , дифференцирующее частные описания процесса, главным образом по числу степеней свободы: чем меньше р -1, тем больше S при прочих равных; 5) фактические уровни значимости гипотез о равенстве параметров модели нулю: а ~ < a(t. ),a(t,),.. ,a(tp ,); 6) векторный показатель устойчивости модели Stab, представляющий собой совокупность трех скалярных показателей; 7) ошибка прогноза правой точки Рг[|, измеряемая в процентах и
вычисляемая по формуле: Prm =\(у„ y?ih>)ly\ -100%, где у^Л> - последнее значение проблемного показателя, рассчитанное по модели, параметры которой оценены по отсчетам с номерами от 1 до и -1; 8) ошибка ретроспективы (обратного прогноза) левой точки Ret", измеряемая в процентах и вычисляемая но формуле Reti<] = - yf^')'у^ 100%, где у1fldl> - первое
значение проблемного показателя, рассчитанное по модели, параметры которой оценены по отсчетам с номерами от 2 до п .
Показатели 1 - 3 характеризуют качество аппроксимации проблемного процесса. Прогнозирующие способности модели характеризуются показателями 4-8. Совокупность всех указанных показателей рассматривается как векторный критерий качества описания.
С целью определения адекватных наборов регрсссоров для каждой линейной формы выполняется перебор всех возможных сочетаний факторных переменных от более простых структур к сложным. Для каждого сочетания вычисляются коэффициенты регрессии и показатели качества полученного варианта модели. Из получаемых вариантов формируется «динамическое» множество Парето. Из этого множества удаляются заведомо неприемлемые варианты, для которых выполняется хотя бы одно из следующих бракующих условий: 1) R2 <0,85; 2) S<1; 3) a(i,)>0,05 и a(i2)>0,05 и ... и а(/р_,) > 0,05;
4) ет„>75; 5) Pr(,J>50.
Удаление бракуемого варианта осуществляется только в том случае, если число вариантов во множестве не менее пяти. Операция удаления отдельных вариантов позволяет рассматривать формируемое «динамическое» множество Парето частных описаний как некоторую популяцию с эволюционной стратегией формирования.
Из пяти бракующих условий формируется браковочный признак - пятиразрядное целое число, состоящее из одних единиц и нулей, выражающих невыполнение и выполнение конкретного условия (в порядке перечисления в списке) соответственно. Из популяции в первую очередь ,удаляются варианты с большим значением браковочного признака.
Полученные варианты финальной популяции ранжируются по интегральному критерию, представляющему собой свертку - сумму взвешенных относительными среднеквадратическими отклонениями нормированных по всему множеству вариантов однонаправленных по влиянию на качество модели частных показателей.
Методика построения модели предлагает для анализа следующие её «лучшие» варианты: 5 первых по интегральному критерию, коэффициенту детерминации R2, отношению О, векторному показателю устойчивости модели Stab, ошибке прогноза правой точки Рг1'1. Сравнение вариантов по векторному показателю устойчивости Stab осуществляется следующим образом: худшим признается вариант, проигрывающий конкуренту по двум показателям из трех. Для лучших вариантов модели осуществляется проверка статистических гипотез относительно равенства нулю коэффициентов регрессии. Для окончательного прогноза используется вариант, лучший по интирально-му критерию. Остальные варианты прогноза выдаются в составе аналитического приложения к прогнозу.
Помимо использования векторного показателя качества модели разработанная методика отличается тем, что предполагает двухуровневую оценку устойчивости описания - параметрическую и структурную. Задача построения прогнозирующей модели решается в два этапа: на первом находится ((лучшая» модель по векторному показателю качества, включающему показатели параметрической устойчивости, на втором - оценивается параметриче-
Алгоритм построения модели для прогнозирования представлен на рис. 2.
Четвертая глава посвящена определению структуры и параметров прогнозирующих моделей для прогноза показателей травматизма, получены результаты окончательного прогноза, оценены характеристики полученных моделей, также выявлены тенденции поведения показателей травматизма РФ в будущем. Построены модели для показателей травматизма на основе выявления и экстраполяции тенденций. В результате эвристической самоорганизации получены
структуры искусственной нейросети, наилучшим образом описывающие тот или иной показатель травматизма.
Для прогнозирования показателей производственного травматизма в РФ на период 2003 - 2006 годы использованы три метода:
1) метод сценарных условий (с поиском наилучшей ЛМР);
2) метод эвристической самоорганизации (с интегрирующим ядром в форме искусственной нейросети);
3) метод выявления и экстраполяции тенденций.
Для всех показателей травматизма все три альтернативные модели имеют равные степени предпочтения, поскольку отсутствуют сколько-нибудь убедительные свидетельства о несостоятельности того или иного варианта. Поэтому в качестве окончательной модели для показателей использован результат консолидации альтернативных прогнозов. Консолидация осуществлялась в виде средних взвешенных и средних геометрических значений. Итоговая форма консолидации определялась погрешностью прогноза тестовых участков временных рядов.
Применение изложенной методики для прогнозирования показателей занятости населения в экономике страны и показателей производственного
екая устойчивость этой модели
Прслмригсаыкы |10строекж и оценка параметров Оли о факторны* цоаеаей
йыааяеннс яш>»ых вямнмЯ н» модельном Уровне и окончательное построение ьдмофылармдь миисяеЦ
Рвижирояалие одиофакгарных ttaieai.fi па вектору показателей Я1 О» ЬюЬ
Р-Р.
I
Пред в врите л иное построение и опенки мар*х1стро*А>-фв*торнмх ыоделей факторы а/чшей (р-1 )-ф»кю|ятЯ полепи с остатн ныын факторамн «р>лпы
Видедсиие лотовых мцяимД на 4юасд- .«ом уроки« н окончательно!, иостроъ-иж. р факторных моделей
Ранжирование /»'факторных моделей по вектору пока»телей &»!», й1 ОД й«/'^
Рис. 2. Алгоритм построения модели
травматизма в РФ позволило уменьшить относительную ошибку прогноза приращений от значений 100 - 140 % и более до 30 - 70 % при глубине прогноза 5 учётных временных интервалов.
Результаты прогноза показателей производственного травматизма в РФ на период 2003 - 2006 годы.
. Год .Mi; ЩШй&ч.. шшшм
Т, 127,7 133,6 133,2 132,3 130,8
т2 3920 3997 3880 3810 3663
т3 4,50 4,44 4,36 4,20 4,08
т4 0,138 0,143 0,146 0,147 0,145
Ь 28,80 28,90 29,12 29,16 29,28
Примечания:
Г/ - число пострадавших с утратой трудоспособности на 1 рабочий день и более (в том числе со смертельным исходом), тысяч человек;
Тг - число пострадавших со смертельным исходом, человек;
Т3 - число пострадавших с утратой трудоспособности на 1 рабочий день и более (в том числе со смертельным исходом), ща 1000 работающих;
Т4 - число пострадавших со смертельным исходом в расчете на 1000 работающих;
Т} - число человеко-дней нетрудоспособности на 1 рабочий день и более, временная нетрудоспособность которых закончилась в отчетном году, в расчете на 1000 человек.
В заключении приведены основные и практические результаты диссертационной работы:
1. Проведён анализ вопросов, ассоциированных с проблематикой моделирования и прогнозирования процессов с детерминированной составляющей. Показано; —что в контексте создания 'современных информационно-аналитических систем для прогнозирования социально-экономических показателей наиболее актуальными являются задачи разработки алгоритмов и процедур автоматического выбора адекватного метода прогнозирования и автоматического определения структуры формального описания.
2. Показано, что существующие методы поиска наилучшей множественной регрессии основаны на применении одного критерия показателя качества модели. Одновременно с этим единственный критерий качества, который достаточно адекватно характеризует прогнозирующие способности модели, в настоящее время не найден. Это обусловливает необходимость применения в практических методиках построения прогнозирующих описаний векторного показателя качества. Использование векторного показателя качества формального описания процесса предполагает разработку способа использования этого критерия в процедуре поиска наилучшей регрессии.
3. Показано, что существующие меюды поиска наилучшей множественной регрессии не предусматривают применение пока ¡ат елей устойчивости формального описания В то же время достаточно очевидно, что только устойчивые описания могут обеспечивать сколько-нибудь надёжные результаты прогнозирования. Это стимулирует разработку и внедрение в практику новых показателей прогнозирующих описаний, отражающих как структурную, так и параметрическую устойчивость прогнозирующих описаний
4. Разработан модифицированный алторитм группового учета аргументов на основе процедуры оптимизации частных по'тиномов МГУАоп Модифицированный метод отличается реалиицией дополнигетытой процедуры подбора оптима тьной степени полипома частного приближения.
5. Ра ¡работай модифицированный алгоритм группового учета аргументов на основе дифферальных частных приближений МГУАдп Для улучшения качества получаемых описаний прсдтагается в процессе реализации многорядных построений использовать не по гииомиа тьные, а дифферальные частные приближения.
6. Разработан модифицированный ал1оритм группового учета аргументов на основе искусственных нейронных сетей МГУАнс Для улучшения качества получаемых описаний предлагается в процессе реализации mhoio-рядных построений использовать алгоритмические описания в виде самоорганизующихся нейронных сетей.
7. Предложена совокупность новых показателей качества ЛМР, предназначенной для решения задачи прогнозирования на основе сценарных усчо-вий методом датированных переменных, названных показателями параметрической и структурной устойчивости прогнозирующего описания.
8 Предложены векторный показатель качества и способ его применения для сравнения частных описаний, то есть способ многокритериального сравнения вариантов модели
9 Разработан алюритм автоматического поиска наилучшей функции для прогнозирования процессов методом экстраполяции тенденций
10 Разработан алгоритм построения наилучшей регрессии, оттичаю-щийся применением эвочюциопной стратегии поиска и векторного показагетя качества, предназначенный для использования при протиодировании на основе сценарных устопий и методом легированных переменных
1! Разработана мегоцика разрабо1КИ прогноза социально-экономических покашелей, отличающаяся применением альтернативных прогнозирующих моделей, что обеспечивает наибо iee полное использование информационно! о содержимого имеющихся статистических данных
СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1 Горелов А А Использование теории хаоса в протиодировании // Проблемы передачи и обработки информации в сетях и системах телекоммупика-
ций: Материалы 10-й Междунар. науч.-техн. конф. Рязань: РГРТЛ, 2001. С. 136-139.
2. Белов В.В., Горелов А.А. Применение искусственных нейросетей в прогнозировании//Мсжвуз.сб.науч. тр.: Математическое и программное обеспечение вычисли (сльных систем: Рязань: РГРТА, 2001. С. 83-87
3. Белов В.В., Горелов А.А. Аппроксимация процессов решениями линейных дифференциальных уравнений. // Межвуэ. сб. науч. тр.- Математическое и про1раммное обеспечение вычислительных систем: Рязань: РГРТА, 2002. С. 90-94.
4. Белов В.В., Горелов А.А. Выбор вида регрессионной модели. // Меж-вуз. сб. науч. тр.: Математическое и программное обеспечение вычислительных систем, Рязань: РГРТА, 2002. С. 94-98.
5 Горелов А.А., Чистякова В.И. Автоматический выбор структуры прогнозирующей модели и длины обучающей последовательности (Тезисы)// Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 11-го Междунар. науч.-техн. семинара. Рязань: РГРТА, 2002. С. 53 - 56.
6. Горелов А.А., Чистякова В.И. Методика и программная система прогнозирования занятости населения в Российской Федерации на основе многофакторной модели // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 13-й Междунар. науч.-техн. конф. Рязань: РГРТА, 2004. С. 150 - 151.
7. Белов В.В., Горелов А.А. Векторный показатель качества. Алгоритм поиска лучшей модели, отличающийся использованием векторного показателя качества (Тезисы)// Проблемы передачи и обработки информации в сетях и системах телекоммуникаций: Материалы 12-го Междунар. науч.-техн. семинара. Рязань: РГРТА, 2004. С. 152-154.
8. Белов В.В., Горелов А.А., Чистякова В.И Показатели качества прогнозирующей модели и способы их оценки // Научные груды VII Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». Москва: Московская I осударственная академия приборос гроения и информатики, 2004. С.82-88.
9. Белов В.В., Горелов A A. Neuro Modeling and Processing (NeuroMaP) (Программа) 3apci истрировано в РОСПАТЕНТ 11.04.2003 г. № 2003610893
10.Белов ВВ., Горелов А.А. Программа интеллектуальной аппроксимации и iipoi позирования процессов с детерминированной составляющей (Mavin). (Программа). Зарегистрировано в РОСПАТЕНТ 11.04.2003 г. № 2003610894.
П.Горелов А.А. Программа эвристической самоорганизации (Fact_Pr). (Программа). Зарегистрировано в ОФАП 27.05.2005 г. № 5020050719.
ГОРЕЛОВ Андрей Александрович
РАЗРАБОТКА АЛГОРИТМОВ И ПРОЦЕДУР ПОВЫШЕНИЯ ТОЧНОСТИ ФАКТОРНОГО ПРОГНОЗИРОВАНИЯ
НА ОСНОВЕ ЭВОЛЮЦИОННОЙ СТРАТЕГИИ ПОИСКА ПРОГНОЗИРУЮЩЕГО ОПИСАНИЯ АКТУАЛЬНОГО ПРОЦЕССА
Автореферат диссер1ации на соискание ученой степени кандидата технических наук
Подписано в печать_. Формат бума1 и 60x84 1/16
Бумага офсетная. Печать трафаретная. Усл. печ. л. 1,5. Уч -изд. л. 1,5. Тираж 100 экз. Заказ. ГОУВПС) «Рязанская государственная радиотехническая академия» 390005, Рязань, ул. Гагарина, 59/1. Редакционно-издательский центр РГРТА.
»15606
РНБ Русский фонд
2006-4 12030
Оглавление автор диссертации — кандидата технических наук Горелов, Андрей Александрович
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ СУЩЕСТВУЮЩИХ.
МЕТОДОВ АППРОКСИМАЦИИ И.
ПРОГНОЗИРОВАНИЯ ПРОЦЕССОВ С ПРЕОБЛАДАЮЩЕЙ
ДЕТЕРМИНИРОВАННОЙ СОСТАВЛЯЮЩЕЙ.
1.1. Определение предметной области.
1.1.1. Необходимость прогнозирования.
1.1.2. Существующие направления развития информационных технологий.
1.1.3. Выбор метода прогнозирования.
1.1.4. Возможные направления развития методов прогнозирования.
1.2. Перечень актуальных задач. ф. 1.2.1. Достигнутые результаты.
1.2.2. Разработка внутренней структуры и механизма функционирования прогнозирующей системы.
1.2.3. Подготовка данных для прогнозирования.
1.2.4. Обеспечение качества прогнозирования.
1.3. Построение всех возможных регрессий.
1.3.1. Предварительные замечания.
1.3.2. Порядок построения.
1.3.3. Метод построения.
1.3.4. Построение только наилучших регрессий.
1.3.5. Пошаговая регрессия.
1.3.6. Другие методы. ц^ 1.4. Выбор критерия.
1.4.1. Коэффициент детерминации R2.
1.4.2. Скорректированный коэффициент детерминации.
1.4.3 .Ср-статистика Мэлоуса.
1.4.4. MSEP-критерий.
1.4.5. Другие меры.
1.5. Основные результаты.
ГЛАВА 2. РАЗРАБОТКА АЛГОРИТМОВ АВТОПОСТРОЕНИЯ АЛГОРИТМИЧЕСКИХ ОПИСАНИЙ ПРОЦЕССОВ НА ОСНОВЕ МЕТОДА ЭВРИСТИЧЕСКОЙ САМООРГАНИЗАЦИИ.
2.1. Общая схема построения алгоритмов, реализующих метод группового учета аргументов.
2.1.1. Описание алгоритма.
2.1.2. Критерии МГУА.
2.2. Разработка модифицированного метода группового учета аргументов на основе процедуры оптимизации частных полиномов (МГУАоп).
2.2.1. Проблемы восстановления функций классическим МГУА и пути их преодоления.
2.2.2 Алгоритм автопостроения модели без использования селекции в последовательных рядах приближения.
2.3. Разработка метода группового учета аргументов на основе дифферальных частных приближений (МГУАдп).
2.3.1. Аппроксимация процессов решениями линейных дифференциальных уравнений.
2.3.2. Результаты аппроксимации процессов решениями линейных дифференциальных уравнений.
2.4. Разработка метода группового учета аргументов на основе самоорганизующихся искусственных нейронных сетей (МГУАнс).
2.4.1. Математическая постановка задачи.
2.4.2. Постановка и возможные пути решения задачи обучения нейронных сетей.
2.4.3. Нейронная сеть с обучением по методу обратного распространения ошибки.
2.2.4. Автоматическое построения «наилучшей» искусственной нейронной сети.
2.2.5. Метод группового учета аргументов на основе аппарата нейронных сетей.
2.5. Основные результаты.
ГЛАВА 3. РАЗРАБОТКА ПРОЦЕДУР АВТОМАТИЧЕСКОГО ВЫБОРА СТРУКУТУРЫ МОДЕЛИ, ОЦЕНКИ ЕЕ ПАРАМЕТРОВ И ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО ОБЪЁМА ВЫБОРКИ.
3.1. Предварительные замечания.
3.2. Автоматизация построения модели для прогнозирования процессов с детерминированной составляющей методом экстраполяции тенденций
3.2.1. Классический способ выбора структуры и вычисления параметров прогнозирующей модели в методе экстраполяции тенденций.
3.2.2. Принципы организации программной системы автоматического синтеза структуры и оценки параметров прогнозирующих функций.
3.2.3. Выбор адекватной стандартной функции по результатам анализа характеристического отношения.
3.2.4. Способ автоматического выбора структуры модели, оценки её прогнозирующей силы и определения наилучшей длины обучающей последовательности с помощью тестовой последовательности.
3.3. Методика построения прогнозирующей регрессионной модели.
3.3.1. Основные положения методики построения модели.
3.3.2. Устойчивость модели и способы её оценки.
3.3.3. Векторный показатель качества прогнозирующей модели.
3.3.4. Проверка гипотез относительно параметров модели.
3.3.5. Использование векторного критерия качества модели в процессе поиска лучшей модели.
3.4. Основные результаты.
ГЛАВА 4. МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ ПОКАЗАТЕЛЕЙ ПРОИЗВОДСТВЕННОГО ТРАВМАТИЗМА В РОССИЙСКОЙ ФЕДЕРАЦИИ И РЕЗУЛЬТАТЫ ПРОГНОЗА.
4.1. Подготовка данных для окончательного прогноза показателей травматизма до 2005 года.
4.1.1. Сценарные условия.
4.1.2. Исходные данные для решения задачи прогноза.
4.2. Прогноз показателей производственного травматизма на основе выявления и экстраполяции тенденций.
4.3. Характеристики финальных прогнозирующих моделей показателей травматизма с помощью факторного регрессионного анализа.
4.4. Характеристики моделей для прогнозирования показателей травматизма с помощью нейросетевых технологий.
4.6. Сравнительные результаты прогноза показателей травматизма.
4.7. Окончательный прогноз показателей производственного травматизма до 2006 года.
4.8. Графическое представление результатов моделирования и прогноза
4.9. Основные результаты.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Горелов, Андрей Александрович
Актуальность проблемы. Перманентная потребность в повышении эффективности и действенности управленческих решений и организационных планов достаточно очевидна. Конкурентная борьба на рынке товаров и услуг, стремление максимизировать прибыль предприятия и минимизировать издержки производства, желание локализовать и уменьшить последствия аварий и техногенных катастроф стимулируют работы, нацеленные на повышение точности и надежности прогноза процессов различной физической и социальной природы, представленных временными рядами данных. Подавляющее большинство социально-экономических процессов могут быть кате-горированы как процессы с детерминированной составляющей. В настоящее время существует значительное количество методов моделирования и прогнозирования таких процессов, такие как классический и специальный регрессионный анализ, искусственные нейронные сети, эволюционные стратегии, системы одновременных уравнений, метод выявления и экстраполяции тенденций, авторегрессия и так далее.
Одновременно с этим, в настоящее время практически отсутствует математическое и программное обеспечение, нацеленное на автоматическое построение наилучшего формализованного описания проблемного социально-экономического процесса в классе всех возможных описаний. Создание такого обеспечения сопряжено с необходимостью разработки методов поиска наилучшего описания. Эти методы должны включать:
1) средства квалификации проблемного процесса и определения адекватного класса методов для его моделирования;
2) векторные показатели качества аппроксимации процесса;
3) алгоритмы многокритериального поиска решения в различных классах методов моделирования.
Средства квалификации проблемного процесса должны реализовывать эвристические алгоритмы, методы теории групповых решений и механизмы логического вывода с развиваемой базой знаний.
Успешное решение поставленных проблем позволит существенно повысить эффективность создания прогнозирующих моделей, применяемых для анализа и прогноза показателей социально-экономической сферы, в частности, для прогнозирования результатов производственно-хозяйственной деятельности предприятий, а также социальных и политических процессов в стране. Полученные результаты найдут широкое применение при создании информационно-аналитических систем в соответствии с концепциями оперативной аналитической обработки (OLAP) и интеллектуального анализа данных (Intelligent data analysis). Принципиально новыми элементами разрабатываемой концепции моделирования и прогнозирования проблемных процессов является внедрение и интенсификация использования процедур альтернативного моделирования и обобщения альтернативных результатов, механизмов мониторинга состояния информационного обеспечения, процессов решения задач прогноза, актуализации моделей, идентификация параметров которых становится возможной по мере накопления статистического материала.
Актуальной темой современной теории моделирования и прогнозирования процессов остаётся задача оценки коэффициентов множественной регрессии в различных «специальных» условиях, которая неявно основывается на предположении существования жестких причинно-следственных отношений между факторными признаками и результативным признаком. Это предположение и порождает традиционные подходы к семантической интерпретации коэффициентов множественной регрессии. В то же время в реальных условиях для прогнозирования процессов достаточно наличия только косвенных причинно-следственных связей, порожденных наличием общих закономерностей в процессах изменения факторных и результативных признаков, примером вышесказанного может служить метод прогнозирования на основе сценарных условий.
Сценарные моделирование и прогнозирование основаны на делении социально-экономических показателей на две группы (факторные и результативные показатели, или признаки) и построении модели зависимости вторых показателей от первых. Деление на указанные группы достаточно услов-^ но, жестких руководящих принципов осуществления такого деления нет, хотя определенная традиция уже сформировалась.
К факторным показателям относят те, которые считают условно управляемыми, т.е. планируемыми. Прогнозирование этих показателей осуществляется, главным образом, экспертным путем. Конечно же, при этом могут использоваться и методы математического моделирования, включая метод выявления и экстраполяции тенденций, аппроксимирующие дифференциальные уравнения, системы одновременных разностных уравнений, искусственные нейронные сети и т.д.
Группу результативных (проблемных) показателей образуют многочисленные прочие показатели. Моделирование и прогнозирование этих показателей также могут осуществляться различными методами, но при прогнозе на основе сценарных условий обычно используется линейная множественная регрессия, в которой в качестве регрессоров используются факторные экзо->41. генно задаваемые «управляемые» («входные») показатели.
В практике прогнозирования многих процессов, в том числе и социально-экономических, типична ситуация, когда объем статистических данных невелик. В таких условиях результаты прогноза, полученные по разным методам, как правило, существенно отличаются друг от друга. Кроме того, ни один из существующих методов решения задачи прогноза не обладает явными преимуществами и не может быть использован как предпочтительный. Решением данной проблемы может служить одновременное использование нескольких альтернативных методов, таких как регрессионный анализ, метод выявления и экстраполяции тенденций, метод прогноза поведения процесса и т.д., в сочетании с процедурой согласования (обобщения) альтернативных результатов прогноза.
Существует множество параметров, оценивающих качество прогноза, но практически все они являются показателями качества аппроксимации и, основываясь на предположении, что прогнозируемый процесс не меняет своего поведения в дальнейшем, используются как показатели прогнозирования. ^ Использование показателей аппроксимации в качестве показателей прогнозирования не является очевидным, но из-за отсутствия последних - это наиболее приемлемое решение. Все это подтверждает необходимость введения новых показателей качества прогноза.
В настоящее время в области моделирования процессов с детерминированной составляющей чётко обозначилась актуальность задачи повышения уровня автоматизации процессов построения. Создание средств высокоуровневого моделирования и прогнозирования позволит расширить и интенсифицировать применение современных высокоэффективных методов разработки прогноза, что, в свою очередь, позволит повысить качество и своевременность принимаемых управленческих решений и планов.
При разработке теории и методов моделирования и прогнозирования процессов охватывается широкий круг математических и прикладных проблем, в развитие которых значительный вклад внесли российские и зарубеж-41 ные ученые: В.М. Глушков, А.А. Амосов, В.А. Трапезников, В.А. Котельников, А.А. Харкевич, Б.Р. Левин, Л.М. Финк, ЯЗ. Цыпкин, С.М. Самойленко, Р.Л. Стратонович, В.И. Тихонов, Д.А. Поспелов, B.C. Шварцман, Э.Л. Блох, И.А. Мизин, Ю.М. Мартынов, Л.П. Пуртов, А.Н. Тихонов, М.Л. Лидов, Н.Дрейпер, Г.Смит, А.Алберт, Дж.Себер, Ф.Уоссермен, Дж.Форрестер и др. В разработку современных концепций организации хранения, представления и автоматизированного анализа данных наибольший вклад внесли Дж.Тьюки, Э. Кодд, В. Инмон.
Задача повышения уровня автоматизации неотрывно связана с задачей автоматического выбора адекватных прогнозирующих описаний проблемных процессов, для решения которой необходима разработка средств квалификации, многоальтернативного моделирования и обобщения альтернативных результатов, интерпретации и формирования итогового отчёта.
Многоальтернативное моделирование и процедуры обобщения результатов альтернативного прогноза необходимы не только для осуществления возможности автоматического поиска адекватной прогнозирующей модели, но и для решения проблемы углубления степени извлечения информационного содержимого из имеющегося статистического материала, поэтому, несмотря на обилие существующих методов прогнозирования процессов с детерминированной составляющей, в контексте проблемы разработки многоальтернативных прогнозов сохраняется актуальность задач разработки новых и улучшения известных методов построения прогнозирующих описаний. Актуальностью этих задач обусловлен выбор цели и задач диссертационной работы.
Целью работы - является повышение точности и надёжности прогнозирования процессов с преобладающей детерминированной составляющей, в частности, социально-экономических процессов за счет повышения эффективности и уровня автоматизации процедур построения адекватных формализованных описаний и их применения для решения задач прогноза.
Задачи исследования. Для достижения целей диссертационной работы необходимо решение следующих задач.
1. Разработка методики автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии.
2. Разработка векторного показателя качества — совокупности показателей, по которым осуществляется сравнение вариантов описания зависимости проблемного показателя от факторных признаков, а также способа применения векторного показателя качества для сравнения частных описаний, то есть способ многокритериального сравнения вариантов модели.
3. Разработка программного комплекса, реализующего предложенную методику поиска лучшей регрессионной модели.
4. Разработка способа автоматического определения наилучшего описания процесса в методе выявления и экстраполяции тенденций.
5. Разработка альтернативных алгоритмов автоматического построения математических моделей, основанных на эвристической самоорганизации, отличающихся структурой интегрирующего ядра, оптимизацией частных приближений и способом формирования популяции описаний.
Методы исследования. При выполнении работы использовались теория математического моделирования, методы вычислительной и прикладной математики, статистическое и имитационное моделирование, эвристическое программирование.
Научная новизна работы состоит в следующем:
1. Предложена методика построения модели линейной множественной регрессии, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию, что повышает полноту анализа вариантов и объективность получаемых результатов.
2. Предложена совокупность показателей качества прогнозирующих описаний, включающая показатели структурной и параметрической устойчивости модели, что гарантирует выбор среди возможных альтернатив описания с наибольшей прогностической силой.
3. Разработан способ автоматического определения наилучшего описания процесса в методе выявления и экстраполяции тенденций оригинален, аналогов не имеет, обеспечивает автоматический выбор адекватного описания и автоматическое определение наилучшей по критерию минимума сред-неквадратической ошибки длины обучающей последовательности.
4. Разработаны алгоритмы автоматического построения математических моделей, основанные на методе эвристической самоорганизации, отличающиеся возможностью изменения структуры интегрирующего ядра (полиномы 2-й степени, дифференциальные уравнения 2-го порядка, искусственные нейронные сети), оптимизацией частных приближений и способом формирования популяции описаний, что обеспечивает повышение показателей качества формируемых алгоритмических описаний моделируемых процессов за счёт синтеза структуры модели, наиболее адекватной составу факторных признаков и специфике изучаемого процесса.
5. Предложена методика разработки прогноза социально-экономических показателей, отличающаяся применением альтернативных прогнозирующих моделей, что обеспечивает наиболее полное использование информационного содержимого имеющихся статистических данных.
Практическая ценность. Полученные результаты являются существенной, но всё же начальной частью реализации концепции создания математических и программных средств для интегрированной высокоуровневой системы моделирования и прогнозирования социально-экономических процессов, обеспечивающий высокий уровень доступности современных методов прогнозирования широкому кругу аналитиков и управленцев. Основные результаты нашли отражение в программах:
Mavin" - программа интеллектуальной аппроксимации и прогнозирования процессов с детерминированной составляющей;
NeuroMap - программа моделирования зависимостей скалярной величины от векторного аргумента и прогнозирования экономических процессов на основе технологии искусственных нейронных сетей;
Factj>r - программа эвристического поиска решения предназначена для автоматического построения линейной факторной прогнозирующей модели процесса изменения во времени показателей социально-экономической сферы.
Система Factpr внедрена в Федеральной службе государственной статистики. Результаты диссертации успешно использованы при разработке прогнозов показателей занятости населения РФ в экономике страны, показателей производственного травматизма («Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом, чел.», «Численность пострадавших со смертельным исходом, чел.», «Численность пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1000 работающих», «Численность пострадавших со смертельным исходом в расчете на 1000 работающих», «Число дней нетрудоспособности у пострадавших с утратой трудоспособности на 1 рабочий день и более и со смертельным исходом в расчете на 1 пострадав-W шего») в РФ.
Внедрение результатов. Результаты диссертационной работы внедрены: в Федеральной службе государственной статистики и используется для прогнозирования показателей занятости населения Российской Федерации (численность безработных, численность занятых в экономике, численности экономически активных и неактивных); в учебный процесс студентов специ-ф альности 220400, 351400 в Рязанской государственной радиотехнической академии.
Внедренный программный продукт имеет свидетельство №5020050719 от 27.05.05 об официальной регистрации программы «Программа эвристического поиска решения» (краткое название "FactPr" vl.l) для ЭВМ в Отраслевом фонде алгоритмов и программ (ОФАП) Государственного координационного центра информационных технологий Минобразования России.
Основные результаты, выносимые на защиту:
1. Методика автоматического построения «наилучшей» прогнозирующей модели в классе форм линейной множественной регрессии, предназначенная для прогнозирования методами сценарных условий и лагированных переменных.
2. Понятие и способ применения векторного показателя качества в процессе поиска «наилучших» прогнозирующих описаний.
3. Программный комплекс, реализующий предложенную методику поиска лучшей регрессионной модели.
4. Способ автоматического определения «наилучшего» описания процесса в методе выявления и экстраполяции тенденций.
5. Алгоритмы автоматического построения математических моделей, основанные на эвристической самоорганизации, включающие процедуры оптимизации частных приближений, решения аппроксимирующих дифференциальных уравнений и синтеза искусственных нейронных сетей как механизма интеграции частных приближений.
Апробация работы. По теме диссертации сделаны доклады на 10-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2001 г.; 11-ой Международном научно-техническом семинаре «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2002 г.; 12-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; 13-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций», Рязань, 2004 г.; VII Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права», Москва, 2004 г.
Публикации. Основные результаты диссертационной работы опубликованы в 8 печатных работах, получены 3 свидетельства о регистрации программы для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и трех приложений. Основной текст содержит 170 страниц, 29 таблиц, 12 рисунков. Список литературы состоит из 136 наименований. Приложения выполнены на 8 страницах.
Заключение диссертация на тему "Разработка алгоритмов и процедур повышения точности факторного прогнозирования на основе эволюционной стратегии поиска прогнозирующего описания актуального процесса"
4.9. Основные результаты
Определены структура и параметры прогнозирующих моделей для окончательного прогноза показателей травматизма на 2003-2006 годы, получены результаты окончательного прогноза, оценены характеристики полученных моделей, также выявлены тенденции поведения показателей травматизма РФ в будущем.
Построены модели для показателей травматизма на основе выявления и экстраполяции тенденций. Получены результаты, которые не в полной мере совпадают с результатами, полученными при факторном прогнозировании.
В результате эвристической самоорганизации получены структуры (по числу показателей травматизма) искусственной нейросети, наилучшим образом описывающие той или иной, показатель травматизма. Вычислены характеристики (веса) полученных нейросетей, получены результаты прогнозирования. Сравнение результатов прогнозирования факторной регрессионной и нейросетевой регрессионной моделей не позволяет выявить доминирующий метод при прогнозировании показателей производственного травматизма. Каждый из методов является лучшим при прогнозировании определенного показателя травматизма. В качестве окончательного прогнозного значения для всех показателей кроме показателей Т4 «Число пострадавших со смертельным исходом в расчете на 1000 работающих » и Т5 «Число человеко-дней нетрудоспособности на 1 рабочий день и более, временная нетрудоспособность которых закончилась в отчетном году, в расчете на 1000 человек», предложено использовать среднее геометрическое значение частных прогнозов. Для показателей Т4 и Т5 в качестве окончательного прогноза использован частный прогноз, полученный методом прогноза поведения процесса.
155
ЗАКЛЮЧЕНИЕ
Выполненная диссертационная работа включает исследования, направленные на разработку методов, алгоритмов и программ для решения задач, связанных с прогнозированием процессов с преобладающей детерминированной составляющей. Предметными областями применения результатов диссертации явились: занятость населения РФ в экономике страны, производственный травматизм в РФ, оптовый рынок электроэнергии. В диссертации представлен подробный анализ задач прогнозирования процессов с преобладающей детерминированной составляющей, выявлены задачи, решение которых позволит повысить надежность и точность прогноза. Реализовано программное обеспечение для решения актуальных задач. В качестве иллюстрирующих примеров в работе приведены решения конкретных задач прогнозирования социально-экономических процессов в РФ. Основные результаты работы состоят в следующем.
1. Проведён анализ вопросов, ассоциированных с проблематикой моделирования и прогнозирования процессов с преобладающей детерминированной составляющей. Показано, что в контексте создания современных информационно-аналитических систем для прогнозирования социально-экономических показателей наиболее актуальными являются задачи разработки алгоритмов и процедур автоматического выбора адекватного метода прогнозирования и автоматического определения структуры формального описания. Определены основные проблемы, возникающие при прогнозировании процессов с детерминированной составляющей. Описан принцип, порядок и метод построения всех возможных регрессий, а также метод построения пошаговой регрессии. Описаны основные критерии прогноза (коэффициент корреляции, скорректированный коэффициент корреляции, Ср-статистика Мэлоуса, MSEP-критерий и другие), приведен метод выбора критерия, по которому осуществляется прогноз.
2. Разработаны алгоритмы автоматического построения формализованных описаний процессов, основанные на методе эвристической самоорганизации, которые отличаются от аналогов структурой интегрирующего ядра, оптимизацией частных приближений и способом формирования популяции описаний, что обеспечивает повышение показателей качества формируемых алгоритмических описаний моделируемых процессов. Разработан модифицированный алгоритм группового учета аргументов на основе процедуры оптимизации частных полиномов МГУАоп. Модифицированный метод отличается реализацией дополнительной процедуры подбора оптимальной степени полинома частного приближения (в классических алгоритмах используется "опорный" полином. Разработан модифицированный алгоритм группового учета аргументов на основе диф-феральных частных приближений МГУАдп. Для улучшения качества получаемых описаний предлагается в процессе реализации многорядных построений использовать не полиномиальные, а дифферальные частные приближения. Разработан модифицированный алгоритм группового учета аргументов на основе искусственных нейронных сетей МГУАнс. Для улучшения качества получаемых описаний предлагается в процессе реализации многорядных построений использовать алгоритмические описания в виде самоорганизующихся нейронных сетей.
3. Показано, что существующие методы поиска наилучшей множественной регрессии основаны на применении одного критерия показателя качества модели. Одновременно с этим единственный критерий качества, который достаточно адекватно характеризует прогнозирующие способности модели, в настоящее время не найден. Это обусловливает необходимость применения в практических методиках построения прогнозирующих описаний векторного показателя качества. Предложен векторный показатель качества прогнозирующей модели, А также способ его применения для сравнения частных описаний, то есть способ многокритериального сравнения вариантов модели. Предложена совокупность новых показателей качества ЛМР, предназначенной для решения задачи прогнозирования на основе сценарных условий, названные показателями параметрической и структурной устойчивости прогнозирующего описания. ^ 4. Разработана методика построения «наилучшей» прогнозирующей линейной модели, отличающаяся применением эволюционной стратегии поиска и векторного показателя качества для выбора группы предварительных описаний, включаемых в популяцию. Разработан алгоритм поиска наилучшей регрессии, отличающийся использованием векторного показателя качества, в методе прогнозирования на основе сценарных условий.
5. Определены структура и параметры прогнозирующих моделей для окончательного прогноза показателей травматизма на 2003-2006 годы, получены результаты окончательного прогноза, оценены характеристики полученных моделей, также выявлены тенденции поведения показателей травматизма РФ в будущем. Построены модели для показателей травматизма на основе выявления и экстраполяции тенденций. В результате эвристической самоорганизации получены структуры (по числу показателей травматизма) искусственной нейросети, наилучшим образом описы-щ вающие той или иной, показатель травматизма. Вычислены характеристики (веса) полученных нейросетей, получены результаты прогнозирования. В качестве окончательного прогнозного значения для всех показателей кроме показателей Т4 «Число пострадавших со смертельным исходом в расчете на 1000 работающих » и Т5 «Число человеко-дней нетрудоспособности на 1 рабочий день и более, временная нетрудоспособность которых закончилась в отчетном году, в расчете на 1000 человек», предложено использовать среднее геометрическое значение частных прогно-^ зов. Для показателей Т4 и Т5 в качестве окончательного прогноза использован частный прогноз, полученный методом прогноза поведения процесса.
Результаты диссертационной работы могут использоваться в качестве основы для создания и дальнейшей реализации концепции создания математических и программных средств для интегрированной высокоуровневой системы моделирования и прогнозирования социально-экономических про-^ цессов. Дальнейшее развитие положений диссертации могут быть направлены на развитие и реализацию отдельных компонентов данной системы, в частности необходимы исследования в следующих направлениях:
1) создание системы формирования исходных данных на основе статистического материала;
2) построение иерархических многошаговых методов моделирова-фч. ния прогнозирования процессов;
3) разработка новых алгоритмов консолидации результатов прогнозов;
4) разработка новых алгоритмов определения свободных параметров прогнозирующих описаний;
5) разработка новых алгоритмов многокритериального поиска решения в различных классах методов моделирования;
6) создание информационной системы пополнения банков алгорит-ф мов и моделей;
7) разработка новых критериев качества прогноза;
8) развитие системы формирования отчетов в сторону расширения форматов представления результатов.
Библиография Горелов, Андрей Александрович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Aczel A.D Complete business statistics. 3rd ed. Richard D. Ir-wing, 1996. - 869 p.
2. Chatfield C. The Analysis of Time Series: an Introduction, 4th ed. -Chapman and Hall, 1989. 242 p.
3. Everit B. A Handbook of Statistical Analyses using S-PLUS. Chapman & Hall, 1994. 143 p.
4. Granger C.W.J., Newbold P. Forecasting Economic Time Series, 2nd ed. Academic Press, Inc., 1986. - 338 p.
5. Hackathorn D. Reinventing Enterprise Systems Via Data Warehousing. Washington, DC: The Data Warehousing Institute Annual Conference, 1995
6. Inmon W.H.Building The Data Warehouse (Second Edition). NY,NY: Wiley John, 1993
7. Kolmogoroff A. Sur Г interpolation et l'extrapolation des suites sta-tionaires. Compt. Rend., 208 (1939), p.2043
8. Mosteller F., Tukey J. W. Data Analysis and Regression: A Second
9. Course in Statistics. Reading, MA: Addison-Wesley, 1977.
10. Neter J., Wasserman W., Whitmore G.A. Applied Statistics, Allyn and Bacon, Inc., 1988. 1006 p.
11. Software Digest Rating Report. 1991, v. 8, № 5.
12. Spector P. An introduction to S and S-PLUS. Duxbuiy Press, 1994. -286 p.
13. Venables M.N., Ripley B.D. Modern Applied Statistics with S-PLUS. Springer-Verlag, 1994 462 p.
14. Winner N. Extrapolation, Interpolation and Smoothing of Stationary Time Series. John Wiley, New York, 1949.
15. Wold H.O. A Study in the Analysis of Stationary Time Series. Alm-quist and Wieksell, Uppsala, 1932
16. Айвазян С.А., Бухштабер B.M., Енюков И.С., Мешалкин JI.Д. Прикладная статистика; Классификация и снижение размерности. Справочное издание под ред. Айвазяна С.А. М.: Финансы и статистика, 1989. - 607 с.
17. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. Справочное издание под ред. Айвазяна С.А. -М.: Финансы и статистика, 1985.-471 с.
18. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. Справочное издание под ред. Айвазяна С.А. — М.: Финансы и статистика, 1983.-471 с.
19. Айвазян С.А., Мхитарян B.C. Прикладная статистика. Основы эконометрики. Учебник для вузов: В 2 т. 2-е изд., испр. — М.: "ЮНИТИ-ДАНА", 2001. 656 (1 том) и 432 (2 том) с.
20. Айвазян С.А., Степанов B.C. Инструменты статистического анализа данных// Мир ПК, № 8, 1997 http://www.osp.ru/pcworld/1997/08/34.htm
21. Андерсен Т. Введение в многомерный статистический анализ. —161
22. М.: Физматгиз, 1963. 500 с.
23. Андерсен Т. Статистический анализ временных рядов. М.: Мир, 1976.-756 с
24. Андрейчиков А.В., Андрейчикова О.Н. Анализ, синтез, планирование решений в экономике. М.: Финансы и статистика, 2000.-368 слил.
25. Арене X., Лейтер Ю. Многомерный дисперсионный анализ -М.: Финансы и статистика, 1985. — 230 с.
26. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов: Учебник М.: Финансы и статистика, 2001. — 228 с.
27. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. - 488 с.
28. Баласанов Ю.Г., Дойников А.Н., Королев М.Ф., Юровский А.Ю. Прикладной анализ временных рядов с программой ЭВ-РИСТА. Центр СП «Диалог» МГУ, 1991.-328 с.
29. Бард И. Нелинейное оценивание параметров. — М.: Финансы и статистика, 1979. 349 с.
30. Белов В.В., Васильев С.В., Наумкина С.Г. Модифицированный метод группового учета аргументов на основе процедуры оптимизации частных полиномов // Вычислительные машины, комплексы и сети: Межвуз. сб. науч. трудов. Рязань: РГРТА, 1999. С. 95-99.
31. Белов В.В., Горелов А.А. Аппроксимация процессов решениями линейных дифференциальных уравнений. // Межвузовский сборник научных трудов: Математическое и программное обеспечение вычислительных систем. Рязань: РГРТА, 2002. С. 90-94.
32. Белов В.В., Горелов А.А. Выбор вида регрессионной модели. // Межвузовский сборник научных трудов: Математическое и программное обеспечение вычислительных систем, Рязань:1. РГРТА, 2002. С. 94-98.
33. Белов. В.В. Алгоритмические методы повышения верности информации в распределенных информационно-управляющих системах.: М.: Радио и связь, 1999. - 238 с.
34. Белов. В.В., Чистякова В.И. Прогнозирование показателей социально-трудовой сферы на основе сценарных условий // Вестник РГРТА. Вып. 12. Рязань, 2003. С. 93-101.
35. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. — М.: Мир, 1989.-540 с.
36. Бендат Дж., Пирсол А. Применение корреляционного и спектрального анализа. М.: Мир, 1979. - 311 с.46.
-
Похожие работы
- Прогнозирующее инверсное нейроуправление в условиях возмущений для позиционно-следящего пневмопривода
- Прогнозирование аналоговых и дискретных процессов на основе структурной идентификации базовых параметров их источников
- Разработка методов и устройств автоматического прогнозирования состояния каналов аналоговых систем передачи
- Разработка алгоритмов и процедур повышения надежности и точности прогнозирования процессов, представленных короткими временными рядами
- Модели прогнозирования процессов, представленных временными рядами с короткой актуальной частью
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность