автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Методы моделирования и прогнозирования дискретных процессов на основе гибридной информации
Автореферат диссертации по теме "Методы моделирования и прогнозирования дискретных процессов на основе гибридной информации"
п6 ОД
РОССИЙСКАЯ АКАДЕМИЯ НАУК Ордена Ленина Сибирское отделение ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР
На правах рукописи
Головченко Владимир Борисович
УДК 519.862.6
МЕТОДЫ МОДЕЛИРОВАНИЯ И ПРОГНОЗИРОВАНИЯ ДИСКРЕТНЫХ ПРОЦЕССОВ НА ОСНОВЕ ГИБРИДНОЙ ИНФОРМАЦИИ
05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
Автореферат
диссертации на соискание ученой степени доктора технических наук
Новосибирск - 1993
Работа выполнена в Иркутском вычислительном центре СО РАН
Официальные оппоненты: - доктор физико-математических наук,
профессор Воронин Ю.А.
- доктор технических наук, профессор Губарев В.В.
- доктор технических наук, профессор Резников А.П.
Ведущая организация: Санкт-Петербургский государственный
университет
г
Защита состоится м» Ю _ 1993 года в ^ на заседании специализированного совета Д 002.10.02 по защите диссертаций на соискание ученой степени доктора наук при Вычислительном центре СО РАН ( 630090, Новосибирск, 90, пр. Академика Лаврентьева, 6 ).
С диссертацией можно ознакомиться в читальном зале
библиотеки ВЦ СО РАН ( Новосибирск, 90, пр. Академика Лаврентьева, 6 ).
Автореферат разослан " ^^ " ^^ 1993 года
Ученый секретарь специализированного совета Забиняко
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Эффективное управление сложными социально-экономическими, природными и техническими системами возможно лишь при условии существования развитых методов прогнозирования протекающих в системах процессов. Существующие методы прогнозирования с использованием математических моделей, построенных на основе статистической информации, применимы лишь к предварительно изученным, неизменным по тенденциям развития процессам с достаточно продолжительной и наблюдаемой предысторией. Однако во многих сложных системах протекающие в них процессы не удовлетворяют •данным условиям, и в этом случае для повышения адекватности модели естественно воспользоваться, кроме статистической, другими видами информации, в первую очередь, экспертной информацией и информацией, заложенной в статистических данных о процессах, подобных прогнозируемому. Исследование возможности использования такого рода гибридной информации с разработкой соответствующих математических методов моделирования и прогнозирования процессов является актуальной проблемой, решению которой.применительно к широко распространенным поцессам с дискретным временем посвящена настоящая диссертационная работа.
Работа выполнена в рамках НИР Иркутского ВЦ СО РАН по региональной научно-исследовательской программе "Сибирь" и государственной научно-технической программе "Безопасность".
Цель исследований. Цель диссертационной работы заключается в создании теоретических основ моделирования и прогнозирования процессов с дискретным временем на основе гибридной информации, разработке соответствующих методов структурного синтеза и параметрической идентификации моделей, реализации разработанных моделей и методов при прогнозировании конкретных процессов.
Научная новизна. Поставлена проблема комплексного использования разнородной информации при прогнозировании дискретных процессов, выполнена классификация источников гибридной инфор-
мации и их неопределенности; разработаны методы выбора переменных, максимальных лагов, класса функций и параметрического множества модели на основе отношений предпочтения, задаваемых экспертами, и статистической информации о процессе; разработаны методы оценивания параметров модели на основе статистической информации о прогнозируемом процессе, статистической информации о процессах, подобных прогнозируемому, и экспертной информации о свойствах и ожидаемых значениях переменных процесса; разработаны методы прогнозирования процесса на основе статистической и экспертной информации без предварительно построенной модели.
При выполнении исследований использован широкий круг идей и методов теории вероятностей и математической статистики, прикладной статистики, теории принятия решений, математического программирования, имитационного моделирования. Прикладные программы для ПЭВМ разработаны в среде "Turbo Pascal" и СУБД "Clipper".
Практическая значимость работы заключается в создании методов, алгоритмов, прикладных программ для ПЭВМ, позволяющих за счет использования различных источников информации существенно повысить надежность прогнозирования процессов в сложных социально-экономических, природных и технических системах.
Разработанные в диссертационной работе средства прошли практическую проверку в ходе научно-исследовательских работ, выполненных при участии автора для ряда организаций: Иркутского областного совета народных депутатов (автоматизированная система моделирования развития области, демографический прогноз численности населения Иркутской области); Вычислительного центра СО РАН (алгоритм и программа для прогнозирования чис-ленностей половозрастеых групп населения области); Главного управления Центрального банка РФ по Иркутской области (Диалог говая система прогнозирования денежного обращения, Экспериментальная система поддержки решений по управлению денежным обращением). Ряд результатов по прогнозированию и принятию решений на основе экспертной информации включен автором в курс лекций, читаемых в Иркутском институте народного хозяйства.
Апробация работы. Основше результаты работы неоднократно докладывались на Всесоюзной конференции "Теория, методология и практика системных исследований" (г.Москва, 1985 г.); Первой Всесоюзной школе "Прикладные проблемы управления макросистемами" (г.Алма-Ата, 1985 г.); Второй Всесоюзной школе "Прикладные проблемы управления макросистемами" (г.Тамбов, 1987 г.); Всесоюзной конференции "Территориальные неоднородные информационно-вычислительные системы" (г.Новосибирск, 1988 г.); Третьей Всесоюзной школе "Прикладные проблемы управления макросистемами" (г.Апатиты, 1989 г.); Всесоюзной конференции "Информатизация и моделирование территориальных социально-экономических объектов" (г.Новосибирск, 1990 г.); Первом Международном совещании ЮНЕСКО и Академии наук СССР "Модели, методы и программные средства анализа глобальной и региональной устойчивости развития" (г.Москва, 1991); Седьмой конференции IFAC/IFORS/ IIASA по моделированию и управлению национальной экономикой (г.Пекин, 1992); Симпозиума IFAC/IFORS/IMACS "Широкомасштабные системы: теория и приложения" (г.Пекин, 1992); Международной научно-практической конференции "Региональные механизмы и управление в социальных и экономических системах" (г.Воронеж, 1992) и на ряде региональных и областных конференций, совещаний, семинаров.
Кроме того, результаты работы неоднократно обсуждались на семинарах в Иркутском вычислительном центре СО РАН, Вычислительном центре СО РАН, на сессиях Координационного совета подпрограммы региональной научно-исследовательской программы "Сибирь", на заседаниях кафедр "Электроники и вычислительной техники" Иркутского политехнического института и "Информатики и кибернетики" Иркутского института народного хозяйства.
Публикации. Полученные в диссертации результаты опубликованы в 34 научных работах, в том числе в I монографии и в I коллективной монографии.
Структура работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы и приложений.
Основная часть работы изложена на 256 стр. машинописного текста. Список литературы насчитывает 173 наименования.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность исследуемой проблемы, описана структура диссертации.
В главе I сформулирована проблема моделирования и прогнозирования дискретных процессов с использованием гибридной информации, проведен анализ современного состояния проблемы, поставлена задача диссертации, намечены подходы к ее решению и изложены общие вопросы, необходимые для разработки проблемы.
Моделью процесса (ус) рассматриваемого типа является зависимость
УС=-фс-1..........
где ус€У - значение зависимой переменной у в момент ^ 7 -множество значений зависимой переменной, х1=(х\,... =Х1»... *ХП - вектор значений независимых переменных х1 в момент t, X1 - множество значений независимой переменной х1, 9=(91,...,ет)€в - вектор параметров, 9 - параметрическое множество, / - вещественнозначная функция, ес- случайное возмущение в момент х -максимальное значение лага зависимой и независимых переменных, Х- дискретное время из множества т=т°сн+ +Тупр, !Г°СН= {-а,...,0> - период основания и Тупр={1,...,7} -период упреждения прогноза.
Традиционный подход к построению модели (I) заключается в выборе переменных х1, у и лагов т на основе содержательных соображений, выборе функции / на основе теоретических предпосылок и оценивании параметров 9 из условия наилучшего соответствия рассчитанных подмоделям значений зависимой переменной статистическим данным у1, гчГ00". Далее модель как рекуррентная процедура используется для прогнозирования изучаемого процесса.
В диссертационной работе задача моделирования и прогнозирования решается при следующих обобщениях традиционного подхода.
Первое обобщение предполагает использование гибридной информации, включающей экспертную информация о переменных х2, лагах переменных конкретном виде функции / и параметричес-
кого множества 8 модели; экспертную информация об общих закономерностях развития процесса и возможных значениях зависимой переменной на периоде упреждения прогноза; статистическую информацию о наблюдаемых значениях переменных изучаемого процесса на периоде основания прогноза; статистическую информацию в виде наблюдаемых значений переменных процессов аналогичной природы; информацию о будущих значениях независимых переменных изучаемого процесса на периоде упреждения прогноза.
Второе обобщение связано с тем, что некоторые из независимых переменных могут измеряться в шкалах, более слабых, чем числовые. В связи с этим целесообразно рассматривать независимые переменные, измеряемые в трех наиболее употребительных шкалах: наименований, порядка и количественной.
Третье обощение обусловлено требованием гибкости формального представления экспертных высказываний и предполагает использование детерминированного, недетерминированного, вероятностного и нечеткого описаний неопределенности.
Четвертое обобщение связано с тем, что при прогнозировании на основе модели значения некоторых из независимых переменных на периоде упреждения прогноза могут быть неизвестны. Поэтому необходимо предусмотреть разработку методов прогнозирования независимых переменных с использованием модели
.....г1-х;в)+ее- (2)
как частного случая модели (I)-, имея в виду, что здесь также возможны случаи разнородных источников информации, различных шкал измерения переменных и различных способов описания неопределенности.
Чтобы иметь возможность использования в процессе построения моделей разнородных сведений и данных, следует составить формальное представлению источниеов гибридной шфоржщии. Представлением статистической информации являются временные ряды; экспертной инфориации о переменных, их лагах, классе функций модели и параметрическом пространстве - множества с определенных на них отношениями предпочтения; экспертной информации о свойствах процессов - формулы логики предикатов первого поряд-
ка с предметной областью и=(и: Т-у-УхХ Ъ.. .хХ и одноместными предикатами, определенными через унарные и бинарные отношения на множествах Т,У,х\...Хп.
Для построения модели необходимо иметь также формальное предоставление неопределенности источников гибридной информации. С этой целью на множестве альтернатив, соответствующих тем или иным элементам описания процесса определяется одна из следующих структур: бинарное отношение правдоподобия, субъективная вероятность и нечеткая мера.
В главе 2 разработаны методы выбора переменных моделей, определения величин их максимальных лагов, выбора класса функций и параметрического множества на основе гибридной информации.
Выбор независимых переменных модели (I) состоит в выделении из индексного множества всех экзогенных факторов № подмножества N^11° тех факторов, которые оказывают существенное влияние на зависимую переменную и принимаются далее за независимые переменные. С этой целью на множестве № определяется бинарное отношение сравнительного правдоподобия Я , при котором Щ/, означает, что влияние переменной х* на у более
правдоподобно (или более значительно), чем переменной хК Тогда, если Я - линейный порядок, то элементы множества 11° оказываются однозначно упорядоченными по Л и в качестве Н достаточно выбрать первые п° элементов полученной таким образом индексной последовательности.
Отношение Я строится на основе гибридной информации о моделируемом процессе и должно быть в том или ином смысле согласовано с ней. Для унификации процедур построения Я в условиях гибридной информации информация каждого 1-го вида приводится к бинарному отношению Б"1 на множестве 1р , а затем определяется отношение Я, наиболее близкое ко всем 51.Разработанные способы построения Я по Б1 разнообразны, и выбор того или иного из них зависит от характера источников информации и типов их неопределенности. Некоторые из способов сводятся к решению задач линейного программирования.
Определение люлсилюлъных лагов переменных заключается в установлении минимальных временных интервалов г и т 1, £еЛт
у X
таких, что на значение зависимой переменной у в момент ? не оказывают влияние ее значение в момент и значения независимых переменных в моменты времени 1.
Различные способы определения максимальных лагов основаны на согласовании величин т* и , соответствующих раз-
личным источникам гибридной информации с учетом неопределенности последней. В частности, если у и чф - искомая и назначенная 7-ым экспертом (1еЬ) величины максимального лага для 1-ой переменной и п°- ограничение на размерность модели по числу переменных с учетом лаговых значений, то величины т I, находятся из решения задачи условной минимизации
т1п I I 'V- I У^0'
которая приводится к задаче линейного программирования.
При выборе класса функций и трамещзаческого тожества необходимо обеспечить согласование множеств :г>=1 ,
каждое из которых соответствует отдельному источнику гибридной инфориации. Используемые здесь способы согласования в целом основаны на тех же подходах, что и в случае выбора переменных модели и величин максимальных лагов.
Описанные методы выбора максимальных лагов, класса функций и параметрического множества модели (I) полностью применимы к модели (2).
Если модель (I) определена, представляет интерес оценка ее адекватности. Пусть случайная величина принимающая значения у из множества действительных чисел я1, является функцией q действительных переменных (г1,... где ...,
Высказано предположение о том, что условное математическое ожидание м(£|я) в некоторой ограниченной области 2°
пространства я9 есть линейная по параметрам (в1.....е9)=б€в=Нт
зависимость М(£ |2г)=91<р1 (г)+.. .+9тфга(2) с известными функциями
к=1,т. Пусть далее имеется экспертная информация о зависимости случайной величины 5 от г в форме совокупности высказываний вида 2€2х)=р1, где У1 - ограниченные открытые снизу и замкнутые сверху интервалы в ^ , для всех
pJ€ 10,13 - правдоподобие события itY1 при условии ziZ1, а функция р имеет смысл субъективной вероятности. Требуется оценить степень согласованности модельной зависимости экспертным высказываниям.
Решение задачи состоит в построении вероятностной модели, события которой определены через интервалы У1, согласовании вероятностной меры с паравдоподобиями р1, отыскания значений параметров вк модели, при которых последняя наилучшим образом соответствует вероятностной мере, и вычисления степени соответствия, принимаемой за меру адекватности. Наиболее трудоемкие этапы сводятся к решению задач линейного и целочисленного программирования.
В главе 3 разработаны методы параметрической идентификации моделей на основе гибридной информации при измерении переменных в различных шкалах.
Оценивание параметров модели (I) при измерении независш,<ш переменных в количественной шкале заключается в решениии задачи минимизации невязки статистических и рассчитанных по модели
значений зависимой переменной у на периоде основания прогноза 0
min J(9); J(G)= I .....yt-%'*t.....*t-x;0)] (3)
t=s~t
(с квадратом или модулем в качестве F) при ограничениях, обусловленных экспертными высказываниями о свойствах или значениях переменной процесса {ус). При этом высказывания широкого класса порождают линейные ограничения
т
П(0)= 1 atyt(6)+p
t=-ö
где yt(9) - решение уравнения (I), выраженное в явном виде через параметры 6; ctt, ß - вычисляемые коэффициенты. Это позволяет привести процедуру оценивания параметров модели (I) к решению задач квадратичного или линейного программирования.
Более сложные экспертные суждения, связывающие поведение процесса со значениями переменных в прошлые моменты времени, записываются в виде дизъюнктивной нормальной форме логики высказываний, что позволяет свести оценивание параметров модели
к решению нескольких задач (3).
Экспертные высказывания могут быть взаимно противоречивы, либо противоречить статистической информации. Алгоритм согласования различных источников информации в этом случае основан на отыскании таких значений 9, которые бы, с одной стороны, приводили модель к согласованию с возможно большим числом высказываний, и с другой стороны, обеспечивали допустимый уровень несовпадения J(д) расчетных и фактических значений зависимой переменной модели на ретроспективе.
Методы оценивания параметров модели (I) с использованием статистической информации о процессах, подобных прогнозированию, основаны на выявлении устойчивых закономерностей р рядах наблюдений за такими процессами, сходных по структуре со свойствами процессов в экспертных высказываниях, и применении описанного выше подхода к оцениванию параметров модели на основе статистической и экспертной информации.
Методы оценивания параметров модели (I) при измерении независимых переменных в шкалах наименования и порядка отличаются от раасмотренных тем, что теперь модель (I) заменяется системой зависимостей
(ус-1 ...2)+ес <20.....
о т от-7
с Х=Х1*...*Хп, для каждой из этих зависимостей из последовательности наблюдений за значениями переменной у на периоде основания прогноза выделяется подпоследовательность , включающая наблюдения при соответствующем наборе значений переменных г, и на основе сформированной таким образом статистической информации и экспертных высказываний выполняется оценивание параметров с использованием изложенного выше подхода.
Методы оценивания параметров модели (2) при измерении независимой переменной в количественной шкале основаны на том же принципе, что и методы оценивания параметров модели (I) при измерении зависимой переменной в количественной шкале.
При измерении независшюй переменной в шкале нашюнований отождествим значения х с состояниями конечной однородной марковской цепи, а последние, в свою очередь, представим первыми
натуральными числами. Через PiJ-=-P[^t+1=Jl^t=iJ обозначим
переходные вероятности цепи. При оценивании вероятностей воспользуемся статистической информацией в виде временного
<41 _
ряда наблюдаемых состояний xt, t=-ö,0 и экспертной информацией
в виде импликаций ш2: (Vi=-ö,-I) [ (х^А1 )=>(яс+1 €ßJ) 1, l€L , где А1Zel - множества состояний, задаваемых экспертами. Предположим также, что экспертная информация характеризуется неопределенностью, а именно, каждому высказыванию w1 поставлено в соответствие его правдоподобие р1. Задача состоит в отыскании оценок pij переходных вероятностей pij., наиболее согласованных со статистической и экспертной информацией.
В соответствии с концепцией субъективных вероятностей правдоподобия р1 интерпретируются как условные вероятности, составляется система ограничений в виде равенств и неравенств, связывающих оценки pij. с вероятностями р1, а затем при этих ограничениях решается залача минимизации суммарного рассогласования оценок и относительных частот где xj - число моментов t в интервале времени [-6,-1] таких, что xt=i, £t+1=/. Если в качестве меры рассогласования выбрана сумма модулей \х{~р{\> то задача минимизации сводится к задаче линейного программирования.
Более общей, чем марковская цепь, является модель процесса {xt} , определяемая функцией перехода ср: (Х)х>-©(1), которая каждой совокупности значений независимой переменной х в моменты t-i,t-i+1.....t ставит в соответствие некоторое вероятностное распределение на X в момент t+I из множества всех распределений ©(X). Здесь при оценивании переходных вероятностей, определяющих функцию ф, используется тот же подход, что и при оценивании переходных вероятностей марковской цепи.
Иначе решается задача оценивания переходных вероятностей на основе статистической информации о процессе i'xt}, подобном прогнозируемому. Условные вероятностями, которые полностью определяют функцию перехода ф, выразим через истинности I. i . правильно построенных формул
О"' TJ
Истинности последних в свою очередь отоадествим с правдоподо-иями р1 соответствующих закономерностей, оценками которых являются относительные частоты проявления закономерностей в статистическом ряде наблюдений значений хг. В случае короткого
ряда наблюдений многие из последовательностей (10.....Ц»Л не
входят в ряд наблюдений. Для соответствующих закономерностей невозможно непосредственно определить истинности большей части формул (4). В этих условиях для оценки истинностей такого рода формул необходимо подсчитать относительные частоты повторения элементарных закономерностей 2={0, 3=1^..........зк/. и че-
рез последние выразить истинности формул (4) в соответствии с аксиомами одной из трех логик - непрерывной логики с максимин-ными операциями, непрерывной логики с ограниченными операциями, вероятностной логики.
Методы оценивания параметров модели при изиерении независимой переменной в шмале порядка аналогичны только что рассмотренным, только теперь расширяются классы экспертных высказываний о свойствах и закономерностях развития процесса.
При одновременном использовании статистической и экспертной инфорлюции постановка и решение задач оценивания переходных вероятностей остаются прежними, лишь иначе расширяется система ограничений задачи минимизации относительно искомых переходных вероятностей за счет дополнительных условий согласования разнородной информации.
В главе 4 предложены методы прогнозирования процессов как с использованием предварительно построенных моделей, так и непосредственно на основе гибридной информации.
После того, как с использованием методов, разработанных в главах 2 и 3, построена модель (I) изучаемого процесса, выполняется его прогнозирование на основе модели как рекурентного соотношения. Процедура прогнозных расчетов в этом случае очевидна. Следует лишь заметить, что необходимо предварительно выполненить прогнозирование независимых переменных, для которых неизвестны значения на периоде упрездения прогноза. Пос-
ледняя задача решается тем же рекурентным способом, только на основе модели (2), а не (I).
Возможны также другие постановки задачи прогнозирования на основе гибридной информации, не связанные с использованием' моделей.
Прогнозирование временных рядов для независимых переменных на основе экспертной информации при измерении переменной в количественной титле. Широко распространена ситуация, когда изучается новый динамический процесс и, следовательно, отсутствует статистическая информация о ходе процесса в прошлом. Тем не менее необходимо высказать обоснованное предположение о наиболее правдоподобном поведении процесса в будущем, основываясь лишь на экспертной информации о свойствах процесса.
Пусть, хс, {=-6,0 - наблюдаемые значения переменной на периоде основания прогноза, иг1, -система экспертных суждений о свойствах и конкретных значениях переменной процесса хс, ¿=-6,7, высказанных с превдоподобиями р , X - множество всех возможных значений переменной х на периоде упреждения прогноза. Задача состоит в том, чтобы из множества всех последовательностей хг (хсеХ), выбрать такую, которая была бы наиболее согласована с экспертными высказываниями.
В интерпретации правдоподобий как субъективных вероятностей строится вероятностная модель процесса <П,21,р>,где Я - пространство элементарных событий, 21 - алгебра подмножеств П, р -вероятностная мера на алгебре 21. За пространство элементарных событий П принимается множество всех последовательностей
ю=(х, ,...,х ), таких что ,7)Сх^еХ]. Алгебра событий 21
У
определяется, исходя из соображений наибольного полного использования экспертных высказываний, как система всех объединений множеств
N
а . = [ ] а1,, аг1.....й№)€я ,
к . ..к 1= к1
где ^=0,1; П^П1; О^ОХО1; К - множество индексных последова-
N
тельностей (й1.....й"), для которых пересечение Г1 П1, не
1=1
пусто; П - множество последовательностей со, удовлетворяющих свойству ггг1. Вероятностная мера р на алгебре 21 определяется так, чтобы она была согласована с правдоподобиями экспертных высказываний, т.е. выполнялось равенство р(П1)=р1 для всех 1=1,N.
Построенная вероятностная модель позволяет разработать метод оценивания правдоподобия принадлежности любой наперед заданной траектории прогнозируемого процесса к сово-
купности последовательностей, заданной системой неравенств т . . — . .
£ сфг^р1, 1=1,Ы с известными коэффициентами а1 , по
t=1
7
экспертной информации в виде высказываний ]> а^х^Ь1,
7 I 1 t=-S
а »^еи, с правдоподобиями р . Реализация метода сводится к решению задачи линейного программирования относительно вероятностей множеств П ,
к1...к"
На основе изложенного подхода с использованием вероятностной модели решается также задача прогнозирования временного ряда для независимой переменной, измеренной в шкале порядка. В этом случае изменяется лишь класс экспертных высказываний, которые теперь принимают вид х ^ , А,1,|а,1еГ0СН+Гупр, !<еЪ.
X (д.
Прогнозирование временного ряда при измерении независимой переменной в шкале наименований заключается в отыскании прогнозной траектории однородной марковской цепи , наиболее согласованной со статистической и экспертной информацией. При этом используются оценки вероятностей перехода цепи, найденные в главе 3. Задача отыскания прогнозной траектории решается методом динамического программирования.
Другой способ прогнозирования временного ряда основан на сравнении частот повторений конфигураций значений переменных, измеренных в шкале наименований, на периодах основания и упреждения прогноза. При этом за прогнозную принимается траек-
тория, содержащаяся в наиболее часто повторяющейся конфигурации.
При прогнозировании зависимой переменной часто встречается ситуация, когда имеются несколько альтернативных моделей, и выполненные по ним прогнозы существенно различны. Возникает задача комбинирования такого рода частных прогнозов с использованием гибридной информаци.
Пусть £€Rn - вектор независимых переменных, y€R1 - зависимая переменная, y=f(x) - неизвестная зависимость. Требуется высказать наиболее правдоподобное предположение о возможном значении у*=/(£*) переменной у при заданном значении х* переменной х, используя при этом: а) семейство частных моделей y=/i(a?,e1),i=1,S ; б) семейство экспертных высказываний x=x*=»ye(aI,t»1], Z€i={ 1,...,N= |L|) , где а1 ,ЬХ - заданные Z-ым экспертом действительные числа, такие, что (ai,bi] - попарно различные интервалы; в) законы распределения случайных ошибок е1, (=1 ,S , с которыми выполняется предсказание у по х на моделях; г) правдоподобия р1(СКр1^) экспертных высказываний ; д) согласованные оценки экспертов для нижней А и верхней В границ значений у , такие, что правдоподобия событий у€(-со,Л] и у€(В,оо) равны нулю.
Построенные с помощью моделей частные прогнозы можно интерпретировать как S случайных величин, а экспертные высказывания представить в виде (S+1)-й случайной величины с функцией плотности распределения, построенной на основе вероятностной модели <П,51,р> подобной рассмотренной выше. Тогда в предположении независимости данных S+1 случайных величин с использованием принципа максимума правдоподобия, удается свести задачу отыскания наиболее вероятного значения у* зависимой переменной при значениях независимых переменных х=х* к решению задачи математического программирования, в частности, линейного программирования при двухстороннем экспоненциальном распределении ошибок частных прогнозов е1, 1=1,S.
При прогнозировании процесса с использованием модели (I) как рекуррентного сооотношения нередко возникает ситуация, когда значения независимых переменных на периоде упреждения
прогноза неизвестны и отсутствуют предпосылки для их прогнозирования, но имеется.возможность привлечения экспертов в содержательной области, которые способны высказать суждения о границах возможных значений переменных. В этом случае представляет интерес отыскание оценок правдоподобия р"3* и р®1" того, что в заданный момент времени из периода упреждения прогноза значение зависимой переменной у процесса будет находиться в заданном интервале ta.ß).
Для линейного случая модели (I) решение данной задачи сводится к построению вероятностной модели <П,91,р>, подобной рассмотренной выше, исследованию на совместность систем линейных неравенств, полученных из соотношения (I), и вычисления оценок ррах и ppin через вероятностную меру р.
Различные постановки задачи прогнозирования на основе гибридной информации предлагается изучать с позиции единого подхода в рамках теории принятия решений.
Вводится множество П={ш:и=(21.....всех последовательностей значений прогнозируемой переменной z (у или xi) на периоде упреждения прогноза. Определятся функция потерь s=s((j),X), которая каждой выбранной в качестве прогнозной со и фактически осуществленной Л последовательностям ставит в соответствие неотрицательное число, характеризующее потери в результате последствий выбора и вместо Л. На множестве П через потери при всех X определяется функция риска J=J(ш). За семейство прогнозных траекторий процесса Q* принимается множество последовательностей и, минимизирующих функцию риска.
Предположим, что на основе гибридной информации найдено единственное вероятностное распределение Р(ш) на конечном множестве П. Тогда риск естественно представить как средние потери J(w)= Е P(\)r(u,M (байесовский риск), а затем, решая
\€Л „
задачу mlnJ(и), найти семейство прогнозных траекторий Q . Если wen
гибридная информация достаточно полна, чтобы на основе каждого ее источника можно было задать свое вероятностное распределение Р(и) на множестве прогнозных последовательностей, то для каждого Р, как и выше, определяется функция риска Jp(u) и находится семейство прогнозных траекторий Q*p, а затем отыски-
вается семейство результирующих прогнозных траекторий П*, в том или ином смысле наиболее близких к П*р. Прогнозные траектории могут быть также найдены в соответствии с принципом ми-нимакса из решения задачи mln max Jp(w).
Описанный подход распространяется на случаи а) несчетного множества П с алгеброй подмножеств и определенной на алгебре вероятностной мерой; б) определенной на П или алгебре подмножеств ü нечеткой мере; в) функций риска, отличных от байесовского.
2 главе £ дано приложение разработанных в предыдущих разделах методов к прогнозированию демографических процессов и процессов денежного обращения в административной области.
К настоящему времени разработано значительное число математических моделей демографических процессов, ориентированных на расчет перспективных численностей половозрастных групп населения. Однако прогнозирование демографических процессов в -административной области имеет определенную специфику, связанную с необходимостью иметь надежный прогноз интенсивностей естественного и механического движения населения. Задача прогнозирования демографической ситуации усложняется в случае включения в сценарий техногенных и природных катастроф, последствия которых существенно влияют на демографические процессы в зоне действия катастрофы.
В основу алгоритмов прогнозирования демографических показателей положена известная динамическая балансовая модель, обычно используемая при расчетах перспективной численности населения. Применительно к демографическим процессам в области модель имеет следующий вид:
50 _ _
ff}0(t+I)= ajjtt) (t), {=1,2; fc=0,K ,
i = 15
D^Sj., (t)-(b°j(t)-l^j(thm°j(t))S°j(t), 1=1,2; >1,100 ti^j (t+1 )=S1[J_1 (t)-(b^j.(i)-Z^j.(i)+4j.(i) (t)+
fljj(t), 1=1.2; ,/=1,100; Й=1 ,K, í=I,2,...,
где i,J,k - индексы признаков групп населения: í=I - мужской пол, i=2 - женский пол; j=0 - возраст до I года, J=I - возраст I год,..., ./=100 - возраст 100 лет и более; й=0 - проживание в области в целом, й=1 - проживание в 1-ом административном районе,..., k=K - проживание в й-ом административном районе; 11*j(í) - численность населения (í,J,k) - й группы на начало í-го года; a^j(t) - средняя численность новорожденных £-го пола на одну женщину J-го возраста в й-ом районе в течете í-ro года; b*j(t) - численность умерших (i,J,й)-й группы населения в течение í-ro года, отнесенная к численности всей группы на начало í-ro года; l¿j(t) - численность населения (í,J)-ñ группы, прибывшего в й-й район извне области в течение í-ro года, отнесенная к численности (i,J,k)-ft группы на начало í-ro года; m^jd) - численность населения (i, Л-й группы, выбывшего из й-го района за пределы области в течение í-ro года, отнесенная к численности (í,J,A)-H группы на начало í-ro года;
itU
ljj(t) ~ численность населения (t,j)-Vi группы, прибывшего в й-й район из u-го в течение í-ro года, отнесенная к численности (í,J,й)-й группы на начало í-ro года.
Основой для проведения прогнозных расчетов являются известная половозрастная структура населения области и районов на начало года переписи населения и статистические данные по численности новорожденных, умерших и изменивших место жительства для каждого í-ro года периода основания прогноза, кроме последнего. На первом этапе прогнозирования выполняется передвижка половозрастной структуры населения на начало года проведения прогнозных расчетов. На втором этапе прогнозирования выполняется передвижка половозрастной структуры по годам периода упреждения прогноза , т.е. в соответствии с моделью как системой рекурентных соотношений последовательно находятся числен-
к К
I *з<*> -1
и=1 u=i
u?tk
ности половозрастных групп населения. Однако теперь интенсивности демографических процессов а, Ь, I, т для ,7-1 не определены и подлежат предварительному прогнозированию.
Задача прогнозирования интенсивностей является ключевой в схеме расчета перспективных численностей половозрастных групп населения, так как точность прогноза интенсивностей в значительной 'мере определяет точность остальных демографическтх прогнозов. Поэтому для решения задачи прогнозирования интенсивностей целесообразно привлечение, кроме статистической, других видов информации.
При кратко- и среднесрочном прогнозировании модели процессов изменение во времени интенсивностей рождаемости и смертности населения могут быть представлены в виде авторегрессионных зависимостей (2). Оценивани параметров моделей производится разработанными в главе 3 методами на основе статистической информации о прогнозируемых интенсивностях в области и регионах, в которых несколько лет назад экологические, экономические и социальные условия жизни населения были схожи по своему влиянию на рождаемость и смертность населения с условиями жизни в области в настоящее время.
Процессы изменения во времени интенсивностей миграций в значительной мере определяются условиями жизни населения области и других регионов, поэтому для моделирования этих процессов более подходит общая многофакторная модель (I). Построение модели и оценивание ее параметров выполняется разработанными в главах 2, 3 методами на основе статистической информации о механическом движении населения области и экспертной информации о характере и степени влияния на интенсивности миграций тех или иных условий жизни.
При прогнозировании демографических процессов в области в условиях воздействия на население поражахщих факторов техногенной или природной катастрофы вместо разделения индивидов по признаку проживания в том или ином административном районе вводится разделение по признаку проживания (£=1)или непроживания (&=2) в зоне действия катастрофе. Добавляются также этапы передвижки возрастов на период с момента начала катастрофы до
начала следующего года и затем до конца' периода упреждения прогноза. Существенно расширяется класс используемых при оценивании интенсивностей смертности и миграций высказываний экспертов в виду появления новых медикобиологических, экологических и социальных факторов, обусловленных последствиями катастрофы. Для оценивания параметров моделей интенсивности используются метода, описанные в главах 2,3.
В условиях перехода к рыночным отношениям и децентрализации экономики страны коренным образом изменяется систем регулирования денежного обращения. Используемые ранее четкие механизмы кассового планирования оказываются неприменимыми в новых условиях. Появилось множество факторов, влияющих на состояние денежного обращения, которые должны быть учтены при выработке управляющих воздействий. В этих условиях задача принятия решений руководством банка по управлению денежным обращением существенно усложняется и возникает необходимость в поддержке решений путем привлечения соответствующим образом обработанных статистических данных и экспертных знаний о процессе денежного обращения.
Первым этапом работы в этом направлении является создание методов и алгоритмов прогнозироваания динамит показателей денежного обращения.
Прогнозированию подлежат следующие показатели: остатки средств на счетах хоздоговоров и учреждений, остатки наличных денег на руках у населения, остатки наличных денег в кассах предприятий торговли, остатки наличных денег в кассах других предприятий и в пути, остатки наличных денег в банках, денежные сбережения, депозиты, ценные бумаги населения в банках, страховые- полисы, скорость обращения денег, индекс цен.
Показатели денежного обращения/ зависят от ряда факторов: темпы прироста объемов производства, уровень платежеспособности плательщиков, сумма централизованных кредитных ресурсов, доходы населения, объем товарооборота, объем бытовых услуг, неинкассируемая часть наличных денег, общий кассовый приход.
Прогнозирование выполняется на основе наблюдаемых значений показателей и влияющих на них факторов на периоде основания
прогноза, а также Заданных значений внешних по отношению к банковской системе факторов на периоде упревдения прогноза. Для повышения надежности прогноза привлекается эксперты-специалисты в вопросах денежного обращения, которые высказываются по поводу ожидаемых тенденций изменения показателей денежного обращения и их конкретных значений на периоде упреждения прогноза. Кроме самого высказывания, каждый эксперт сообщает о степени его правдоподобия. Для параметрической идентификации моделей (I), (2), применяемых при прогнозировании, используются метода, разработанные в главе 3.
Второй этап работы по созданию по созданию средств поддержки принятия решений в управлении денежным обращением заключается в разработке шгитациионной модели , позволяющей выполнять вариантное■ прогнозирование показателей денежного обращения при различных сценариях развития финансовой и сиежных сфер области. Кроме перечисленных выше показателей и факторов, здесь имеют место следующие управляющие воздействия: учетная ставка по кредитам и векселям, объем резервных ресурсов банков, объем предоставляемых кредитов, обтаем проданных ценных бумаг, объем купленных ценных бумаг. Эти управляющие воздействия также включаются в сценарий.
Особенность имитационной модели состоит в том, что функции "вход-выход" элементов модели строятся путем специально организованного опроса экспертов, которые высказываются об интервалах возможных значений выходов при различных комбинациях значений входов и дают оценку правдоподобий своих высказываний.
После выполненной таким образом настройки модели следуют процедуры имитации, статистической обработки результатов имитационного эксперимента и вычисления прогнозных значений показателей денежного обращения для выбранного сценария.
Изложенные схемы моделирования и прогнозирования реализованы в разработанных под руководством и с участием автора Диалоговой системе прогнозирования денежного обращения и Экспериментальной системе поддержки решений в управлении денежным обращением. Приведены структура и описание программного и ин-
формационного обеспечения этих прикладных систем.
В заключении кратко сформулированы основные результаты диссертационной работы.
В приложении дано решение задач выбора наилучшей альтернативы путем минимизации расстояния между отношениями и несмещенного оценивание параметров вероятностно-статистической модели с конечным пространством элементарных событий, приведены образцы меню и экранных форм прикладных систем, приведены копии актов и справок о практическом использованииполученных в работе результатов.
ЗАКЛЮЧЕНИЕ
Выполненные в диссертации исследования позволили осуществить постановку, предложить подходы и разработать ряд методов решения научной проблемы моделирования и прогнозирования дискретных процессов на основе гибридной информации, имеющей важное прикладное значение. Основные научные и практические результаты исследования состоят в следующем:
1. Сформулированы обобщения традиционного подхода к моделированию и прогнозированию дискретных во времени процессов в направлении использования гибридной информации, предложены классификация и формальное представление источников гибридной информации и ее неопределенности,
2. Предложен общий подход и разработаны конкретные методы решения задач выбора переменных, их максимальных лагов, класса функций и параметрического множества модели на основе отношения правдоподобия, построенного с использованием статистической и экспертной информации при различных типах неопределенности. Разработан метод оценивания адекватнос-н регрессионной модели на основе экспертных высказываний об интервалах возможных значений переменных на периоде упреждения прогноза.
3. Для дискретного процесса рассмотрен широкий спектр экспертных высказываний, выполнена их формализация и разработаны процедуры оценивания параметров модели процесса.Предложены способы оценивания параметров модели на основе статистической информации относительно развития процесса, подобного прогнози-
руемому.
4. Разработаны метода оценивания параметров моделей для независимых переменных, основанные на одновременном использовании статистической и экспертной информации.
5. Построена вероятностная модель временного ряда по экспертным высказываниям и исследованы ее свойства. Разработаны методы прогнозирования временных рядов для независимых переменных на основе статистической и экспертной информации.
6. Разработаны методы комбинирования прогнозов, выполненных по нескольким моделям, и прогнозирования временных рядов для независимых переменных с использованием экспертной информации об интервалах возможных значений переменных на периоде упреждения прогнозе,
7. Разработана общая схема прогнозирования дискретных во времени процессов на основе гибридной информации как принятия решений в условиях неопределенности, позволяющая согласовать в окончательном прогнозе разнородную информацию.
8. Построены математические модели демографических процессов в области, в том числе в условиях природных и техногенных катастроф, ориентированные на проведения прогнозных расчетов с использованием гибридной информации.
9. Построены математическая и имитационная модели дежного обращения в области, идентифицированные на основе статистической и экспертной информации и ориентированные на вариантное краткосрочное прогнозирование показателей денежного обращения в условиях нестабильности финансовой системы. На основе моделей разработаны прикладные компьютерные системы поддержки решений в сфере денежного обращения.
Основные научные работы, опубликованные автором по теме диссертации:
I. Головченко В.Б. Прогнозирование социально-демографической ситуации в регионе как основа для оптимального использования трудовых ресурсов // Проблемы внедрения результатов и оценка эффективности НИР по разработке, совершенствова-
нию и внедрешю АСУП в народное хозяйство: Тез. докл. Всесоюз. научно-коорд. совещания. - Иркутск: Иркутский политехи, ин-т, 1982. - С. 51-52.
2. Матросов В.К., Головченко В.Б., Носков С.И. Моделирование и прогнозирование развития административной области // Теория, методология и практика системных исследований: Тез. докл. Всесоюз. конф. - М.: ВНИИСИ, 1984. - Часть 3. - С. 143-144.
3. Головченко В.Б. Алгоритм предсказания на таблицах данных, основанный на подсчете числа повторений конфигураций // Пакеты прикладных программ. Функциональное наполнение. -Новосибирск: Наука. Сиб. отд-ние, 1985. - С. 90-95.
4. Головченко В.Б. Модель развития народонаселения административной области // Тез. докл. Первой Всесоюзной школы "Прикладные проблемы управления макросистемами". - М.: ВНИИСИ, 1985. - С. 74-75.
5. Головченко В.Б., Носков С.И. О комплексе программ сравнения эконометрических моделей // Пакеты прикладных программ. Функциональное наполнение. - Новосибирск: Наука. Сиб. отд-ние, 1985. - С. 90-96.
6. Головченко В.Б., Носков С.И. Многокритериальный выбор наилучшего уравнения регрессии // Пакеты прикладных программ. Итоги и применения. - Новосибирск: Наука. Сиб. отд-ние, 1986. - С. 168-174.
7. Головченко В.Б. О прогнозировании дискретных в пространстве и времени процессов при неполной априорной информации. - Деп. в ВИНИТИ 25.02.86, № 1281-В86. - 8 с.
8. Головченко В.Б. Прогнозирование на основе априорной информации о сравнительном правдоподобии свойств процесса// Тез. докл. Второй Всесоюзной школы "Прикладные проблемы управления макросистемами". -М.: ВНИИСИ, 1987. -С. 74-75.
9. Головченко В.Б. Прогнозирование дискретных в пространстве состояний и времени процессов. - Препринт / ИрВЦ СО АН СССР. - Иркутск: 1988. - 51 с.
10. Головченко В.Б. Моделирование и прогнозирование развития народонаселения и социального комплекса области // Прило-
жение математических моделей к анализу эколого-экономи-ческих систем. - Новосибирск: Наука. Сиб. отд-ние, 1988.-С. 33-41.
11. Голобчешо В.Б., Пстороченко H.A. Моделирование вариантов социально-экономического развития области// Территориальные неоднородные информационно-вычислительные системы: Тез. докл. Всесоюз. конф. - Новосибирск: ВЦ СО АН СССР, 1988. - С. 97-99.
12. Матросов В.U., Головченко В.Б., Жидиханов Б.Р., Носков С.И. Автоматизированная система моделирования развития области // Территориальные неоднородные информационно-вычислительные системы: Тез. докл. Всесоюз. конф. -Новосибирск: ВЦ СО АН СССР, 1988. - С. 91-93.
13. Головченко В.Б. Сравнение и выбор вариантов социально-экономического развития области // Тез. докл. Третьей Всесоюзной школы "Прикладные проблемы управления макросистемами". - М.: ВНИИСИ, 1989. - С. 147.
14. Иатросов B.U., ГолоЬченко В.Б., Носков С.И., Жидхлха-нов Б.Р. Автоматизированная система моделирования развития области // Информатизация и моделирование территориальных социально-экономических систем. - Новосибирск: ВЦ СО АН СССР, 1989. - С. 77-97.
15. Головченко В.Б. Прогнозирование временных рядов на основе экспертной информации // Информатизация и моделирование территориальных социально-экономических объектов: Тез. докл. Всесоюз. конф. -Новосибирск: ВЦ СО АН СССР, 1990. -Часть 2. - С. 29-31.
16. Головченко В.Б. Построение вероятностной модели временного ряда на основе экспертной инфориации. - Деп. в ВИНИТИ 29.03.90, № I673-B90. - 14 с.
17. Головченко В.Б. Оценивание переходных вероятностей и прогнозирование однородной марковской цепи на основе статистической и экспертной информации. - Деп. ВИНИТИ 15.II.90, Л 5796-В90. - 12 с.
18. Головченко В.Б., Носков С.И. Эконометрическое моделирование на основе статистической и экспертной информации //
Информатизация и моделирование территориальных социально-экономических объектов: Тез. докл. Всесоюз. конф. Часть 2. - Новосибирск: ВЦ СО АН СССР, 1990. - С. 10-11.
19. Головченко В.Б.,'Носков С.И. Оценивание параметров линейной регрессии с переключениями. - Деп. ВИНИТИ 15.II.90, № 5797-В90. - II С.
20. Головченко В.Б., Жидиханов Б.Р., Носков С.И. Об одном подходе к разработке подсистемы "Демография и социальное развитие в составе АСУ "Город"" // Информатизация и моделирование территориальных социально-экономических объектов: Тез. докл. Всесоюз. конф. Часть 2. - Новосибирск: ВЦ СО АН СССР, 1990. - С. 24-25.
21. Матросов В.М., Головченко В.Б., Носков С.И. , Псторочен-ко Н.А. Система математических моделей социально-экономического развития административной области: опыт разработки и применения // Информатизация и моделирование территориальных социально-экономических объектов: Тез. докл. Всесоюз. конф. -Новосибирск: ВЦ СО АН СССР, 1990. -Часть 2. - С. 3-5.
22. Головченко В.Б. Прогнозирование временных рядов по экспертным высказываниям // Изв. АН СССР. Техн. кибернетика. - 1991. - № 3. - С. 47-51.
23. Головченко В.Б., Носков С.И. Оценивание параметров эконо-метрической модели по статистической и экспертной информации // Автоматика и телемеханика. - 1991. - № 4. - С. 123-132.
24. Матросов В.М., Головченко В.Б., Носков С.И. Моделирование и прогнозирование показателей социально-экономического развития административной области. - Новосибирск: Наука. Сиб. отд-ние, 1991. - 144 с.
25. Носков С.И., Головченко В.Б., Еидиханов Б.Р. Методы и технология моделирования социально-экономического развития области // Модели, методы и программные средства анализа глобальной и региональной устойчивости развития: Тр. Междунар. совещ. - М: 1991. - С. 128 - 142.
26. Головченко В.Б., Носков С.И. Оценка адекватности линейной
регрессии на основе экспертных высказываний // Кибернетика. - 1992. - Л 5. - С. 109-115.
27. Толовченко В.Б., Носков С.И. Комбинирование прогнозов с учетом экспертной информации // Автоматика и телемеханика. - 1992. - № II. - С. 109-117.
28. Головченко В.Б., Ованесян С.С. Методология разработки автоматизированной системы поддержки решений по управлению денежным обращением // Региональные механизмы и управление в социальных и экономических системах: Тез. докл. Междунар. конф. -Воронеж: Воронеж, политехи, ин-т, 1992. - С. 94-95.
-
Похожие работы
- Символьная верификация событийно-управляемых динамических систем
- Синтез робастного стабилизирующего управления гибридными системами при структурных и амплитудных ограничениях
- Символьная верификация непрерывно-дискретных систем. Алгоритм обобщенного таймер-преобразования
- Устройства дискретной автоматики с гибким использованием ресурса помехозащиты
- Синтез робастных динамических и децентрализованных регуляторов гибридных систем
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность