автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Оценка параметра авторегрессивной модели первого порядка при случайных пропусках измерений

кандидата технических наук
Валеев, Тагир Ильясович
город
Томск
год
1992
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Оценка параметра авторегрессивной модели первого порядка при случайных пропусках измерений»

Автореферат диссертации по теме "Оценка параметра авторегрессивной модели первого порядка при случайных пропусках измерений"

Министерство науки, высшей школы и технической политики Р5 Томский государственный унигерситет им. В.В.КуЯбнвсва

На правах рукописи УДК Ы9.2

ЕАЛЕЕВ Тагир Ильясович

ОЦЕНКА ПАРАМЕТРА АНГ0РьГРВХ1ЮНШЛ МОДШ ПЕРВОГО ПОРЯДКА Ш СЛУЧАЙНЫХ ПРОПУСКАХ ИЗМЕРИШ

Специальность 06.13.16 - применение вычислительной техники, математического моделирования и математических методов в , научных исследованиях

АВТОРЕФЕРАТ диссертации на соискание ученой ставни кандидата технических наук

Томск - 1992

Работа Емполнена в Томском государственном университете имени-В.В.Куйбышева и я Сибирском Физико-Техническом институте имени В.Д.Кузнецова,

Научный руководитель: доктор физико-математических наук, профессор А.Ф.Терпугов Официальные оппоненты: доктор физикс-ыатеыатичееккх наук,

^едущая организация: Институт Технической Механики АН Украины (г. Днепропетровск)-

сов на заседании специализированного Совета Д.063.53.03 Томского государственного университета имени В. В. Куйбышева ( 634050,

С диссертацией могло ознакомиться в тучной библиотеке Томского государственного университета

профессор В.А.Топчий кандидат технических наук Г.М. Кошкин

Защита состоится "//" • 1993 г. в ча-

г. Томск-50, пр. Ленина, 26).

Ученый секретарь специализированного Совета, • кандидат физико-математических наук, доцент

Б.Е.Тривоженк:

- 3 -

0Б4АЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы ■ С проблемой аналнза временных ря-» приходится сталкиваться в целом ряде технических и научных 'уаций: в научных исследованиях - при обработке эксперимон-[ьных данных, в технике - в задачах контроля состояния и фун-юнирования динамичесикх систем.

Большая часть теории, посвященной анализу временных рядов, |работана для случая i когда измерения производятся через рав-! промежутки времени. Однако в последние годы все больший ;:н~-iec представляют задачи, когда измерения временного ряда про-юдятся через неравные, вообще говоря, случайные промежутки !мени. Это может быть вызвано тем, что: в ряде технических :теы измерения через случайные промежутки времени заложены в iy схему измерений; в некоторых случаях выгодно организовывать прения в случайные моменты времени, так как это устраняет соторые нежелательные эффекта, такие как свертывание спектра; 1Можны сбои в работе измерительной и регистрирующей апшц^ту-

Частным случаем измерений в случайные моменты времени яп~ ;тся случай, когда измерения производятся через равные промочен времени, но часть этих измерений случайным образом пропа-!Т. Такая ситуация возможна в тех же случаях, что и указанные

ie.

Все это приводит к необходимости расширения теории анали-временных рядов на случай, когда измерения производятся че-| случайные промежутки времени или на случай случайного про-,ания измерений. Это и определяет акт; иьность данной работы.

Целью работы явпялось:

1. Разработать математические модели пропусков измерений.

2. Разработать достаточно простые в вычислительном отнеше-

нии оценки параметра авторегрессионной модели первого порядка при пропусках измерений.

0. Исследовать свойства получоннмх оценок.

4. Создать прс раммное обеспечение для вычисления оценок по яксперименталыам да1!ккм и провести их ими/тацконное иоделир ванне.

тоды исследования_. При решении поставленных задач ис

пользовались методы математической статистики, теории случайных процессов, теории маркозеккх процессов, теории вероятностей. Дл проверки аналитических результатов использовалось имитационное моделирование на ЭШ.

Научная новизна результатов, полученных в диссертации сос тоит в следующем:

1. Предложены некоторые математические модели для пропадания измерений, в частности,- модель с независимыми пропаданиями, модель с марковскими пропаданиями, модель с независимыми группами пропадающих измерений.

2. Предложена сценки параметра авторегрессионной модели первого порядка в двух случаях - информация о количестве пропу-щешшх измерений теряется и информация о количестве пропущенных измерений сохраняется.

3.-Исследованы асимптотические свойства полученных оценок, г частности, доказана их сходимость почти наверное, вычислена ¡к •чоимнтоткческал дисперсия, зффекгиЕНСсть, доказана их асимптотическая норгшльность.

Оеновшо овжящпе?.'уо полохеиия__•

I • Иоясди Гфопяддн'Дк с- кеговкекм&ш группам ироподаэфК п.-умср^шП и их частнкс случаи.

И. Вид урашсш:И, оиределло:д!1х оценку параметра агтсрсгрес-сионной модели первого порядка.

3. Сходимость оценок почти наверное.

4. Формулы, 'определяющие асимптотическую дисперсию ч асимптотическую эффективность предложенных оценок.

0. Асимптотическая нормальность предложенных оценок.

Реализация результатов работы . Разработанные алгоритмы и

реализующие их программы могут быть использованы при обработке экспериментальных данных при наличии пропусков измерений. Предложенные статистические процедуры реализованы в виде программ, которые переданы в НПО "Полет" г. Омск, где предполагается их использование при создании системы математического обеспечения для автоматизированных систем контроля и прогнозирования функционирования сложных технических систем.

Апробация работы . Основные положения диссертации и отдельные ее результаты докладывались и обсуждались на:

1. Республиканской научно-технической школе-семинаре "Анализ систем массового обслуживания и сетей ЭВ.Г (Одесса, 1990 ).

2. Республиканской научной конференции "Математическое и программное обеспечение анализа данных" (Минск, 1990).

3. Всесоюзной научно-технической нон$еронции "Иде-! чфика-ция, измерение характеристик и имитация случайных сигналов" (Новосибирск, 1991)*

4. Всесоюзной научш-технической конференции "Распределенные миЕфопроцессорные управляющие системы и локальные вычислительные сети" (Томск, 1991).

5. Украинской школе-семинаре "Вероятностные модели и обработка случайных сигналов и полей" (Черкассы, 1991).

Публикации. По результатам проводимых исследований опубликовано б печатных работ. Материалы диссертации вошли тякке в отчет по хоздоговорной теме "Жуляны" в 19Ш - 90 г.г., кьтолнян-пейся в Сибирском физико-техническом институте для НПО "Полет".

Структура и объем работы . Диссертация состоит из введения трех глав, списка литературы из ¿1 наименования. Объем диссертации - 141 страница машинописного текста. Работа содержит 22.. рисунка и I таблицу. Прилагается акт об использовании результате работы.

КРАТКОЕ ССДЕШНИЕ РАБОТЫ Во введении приведен краткий обзор литературы по рассматриваемой тематике, определены цели исследования и дана общая характеристика работы.

Первая глава диссертации посвящена задаче оценки параметра авторегрессионной модели первого порядка при независимых группах пропусков измерений и отсутствии информации о количестве пропущенных измерений..

Пусть имеется авторегрессионный процесс первого порядка который описывается уравнением вида

+ (I)

где /=■•■) -I, О, I, ... , ^ - коэффициент авторегрессии, удовлетворяющий условию / , величины ?){ есть независимые одинаково распределенные случайные величины с характеристиками /7-^ = о, = ^ . N{>1} - %<

Наблюдаемый процесс ^ строится следующим образом. Пусть в некоторый момент с. наблюдалось значение процесса . Обозначим его через . Затем после этого наблюдения Л.-значений процесса Х^ оказались пропущенными и следующее наблюденное значение соответствует моменту времени с — ^*/ его ыы обозначим через ^ . Затем следует снова пропус-

ков и т.д.

Таким образом, полная информация о результатах наблюдений

зет вид ' , ^ = О, I.....где - на-

оденноэ значение процесса в некоторый ыоыоит иременн,

- количество пропущенных значений перед наблюдением В качестве модели, описывающей пропуски измерений, в рабо-исследовалась следующая модель: величины ^ считались 1ш-висимыми одинаково распределенными случайными величинами с определением вероятностей р Эту модель мы назвали мо-яью с независимыми группами пропусков. Ее частные случаи, котов изучались более подробно, следующие:

I. Независимые пропуски, когда каждое значение процесса может быть пропущено с вероятностью р и пропуски не за-сят друг от друга. В эт.сн случае

2. Ыарковская модель пропусков. Будем считать, что есть не-торый упра вляющнй процесс ¿^ - / в • Если - ^ , то '¡. наблюдается, если ¿¿-с , то X^ пропекается.

Процесс считается марковским случайным процессом,

ли - ^ , то будем считать, чтЬ' с вероятностью

и с вер°ятностью о1 ; если же

^ с вероятностью и - с вероятностью

-А • Таким образом, ' ©^ есть вероятность перехода ■/-*& .5 - вероятность перехода 0-> ■( . В этом случае

/- <1 , если ^ — С ,

К*) = \ , . 13)

. если >> { .

Зоэмсжны, конечно, и другие модели пропусков, но в работе :следовались только эти.

ра . ^/f i . '^/ч • В этом случае

При построении и исследовании оценок параметра Q в данной главе предполагается, что в парах ( ) информация

о величинах SL теряется и имеющаяся экспериментальная информация имеет вид

процесс можно представить в виде

(4)

, , О) (i) 5 (§■+<■)

Показывается, что условная плотность вероятностей имеет вид

I ~ » Т0 есть

ляется марковским процессом. Далее, де::;е для нормальных характеристическая функция плотности 1 ) имеет вид

w - (5)

и дажэ в простейших случаях г явном виде не вычисляется. Поэтова

му для построения оценки параметра был использован

модифицированный метод наименьших квадратов. Обозначим . „ .

■ Ко)

Так как - <у (?) , то из условия

N

d

оценка J? параметра £ должна искаться из уравнения

Теорема I. Если ряд / (-'-f)X b(S) монотонно возрастает

1Ш интервале , то уравнение (7) имеет единственный

корень, удовлетворяющий условию /р/^ / , если ы , н л

TlU-JTLtí > -

i'' S-0

- о -

В частных случаях независимых и марковское пропаданий наблюдения уравнение (7) имеет соответственно вид

■ (6)

(9)

л'-Л

и / ^ ^

В последней случае получена область значений • ПРИ кото-

рьос уравнение (9) имеет единственный корень.

Теорема 2. Пусть в интервале [-1, I] непрерывна и строго монотонно возрастает'с ростом £ . Тогда при /У->со оценка ^ сходится к истинному значении £ почти наверное.

Доказательство данной теоремы основывается на теореме Бирхго-фа для марковских цепей.

Используя марковское свойство процесса У- и метод линеаризации, находится асимптотическая дисперсия оценки £

УЯ-Ь-тЬ „о,

(Г (И)

!та формула, кроме . <? , зависит от эксцесса случайной компоненты -?")> , вхсд>пцего в параметр К. Препложена оценка Д" параметра К

¿с ■ . N

л Л-У*!' А - у—-*--у" 7 ?

показана ее сходшость почти наверное, что позволяет вычислить, по крайней мере, оценку дисперсии величины ^

В схеме с независим*1!.«! пропаданиями наблюдений

в схеме с марковской моделью пропадания наблюдений

что позволяет производить вычисления асимптотической дисперсии оценки

Эффективность построенной оценки была исследована только для случая, когда случайная компонента ^ процесса Х^ является нормальной случайной величиной. Так как распределение вероятностей величин ^ даже в этом случае явно получить не удается, то была получена лишь нижняя граница для эффективности оценки

/

Я) ■ >

?

, Л

с? .

лип

(15)

• 25 <-/

111

с

Яг*

(16)

•/"Г /-Г

Входящие сюда суммы были конкретизированы для случаев независимых пропаданий и марковской схемы пропадания измерений. Пример графика зависимости от для независимых пропаданий изменений приведен на рис. I.

-Ой -Оч о ом о.ь I

Рис. 1

Теорема 3. При Л^ «л величины

имеют предельное нормальное распределение со средним значением 0.

Теорема 4. При величина имеет предельное

нормальное распределение с нулевым математическим ожиданием и дис- . Персией, даваемой формулой (10).

При доказательстве данной теоремы используется теорема 3. Она позволяет найти асимптотический доверительный интервал для параметра ^ . . 1

Вторая глава посвящена задаче оценки параметра авторегрессионной модели первого порядка при независимых группах пропусков измерений и сохранении информации о количестве пропусков, то есть сцеш<а строится по парам

(X) , ^ - О ..., /А

Здесь рассмотрены две оценки параметра £ , первая из которых носит вспомогательной характер к используется в качестве первого приближения для' второй, более точной оценки.

Построение первой оценки основало на том, что процессом наблюдений управляет некоторый процесс ^-/С''/-» так что наблюдаемый процесс представляется в виде ¡/^ = • Сам процесс

предполагается марковским стационарным с характеристиками, которые для частных случаев независимых и марковских моделей пропадания измерений выписаны в явном виде. Получены также расчетные формулы для этих характеристик в общеЦ схеме групповых пропаданий с независимыми группами пропусков.

Предлагаемая оценка имеет вид

р - Л'А/ , а ,

>-С V У ,

^ (17)

Доказано, что при Л7^"^ эта оценка сходится к истинному значения параметра £ почти наверное. Вычислена асимптотическая дисперсия и аснмптотичесхая эффективность оценки. Доказана также асимптотическая норма..ьность этой сиенки.

л

Другая оценка £ находится из условия

н

.¿-/ ^ f

и имеет вид

Длл получения этой оценки необходимо решить трансцендентное уравие-те (18) относительно £

Теорема 4. При Д'-»оо уравнение (18) имеет с вероятность» I корень в окрестности истинного значения ^ и этот корень сходится к ^ почти наверное.

Так как при Упочти наверное отрицательна, то

длл нахождения корня можно применить любой пошаговый алгоритм, используя в качество начального приближения предыдущую оценку. Асимптотическая дисперсия оценки из (18) имеет вид

' ^ с-

которая в диссертации выписана в явном виде для независимых и Маркове кой схемы пропадания изменений. Теорема 5. При величина

^ ш- ^ г^/г^- - V

сходится по распределению к нормальной случайной величине с нулевым математическим ожиданием и дисперсией

мШ^с^СО'ПМ-

£-0 '

На основании этой теоремы доказывается теорема об асимптотической нормальности величины

Теорема 6. При /У-^ос величина \ОГ сходится по, рас-

пределению к нормальной случайной величине с нулевым математическим ожиданием и дисперсией, определяемой формулой (19).

Вычислена также асимптотическая эффективность оценки из (18). Пример зависимости ее эффективности от £ для независимых пропаданий измерений приведен на рис. 2.

Рис. 2

В третьей главе дается описание программ, реализующих численные алгоритмы реализации разработанных оценок. Первая подпрограм-ла позволяет находить оценку ^ . параметра ^ в случае, когда'информация о числе пропусков теряется. Вторая подпрограмма позволяет находить оценку £ для случая, когда информация о 1исле пропусков сохраняется. Обе подпрограммы написаны для марковской схемы пропадания наблюдений и для независимых пропаданий на-5людений. Также разработана программа для расчета эффективности оцет «к.

Все эти программы написаны на яэыко ФОРТРАН. Для их конкретного использования были составлены головные управляющие интерактив-

ные программы, позволяющие работать с приведенными подпрограммами в диалоговом режиые.

В работе было таете проведено имитационное моделирование полученных оценок. При этом ставились следующие задачи:

1. Так как нормальность полученных оценок была доказана лишь в асимптотическом случае /У-** ^ » 1° первая цель заключалась в том, чтобы определить, при каких объемах выборки оценки можно считать нормальными.

2. Второй целью была проверка работоспособности составленных программ.

Моделирование подтвердила работоспособность разработанных программ и их достаточно большое быстродействие (секунды при объемах выборки порядка 100).

Проверка нормальности полученных оценок осуществлялась 400 -кратным повторением моделирования при одном и том же значении <? и параметров схемы пропусков измерений. Результаты моделирования оценки $ преобразовывались в гистограмму. Проверка гипотезы о нормальности осуществлялась по критерию Колмогорова. Примеры полученных при г-ом гистограмм с наложенными на них гипотетическими

Первая из них соответствует случаю, когда информация о количестве пропущенных измерений отсутствует, вторая - когда информация о количестве пропусков сохраняется, то есть пропущенные измерения заменяются нулями.

На основании результатов имитационного моделирования можно сделать следующие еыводн. При /у/--£ нормальность оценок с достигается уже при объеме выборок порядка 100. При возрастании

/ растет объем выборки, при котором достигается нормальность оценок. Когда с. i это происходят при /У- >'СО , при f - порядка 250. .

ЗАКЛЮЧЕНИЕ Основные- результаты диссертационной работы сводятся к следующему:

1. Для случая, когда информация о числе пропущенных измерений

Л

теряется, получено уравнение, определяющее оценку Г параметра по методу наименьших квадратов. Это уравнение конкретизировано для

п

случая независимых прс/.усков н марксской модели пропусков измерений.

2. Доказана сходимость построенной оценки к истинному значению параметра С печти наверное.

3. Методом "линеаризации найдена асимптотическая (при Л'-* , " где /V - сбъем выборки) дисперсия оценки, которая убывает как

{/N . Найде.. глаьныЯ член разложения по степеням 1/N . Выражение для дисперсии конкретизировано для независимых и марковских лропусксв измерений.

•}. Найдена нижняя граница для мин;«, льной дисперсии оценки 1,ля случая, когда авторегрессионный процесс является нормальным. )та граница конкретизирована для случая независимых и марковских ^хем пропусков и построены графики, определяющие эффективность по-

строенной оценки.

6. Доказана асимптотическая (при Д^ оо ) нормальность построенных сценок.

6. Б случае, ког;;э информация о количестве пропущенных значений сохраняется, в качестве вспомогательного рассмотрен случай, ко гда пропущенные значения заменяются нулями. Это позволило псстро-

л

ить достаточно простую оценку £ параметра £ , которая может быть использована в качестве начального приближения для более точных оценок.

7. По методу наименьших квадратов получено уравнение, определяющее оценку ^ в случае, когда инфор/ация о количестве пропусков известна.-Показано, что при /V-* ^ с вероятностью I у этого уравнения есть корень, лежащий в окрестности истинного значения параметра

8. Получены формулы, определяющие асимптотическую дисперсию оценки, которые конкретизированы для независимых и марковских схем пропусков. Построены графики, определяющие эффективность оценки. Доказана асимптотическая (при ) нормальность построенной оценки. .

9. На языке ФОРТРАН разработаны программы для оценки параметра £ для обоих рассмотренных случаев.

- 17 -

ПУБЛИКАЦИИ ГО ТЕМЕ ДИССЕРТАЦИИ

1. Валеев Т.И. Оценка параметра авторегресеии первого порядка с пропущенными наблюдениями по схеме Еернулли. // Республиканская научно-техническая школа-семинар "Анализ и синтез систем массового обслуживания и сетей ЭШ". Тез докл., ч. II - Одесса, 1990,

, с. 14 - 20.

2. Терпугов А.Ф., Валеев Т.Н. Статистический анализ авторег-рессиснной модели первого порядка при независимых пропусках измерений. // Техника средств связи. Сер. СС - 1990. - Вып. 7. - С. 5662.

3. Валеев Т.Н., Терпугов А.Ф. Оценка параметров авторегрессионной модели первого порядка при марковской схеме пропадания иэме- ' рений. - Томск. Изд-во Том. ун-та. Препринт К 10 - 1991. 32 с.

4. Валеев Т.И. Эффективность МНК - сценки авторегрессионного параметра при групповых пропаданиях измерений. // Распределенные микропроцессорные управляющие системы и локальные вычислительные сети. Материалы Всесоюзной научно-техническойконференции. - Томск. Изд-во Том. ун-та, 1991. - С. 50-52.

5. Валеев Т.Н. Оценка параметра автсрегрессии первого поряд-- ка при групповых гтрс::одаш'.ж измерений. //Украинская школз-сеыиипр

"Вероятностные модели и обработка случаШагс сигналов и полей". Тез. докл. - Черкассы, 1991.

С. Валеев Т.Н., Терпугов Л. Ф. -Статистический ашлис ягло.оег-рзсспснной модели первого порядка при случайных ррстусках наморен;:'!. // Радиотехника, 1992, К , с.

7. Езлосз Т.И., Терпугов А.Ф. Опенка коэффициента амор*.гре<;-пгп первого порядка при случайтзс пропусках наблюдений. 7/ « Научная конференция ''Планирование и автоматизация эксперимента в научных исследованиях". !,!.:, 199£ г., с.17.

,-т"' /