автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Разработка алгоритмов вовлечения априорной информации в процедуры статистического оценивания

кандидата физико-математических наук
Тарасенко, Петр Феликсович
город
Томск
год
1994
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка алгоритмов вовлечения априорной информации в процедуры статистического оценивания»

Автореферат диссертации по теме "Разработка алгоритмов вовлечения априорной информации в процедуры статистического оценивания"

РГ6 од

' г V '

Министерство науки, Висшей школы и технической политики РФ

ТЬмский ордена Октябрьской Революции н ордена Трудового Красного Знамени государственный университет имени В. В. Куйбызева

На правах рукописи ТАРАСЕНКО Петр Феликсович

УДК 519.24

РАЗРАБОТКА АЛГОРИТМОВ ВОВЛЕЧЕНИЯ АПРИОРНОЙ ИНФОРМАЦИИ В ПРОЦЕДУРЫ СТАТИСТИЧЕСКОЮ ОЦЕНИВАНИЯ

Специальность 05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

АВТОРЕФЕРАТ

Диссертации на соискание ученой степени кандидата физико-математических наук

Томск 1994

Работа выполнена в Томском государственном университете им.В. В.Куйбышева.

Научный руководитель: кандидат технических наук,

Дмитриев Ю.Г.

Официальные оппоненты:

доктор-физико-математических наук,

Полищук Ю. Ы. кандидат физико-математических наук Устинов Ю.К.

Ведуцая организация:

Институт математики С» РАН ( г. Новосибирск )

/ А Защита состоится ' 11 часов

19- мая

_1994гсщав

на заседании специализированного • совета Д 063.53.03 Томского ордена Октябрьской Революции и ордена Трудового Красного знамени государственного университета имени В.Б.Куйбышева С 634030, г.Томск, проспект Ленина, .36 ).

С диссертацией можно ознакомиться в Научной Томского государственного университета.

библиотеке

Автореферат разослан

оатрм

_19Э4 года

Ученый секгетарь специализированного совета кандидат физико-математических наук, доцент

Б. В. Тривсскенко

ОЩАЯ ХАРАКТЕРИСТИКА РАБОТУ

Актуальность проблемы. Проблема оценивания функционалов от неизвестны! распределений по результатам наблюдений над случайными зеличинамн возникает в огромном числе практических задач, ¡вязанных с обработкой экспериментальных данных. Стремление улучшить качество оценивания при сохранении объема наблвдений или юкратнть затраты на эксперимента за счет улучшения точности щенивания, приводит к необходимости черпать информацию об гселедуемом объекте не только из экспериментальных данных, но и из юдели этого объекта, различных дополнительных источников, аковыми являются физические соображения, опыт исследователя, нтуитивные мнения экспертов и т.д.

Приме"ительно к задаче непара..,етрического оценивания ункционалов от неизвестного распределения, такая дополнительная приорная информация может выражаться заданием моментов, аргинальных распределений, вероятностей некоторых событий, веренности в унимодальности, непрерывности или симметрии асщвделения относительно некоторых преобразований пространства немантарных исходов и другими характеристиками распределений. «Формация подобного рода оставляет исследователя на ^параметрическом уровне априорной неопределенности, однако сужает пасс допустимых распределений. За счет этого сужения появляется »ложность построения процедур статистического оценивания, ¡ладаюцих улучшенными свойствами по сравнению с процедурами, не дагывающяш дополнительную априорную информацию.

Имеется обширная литература по методам привлечения дополни-яьной априорной информации в процедуры статистического оценива-!я, где эта проблема рассматривается как с теоретической точки ения, так и г приложениях: статистическом моделировании, стохас-гческой аппроксимации, статистической физике и радиофизике, борочном контрсиге качества продукции, обработке результатов циологаческих опросов, аналт-зе действия лекарств и т.д.

Значительно меньше изучена проблема использования приближенно т.е. с погрешность» ) заданной априорной информации. Суть ее лоит в тем, что на практике исследователь не всегда может быть &рен в полной адекватности используемой модели, в точности риорной информации. Однако даже приближенная информация может гь полезной при обработке экспериментальных данных.

Данная диссертационная работа посвящена разработке алгоритмов тараметрического оценивания, использующих априорную информацию, анную как точно, так- и приближенно.

Педь работы - разработка способов описания и использования априорной информации об инварианте ти условных распределений элементарные исходов эксперимента, а также построение и анализ алгоритмов привлечения приближенно заданной априорной информации в статистические оценки.

Научная ншизна работы состоит в том, что:

1. Описчн класс распределений, условно-инвариантных относительно группы преобразований пространства элементарных исходов. Получены и исследованы непараметрические оценки таких распределений и функционалов от них.

2. Введена условно-инвариантная случайная вероятностная мера Дирихле. Построены процедуры непараметрического байесовского оценивания условно-инвариантных распределений и некоторых функционалов от них.

3. Предложен метод построения оценок, использующих неточно заданную априорную информацию. Такие оценки получены и исследованы для ряда задач непараметрического оценивания функционалов.

4. Сформулированы и доказаны утверждения, позволяющие исследовать предельное поведение функционалов от эмпирического распределения, явно зависящих от числа наблюдений.

Методы исследования. В работе используются методы теории вероятностей и математической статистики, функционального анализа, а также методы статистического моделирования на ЗВМ.

Практическая ценность результатов исследований. Предложенные процедуры оценивания усяовно-иньариантных распределений и Функционалов от них могут быть использованы для повышения качества оценок, в частности - для уменьшения дисперсии численного, интегрирования методом Монте-Карло, при обработке результатов социологических опросов, в задачах выборочного контроля качества продукции. Метод построения оценок, привлекающих неточную априорную информацию - в системах обработки технических, социологических, биологических и других экспериментальных наблюдений, где встречает» ситуация неточности начальных моделей.

Публикации. По теме диссертации опубликовано 9 работ.

Апробация ш'хгты. Основные положения диссертации докладывались и обсуждались на ВНТК "Метода представления и обработки случайных сигналов и полей" ( г. Туапсе, 1989 ), "Информационные метода повышения эффективности и помехоустойчивости радиосистем и систем связи" ( г.Ташкент, 1390 ), "Применение многомерного статистического анализа в экономике и оценке качества продукции" ( г. Тарту, 1990 )"Идентификация, измерение характеристик и имита-

ия случайных сигналов" ( г. Новосибирск, 1991 ), . Материалы дис-зртации отражены в 8 отчетах по госбюджетным и хоздоговорным те-ам, выполнявшимся в СФТЙ при ТГУ е 1988-1993 годах.

Структура и объем работы. Диссертация состоит из введения, рех глав, заключения, приложения и списка использованной литера-уры С 214 названий ). Содержание работы изложено на М странице ;новного машинописного текста, иллюстрировано 5 рисунками.

КРАТКОЕ СОДЕРЖАНИБ РАБОТЫ

Во введении обосновывается актуальность темы исследования, роводится обзор литературы, устанавливается круг вопросов, ¡следуемых в диссертации.

В первой главе' рассматривается задача использования 1риорной информации об условной и'*вариантности распреления лборки в задачах непараметрического оценивания распределений и досционалов от них.

- в 81.1 определяется понятие условно-инвариантной доятностной ..еры СУИВМ) на (Х,рО, имеющее инвариантные относительно конечной группы измеримых зеобразований пространства X ) условные ( на множествах разбиения = {С1 ,С2,...} ) распределения:

Определение 1.1.1. Вероятностная мера Р на (Х,$4) яывается Г8,£,30-УИВМ ,У)), если Р(С)=У(С) и

!д(АГ)С))У(С)=Р(ЛПС )"У(дС) , где У(С) (С«8)

распределение на ¡^-инвариантном разбиении 6.

Здесь же исследована структура орбит, порождаемых группой "§ в ;эбиении ё и определено понятие класса УЙВМ, с помощью которого ясно описывать априорную информацию об инвариантности условных определений выборки:

Определение 1.1.2. Вероятностная мера Р на {Х,14> ;зывается .У1".)-условно-инвариантной, если

Далее приведены примеры таких классов, позволяющих описывать, частности, информацию о симметрии относительно неизвестного и вестного центра, с неизвестными и заданными

роятностями на разбиении.

- в Я. 2 получен проектор в класс УИВМ С отображение : .V* ), неподвижнее на 9 (в* ) ):

Т е о р е м а 1.2.1. Отображение Г1: ?(«* ):

ПР(А) - ТстеУг(С> ^ ¥(дС>— • «>

-б-

где -Р(АС) - {Р(АС> '

I йт(АС), Р($рС)-0.

является проектором в класс (в* 1-УШШ, если 8р=ёпр , £Р=!?ПР,

у;®? и

Проектирование меры Р сводится к ее ¡?р-симметризации, после чего уже инвариантные условные меры на ёр перевзвешиваются с заданными весами У?. Причем "априорная догадка" <3Р используется всякий раз, когда Р($гС)=0 дС), но УрГС)>0.

- в 81.3 исследуются предельные свойства оценки условно-инвариантного распределения проекцией ГУ С проекции (I) эмпирической меры Рп ). Для случая, когда ?.У .т'' (8 .У) и |6 |соо, получено предельное распределение'оценки ПРП:

Т е о р е м а 1.3.1. ПР„ асимптотически нормальна с дисперсией: Р(С)Р(АПд(АС))-Р(АС)Р<АдС>

°л<*.^Р(дС)-:

Далее найдено смещение оценки ПРП

ВПРп(А) - '£Се1Л<С)Рп($С>\й(А\С>-Р{А\С)\ и проводится сравнение качества оценок, использующих информацию об условной инвариантности распределения выборки лишь частично:

Теорема 1.3.2. Имеют место соотношения: (а) о1($,(Х})~агА(&9,(Х})-(2\Щ)~11:д£% Р(АЬдА).

где X - множество представителей правых смежных классов подгруппы 3?0 группы А - тмметричная разность множеств;

(в) а\($)=а\($,Ш>-\ Р(ЯС)?№)[i?(АЖ)-Р(А\$0

где 1?0- множе тю представителей орбит группы У в I?.:

- в 81.4 подучены выражения для точных значений среднего, дисперсии и СКО оценки ПРП для случая, когда , т.е. заданы вероятности множеств разбиения пространства элементарных исходов. Рассмотрены случаи, когда наблюдения являются НОРСВ и когда они выбраны случайно из конечной совокупности с возвращением С СЕВ) или и без возвращения ССВБВ).

Т е о р е м.а 1.4.1. Смещение и СКО оценки ПРп имеют вид: ВПРп(А (а4-Рл), 8ПРп(А)-(йА-РА ГН(0А-Рл )+Р}У(У-Р4). где

гГ \f w I"1

l л * Jin I для СВБВ,

[i-Px)" для CBB и HOPCB,

N - объем конечной совокупности,

Рк'"У(Ск) С Pk»/fk/N для конечной союкупности ),

V-dlag(Vl,...,7t), Vx-[(1-Hn({k>))• а «^/(a+ej ,

6k - { 1 для CBB н HOPCB; Wk для СВБВ }, a "{ О для CBB и HOPCB; -J! для СВБВ J,

Wk-s )( даясввв.

T S]'p*' [i-pk)n"S для m иНОРСВ,

- в 81.5 рассматривается обоб■ ?ние метода симметризации подынтегральной функции для вычисления математического сскндания 0=^JfdP для случая инвариантности распределения Р относительно конечной группы преобразований

в($д) = п'1^"/^), (2)

где Р(х)=(1/\$01 Г(дх) - ^„-симметризованная подынтеграль-

ная функция. Найдена величина уменьшения дисперсии 1)9при увеличении числа преобразований, образующих группу:

Теорема 1.5.1. Пусть |/Цг=.Г/'гс*?«»> X - множество представителей правых смежных классов подгруппы &0 группы $, ¥ (х)-Р(дх), е - тождественное преобразование. Тогда:

Сё(9) - 09) - Г2п|Ж|Г,5:ЛвХ1*,.-'?н18- '

Далее получены оценки для величины уменьшения дисперсии при применении симметризации подынтегральной функции относительно группы преобразований, рассмотрен вопрос об уменьшении трудоемкости при применении метода 5?-симметризации (2). Кроме того, проведено сравнение двух модификаций метода Монте-Карло, рассчитан шх на использование условной инь риантносли усреднявдего распределения: метода, основанного на классических способах уменьшения дисперсии С расслоенния выборки и симметризации ) и методе подстановки проекции (I) для эмпирического распределения. Показано, что они асимптотически эквивалентны, но важно, что сочетание классических методов применимо не для всех практически интересных случаев.

Вторая глава посвящена применению условно-инвариантного типа априорной информации при непараметрическом байесовском оценивании.

- вводятся обозначения и определения, используемые в

данной главе. В частности, определение случайной вероятностной меры (СВМ), байесовской независимой выборки из нее и др.

- в 82.2 введено понятие условно-инвариантной СВМ (УИСВМ), сбсбв^авдее известные инвариантные СВМ:

Определение 2.2.1. СВМ Р на (ХМ) называется ГС,У,Ю-усювко-инвариантной, если п.н.

Далее дрртся способ описания УИСВЫ с помощью семейства конечномерных распределений:

Лемма 2.2.1. Обозначим вв<=ё - множество представителей орбит группы У в 6, т.е. минимальное подмножество 8, для которого Х'УдтдШсев ЯС\

¥(С ненулевые представители орбит;

Х=( НК,...,ИШ с: Сб5 ) - произвольное (1?,-условно-инвариантное

С Щ:

»<-измеримое рафинирование разбиения £: Х-З^с^^Е.

т.е. ¿¡^И^'С УСев, дН^еХ УС^Й У>77ис;

Гс<й,Х>~[ <ЗГ'Г,с;/»'ГС>,...,<а('Я1, с)ЛГ<С) ) -вектор, связанный со

значениями некоторой меры 0 ( не обязательно вероятностной ) на множества* разбиения Я С здесь ).

Пусть задано семейство распределений векторов ^¥С(Р,Х): Се^,зс|,

причем, УСеё0\е1:реС)«О п.н. Пусть УС®!?, выполнены условия:

(а) 21. .«I-— п н-;

по *

иТ7тс-. Р(оН{с>-Р(И1стоС)/У(С) п.н,;

(в) векторы из множества ^/ГС(Р,Х) взаимно независимы;

(г) распределения векторов УС(Р,X) и УС(Р,Х") идентичны с точностью до перестановок аргументов, если X и X" отличаются друг от друга только порядком нумерации своих множеств;

(д) если разбиение X" является ■ рафинированием X, причем

я«"Я^а.Срх С где 7^-), то

. распределение вектора | (*- * |, най-

денное из распределения вектора ТС(Р,Х"), идентично распределению вектора УС(Р ,Х) из заданного семейства. Тогда существует единственная СВМ, индуцирующая заданное семейство распределений.

Pr(JK*x)

Затем при следующих ограничениях на тройку VCeg либо дС*С , либо С>=0, либо С - атом в si (3)

на основании леммы 2.2.1 дается определение УШШ Дирихле.-

Определение 2.2.2. Пусть у - ограниченная и аддитивная мера на (3f.fi) такая, что ,fj ,У). Тогда

68 -УИСВМ Р называется УИСВМ Дирихле с параметром ' у , если для всякого (ё,"ß)-условно-инвариантного s?-измеримого разбиения % выполняется:

(а) случайный вектор Уимеет распределение Дирихле с параметрами (у, /О для кех VCeg

(б) векторы из семейства CegJ взаимно независимы.

Конструктивное определение УИСВМ Дипяхле дает Теорема 2.2.1. Пусть öx(A)"Ia(x ) - обозначение индикаторной функции множества А\

Nc(x) » -(yiC)/ViC)) /°е~чу'*с1у, хе(0,<»). С® U ;

х

{ Jp-.J"!} Cegj , - последовательности случайных величин,

определяемых фунциями распределения ехрГ Ыс(хП,г*0,

.0 , л:*0,

Pr(JjC*x]JiC~xl.....«/J.I,c=xj.lJ -

, explNc(x )-^c(xj_i)J ,x&(0 .x^), - j 1 , IWj.,,

1 0 , x*0,

причем Jlc и J g независимы Vî.JgTT», если C,*C2 ;

f V r :J =17«-, Ceg ; -семейство независимых и не зависящих от , -if-flCJ

{J*.} случайных величин, причем - VJe77oô, Ceg.;

. . у (С) 1

{ JiC:j"T^,CsSi } - семейство случайных величин.

Положим также-яа l'j gC=Qi/jC Vgeg, Ceglf jeT~S>.

Тогда с = 2ZCeg vîC) T.™! fî7jc e

Наконец, в следующей -теореме показано богатство носителя УИСВМ Дирихле:

Теорема 2.2.2. Пусть Р - УИСВМ Дирихле с параметром у, a Q - любая условно-инвариантная вероятностная мера на ("X ,-Л) такая, что Q « у. Тогда:

Ca) для любых rsZ*, e>ö и для любых .^-измеримых множеств Аи...,Аг

выполняется: PrMpf^-Qf/l^jc: i=77r ] >0; (б) Если у (Л) =0, то Р(А)=0 п.н. Св) Если у(4)>0. то Р(А)>0 . .н. УА^.

- в 82.3 получен вид апостериорного распределения условно-инвариантной СШ Дирихле.

Т е о р е м а 2.3.1. Если PeOg^iy; кх=>(х1,... ,хп) - выборка из Р, то апостериорная СВМ Р|х е Э^-уФ*. где Vderf:

»(Ai'T.g^gSZi",egx{AJ. (4) На основе этой теоремы найдена байесовская оценка многомерной условно-инваркантной функции распределения:

Теорема 2.3.2. Пусть (X,, на

ffliap), X" (xt.... ,хп) - выборка из Р. Пусть потери от принятия § в качестве оценки функции распределения S выражаются расстоянием Крамера-Миэеса: L(S )=S(S(x )-S{x )fW(dx), гдеУ - ограниченная неотрицательная весовая мера на" (Д?8Р.). Тогда байесовская оценка является (S.У-условно-инвариантной вероятностной мерой:

iV^-Zog V(C)[ Xn(C)G(A\C) +<1-\п(С)тРп(А\С> ) (5)

где а ПРП - проекция (I) для Рп.

- в 52. 4 найдены байесовские оценки некоторых функционалов от условно-инвариантных распределений:

Теорема 2.4.1. Пусть на (X.it).

G"t/i,V), x'(xi,...,xJ - выборка .из Р. Пусть являются п.н. конечными борелевскими функциями на (ХМ) и /|/,|с?г-=оо, /1 fi9 • /а I с?у<оо Vg«S?. Пусть потери от принятия

5 в качестве оценки функционала 3 квадратичные: Ь(Ъ,3)г. Тогда байесовские оценки функционалов i,fP)«J/tcfP и

З.(Р)«//,dP• JfMP имеют вид:

J ft i й V(gC) V(hC> V(C) >. Kn'^K^^ -fi(C>+V(C)-*

S/iO-fgh dp S/iV db

flfO - pl(C) J'

где p и определяются формулами (4) и (5).

- в S2.5 рассмотрены вопросы применения условно-инвариантных СВМ Дирихле в задаче оценивания симметричных распределений. Кроме этого введено понятие условно-симметриэованной СВМ Дирихле и установлена его взаимосвязь с условно-инвариантной СВМ Дирихле:

0 п р е д е j. в н и е 2.5.2. Пусть Р, - СШ Дирихле на (X.«О ( не условно-инвариантная ) с параметром Услошо--

симметризованной СВМ Дирихле будш называть СВМ

ItgMgUCt) Р(А) - *<С)-—---,Лм1.

Т е о р е м а '2.3.1. Если тройка удовлетворяет

условии (3), то условно-симметризоганная СВМ Дирихле Р с параметром .а является условно-инвариантной СВМ Дирихле с параметром?: )а (АС), А&А, гд е ^дС.

Отсюда следует, что условно-симметризованная СВМ Цирихде охватывает более широкий класс УИСВМ. Однако без ограничений (3) не удается получить апостериорное распределение такой СВМ и использовать его для байесовского оценивания.

. В третьей главе предлагается метод построения и анализа оценок функционалов от распределений, использующих неточно заданную априорную информацию.

- в 83.1 рассматриваются общие принципы построения оценок функционалов от распределений 9=6 (Р) по выборке НОРСВ объема п из Р в случае, когда известно ( возможно, неточно ) значение другого функционала Д (Р)*0. Намечены два подхода к ее решению: комбинированный и функциональный. Комбинированный подход связан с минимизацией среднеквадратической ошибки ССКО) в классе линейных комбинаций эмпирических оценок Функционалов вида 9ПСХ) - 9п-ХЛп, приводит к оптимальной оценке 91)('Х<1), которая явно зависит от объема выборки и от неизвестного распределения:

мгеп-ем„ пМ(оп-вн\-&) * апК(вп-в)

М&.1 " пЫ(А„-А)г * 2АпМ(Ап-А) * пА* но дает выигрыш в СКО при любом числе набиодений:

(М(вТ1-е)Ап)г зе>па,) - М--% " .

" мд*

Ври использовании функционального подхода оптимальная в смысле ШЗ оценка С или некоторое приближение к ней ) ищется в классе оценок вида в((1-Х)Ргде Рп - эмпирическое распрсдагенке, а Рп -оценка распределения, ориентированная на точное выполнение априорного условия.

- в 83,2 в связи с необходимость?®. возгожакзей при построении и анализе оценок, асимптотически эквивалентных оптимальным» обобщается известные утверждения о слабой сходимости оценок функционалов Миэеса на случай функционалов вида Т(Р,п), явно зависящих от числа наблюдений.

Определение 3.2.3. Функционал Т(Р,п) называется (р1,...рщ) - миэесовским в точке Р, если:

(а) существует звездчатое в точке Р множество ?т такое, что

1Ш Рг(Рп«?т}-/;

-1Й-

С5) футе яоная TIP,п) дифференцируем т раз в точке ? относительно множества ?т, т.е. для PQ(=P+í (Q-P):

- X..J 7iMíP,n.V¡.....ykJ n(Q-PHdUiH

at 4-0. i-i

Св) существует последовательности p¡(n) ,рт(п) такие, что

pk(n) sup j-^-j-TfP (.njl-O (i) V/t-еТТш, где P^P+UP -Р).

* lelo ,1!> dí 1 p ran

Теорема 3.2.1. Пусть функционал Т(Р.,п) является íp,,...,рп) - мизеоовским в точке Р. Среди первых m его производных могут бить нулевые: Ttk>fP,n,y,,...,yk)=0 тождественно по y¡,Ук VkeMyCÍ, si, причем и множетю ненулевых производных

непусто. Обозначим рту^у" 0' р fn) ] и

MT=[ífeM|:pkfni=0(pín^j}. Если p(n)=o(pJn>) то Ve>0

т. е. предельное распределение величины Т(Рп,п)-Т(Р,п) совпадает с предельным распределением суммы отличных т куля производных, иыеадих минимальную скорость сходимости.

Теорема 3.2.2. Пусть I](п,Т) - функция, заданная для лабого п в окрестности точки Т(Р), где Т-Пх,... ,ТЬ) - функционалы йнзеса ш-го порядка в точке Р. Пусть Л удоааетворяет условиям: (а) в окрестности точки TíР) для всех п существуют непрерывные частные производный Функции И по Т,,...,Тя: &TH<n,Ti,...,TJ ■

-----, где .r el.m, г,чО ,s;

dT\i ... дТ\* 11 1 1

Сб) для всех i i,m дифференциалы функции ¡1 по переменным 7¡,... ,Та

в точке Т(Р) как функции от л- удовлетворяют условию:

Pr(n )n'l/ZdrH In ,Т(Р) )~OU );

рг(п) ¡9Г//Г ,

П leí 0 , J¡ |9i J

—Oil) VfeTjñ.

Тогда И является ipl ..,ри> - мизеоовским функционалом в точке Р.

Теорема 3.2.3. Пусть II (п, Т) - Функция, заданная для всех п в.окрестности точки TCP), где 7WT,,...,Tb;, TjPj-jfdP н

Viml.s. Пусть Я удовлетворяет условиям: (а) ь окрестности точки 7\ Р) для всех л сус}еству»т непрерывные частные произдадные функции И по Г до л-го порядка включительно и, как функции от п, они удовлетворяют условию:

ffT\t ...аг;. " г>т(п,Г1,....га) п-т'* * 0кС" ;

-1Ъ-

(б) для множеств ...г,): г^О"Тш, |

М - {(г.г,.....га>: г-1 ,т, (г,.....г,)шПТ

С'Ъ.....Г.)-*; .....- .

- о^.'}^*,,...,^«^ Р>1(п,ки...,кя>}" рТпг}

выполняется: ит,г,,...гв): Гг,/е0гИ1| П Мн=0.-

Тогда если обозначить ^«п )/^(Рп~Р), то

р(п)[й(п,Т,(Рп>,...,Г,(РпП-Н(п,7/Р),...,Та(Р))] « Ат<Т.(Р),....Тщ(Р),г.,...,г) . г, ■

Г I 3 * I * * 8 т-~гЭ ь (

- -:—рт—:-nt.ii

Л г^ р(п> ^ р(п> 1 + р1~-И\М„ рг(п,г,,....г,) * ят(п,г1.....•

- в 83.3 подробно рассмотрена задача комбинированного оценивания личейного Функционала 8»]"ф<1Р, если априори приближенно известно значение другого линейного функционала А<*/фс1РъО. Обозначим ОсоуГф.Ф), О-уагГф), К-уагСф), р'-С^/УО, ' . а \.в„,сп.гп - эмпирические оценки соответствующих функционалов.

Если имеет место точное равенство Д=0, то эту информации можно привлечь в процедуру оценивания для улучшения ее качества:

9 » 9 - С Л /V . (6)

п п п '

При р«1гСР), Д-0 и V>0 оценка (6) будет асимптотически

нормальна с дисперсией ОС/-рг). Если ж условие Л-0 вкпсшкйтся лишь приближенно, то оценка (6) не являэтся оостоятеаьн 1.

Применение комбинированного подхода • дяя ;аисса оиекоа в„(Х.) - 9П- ХДП при условта Ф,'фвЦ<Р> и У>0, дает оптимальную в смысле СКО оценку

- 9п-Х.Д,, к.(п.Р)~С/(Г+пАа) (7)

СКО которой имеет" вид ¿9,/Х..) - п~1[о-(?/(У+пб? и она является

асимптотически нормальной с диперсией ог» { всш

Л О , если Д-0. В то ж время для более сильных типов сходимости имеет место:

Г в , Д-О, (аг/п , Д-0,

" д*о, " * I (Гм-оа/п1). д-о.

Оценка С?) не применима на практике, т.«.. зависит от неизвестного распределения. Построение же адаптивных оценок не шляется тривиальной задачей, т.к. обычный катод подстановки т триводит к оценкам, асимптотически эквивалентны* оптимальней:

о„(К,>, х.пГК(п.рп/-сп/о^лАгп). т

Теорема 3.3.1. Если <р.t'eljiP) и У>0, то

г и ) f frfi<x/Ctt}, Д-0,

lim PH n (6 (L ,)- 9) < x - { l % >

l " > l ©ir/DH), Д-0,

r«ß и E, .£s -независимые случайные величины,

имеющие стандартное нормальнее распределение. Кроме того,

Dl-i+14p* и „ , , «

' inttiAn-AjrC/K2>Opin . Д-0,

ц Г Гп^ГД-

р.~ . . Л"0.

Выходом, из этой ситуации является специфическое оценивание параметра X, ( изменение скорости вовлечения в оценку информации о погрешности Д ):

К,г'К(па,Рп)~Сп/(Уп+паАгп ), аш(1/2,1). (9)

Теорема 3.3.2. Если (г,ф2«=Ьг (Р). Г>0 и а<*(0,1), то

Оп(//п' "), Л

1Л f О u/n "

п п.г n { Q (1/п« »

Р..... >. Д-0-

Однако скорость убывания остаточного чле'ч адаптации южно увеличить, еи;и использовать еще одну оценку:

К<па»,Рп> ~ !Уп+п«»л1 ), СЮ)

а -а(п,Р )- I--г , зш(1/2,1).

" . п 2+пХ

Теорема 3.3.3. Если ф.ф2«!,, ГР,), У>0, то имеет «вето:

м, ( О (1/п^), Л"0,

п» га а 41 „ 1 у

" п-* " I 0р(1/п) , Д-0.

Далю для полученных оценок установлены следующие утверждения, к^ дающиеся сходимости среднег: и СКО:

Теорема 3.3.4. Если У>0 и Ф.ф1ч>ф,фто

Г О(1/п) , Д=0,

а?© сх ,.) - е * ^

" п'г 10«/п°), Д.О.

Теорема 3.3.5. Если , то У1-7ТЗ

Ли 5ввГХ.п-1) - О.

Теорема 3.3.6. Если У>0 и ф,<Н>,Ф:е1ггР), то

f Dp2 + О(i/nUl a)), Д-0,

- в $3. А рассмотрена задача комбинированного оценивания линейного функционала 0=/(рс1Р, если априори приближенно известно значите несколько других линейных функционалов: С ). Обозначим С-соуСф,ф>, О-уаг(ф), У-уог(^),

р*-(С,С г-/+п(А ,А), где под скалярным п^сичредени*«, ихмтея

-15в виду fa,e;»aTF"1e.

Оптимальной в смысле СКО оценкой из класса 9nfXj»9n-XTAn будет Qn<\. ), где Х„=Л"'с, Л=Г+п(Л.А>, А'1 =Р~1-пГ"1ДЛтГ,/2, при этом

9na.H6n-[<C,AJ+n[tC,A>rA,Aj-iC,AJiA.A)])/2^ (Ю

senfX„> - (о-СтЛ"'с)/п = Ъ(1-рг)/п+1С.А)г/г.

Особенностью данной задачи является то, что построение адаптивной к СП) оценки невозможно, и это приводит к необходимости рассмотрения более простоя субоптимальной оценки:

W. \-V'*c/[i+nt?VlÄ\. (12)

S9na0i - n'I|d-[(C,C^n[2fC,Cj(A)A)-(C>Ai2]]//,2i!| =■

- n"I|D-rC.C)/2+n[rC,CJfA,A;-fC,A)2]//zi!|,

причем S9nfX.) =s ,?8nfX0J « п"'[о-ГС,С)/2] s D/n - D9n. Адаптивная ( асимптотически субоптимальная ) оценка имеет вид:

«а (1/2,1). (13)

Теорема 3.4.1. Если (p,qnj)k,t|)®elafpj Vk^TTm и deUV )*0,

то (13) асимптотически нормальна с дисперсией D-(C,C), А=0.

«г \ (OJi/nl~a >, А=0,

и, кром° того, п 8 (X )-б„ГХ,.; = ( „ «

1 " "" " 0 J lo^i/n"^, А*0.

- в 83. 5 рассмотрен вырожденный случай задачи из S3.4, когда используемые априорные условия является линейно зависим- лш ( rang(V )-m-i, но Д*0 ). Получены оптимальная, субоптимальная и адаптивная оценки, исследованы их предельные свойства.

- в 83.6 решается задача оценивания функций от .линейных Функционалов НО)"И(в1,...>0в), G^JfpdP ( dim((p)-*r ) с использованием нескольких априорных условий- Д=/фс?Ра-0 ( <Ит(ф)~т ). Рассмотрены два способа оценивания: подстановка в // комбинированных оценок ее аргументов Q

HjiH - (14)

и комбинирование с эмпирической оценкой функции Н

апа> - ffn - хХ- • сю

Обозначим C«cov ftp ,*(>>, D~var(<s>), У=упгГФ>, T=iracef0-7 /iГвЛ, e*-ATr-'A-, DH-VTB(e)-D-VH(e), P^V^'^W Cn~C-VH(Q)+A-T/2.

Эсобенность данной задачи проявллетея в том, что уж? на этапз построения оптимальных и субсотжалыж оценок в классе (Я), требуется выпсижяпге услозий регул яркости:

Са) штртпю ¥ кз вдшбзнз;

С6) функция И ¡мает непрерывные в окрестности точки в частньэ

производные до третьего порядка включительно; Св) для некоторого з' выполняется: \н(0П)|</Спа, причем е ¿2<Р) для всех ¿.«17?, ,та, где I г> шаг £¿5+3.4] .

Св') где с1п - некоторая статистика, для которой /<3П<ЯР-«»,

Условие (в) применимо,для коэффициентов асимметрии, - эксцесса, корреляции и вариации, а условие (в') - для центральных моментов.

Лемма З.6.1.- При выполнении условий (б,в) или (б,в') и (ял-и) =Т/2п+0(1/п3/г), М (ип-я]г "Ьн/п*О (1/пг/г).

м[н^-и]\"Сп/пЮаУп3/г), Пт Рг { пл[нп-н)<х ] - Ф(х/й\*).

Субоптимальными в классе СЮ будут оценки ип(^)-Нп-\1Ап, пбг), к-0.1.2,

С0= пи[йп-й]д„. С,- сн, с8= С-ЧИ(в), для которых

Г иг 1 г Г Ои(1-рг), Д-0,

1ш Рг < (Х.ЫП<х } - Ф(х/а), где о - < "

1 п к -1 I Сн , Д-0.

Адаптивные оценки при к"1,2 имеют вид: МС ^'^ХУ^п"8''. ОМШ2Л). СБ)

Теорема 3.6.1. Если выполнены условия Са-в) или Са.б.в'), то при к°1,2-.

„»Г«/ » г. ,1 ^«Л»1-'.

п * ¡А /Х - )-и(Хр)\ <

1 11 ^ п [ОрГ'/Уп ,), Д*0.

Для масса СМ) методы, предложенные в §3.4, приводят к

субоптимальной оценка . ¡>.0*\'~1С/(1+п8г), и адаптивной к ней

»,'^НГвп-||,вАл сю

причем Пт Рг { п^Гй } - Ф(х/а).

п»» I 1 } >

Теорема 3.6.2. Если выполнены ограничения Са-в) или

Са.б.в'), то , „

и г л гоР а/пх'*), д-о,

1 " "" " 1ори/п*-*), А*0. - в §3.7 описаны результаты имитационных экспериментов по исследованию качества построенных в §§ 3.3-3.6 оценок для конечных объемов выборки. Даются рекомендации по нх использованию. Главный вывод состоит в выявленном преимуществе адаптивных оценок по сравнений со своими конкурентами.

Качественная картина результатов моделирования для оценок из

53.3 представлена на рис. I. Адаптивные оценки 9ПСХП) (9) сравнивались с эталонными - эмпирической 9п и оптимальной 6ПСХ.) (7), а также с конкурирующими - оценкой 8П (6), ориентированной на точное выполнение априорных условий и оценкой с предварительной проверкой гипотезы:

Г 9 . Тп*Т (1), б„Н где Г --, ?-уровень значимости.

ьп- тп*т0<1>. Уп

Сравнение проводилось по критерию СКО для различных погрешностей Д в задании априорных условий и различных объемов выборки.

Из рисунка видно, что адаптивная оценка выигрывает по сравнению с эмпирической в большем интервале погрешностей, чем оценка с предварительной проверкой гипотезы. Причем на этом интервале она имеет меньшую СКО.

Аналогичные результаты получены н для оценок, построенных в 83.4 и 53.6. При этом обнаружено, что случай использования нескольких априорных условий существенно отличается от использования одного условия. Уже при учете двух априорных условий максимумы СКО адаптивной оценки С аналогичные максимумам на рис. I ) наблюдаются . лишь на сечении поверхности СКО, заданном в пространстве погрешностей Д уравнением СтР"'д - О. На сечениях, проходящих через точку А "О в других направлениях, эти максимумы отсутствуют.

Кроме того, для оценок функций от линейных функционалов выявлено некоторое преимущество способа оценивания (17) перед CIS).

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Ведено обобщение понятия условно-инвариантны! вероятностных мер С которое позволяет одновременно описывать априорную информацию о симметрии и вероятностях распределения на заданных инсжЕствах ) на случай инвариантности относительно группы преобразований выборочного пространства.

2. Построена оценка условно-инвариантного распределения, получено ее предельное распределение, показано ее преимущество по сравнению с оценками, использущими условиую-инвариантность распределения выборки лишь частично.

3. Получены выражения для" точных значений среднего и СКО модифицированной оценки распределения с заданными вероятностями множеств разбиения пространства элементарных исходов С для случаев, когда наблюдения являются НОРСВ и когда они выбраны случайно кз конечной совокупности с возвращением или без возвращения )..

4. Метод снмыетригоции подынтегральной Функции для вычисления математических ожиданий обобщен на случай у . ловкой инвариантности распределения относительно конечной группы преобразований пространства элементарных исходов.

5. Введено и обосновало понятие условно-инвариантной случайной вероятностной меры Дирихле,. позэоляаздее описывать более сальную С по сравнению с известными инвариантными случайными кроптностшш мерами ■) дополнительную информацию в задачах непарамегрического байесовского' оценивания. Получены байесовские оценки многомерных уславно^-инвариантных функций распределения некоторых функционалов от условно-инвариантных вероятностных мер

6. Для случая, когда априорная информация является прибли-шшой, представлен нет од построения оценок функционалов Мизеса. Для линейных функционалов от неизвестного распределения и функций от линейных функционалов предложены новые оценки, позволявшие нстяьэовагь приближенную априорную информацию о значениях других линейных функционалов Исследованы предельные свойства таких оценок, показаны преимущества перед . традиционными методами, оценивания при конечных объемах Р йоркн.

7. Сформулированы и доказаны утверждения, позволяющие исследовать предельное поведение функционалов от эмпирического распределения, явно зависящих от числа наблюдший.

ЛУБЯИКАЦИИ

1. Тарасенко П. Ф. Непараметрическое байесовское оценивание условно-инвариантных распределений // Мет. представл. н обраб. случ. сигн. и полей: тез. докл. Харьков-Туапсе, год-во ХЙРЭ, 1939,- с. 3.

2. Dmitriev Yu. G. , Tarasenko F. P. , Tarasenko P. P. Modified bootstrap procedures in data, analysis. Paper presented to International Symposium on Data Analysis, ПШ1А, Antibes / Juan les Pins (France), 11-14 Sept.-1989, Progr. ,p.I2.

3. Дмитриев p. Г. , lapaceHKO П.Ф. Непараметрнческие алгоритмы обнаружения сигналов с использованием дополнительной информации // Информационные методы повышения эффективности и помехоустойчивости радиссисте" н систем связи: тез. докл. Москва -Ташкам, 1990, с. 88.

4. Дмитриев Ю.Г., Тарасенко П. Ф. О непараыетрических оценках функционалов // Непаран. и робаст. статист, мет. в кнберн. и информатике: Матер. VII Всесоюз. семин. Томск,1990, ч.1, с.199-204..

5. Тарасенко П. Ф. , Об оценивании линейных функционалов с использованием неточной априорюй информации // ','зтем. и программке» обеспеч. анализа данных: тез докл. Минск, азд-во БГУ, 1990, с.20.

6. Тарасенко П. Ф. 0 симметризации в многомерном интегрировании методом Монте-Карло. // Пршен. многомер. статист, анализа в экономике и оценке качества продукции: тез. докл. Гарту, изд-во'Тартуского ун-та, 1990, чЛ, с.95-96. .

?. Тарасенко П. Ф. О качестве' оценок линейных функционалов с использованием неточной априорной информации для конечных объемов выборки. // Йдентиф. , измер. характеристики имитация случ. сигн. : тез. докл. Новосибирск, НЭТИ, IS9I, с. 168-169.

8. Дмитриев Ю. Г. , Липская А.Н. , Тарасенко П.Ф. Использование неточно заданной дополнительной информации при оценивании числовых характеристик случайных величин. // Тез. докл. на Респ.науч.конф.

и Ma тем. обеспеч. анализа данных". Иинск, 1931.

9. Дмитриев О. Г. , Тарасенко П. Ф. Использование априорной информации в статистической, обработке экспериментальных данных. // Известия вузов, Физика, 1992, fS 9, с. 136-142.

Заказ » Гирд- ЮС ' зкз.

У0П ТГУ. Томок. 29, Никитина, 'i.