автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Разработка алгоритмов вовлечения априорной информации в процедуры статистического оценивания
Автореферат диссертации по теме "Разработка алгоритмов вовлечения априорной информации в процедуры статистического оценивания"
РГ6 од
' г V '
Министерство науки, Висшей школы и технической политики РФ
ТЬмский ордена Октябрьской Революции н ордена Трудового Красного Знамени государственный университет имени В. В. Куйбызева
На правах рукописи ТАРАСЕНКО Петр Феликсович
УДК 519.24
РАЗРАБОТКА АЛГОРИТМОВ ВОВЛЕЧЕНИЯ АПРИОРНОЙ ИНФОРМАЦИИ В ПРОЦЕДУРЫ СТАТИСТИЧЕСКОЮ ОЦЕНИВАНИЯ
Специальность 05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ
Диссертации на соискание ученой степени кандидата физико-математических наук
Томск 1994
Работа выполнена в Томском государственном университете им.В. В.Куйбышева.
Научный руководитель: кандидат технических наук,
Дмитриев Ю.Г.
Официальные оппоненты:
доктор-физико-математических наук,
Полищук Ю. Ы. кандидат физико-математических наук Устинов Ю.К.
Ведуцая организация:
Институт математики С» РАН ( г. Новосибирск )
/ А Защита состоится ' 11 часов
19- мая
_1994гсщав
на заседании специализированного • совета Д 063.53.03 Томского ордена Октябрьской Революции и ордена Трудового Красного знамени государственного университета имени В.Б.Куйбышева С 634030, г.Томск, проспект Ленина, .36 ).
С диссертацией можно ознакомиться в Научной Томского государственного университета.
библиотеке
Автореферат разослан
оатрм
_19Э4 года
Ученый секгетарь специализированного совета кандидат физико-математических наук, доцент
Б. В. Тривсскенко
ОЩАЯ ХАРАКТЕРИСТИКА РАБОТУ
Актуальность проблемы. Проблема оценивания функционалов от неизвестны! распределений по результатам наблюдений над случайными зеличинамн возникает в огромном числе практических задач, ¡вязанных с обработкой экспериментальных данных. Стремление улучшить качество оценивания при сохранении объема наблвдений или юкратнть затраты на эксперимента за счет улучшения точности щенивания, приводит к необходимости черпать информацию об гселедуемом объекте не только из экспериментальных данных, но и из юдели этого объекта, различных дополнительных источников, аковыми являются физические соображения, опыт исследователя, нтуитивные мнения экспертов и т.д.
Приме"ительно к задаче непара..,етрического оценивания ункционалов от неизвестного распределения, такая дополнительная приорная информация может выражаться заданием моментов, аргинальных распределений, вероятностей некоторых событий, веренности в унимодальности, непрерывности или симметрии асщвделения относительно некоторых преобразований пространства немантарных исходов и другими характеристиками распределений. «Формация подобного рода оставляет исследователя на ^параметрическом уровне априорной неопределенности, однако сужает пасс допустимых распределений. За счет этого сужения появляется »ложность построения процедур статистического оценивания, ¡ладаюцих улучшенными свойствами по сравнению с процедурами, не дагывающяш дополнительную априорную информацию.
Имеется обширная литература по методам привлечения дополни-яьной априорной информации в процедуры статистического оценива-!я, где эта проблема рассматривается как с теоретической точки ения, так и г приложениях: статистическом моделировании, стохас-гческой аппроксимации, статистической физике и радиофизике, борочном контрсиге качества продукции, обработке результатов циологаческих опросов, аналт-зе действия лекарств и т.д.
Значительно меньше изучена проблема использования приближенно т.е. с погрешность» ) заданной априорной информации. Суть ее лоит в тем, что на практике исследователь не всегда может быть &рен в полной адекватности используемой модели, в точности риорной информации. Однако даже приближенная информация может гь полезной при обработке экспериментальных данных.
Данная диссертационная работа посвящена разработке алгоритмов тараметрического оценивания, использующих априорную информацию, анную как точно, так- и приближенно.
Педь работы - разработка способов описания и использования априорной информации об инварианте ти условных распределений элементарные исходов эксперимента, а также построение и анализ алгоритмов привлечения приближенно заданной априорной информации в статистические оценки.
Научная ншизна работы состоит в том, что:
1. Описчн класс распределений, условно-инвариантных относительно группы преобразований пространства элементарных исходов. Получены и исследованы непараметрические оценки таких распределений и функционалов от них.
2. Введена условно-инвариантная случайная вероятностная мера Дирихле. Построены процедуры непараметрического байесовского оценивания условно-инвариантных распределений и некоторых функционалов от них.
3. Предложен метод построения оценок, использующих неточно заданную априорную информацию. Такие оценки получены и исследованы для ряда задач непараметрического оценивания функционалов.
4. Сформулированы и доказаны утверждения, позволяющие исследовать предельное поведение функционалов от эмпирического распределения, явно зависящих от числа наблюдений.
Методы исследования. В работе используются методы теории вероятностей и математической статистики, функционального анализа, а также методы статистического моделирования на ЗВМ.
Практическая ценность результатов исследований. Предложенные процедуры оценивания усяовно-иньариантных распределений и Функционалов от них могут быть использованы для повышения качества оценок, в частности - для уменьшения дисперсии численного, интегрирования методом Монте-Карло, при обработке результатов социологических опросов, в задачах выборочного контроля качества продукции. Метод построения оценок, привлекающих неточную априорную информацию - в системах обработки технических, социологических, биологических и других экспериментальных наблюдений, где встречает» ситуация неточности начальных моделей.
Публикации. По теме диссертации опубликовано 9 работ.
Апробация ш'хгты. Основные положения диссертации докладывались и обсуждались на ВНТК "Метода представления и обработки случайных сигналов и полей" ( г. Туапсе, 1989 ), "Информационные метода повышения эффективности и помехоустойчивости радиосистем и систем связи" ( г.Ташкент, 1390 ), "Применение многомерного статистического анализа в экономике и оценке качества продукции" ( г. Тарту, 1990 )"Идентификация, измерение характеристик и имита-
ия случайных сигналов" ( г. Новосибирск, 1991 ), . Материалы дис-зртации отражены в 8 отчетах по госбюджетным и хоздоговорным те-ам, выполнявшимся в СФТЙ при ТГУ е 1988-1993 годах.
Структура и объем работы. Диссертация состоит из введения, рех глав, заключения, приложения и списка использованной литера-уры С 214 названий ). Содержание работы изложено на М странице ;новного машинописного текста, иллюстрировано 5 рисунками.
КРАТКОЕ СОДЕРЖАНИБ РАБОТЫ
Во введении обосновывается актуальность темы исследования, роводится обзор литературы, устанавливается круг вопросов, ¡следуемых в диссертации.
В первой главе' рассматривается задача использования 1риорной информации об условной и'*вариантности распреления лборки в задачах непараметрического оценивания распределений и досционалов от них.
- в 81.1 определяется понятие условно-инвариантной доятностной ..еры СУИВМ) на (Х,рО, имеющее инвариантные относительно конечной группы измеримых зеобразований пространства X ) условные ( на множествах разбиения = {С1 ,С2,...} ) распределения:
Определение 1.1.1. Вероятностная мера Р на (Х,$4) яывается Г8,£,30-УИВМ ,У)), если Р(С)=У(С) и
!д(АГ)С))У(С)=Р(ЛПС )"У(дС) , где У(С) (С«8)
распределение на ¡^-инвариантном разбиении 6.
Здесь же исследована структура орбит, порождаемых группой "§ в ;эбиении ё и определено понятие класса УЙВМ, с помощью которого ясно описывать априорную информацию об инвариантности условных определений выборки:
Определение 1.1.2. Вероятностная мера Р на {Х,14> ;зывается .У1".)-условно-инвариантной, если
Далее приведены примеры таких классов, позволяющих описывать, частности, информацию о симметрии относительно неизвестного и вестного центра, с неизвестными и заданными
роятностями на разбиении.
- в Я. 2 получен проектор в класс УИВМ С отображение : .V* ), неподвижнее на 9 (в* ) ):
Т е о р е м а 1.2.1. Отображение Г1: ?(«* ):
ПР(А) - ТстеУг(С> ^ ¥(дС>— • «>
-б-
где -Р(АС) - {Р(АС> '
I йт(АС), Р($рС)-0.
является проектором в класс (в* 1-УШШ, если 8р=ёпр , £Р=!?ПР,
у;®? и
Проектирование меры Р сводится к ее ¡?р-симметризации, после чего уже инвариантные условные меры на ёр перевзвешиваются с заданными весами У?. Причем "априорная догадка" <3Р используется всякий раз, когда Р($гС)=0 дС), но УрГС)>0.
- в 81.3 исследуются предельные свойства оценки условно-инвариантного распределения проекцией ГУ С проекции (I) эмпирической меры Рп ). Для случая, когда ?.У .т'' (8 .У) и |6 |соо, получено предельное распределение'оценки ПРП:
Т е о р е м а 1.3.1. ПР„ асимптотически нормальна с дисперсией: Р(С)Р(АПд(АС))-Р(АС)Р<АдС>
°л<*.^Р(дС)-:
Далее найдено смещение оценки ПРП
ВПРп(А) - '£Се1Л<С)Рп($С>\й(А\С>-Р{А\С)\ и проводится сравнение качества оценок, использующих информацию об условной инвариантности распределения выборки лишь частично:
Теорема 1.3.2. Имеют место соотношения: (а) о1($,(Х})~агА(&9,(Х})-(2\Щ)~11:д£% Р(АЬдА).
где X - множество представителей правых смежных классов подгруппы 3?0 группы А - тмметричная разность множеств;
(в) а\($)=а\($,Ш>-\ Р(ЯС)?№)[i?(АЖ)-Р(А\$0
где 1?0- множе тю представителей орбит группы У в I?.:
- в 81.4 подучены выражения для точных значений среднего, дисперсии и СКО оценки ПРП для случая, когда , т.е. заданы вероятности множеств разбиения пространства элементарных исходов. Рассмотрены случаи, когда наблюдения являются НОРСВ и когда они выбраны случайно из конечной совокупности с возвращением С СЕВ) или и без возвращения ССВБВ).
Т е о р е м.а 1.4.1. Смещение и СКО оценки ПРп имеют вид: ВПРп(А (а4-Рл), 8ПРп(А)-(йА-РА ГН(0А-Рл )+Р}У(У-Р4). где
гГ \f w I"1
l л * Jin I для СВБВ,
[i-Px)" для CBB и HOPCB,
N - объем конечной совокупности,
Рк'"У(Ск) С Pk»/fk/N для конечной союкупности ),
V-dlag(Vl,...,7t), Vx-[(1-Hn({k>))• а «^/(a+ej ,
6k - { 1 для CBB н HOPCB; Wk для СВБВ }, a "{ О для CBB и HOPCB; -J! для СВБВ J,
Wk-s )( даясввв.
T S]'p*' [i-pk)n"S для m иНОРСВ,
- в 81.5 рассматривается обоб■ ?ние метода симметризации подынтегральной функции для вычисления математического сскндания 0=^JfdP для случая инвариантности распределения Р относительно конечной группы преобразований
в($д) = п'1^"/^), (2)
где Р(х)=(1/\$01 Г(дх) - ^„-симметризованная подынтеграль-
ная функция. Найдена величина уменьшения дисперсии 1)9при увеличении числа преобразований, образующих группу:
Теорема 1.5.1. Пусть |/Цг=.Г/'гс*?«»> X - множество представителей правых смежных классов подгруппы &0 группы $, ¥ (х)-Р(дх), е - тождественное преобразование. Тогда:
Сё(9) - 09) - Г2п|Ж|Г,5:ЛвХ1*,.-'?н18- '
Далее получены оценки для величины уменьшения дисперсии при применении симметризации подынтегральной функции относительно группы преобразований, рассмотрен вопрос об уменьшении трудоемкости при применении метода 5?-симметризации (2). Кроме того, проведено сравнение двух модификаций метода Монте-Карло, рассчитан шх на использование условной инь риантносли усреднявдего распределения: метода, основанного на классических способах уменьшения дисперсии С расслоенния выборки и симметризации ) и методе подстановки проекции (I) для эмпирического распределения. Показано, что они асимптотически эквивалентны, но важно, что сочетание классических методов применимо не для всех практически интересных случаев.
Вторая глава посвящена применению условно-инвариантного типа априорной информации при непараметрическом байесовском оценивании.
- вводятся обозначения и определения, используемые в
данной главе. В частности, определение случайной вероятностной меры (СВМ), байесовской независимой выборки из нее и др.
- в 82.2 введено понятие условно-инвариантной СВМ (УИСВМ), сбсбв^авдее известные инвариантные СВМ:
Определение 2.2.1. СВМ Р на (ХМ) называется ГС,У,Ю-усювко-инвариантной, если п.н.
Далее дрртся способ описания УИСВЫ с помощью семейства конечномерных распределений:
Лемма 2.2.1. Обозначим вв<=ё - множество представителей орбит группы У в 6, т.е. минимальное подмножество 8, для которого Х'УдтдШсев ЯС\
¥(С ненулевые представители орбит;
Х=( НК,...,ИШ с: Сб5 ) - произвольное (1?,-условно-инвариантное
С Щ:
»<-измеримое рафинирование разбиения £: Х-З^с^^Е.
т.е. ¿¡^И^'С УСев, дН^еХ УС^Й У>77ис;
Гс<й,Х>~[ <ЗГ'Г,с;/»'ГС>,...,<а('Я1, с)ЛГ<С) ) -вектор, связанный со
значениями некоторой меры 0 ( не обязательно вероятностной ) на множества* разбиения Я С здесь ).
Пусть задано семейство распределений векторов ^¥С(Р,Х): Се^,зс|,
причем, УСеё0\е1:реС)«О п.н. Пусть УС®!?, выполнены условия:
(а) 21. .«I-— п н-;
по *
иТ7тс-. Р(оН{с>-Р(И1стоС)/У(С) п.н,;
(в) векторы из множества ^/ГС(Р,Х) взаимно независимы;
(г) распределения векторов УС(Р,X) и УС(Р,Х") идентичны с точностью до перестановок аргументов, если X и X" отличаются друг от друга только порядком нумерации своих множеств;
(д) если разбиение X" является ■ рафинированием X, причем
я«"Я^а.Срх С где 7^-), то
. распределение вектора | (*- * |, най-
денное из распределения вектора ТС(Р,Х"), идентично распределению вектора УС(Р ,Х) из заданного семейства. Тогда существует единственная СВМ, индуцирующая заданное семейство распределений.
Pr(JK*x)
Затем при следующих ограничениях на тройку VCeg либо дС*С , либо С>=0, либо С - атом в si (3)
на основании леммы 2.2.1 дается определение УШШ Дирихле.-
Определение 2.2.2. Пусть у - ограниченная и аддитивная мера на (3f.fi) такая, что ,fj ,У). Тогда
68 -УИСВМ Р называется УИСВМ Дирихле с параметром ' у , если для всякого (ё,"ß)-условно-инвариантного s?-измеримого разбиения % выполняется:
(а) случайный вектор Уимеет распределение Дирихле с параметрами (у, /О для кех VCeg
(б) векторы из семейства CegJ взаимно независимы.
Конструктивное определение УИСВМ Дипяхле дает Теорема 2.2.1. Пусть öx(A)"Ia(x ) - обозначение индикаторной функции множества А\
Nc(x) » -(yiC)/ViC)) /°е~чу'*с1у, хе(0,<»). С® U ;
х
{ Jp-.J"!} Cegj , - последовательности случайных величин,
определяемых фунциями распределения ехрГ Ыс(хП,г*0,
.0 , л:*0,
Pr(JjC*x]JiC~xl.....«/J.I,c=xj.lJ -
, explNc(x )-^c(xj_i)J ,x&(0 .x^), - j 1 , IWj.,,
1 0 , x*0,
причем Jlc и J g независимы Vî.JgTT», если C,*C2 ;
f V r :J =17«-, Ceg ; -семейство независимых и не зависящих от , -if-flCJ
{J*.} случайных величин, причем - VJe77oô, Ceg.;
. . у (С) 1
{ JiC:j"T^,CsSi } - семейство случайных величин.
Положим также-яа l'j gC=Qi/jC Vgeg, Ceglf jeT~S>.
Тогда с = 2ZCeg vîC) T.™! fî7jc e
Наконец, в следующей -теореме показано богатство носителя УИСВМ Дирихле:
Теорема 2.2.2. Пусть Р - УИСВМ Дирихле с параметром у, a Q - любая условно-инвариантная вероятностная мера на ("X ,-Л) такая, что Q « у. Тогда:
Ca) для любых rsZ*, e>ö и для любых .^-измеримых множеств Аи...,Аг
выполняется: PrMpf^-Qf/l^jc: i=77r ] >0; (б) Если у (Л) =0, то Р(А)=0 п.н. Св) Если у(4)>0. то Р(А)>0 . .н. УА^.
- в 82.3 получен вид апостериорного распределения условно-инвариантной СШ Дирихле.
Т е о р е м а 2.3.1. Если PeOg^iy; кх=>(х1,... ,хп) - выборка из Р, то апостериорная СВМ Р|х е Э^-уФ*. где Vderf:
»(Ai'T.g^gSZi",egx{AJ. (4) На основе этой теоремы найдена байесовская оценка многомерной условно-инваркантной функции распределения:
Теорема 2.3.2. Пусть (X,, на
ffliap), X" (xt.... ,хп) - выборка из Р. Пусть потери от принятия § в качестве оценки функции распределения S выражаются расстоянием Крамера-Миэеса: L(S )=S(S(x )-S{x )fW(dx), гдеУ - ограниченная неотрицательная весовая мера на" (Д?8Р.). Тогда байесовская оценка является (S.У-условно-инвариантной вероятностной мерой:
iV^-Zog V(C)[ Xn(C)G(A\C) +<1-\п(С)тРп(А\С> ) (5)
где а ПРП - проекция (I) для Рп.
- в 52. 4 найдены байесовские оценки некоторых функционалов от условно-инвариантных распределений:
Теорема 2.4.1. Пусть на (X.it).
G"t/i,V), x'(xi,...,xJ - выборка .из Р. Пусть являются п.н. конечными борелевскими функциями на (ХМ) и /|/,|с?г-=оо, /1 fi9 • /а I с?у<оо Vg«S?. Пусть потери от принятия
5 в качестве оценки функционала 3 квадратичные: Ь(Ъ,3)г. Тогда байесовские оценки функционалов i,fP)«J/tcfP и
З.(Р)«//,dP• JfMP имеют вид:
J ft i й V(gC) V(hC> V(C) >. Kn'^K^^ -fi(C>+V(C)-*
S/iO-fgh dp S/iV db
flfO - pl(C) J'
где p и определяются формулами (4) и (5).
- в S2.5 рассмотрены вопросы применения условно-инвариантных СВМ Дирихле в задаче оценивания симметричных распределений. Кроме этого введено понятие условно-симметриэованной СВМ Дирихле и установлена его взаимосвязь с условно-инвариантной СВМ Дирихле:
0 п р е д е j. в н и е 2.5.2. Пусть Р, - СШ Дирихле на (X.«О ( не условно-инвариантная ) с параметром Услошо--
симметризованной СВМ Дирихле будш называть СВМ
ItgMgUCt) Р(А) - *<С)-—---,Лм1.
Т е о р е м а '2.3.1. Если тройка удовлетворяет
условии (3), то условно-симметризоганная СВМ Дирихле Р с параметром .а является условно-инвариантной СВМ Дирихле с параметром?: )а (АС), А&А, гд е ^дС.
Отсюда следует, что условно-симметризованная СВМ Цирихде охватывает более широкий класс УИСВМ. Однако без ограничений (3) не удается получить апостериорное распределение такой СВМ и использовать его для байесовского оценивания.
. В третьей главе предлагается метод построения и анализа оценок функционалов от распределений, использующих неточно заданную априорную информацию.
- в 83.1 рассматриваются общие принципы построения оценок функционалов от распределений 9=6 (Р) по выборке НОРСВ объема п из Р в случае, когда известно ( возможно, неточно ) значение другого функционала Д (Р)*0. Намечены два подхода к ее решению: комбинированный и функциональный. Комбинированный подход связан с минимизацией среднеквадратической ошибки ССКО) в классе линейных комбинаций эмпирических оценок Функционалов вида 9ПСХ) - 9п-ХЛп, приводит к оптимальной оценке 91)('Х<1), которая явно зависит от объема выборки и от неизвестного распределения:
мгеп-ем„ пМ(оп-вн\-&) * апК(вп-в)
М&.1 " пЫ(А„-А)г * 2АпМ(Ап-А) * пА* но дает выигрыш в СКО при любом числе набиодений:
(М(вТ1-е)Ап)г зе>па,) - М--% " .
" мд*
Ври использовании функционального подхода оптимальная в смысле ШЗ оценка С или некоторое приближение к ней ) ищется в классе оценок вида в((1-Х)Ргде Рп - эмпирическое распрсдагенке, а Рп -оценка распределения, ориентированная на точное выполнение априорного условия.
- в 83,2 в связи с необходимость?®. возгожакзей при построении и анализе оценок, асимптотически эквивалентных оптимальным» обобщается известные утверждения о слабой сходимости оценок функционалов Миэеса на случай функционалов вида Т(Р,п), явно зависящих от числа наблюдений.
Определение 3.2.3. Функционал Т(Р,п) называется (р1,...рщ) - миэесовским в точке Р, если:
(а) существует звездчатое в точке Р множество ?т такое, что
1Ш Рг(Рп«?т}-/;
-1Й-
С5) футе яоная TIP,п) дифференцируем т раз в точке ? относительно множества ?т, т.е. для PQ(=P+í (Q-P):
- X..J 7iMíP,n.V¡.....ykJ n(Q-PHdUiH
at 4-0. i-i
Св) существует последовательности p¡(n) ,рт(п) такие, что
pk(n) sup j-^-j-TfP (.njl-O (i) V/t-еТТш, где P^P+UP -Р).
* lelo ,1!> dí 1 p ran
Теорема 3.2.1. Пусть функционал Т(Р.,п) является íp,,...,рп) - мизеоовским в точке Р. Среди первых m его производных могут бить нулевые: Ttk>fP,n,y,,...,yk)=0 тождественно по y¡,Ук VkeMyCÍ, si, причем и множетю ненулевых производных
непусто. Обозначим рту^у" 0' р fn) ] и
MT=[ífeM|:pkfni=0(pín^j}. Если p(n)=o(pJn>) то Ve>0
т. е. предельное распределение величины Т(Рп,п)-Т(Р,п) совпадает с предельным распределением суммы отличных т куля производных, иыеадих минимальную скорость сходимости.
Теорема 3.2.2. Пусть I](п,Т) - функция, заданная для лабого п в окрестности точки Т(Р), где Т-Пх,... ,ТЬ) - функционалы йнзеса ш-го порядка в точке Р. Пусть Л удоааетворяет условиям: (а) в окрестности точки TíР) для всех п существуют непрерывные частные производный Функции И по Т,,...,Тя: &TH<n,Ti,...,TJ ■
-----, где .r el.m, г,чО ,s;
dT\i ... дТ\* 11 1 1
Сб) для всех i i,m дифференциалы функции ¡1 по переменным 7¡,... ,Та
в точке Т(Р) как функции от л- удовлетворяют условию:
Pr(n )n'l/ZdrH In ,Т(Р) )~OU );
рг(п) ¡9Г//Г ,
П leí 0 , J¡ |9i J
—Oil) VfeTjñ.
Тогда И является ipl ..,ри> - мизеоовским функционалом в точке Р.
Теорема 3.2.3. Пусть II (п, Т) - Функция, заданная для всех п в.окрестности точки TCP), где 7WT,,...,Tb;, TjPj-jfdP н
Viml.s. Пусть Я удовлетворяет условиям: (а) ь окрестности точки 7\ Р) для всех л сус}еству»т непрерывные частные произдадные функции И по Г до л-го порядка включительно и, как функции от п, они удовлетворяют условию:
ffT\t ...аг;. " г>т(п,Г1,....га) п-т'* * 0кС" ;
-1Ъ-
(б) для множеств ...г,): г^О"Тш, |
М - {(г.г,.....га>: г-1 ,т, (г,.....г,)шПТ
С'Ъ.....Г.)-*; .....- .
- о^.'}^*,,...,^«^ Р>1(п,ки...,кя>}" рТпг}
выполняется: ит,г,,...гв): Гг,/е0гИ1| П Мн=0.-
Тогда если обозначить ^«п )/^(Рп~Р), то
р(п)[й(п,Т,(Рп>,...,Г,(РпП-Н(п,7/Р),...,Та(Р))] « Ат<Т.(Р),....Тщ(Р),г.,...,г) . г, ■
Г I 3 * I * * 8 т-~гЭ ь (
- -:—рт—:-nt.ii
Л г^ р(п> ^ р(п> 1 + р1~-И\М„ рг(п,г,,....г,) * ят(п,г1.....•
- в 83.3 подробно рассмотрена задача комбинированного оценивания личейного Функционала 8»]"ф<1Р, если априори приближенно известно значение другого линейного функционала А<*/фс1РъО. Обозначим ОсоуГф.Ф), О-уагГф), К-уагСф), р'-С^/УО, ' . а \.в„,сп.гп - эмпирические оценки соответствующих функционалов.
Если имеет место точное равенство Д=0, то эту информации можно привлечь в процедуру оценивания для улучшения ее качества:
9 » 9 - С Л /V . (6)
п п п '
При р«1гСР), Д-0 и V>0 оценка (6) будет асимптотически
нормальна с дисперсией ОС/-рг). Если ж условие Л-0 вкпсшкйтся лишь приближенно, то оценка (6) не являэтся оостоятеаьн 1.
Применение комбинированного подхода • дяя ;аисса оиекоа в„(Х.) - 9П- ХДП при условта Ф,'фвЦ<Р> и У>0, дает оптимальную в смысле СКО оценку
- 9п-Х.Д,, к.(п.Р)~С/(Г+пАа) (7)
СКО которой имеет" вид ¿9,/Х..) - п~1[о-(?/(У+пб? и она является
асимптотически нормальной с диперсией ог» { всш
Л О , если Д-0. В то ж время для более сильных типов сходимости имеет место:
Г в , Д-О, (аг/п , Д-0,
" д*о, " * I (Гм-оа/п1). д-о.
Оценка С?) не применима на практике, т.«.. зависит от неизвестного распределения. Построение же адаптивных оценок не шляется тривиальной задачей, т.к. обычный катод подстановки т триводит к оценкам, асимптотически эквивалентны* оптимальней:
о„(К,>, х.пГК(п.рп/-сп/о^лАгп). т
Теорема 3.3.1. Если <р.t'eljiP) и У>0, то
г и ) f frfi<x/Ctt}, Д-0,
lim PH n (6 (L ,)- 9) < x - { l % >
l " > l ©ir/DH), Д-0,
r«ß и E, .£s -независимые случайные величины,
имеющие стандартное нормальнее распределение. Кроме того,
Dl-i+14p* и „ , , «
' inttiAn-AjrC/K2>Opin . Д-0,
ц Г Гп^ГД-
р.~ . . Л"0.
Выходом, из этой ситуации является специфическое оценивание параметра X, ( изменение скорости вовлечения в оценку информации о погрешности Д ):
К,г'К(па,Рп)~Сп/(Уп+паАгп ), аш(1/2,1). (9)
Теорема 3.3.2. Если (г,ф2«=Ьг (Р). Г>0 и а<*(0,1), то
Оп(//п' "), Л
1Л f О u/n "
п п.г n { Q (1/п« »
Р..... >. Д-0-
Однако скорость убывания остаточного чле'ч адаптации южно увеличить, еи;и использовать еще одну оценку:
К<па»,Рп> ~ !Уп+п«»л1 ), СЮ)
а -а(п,Р )- I--г , зш(1/2,1).
" . п 2+пХ
Теорема 3.3.3. Если ф.ф2«!,, ГР,), У>0, то имеет «вето:
м, ( О (1/п^), Л"0,
п» га а 41 „ 1 у
" п-* " I 0р(1/п) , Д-0.
Далю для полученных оценок установлены следующие утверждения, к^ дающиеся сходимости среднег: и СКО:
Теорема 3.3.4. Если У>0 и Ф.ф1ч>ф,фто
Г О(1/п) , Д=0,
а?© сх ,.) - е * ^
" п'г 10«/п°), Д.О.
Теорема 3.3.5. Если , то У1-7ТЗ
Ли 5ввГХ.п-1) - О.
Теорема 3.3.6. Если У>0 и ф,<Н>,Ф:е1ггР), то
f Dp2 + О(i/nUl a)), Д-0,
- в $3. А рассмотрена задача комбинированного оценивания линейного функционала 0=/(рс1Р, если априори приближенно известно значите несколько других линейных функционалов: С ). Обозначим С-соуСф,ф>, О-уаг(ф), У-уог(^),
р*-(С,С г-/+п(А ,А), где под скалярным п^сичредени*«, ихмтея
-15в виду fa,e;»aTF"1e.
Оптимальной в смысле СКО оценкой из класса 9nfXj»9n-XTAn будет Qn<\. ), где Х„=Л"'с, Л=Г+п(Л.А>, А'1 =Р~1-пГ"1ДЛтГ,/2, при этом
9na.H6n-[<C,AJ+n[tC,A>rA,Aj-iC,AJiA.A)])/2^ (Ю
senfX„> - (о-СтЛ"'с)/п = Ъ(1-рг)/п+1С.А)г/г.
Особенностью данной задачи является то, что построение адаптивной к СП) оценки невозможно, и это приводит к необходимости рассмотрения более простоя субоптимальной оценки:
W. \-V'*c/[i+nt?VlÄ\. (12)
S9na0i - n'I|d-[(C,C^n[2fC,Cj(A)A)-(C>Ai2]]//,2i!| =■
- n"I|D-rC.C)/2+n[rC,CJfA,A;-fC,A)2]//zi!|,
причем S9nfX.) =s ,?8nfX0J « п"'[о-ГС,С)/2] s D/n - D9n. Адаптивная ( асимптотически субоптимальная ) оценка имеет вид:
«а (1/2,1). (13)
Теорема 3.4.1. Если (p,qnj)k,t|)®elafpj Vk^TTm и deUV )*0,
то (13) асимптотически нормальна с дисперсией D-(C,C), А=0.
«г \ (OJi/nl~a >, А=0,
и, кром° того, п 8 (X )-б„ГХ,.; = ( „ «
1 " "" " 0 J lo^i/n"^, А*0.
- в 83. 5 рассмотрен вырожденный случай задачи из S3.4, когда используемые априорные условия является линейно зависим- лш ( rang(V )-m-i, но Д*0 ). Получены оптимальная, субоптимальная и адаптивная оценки, исследованы их предельные свойства.
- в 83.6 решается задача оценивания функций от .линейных Функционалов НО)"И(в1,...>0в), G^JfpdP ( dim((p)-*r ) с использованием нескольких априорных условий- Д=/фс?Ра-0 ( <Ит(ф)~т ). Рассмотрены два способа оценивания: подстановка в // комбинированных оценок ее аргументов Q
HjiH - (14)
и комбинирование с эмпирической оценкой функции Н
апа> - ffn - хХ- • сю
Обозначим C«cov ftp ,*(>>, D~var(<s>), У=упгГФ>, T=iracef0-7 /iГвЛ, e*-ATr-'A-, DH-VTB(e)-D-VH(e), P^V^'^W Cn~C-VH(Q)+A-T/2.
Эсобенность данной задачи проявллетея в том, что уж? на этапз построения оптимальных и субсотжалыж оценок в классе (Я), требуется выпсижяпге услозий регул яркости:
Са) штртпю ¥ кз вдшбзнз;
С6) функция И ¡мает непрерывные в окрестности точки в частньэ
производные до третьего порядка включительно; Св) для некоторого з' выполняется: \н(0П)|</Спа, причем е ¿2<Р) для всех ¿.«17?, ,та, где I г> шаг £¿5+3.4] .
Св') где с1п - некоторая статистика, для которой /<3П<ЯР-«»,
Условие (в) применимо,для коэффициентов асимметрии, - эксцесса, корреляции и вариации, а условие (в') - для центральных моментов.
Лемма З.6.1.- При выполнении условий (б,в) или (б,в') и (ял-и) =Т/2п+0(1/п3/г), М (ип-я]г "Ьн/п*О (1/пг/г).
м[н^-и]\"Сп/пЮаУп3/г), Пт Рг { пл[нп-н)<х ] - Ф(х/й\*).
Субоптимальными в классе СЮ будут оценки ип(^)-Нп-\1Ап, пбг), к-0.1.2,
С0= пи[йп-й]д„. С,- сн, с8= С-ЧИ(в), для которых
Г иг 1 г Г Ои(1-рг), Д-0,
1ш Рг < (Х.ЫП<х } - Ф(х/а), где о - < "
1 п к -1 I Сн , Д-0.
Адаптивные оценки при к"1,2 имеют вид: МС ^'^ХУ^п"8''. ОМШ2Л). СБ)
Теорема 3.6.1. Если выполнены условия Са-в) или Са.б.в'), то при к°1,2-.
„»Г«/ » г. ,1 ^«Л»1-'.
п * ¡А /Х - )-и(Хр)\ <
1 11 ^ п [ОрГ'/Уп ,), Д*0.
Для масса СМ) методы, предложенные в §3.4, приводят к
субоптимальной оценка . ¡>.0*\'~1С/(1+п8г), и адаптивной к ней
»,'^НГвп-||,вАл сю
причем Пт Рг { п^Гй } - Ф(х/а).
п»» I 1 } >
Теорема 3.6.2. Если выполнены ограничения Са-в) или
Са.б.в'), то , „
и г л гоР а/пх'*), д-о,
1 " "" " 1ори/п*-*), А*0. - в §3.7 описаны результаты имитационных экспериментов по исследованию качества построенных в §§ 3.3-3.6 оценок для конечных объемов выборки. Даются рекомендации по нх использованию. Главный вывод состоит в выявленном преимуществе адаптивных оценок по сравнений со своими конкурентами.
Качественная картина результатов моделирования для оценок из
53.3 представлена на рис. I. Адаптивные оценки 9ПСХП) (9) сравнивались с эталонными - эмпирической 9п и оптимальной 6ПСХ.) (7), а также с конкурирующими - оценкой 8П (6), ориентированной на точное выполнение априорных условий и оценкой с предварительной проверкой гипотезы:
Г 9 . Тп*Т (1), б„Н где Г --, ?-уровень значимости.
ьп- тп*т0<1>. Уп
Сравнение проводилось по критерию СКО для различных погрешностей Д в задании априорных условий и различных объемов выборки.
Из рисунка видно, что адаптивная оценка выигрывает по сравнению с эмпирической в большем интервале погрешностей, чем оценка с предварительной проверкой гипотезы. Причем на этом интервале она имеет меньшую СКО.
Аналогичные результаты получены н для оценок, построенных в 83.4 и 53.6. При этом обнаружено, что случай использования нескольких априорных условий существенно отличается от использования одного условия. Уже при учете двух априорных условий максимумы СКО адаптивной оценки С аналогичные максимумам на рис. I ) наблюдаются . лишь на сечении поверхности СКО, заданном в пространстве погрешностей Д уравнением СтР"'д - О. На сечениях, проходящих через точку А "О в других направлениях, эти максимумы отсутствуют.
Кроме того, для оценок функций от линейных функционалов выявлено некоторое преимущество способа оценивания (17) перед CIS).
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Ведено обобщение понятия условно-инвариантны! вероятностных мер С которое позволяет одновременно описывать априорную информацию о симметрии и вероятностях распределения на заданных инсжЕствах ) на случай инвариантности относительно группы преобразований выборочного пространства.
2. Построена оценка условно-инвариантного распределения, получено ее предельное распределение, показано ее преимущество по сравнению с оценками, использущими условиую-инвариантность распределения выборки лишь частично.
3. Получены выражения для" точных значений среднего и СКО модифицированной оценки распределения с заданными вероятностями множеств разбиения пространства элементарных исходов С для случаев, когда наблюдения являются НОРСВ и когда они выбраны случайно кз конечной совокупности с возвращением или без возвращения )..
4. Метод снмыетригоции подынтегральной Функции для вычисления математических ожиданий обобщен на случай у . ловкой инвариантности распределения относительно конечной группы преобразований пространства элементарных исходов.
5. Введено и обосновало понятие условно-инвариантной случайной вероятностной меры Дирихле,. позэоляаздее описывать более сальную С по сравнению с известными инвариантными случайными кроптностшш мерами ■) дополнительную информацию в задачах непарамегрического байесовского' оценивания. Получены байесовские оценки многомерных уславно^-инвариантных функций распределения некоторых функционалов от условно-инвариантных вероятностных мер
6. Для случая, когда априорная информация является прибли-шшой, представлен нет од построения оценок функционалов Мизеса. Для линейных функционалов от неизвестного распределения и функций от линейных функционалов предложены новые оценки, позволявшие нстяьэовагь приближенную априорную информацию о значениях других линейных функционалов Исследованы предельные свойства таких оценок, показаны преимущества перед . традиционными методами, оценивания при конечных объемах Р йоркн.
7. Сформулированы и доказаны утверждения, позволяющие исследовать предельное поведение функционалов от эмпирического распределения, явно зависящих от числа наблюдший.
ЛУБЯИКАЦИИ
1. Тарасенко П. Ф. Непараметрическое байесовское оценивание условно-инвариантных распределений // Мет. представл. н обраб. случ. сигн. и полей: тез. докл. Харьков-Туапсе, год-во ХЙРЭ, 1939,- с. 3.
2. Dmitriev Yu. G. , Tarasenko F. P. , Tarasenko P. P. Modified bootstrap procedures in data, analysis. Paper presented to International Symposium on Data Analysis, ПШ1А, Antibes / Juan les Pins (France), 11-14 Sept.-1989, Progr. ,p.I2.
3. Дмитриев p. Г. , lapaceHKO П.Ф. Непараметрнческие алгоритмы обнаружения сигналов с использованием дополнительной информации // Информационные методы повышения эффективности и помехоустойчивости радиссисте" н систем связи: тез. докл. Москва -Ташкам, 1990, с. 88.
4. Дмитриев Ю.Г., Тарасенко П. Ф. О непараыетрических оценках функционалов // Непаран. и робаст. статист, мет. в кнберн. и информатике: Матер. VII Всесоюз. семин. Томск,1990, ч.1, с.199-204..
5. Тарасенко П. Ф. , Об оценивании линейных функционалов с использованием неточной априорюй информации // ','зтем. и программке» обеспеч. анализа данных: тез докл. Минск, азд-во БГУ, 1990, с.20.
6. Тарасенко П. Ф. 0 симметризации в многомерном интегрировании методом Монте-Карло. // Пршен. многомер. статист, анализа в экономике и оценке качества продукции: тез. докл. Гарту, изд-во'Тартуского ун-та, 1990, чЛ, с.95-96. .
?. Тарасенко П. Ф. О качестве' оценок линейных функционалов с использованием неточной априорной информации для конечных объемов выборки. // Йдентиф. , измер. характеристики имитация случ. сигн. : тез. докл. Новосибирск, НЭТИ, IS9I, с. 168-169.
8. Дмитриев Ю. Г. , Липская А.Н. , Тарасенко П.Ф. Использование неточно заданной дополнительной информации при оценивании числовых характеристик случайных величин. // Тез. докл. на Респ.науч.конф.
и Ma тем. обеспеч. анализа данных". Иинск, 1931.
9. Дмитриев О. Г. , Тарасенко П. Ф. Использование априорной информации в статистической, обработке экспериментальных данных. // Известия вузов, Физика, 1992, fS 9, с. 136-142.
Заказ » Гирд- ЮС ' зкз.
У0П ТГУ. Томок. 29, Никитина, 'i.
-
Похожие работы
- Статистическая обработка данных с использованием априорной информации
- Модифицированные оценки линейных функционалов от распределений вероятностей с учетом дополнительной информации
- Непараметрический метод учета априорной информации при идентификации стохастических систем
- Методы минимаксного оценивания в многомерных линейных моделях наблюдения при наличии геометрических ограничений на моментные характеристики
- Математические модели и программный комплекс для оптимального оценивания потокораспределения в инженерных сетях
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность