автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Методы устойчивого оценивания параметров моделей по статистическим данным

кандидата технических наук
Гаврилов, Константин Викторович
город
Новосибирск
год
2005
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Методы устойчивого оценивания параметров моделей по статистическим данным»

Автореферат диссертации по теме "Методы устойчивого оценивания параметров моделей по статистическим данным"

На правах рукописи

Гаврилов Константин Викторович

МЕТОДЫ УСТОЙЧИВОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ МОДЕЛЕЙ ПО СТАТИСТИЧЕСКИМ ДАННЫМ

Специальность 05.13.17 - Теоретические основы информатики

Автореферат диссертации на соискание ученой степени кандидата технических наук

Новосибирск - 2005

Работа выполнена в Новосибирском государственном техническом университете

Научный руководитель:

Официальные оппоненты:

кандидат технических наук, доцент Лисицин Даниил Валерьевич

доктор технических наук, профессор Попов Александр Александрович

Ведущая организация:

кандидат технических наук, доцент Бериков Владимир Борисович

Институт вычислительной математики и математической геофизики СО РАН, г. Новосибирск

Защита состоится 22 июня в 1600 часов на заседании диссертационного совета Д 212.173.06 в Новосибирском государственном техническом университете по адресу: 630092, г. Новосибирск, пр. К. Маркса, 20.

С диссертацией можно ознакомиться в библиотеке Новосибирского государственного технического университета.

Автореферат разослан " 2С' " мая 2005 г.

Ученый секретарь диссертационного совета

Чубич В.М.

Ш5

21Г/Г/У

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследований. Методы прикладной статистики успешно применяются в различных областях человеческой деятельности, практически во всех сферах научной деятельности. Потребность описать наблюдаемое явление приводит к тому, что одной из часто встречающихся задач, стоящих перед исследователем, стала задача оценивания параметров модели по результатам наблюдений.

Статистические выводы, связанные с анализом параметрических моделей, такие как оценивание параметров или построение доверительных интервалов, согласно классической теории, делались, исходя из предположения о каком-либо определённом виде распределения наблюдений. Наиболее известным является гауссовский статистический анализ, основанный на применении центральной предельной теоремы. Теория сосредотачивалась на оптимизации точности получаемых результатов в рамках рассматриваемой модели.

На ограниченность такого подхода, пожалуй, впервые указал А. Н. Колмогоров. Исследователи обнаружили, что реальное распределение наблюдений, как правило, расходится с принятым в модели, в результате чего могут серьёзно пострадать все статистические выводы. Возникла проблема устойчивого оценивания параметров моделей. В связи с этим получили развитие так называемые непараметрические методы, т.е. методы, свободные от предположения нормальности, как и любого другого определённого параметрического закона для ошибок. Известны, например, работы Т. П. Хеттманспергера по ранговым методам, а также сравнительно недавние работы Ю. Н. Тюрина по знаковому статистическому анализу.

Другой известный подход к проблеме устойчивости, активно развивавшийся Б. Т. Поляком и Я. 3. Цыпкиным, называется принципом оптимальности на классе и основан на минимаксном принципе построения оценок для некоторого множества возможных распределений. Его частным случаем является подход П. Хьюбера, получивший название робастного и рассматривающий конечную окрестность модельного распределения. Позже термин «робастность» приобрёл более широкое значение, его стали употреблять для обозначения устойчивости в каком-либо определённом, заранее оговорённом, смысле. Характерно, что и минимаксный, и непараметрический подходы теряют устойчивость при нарушении симметрии возмущения распределения наблюдений.

Локально-устойчивый подход Ф. Хампеля, основанный на использовании функции влияния, позволил качественно выделить оценки, обладающие свойством устойчивости к асимметричному засорению. Однако введённое им понятие 5-робастности не приводит к решениям, которые обладают указанным свойством.

Л. Д. Мешалкин предложил семейство оценок всех параметров многомерного нормального распределения, обладающих устойчивостью к асимметричному засооению. но это решение не привлекло заметного внимания статиста-

ложенных оценок. А. М. Шурыгин развивал идеи Мешалкина, в том числе обобщил его результаты в рамках локально-устойчивого подхода к оцениванию параметров распределений. Однако локально-устойчивый подход, предложенный Шурыгиным, несмотря на очевидную полезность, до настоящего времени не получил должного теоретического обоснования. Исследованиями по проблеме устойчивости занимались также Дж. Тьюки, Дж. Пфанзагль, Л. Жакель, Э. Леман, Д. Эндрюс, С. А. Смоляк, Б. П. Титаренко, А. И. Орлов, Ф. П. Тара-сенко и многие другие учёные.

В связи с тем, что теория робастности не завершена и находится в стадии активного развития, А. И. Орлов назвал направление, связанное с построением робастных процедур статистического анализа, одной из главных «точек роста» прикладной статистики.

Цель и задачи исследований. Основной целью диссертационной работы является дальнейшее развитие методов робастного оценивания параметров распределений и линейных регрессионных моделей независимых наблюдений с аддитивной помехой с точки зрения применения методов и моделей для более адекватного описания реальной ситуации. Основными задачами исследований являются построение, исследование и применение робастных подходов.

Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, математического анализа, вычислительной математики, статистического моделирования.

Научная новизна и личный творческий вклад автора. Среди приведённого в диссертации материала автором были получены следующие основные результаты:

- предложен вариант теоретического обоснования робастных методов, построенных по принципу локальной устойчивости к точечному засорению и развиваемых А. М. Шурыгиным;

- проведены теоретические исследования локально-устойчивых методов оценивания параметров, в том числе введено понятие равнооптимальной оценки, сформулирован и доказан ряд теорем, касающихся свойств локально-устойчивых оценок;

- предложено комбинирование принципа оптимальности на классе и робастных методов, на основе данного подхода исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания параметров данных моделей;

- предложена вычислительная процедура для оценивания параметров линейных регрессионных моделей адаптивным робастным /у -методом;

- проведены численные исследования предложенных подходов с использованием метода статистического моделирования;

- с использованием предложенных подходов построены модели процесса струйного электрофоретического осаждения, применяемого для нанесения композиционных покрытий на детали машин.

•• *» к ч »

•ц «Щ - 4

Положения, выносимые на защиту. На защиту выносятся новые результаты, полученные автором в процессе проведения исследований.

Обоснованность и достоверность научных положений, рекомендаций и выводов обеспечивается:

- применением для исследования свойств рассматриваемых оценок и методов аналитического аппарата математического анализа, математической статистики и теории вероятностей;

- подтверждением аналитических выводов и рекомендаций результатами испытаний методов с использованием статистического моделирования.

Практическая ценность результатов:

- разработанные подходы позволяют получать оценки, устойчивые к виду распределения ошибок наблюдений, в том числе к наличию выбросов в массиве данных и к асимметричному засорению;

- созданное программное обеспечение позволяет эффективно производить вычисление оценок линейных регрессионных моделей с применением разработанных подходов;

- результаты исследований используются на факультете прикладной математики и информатики НГТУ, разработаны модели реальных технологических процессов для ОАО «Завод дорожных машин».

Апробация работы. Результаты исследований, проведённых автором, докладывались и обсуждались: на студенческих конференциях в рамках дней науки НГТУ (Новосибирск, 1999 г. и 2000 г.); на всероссийской научной конференции студентов, аспирантов и молодых учёных «Наука. Технологии. Инновации» - 2003 г.; на Российской научно-технической конференции «Информатика и проблемы телекоммуникаций» - 2004 г.

Публикации. Результаты исследований по теме диссертации опубликованы в восьми печатных работах, в том числе: научные статьи - 5, материалы конференций - 3.

Структура работы. Диссертация состоит из введения, пяти глав основного содержания, заключения, списка использованных источников из 49 наименований и приложений. Общий объём диссертации составляет 144 страницы, включая 16 таблиц и 32 рисунка.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Глава 1. Состояние проблемы и обоснование задач исследований

В данной главе приводятся основные понятия, ставятся в математической форме задачи, описывается современное состояние направления, связанного с проблемой робастности, проводится обзор существующих подходов к её решению, даётся обоснование задач исследований.

Основные понятия. Исходной схемой в теории робастности, как правило, служит задача оценивания параметров распределений. Пусть хи...,хт - наблю-

дения случайной величины ¡;, распределённой с плотностью /fx.fi), где хеХсЯ. и неизвестный параметр 0 б © с (Я.

Определим оценку параметра в этой модели как

т

0 = агдпмп£л/(х,,9), (1.1)

0 /=1

где М(х,в): % х © -> Л ~ непрерывная, дифференцируемая почти всюду функция, называемая функцией потерь. Дифференцируя сумму в выражении (1.1) по параметру и приравнивая производную нулю, получаем оценочное уравнение

т

£у(х,.,ё) = 0, (1.2)

1=1

решение которого используется для нахождения оценки (1.1). Функция у в уравнении (1.2)

у(х,е)=Ам(Х;0)

называется оценочной функцией (она определена с точностью до не зависящего от х множителя).

Необходимым условием состоятельности оценок является условие асимптотической несмещённости

Е \|/(х, 0) = |\|/(х, 9)/(*, 0) <1х = 0, для всех 0 6©. (1.3)

X

Оценочная функция называется нормированной, если = 1, где

Щу,Л= к*,е)А/(*,0)Л = -Гд*,(1-4)

к ае х т

Теория робастности в контексте задачи оценивания параметров моделей занимается исследованием свойств оценок, а также предлагает способы конструирования оценочных функций, обладающих теми или иными свойствами, в том числе свойством робастности.

Обоснование задач исследований:

• теория робастности не завершена и находится в стадии активного развития;

• принцип оптимальности на классе, являющийся одним из наиболее известных подходов к проблеме устойчивости, приводит к неустойчивым решениям при нарушении симметрии засорения;

• один из весьма перспективных подходов к проблеме робастности, предложенный А. М. Шурыгиным и основанный на принципе локальной устойчивости, не был строго теоретически обоснован, а соответствующая теория не полностью разработана;

• локально-устойчивый подход Шурыгина применён лишь к относительно небольшому числу статистических моделей.

Глава 2. Построение и исследование робастных локально-устойчивых методов

В данной главе приведена теоретическая основа построения методов локально-устойчивого оценивания параметров распределений Установлена связь данного подхода с подходом Ф. Хампеля. В рамках предложенного подхода построен один из возможных методов, в который заложен принцип локальной устойчивости к максимально неопределённому точечному засорению. Метод впервые был предложен А. М. Шурыгиным, но построен им из других соображений, нежели приведённые в данной главе. Проведено теоретическое исследование метода.

Постановка задачи. Требуется получить устойчивые оценки параметра 0 закона распределения /(х,0). Оценка параметра по т наблюдениям находится как решение оценочного уравнения вида (1.2). Для построения требуемых оценочных функций необходимо ввести критерий, учитывающий и точность, и устойчивость оценок.

Модель ошибок. Рассмотрим а-засорённое распределение наблюдений с плотностью

/а(х1в) = (1-о)/(*,в) + аА(*,в),

где/- модельная плотность и Л - засоряющая.

Рассмотрим простейший вид возмущения - точечное засорение:

где 5(0 - функция Дирака, у - аномальное наблюдение, т.е. точка, в которой произошло засорение.

Используемая асимптотика. Полагается, что количество аномальных наблюдений в выборке пропорционально корню её объёма, т.е.

а = к/4т,

где к - некоторый коэффициент пропорциональности. При данном порядке малости уровня засорения а оценка, оставаясь асимптотически несмещённой, имеет величину смещения, которой нельзя пренебречь, поскольку она того же порядка малости, что и ошибка, вносимая рассеянием оценки.

Критерий качества. Чтобы характеризовать качество оценки, рассматривается математическое ожидание квадрата отклонения оценки 0т для выборки объёма т от истинного значения 0*. Обозначим эту величину через ёт:

¿т=Е (§т-0*)2. (2.1)

Критерий (2.1) асимптотически принимает вид

¿(41,/а) = У(ъЛ + к2&г(у,Ч,Л, (2-2)

где ^(\|/,/) - асимптотическая дисперсия оценки, 1Р{х,у,/) = \|/(х,0)/#(\)/,/) - функция влияния по Хампелю, у - аномальное наблюдение, М- нормировочная характеристика (1.4). Первое слагаемое в выражении (2.2) отвечает за эффективность оценки, второе, связанное с её смещением, - за устойчивость.

(2.4)

Чувствительность оценки. Второе слагаемое в (2 2) предложено взвешивать по у, рассмотрев величину чувствительности

= (2.3)

которая в случае евклидовой метрики соответствует байесовскому максимально неопределенному точечному засорению:

% /IX

Выбор выражения (2.4) для чувствительности произведён согласно принципу максимальной энтропии. Действительно, максимально неопределённое распределение засоряющего импульса у есть равномерное его распределение, ибо при отсутствии априорной информации равномерное распределение имеет максимальную энтропию Таким образом, величина (2.4) получена в результате взвешивания второго слагаемого в (2.2) с постоянным весом.

Оценка называется устойчивой, если < со .

Если в выражении (2.3) для чувствительности использовать -норму, то устойчивость в данном смысле будет соответствовать условию В-робастности по Хампелю, а минимизация чувствительности даст наиболее 5-робастную оценку.

Локально-устойчивые оценки.

• Минимизация (2.4) по \|/ приводит к максимально устойчивой оценке (ОМУ), введённой А. М. Шурыгиным,

3-1п/(д:,е) + Р

Уому(*.0) = с

59

(2.5)

где р = р(0) определяется из условия асимптотической несмещённости (1.3), с = с(0) - произвольная функция параметра.

• Степень устойчивости оценочной функции характеризуется следующей относительной характеристикой, принимающей значения от 0 до 1:

81Ъ V)/ = 8«Ь в = Щчому.Л

• Рассмотрено введённое А. М. Шурыгиным условно-оптимальное семейство оценок, обеспечивающее минимальную чувствительность при фиксированной асимптотической дисперсии оценок:

у(х,9) =

ае

1п/(х,6) + р

1 + -

Я*,е).

(2.6)

где константы сир имеют тот же смысл, что и в (2.5).

• Рассмотрено семейство обобщенных радикальных оценок, введённое Л. Д. Мешалкиным для случая нормального распределения:

У(*,в) =

—1п/(х,е) + р эе

Г{Х,&), 0<Х.<1,

(2.7)

где X - параметр радикальности, рис имеют тот же смысл, что и в (2.5). Данное семейство обычно близко к условно-оптимальному семейству (2.6) в смыс-

ле значений эффективности и устойчивости оценок, но семейство (2.7) удобнее для анализа. К оценке (2.7) можно прийти, если минимизировать второе слагаемое в выражении (2.2) при плотности распределения засоряющего импульса, пропорциональной /1_х(дг,в).

• При X = 1/2 оценка (2.7) называется радикальной (ОР).

Новые результаты исследования локально-устойчивых оценок.

• Предложено понятие равнооптимальной оценки, принадлежащей условно-оптимальному классу (2.6) и удовлетворяющей условию

вЛу = е1¥ \|/. (2.8)

Смысл критерия этой оценки следующий. Повышая эффективность, мы проигрываем в устойчивости, и наоборот. Как правило, исследователь не располагает априорной информацией о том, что в каждом конкретном случае окажется лучше для рассматриваемой оценки: поднять эффективность или устойчивость и в каком соотношении, поэтому, согласно принципу максимальной энтропии, предложено распределять ресурсы метода равномерно на улучшение каждой характеристики.

• Сформулированы и доказаны следующие теоремы.

- Теорема 2.1 Для оценки максимальной устойчивости (2.5) имеет место

= cN '(»Кому,/),

где с - константа, фигурирующая в выражении для оценочной функции (2.5), N- нормировочная характеристика (1.4).

- Теорема 2 2. Пусть 0 - параметр сдвига. Тогда, если значения функции плотности f(x,6) в граничных точках интервала X равны между собой, то для оценочных функций (2.6), (2.7) и, в частности, (2.5) имеет место р = 0.

- Теорема 2 3. Пусть 0 - параметра масштаба. Тогда, если в граничных точках интервала X значения выражения х /1+Х(х,9) равны между собой, то для обобщённой радикальной оценочной функции (2.7) имеет место

р = 6-,А/(1 + Х).

- Теорема 2.4. Пусть 0 - параметр сдвига. Тогда, если значения функции плотности f(x,0) в граничных точках интервала X равны между собой, то для радикальной оценки имеет место равенство (2.8).

- Теорема 2.5. Пусть 0 - параметр масштаба. Тогда, если в граничных точках интервала X соблюдается условие х f(x,Q) ~ 0, то для радикальной оценки

условие (2.8) равносильно условию

п2

¡[ug'(u}] du \g\u)du = A\[ug'{u)fdu,

и g^ и и

где используется представление /(х,6) = 0"'g(x/0), и = х/0 е ЧЛ.

- Следствие. Пусть 8 - параметр масштаба. Тогда, если распределение принадлежит семейству двойных экспоненциальных распределений, т.е. функция плотности имеет вид

/(д:,е) = [0Г(1//> + 1)Г1ехр[-(л/е)"], Р>0, х>0,

или

/(*,9) = [2ег(1/р +1)]"1 ехр[-(1 X1/0/], р>0, хеЯ, то для радикальной оценочной функции справедливо равенство (2.8).

Выводы. С точки зрения рассмотренного подхода, наиболее привлекательной представляется равнооптимальная оценка. Но для неё часто не существует простых аналитических выражений, поэтому во многих случаях для её аппроксимации можно рекомендовать использовать радикальную оценку.

Глава 3. Адаптивный робастный подход

Рассмотрен адаптивный робастный подход на примере решения задачи оценивания параметров линейных регрессионных моделей адаптивным Ьу -методом в сочетании с радикальным оцениванием. Предложены численные процедуры получения оценок.

Модель наблюдений. Рассмотрим задачу оценивания параметров линейной регрессионной модели независимых наблюдений

у = Хв + ^, (3.1)

где У = {у\,уг,—,уп)т ~ вектор откликов, в = (б,^, ...,9т)г - вектор параметров, 4 = (^,42.-,4я)Г _ вектор ошибок и X - матрица наблюдений.

Модель ошибок. Пусть все ошибки ¡; распределены с плотностью

т=-

1

-ехр

, Х.>0, у>0.

(3.2)

2АГ(1/у + 1)

Оценки параметров. Следующие обобщённые радикальные оценки параметров моделей (3.1) и (3.2) были получены Д. В. Лисициным (2004 г):

у(у,,е7Нл -*[0 Г 1 -х[в)хи ехр где / = 1, п, у = 1, т, х] - г-я строка матрицы X;

-6«

О + б^Шр-!

ехр 1 У

ч'а/г+^+ыо+йу)

ехр

Г Ху

Здесь I - значения остатков, ¥ - дигамма-функция, 39, и 5У - соответствующие параметры радикальности, принимающие значения от 0 до 1.

Оценки получаются в результате совместного решения оценочных уравнений для каждого из параметров.

Для параметра формы v предложено использовать ограничение 1 < v < 2.

Численный алгоритм получения оценок параметров основан на итерационном методе наименьших квадратов, где на каждой итерации по уточнению оценок параметра 0 вычисляется оценка параметра формы v и делается одна итерация методом Ньютона для уточнения оценки параметра масштаба X.

Пример. Рассмотрим задачу оценивания параметра 9 простейшей регрессионной модели

где ошибка ^ имеет стандартное нормальное распределение, засорённое распределением Коши с параметром масштаба X = 1. Долю засорения обозначим а.

На рис. 3.1 показана зависимость оценок параметра формы V от уровня засорения. Используются одинаковые значения параметров радикальности для оценок различных параметров. Чем менее устойчив метод, т.е. меньше параметр радикальности 8, тем быстрее параметр формы снижается к единице. Это связано с тем, что когда робастных свойств метода недостаточно для описания тяжёлых хвостов распределения ошибок, алгоритм компенсирует это за счёт снижения параметра формы. Пока параметр формы больше единицы (это характерно для больших 5), можно считать, что метод неплохо описывает тяжёлые хвосты распределения ошибок, но, с другой стороны, слишком большой параметр радикальности снижает точность метода. Поэтому параметр радикальности лучше выбирать ближе к середине интервала между нулём и единицей или при его выборе ориентироваться на фактическую тяжесть хвостов.

2

1,8

1.6

1,4--

1,2

О 5 10 15 20 25

Рис. 3.1. Зависимость оценок параметра формы от уровня засорения

Глава 4. Анализ финитной и приближённой финитной статистических моделей

В данной главе исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания всех параметров данных моделей, изучены свойства оценок.

Указаны теоретические предпосылки использования приближённой финитной модели в ряде случаев, возникающих на практике. Рассмотренные методы могут использоваться для анализа регрессионных моделей.

Практическое применение. На практике в задачах, связанных с оцениванием неизвестных параметров моделей по результатам наблюдений, априорная информация о характере ошибок нередко состоит в том, что ошибка ограничена по абсолютной величине. Типичная природа возникновения такого ограничения - это использование измерительных приборов, для которых, как правило, известна абсолютная либо относительная погрешность измерений, а также обработка округлённых данных. Таким образом, финитная модель ошибок в ряде случаев может оказаться предпочтительнее других статистических моделей с точки зрения более адекватного описания реальной ситуации.

Приближённая финитная модель, в отличие от финитной, позволяет описать наличие выбросов, которые могут появляться среди наблюдений в результате грубых ошибок, так как в самой модели заложена возможность нарушения финитности. Поэтому приближённая финитная модель на практике лучше отвечает характеру ошибок наблюдений. Действительно, при анализе чистой финитной модели мы вынуждены полностью игнорировать аномальные наблюдения (считается, что они не могут появляться), но мы не можем с уверенностью сказать, является ли аномальным то или иное наблюдение, так как имеются неизвестные параметры. В приближённой финитной модели все наблюдения участвуют в формировании оценок.

Для данной модели может применяться адаптивный подход. При этом по имеющейся выборке одновременно с оцениванием параметра сдвига (или параметров регрессии) оцениваются мешающие параметры: параметр масштаба, т.е. граница интервала финитности, и параметр формы, характеризующий степень отступления от финитности. Возможно также оценивать только один из указанных мешающих параметров, если другой известен.

Во всех случаях, чтобы обеспечить устойчивость оценок к асимметричному засорению, при их построении применяется теория робастности.

Финитная модель

Задача. Требуется устойчиво оценить параметр 0 в модели наблюдений

х = е + (4.1)

где х - наблюдаемое значение, % - ошибка наблюдений, / > 0.

Решение. Случайная величина % имеет финитное распределение на отрезке [-/,/]. Какой конкретно вид имеет это распределение, неизвестно, но, согласно принципу оптимальности на классе, среди всех финитных распределений наи-

менее благоприятным, т.е. имеющим наименьшую информацию Фишера для параметра сдвига, является косинус-распределение с плотностью

г, пч ' 2 я (ж-9) 1 / 21 21

1 + cos

/

(4.2)

которую постулируем в качестве модельной.

Оценки параметра сдвига. Рассмотрим оценки параметра 9. • Условно-оптимальная оценка. Для модели (4.2) нормированная условно-оптимальная оценочная функция имеет вид:

y+cos

л (х-в)' I

л I

где у = 2 X / +1, X > 0. Для данной оценки справедливы соотношения ,2 / I--л Г \

(4 3)

11

V = l? Tí

1 +

Xzl y + U

2V

; w = -V

• Компромиссная оценка (ОК) принадлежит семейству (4.3) при значении параметра X = К(1|/омп,/)/^(уому,/) = (4/)"1.

• Равнооптгшальная оценка (ОРО) также принадлежит семейству (4.3) при значении параметра X = (8/)"'.

Функциональный вид и основные характеристики некоторых оценочных функций параметра сдвига при ограничении | х - 91< / приведены в табл. 4.!.

Таблица 4 1

Оценки параметра сдвига косинусной модели

№ п/п Оценка Оценочная функция eff v stby

1 ОМП к 21 100 % 0%

2 ОМУ . „. 21 . п(х-в) *)/(*, 0) = —sin—i-- 1С 1 50% 100%

3 Усечённый МНК у(х,в) = х-в 77,53 % 60,79 %

4 Радикальная оценка , 3/ . л(;с-9) ш(х,в) = —sin—i-- 4 21 72,05 % 72,05 %

5 Компромиссная оценка , /(3+V5) л(^-в) /Г„ „ я(л-е)1 \|f(*,9) = —--sin —--/ 3 + 2cos—--- я ' / L / 69,10 % 85,41 %

6 Равнооп-тимальная оценка , лч 8/ . я(*-9) /Г, „ 7C(JC — в)~| \|/(лс,в) = —sin—-' / 5 + 4cos—-- Я 1 / 1 11 75% 75%

На рис. 4.1 изображены графики рассмотренных в табл. 4.1 оценочных функций. При построении графиков использовались значения I = 1 и 9 = 0.

Рис 4.1. Графики оценочных функций параметра сдвига

На рис. 4.1 видно, что ОМУ оказалась также наиболее ,5-робастной оценкой среди рассмотренных. Но, например, равнооптимальная оценка уступает радикальной оценке в смысле 5-робастности, хотя превосходит её по устойчивости в смысле Шурыгина. В рассмотренных случаях все оценки, кроме ОМП, оказались устойчивыми и в смысле Шурыгина, и в смысле Д-робастности. Оценочная функция ОМП не ограничена вблизи границ финитной области, что приводит к её неустойчивости в обоих смыслах.

Оценки параметра масштаба. В роли аргумента t рассмотренных оценочных функций выступают значения остатков модели (4.1) либо иных регрессионных моделей.

• Оценка максимальной устойчивости (ОМУ):

= eff^ = 32,67%.

• Оценка максимального правдоподобия (ОМП):

УомпО.О = ^2ß{UttgJl~'); stbfoMn=0.

• Радикальная оценка (ОР):

27п ( . nt 21 яЛ

eff>0P = 60,19%; stb*|/0P = 61,07%.

• Медианная оценка находится как выборочный аналог равенства

/ = 3,77726388419541 med |5|.

Приближённая финитная модель

Рассмотрим условие задания приближённой финитной модели

/

|/(/)Л>1-а, (4.4)

-/

где /(¿) - плотность распределения ошибок !;, параметр а, характеризует степень отступления от финитности, 0 < а < 1.

Наименее благоприятным при условии (4.4) является косинусно-экспоненциальное (КЭ) распределение с плотностью

/(0 =

/

, ехр!-^|,|/|>/

(4.5)

где константы р(, ...,р4 - неотрицательные числа, которые зависят от а и определяются выражениями

р4 = 2pitgpi. Рз = ^ехрР4, р2 =

константа р, определяется как решение трансцендентного уравнения

1 + p|tgp, - a-1 eos2 Pi = 0. Заметим, что для наименее благоприятного распределения (4.5) неравенство (4.4) обращается в равенство, а является параметром формы.

Оценки параметра сдвига:

• оценка максимального правдоподобия (ОМП)

ч'омп(*.е)=16 / р ;

[sgn(jt-0)tgp,, |*-0|>/

• оценка максимальной устойчивости (ОМУ) sin Г| —|х-0|</

|*-в|У

vomy(^0) =

ехр

Р4 1-i

/

sgn(x-0)sin2f)|, |х-0|>/

> радикальная оценка (ОР)

уор(л,0) =

sm-

ехр

/ ' ' if,_l£Z Н /

, |х-в|й!

sgn(x — 8) sinpj, ] X - е t> /

Оценки параметра масштаба. В роли аргумента < рассмотренных оценочных функций выступают значения остатков модели наблюдений (4.1) либо иных регрессионных моделей.

1 Оценка максимального правдоподобия (ОМП) Уомп0>0 =

I

> Оценка максимальной устойчивости (ОМУ)

УомуС.7):

/ 8,П / ~2 / ' '''

1--

• Радикальная оценка (ОР)

Г р,/ . рxt 1 В.< , , ,

^sin*-1---cos^-, \ t </

l 13 / 1 '

04 M 1,

^Г"з|ехр

cos2p,, |i|>/

cosPj, \t |>/

Оценка параметра формы. Предлагается использовать непараметрическую оценку, которая представляет собой выборочный аналог определения параметра а на основе выражения (4.4), обращающегося в равенство. Для т наблюдений оценка имеет вид

1 т

ты\

где г, = х1 - в - компоненты вектора остатков модели наблюдений (4.1). В более общем случае элементы г1 могут содержать остатки регрессионных моделей, отличных от (4.1).

Глава 5. Численные исследования

В данной главе проведены численные исследования с целью изучения предложенных робастных методов обработки наблюдений при использовании метода статистического моделирования. Рассматривается применение данных методов для моделирования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин. Для вычисления адаптивных робастных оценок параметров линейных регрессионных моделей используется разработанная программная система, описание которой приведено в приложении.

Пример 1. Исследование влияния асимметричного засорения при использовании финитной модели ошибок. Используется регрессионная модель с тремя переменными и полной квадратичной структурой (10 параметров). Объём выборки составляет 343 наблюдения, результаты усредняются по 1000 повторных экспериментов.

Пусть ошибки наблюдений в качестве модельного имеют косинус-распределение с параметром / = 1. В эксперименте используется засорение определённой части наблюдений путём систематического сдвига значений наблюдений на единицу.

На рис. 5.1 приведена зависимость средней погрешности оценивания при использовании различных оценок от уровня засорения.

Рис 5 1 Зависимость погрешности оценивания от уровня засорения

Приведённые графики показывают, что, чем более устойчивая оценка, тем медленнее падает точность оценивания с ростом засорения. Величина этого падения бывает существенно больше, чем выигрыш от использования ОМП при отсутствии засорения. Таким образом, на практике целесообразно применять робастные методы обработки наблюдений.

Пример 2. Исследование влияния тяжёлых хвостов при использовании приближенной финитной модели ошибок. Используется регрессионная модель с одним параметром - генеральным средним. Результаты усредняются по 1000 повторных экспериментов, используется выборка объёмом 1 ООО наблюдений.

Пусть помеха имеет равномерное распределение на отрезке [-1,1] (дисперсия о2 - 1/3), засорённое распределением Лапласа с дисперсией о2 - 9. Истинное значение параметра 9 = 1.

Рассмотрены следующие оценки:

- оценка максимальной устойчивости (ОМУ) для КЭ модели;

- радикальная оценка (ОР) для КЭ модели;

- радикальная оценка для косинусной модели (ОР, а = 0);

-МНК.

На рис 5 2 приведена зависимость средней погрешности оценивания для различных оценок от уровня засорения. Из рисунка видно, что наименьшей точностью обладает МНК, наибольшей - радикальная оценка для КЭ модели. Радикальная оценка для косинусной модели лишь незначительно уступает КЭ модели по точности, поскольку засоряемое распределение является финитным.

Рис. 5.2 Зависимость погрешности оценивания от уровня засорения

Согласно данным на рис. 5.2, с одной стороны, целесообразно использовать робастные методы, с другой - ОМУ может приводить к потере точности из-за слишком низкой эффективности. Поэтому на практике, как правило, можно рекомендовать использовать оценки, занимающие некоторое промежуточное положение между ОМУ и ОМП, например радикальные.

ЗАКЛЮЧЕНИЕ

В соответствии с поставленными целями исследований получены следующие основные результаты.

1 Проведён обзор основных подходов к проблеме устойчивого оценивания параметров, рассмотрена возможность различного комбинирования минимаксного, адаптивного и робастного локально-устойчивого подходов.

2. Предложен вариант теоретического обоснования робастного локально-устойчивого метода Шурыгина. Проведены теоретические исследования локально-устойчивых методов оценивания параметров, в том числе введено понятие равнооптимальной оценки, сформулирован и доказан ряд теорем о свойствах локально-устойчивых оценок.

3 Предложена вычислительная процедура для оценивания параметров линейных регрессионных моделей адаптивным робастным Lv -методом

4 Исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания всех параметров данных моделей, указаны теоретические предпосылки их практического использования. Методы обработки наблюдений, построенные в предположении приближённой финит-ности ошибок, предлагается использовать на практике, в том числе, для оценивания параметров регрессионных моделей.

5. Разработана программная система для адаптивного робастного оценивания параметров линейных регрессионных моделей в предположении приближённой финитности ошибок наблюдений. Имеется также модификация данной программной системы для адаптивного робастного Ц, -оценивания.

6 Проведены численные исследования предложенных робастных методов обработки наблюдений с использованием метода статистического моделирования (Монте-Карло). Подтверждены следующие качества методов:

- устойчивость к виду распределения ошибок наблюдений, в том числе к наличию выбросов в массиве данных и к асимметричному засорению;

- сравнительно высокая эффективность оценок.

7. Разработанные методы применены для моделирования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин.

СПИСОК ПУБЛИКАЦИЙ

1. Тимофеев В. С., Гаврилов К. В. К оцениванию параметров модели линейной регрессии. // Труды IV международной конференции «Актуальные проблемы электронного приборостроения». - Новосибирск, 1998. - Т. 3. - с. 83-85.

2. Гаврилов К. В. Адаптивный метод оценивания параметров в линейных регрессионных моделях. // Сб. науч. тр. НГТУ. - Новосибирск: НГТУ, 1999. -Вып. 2(15).-С. 9-20.

3. Денисов В. И., Лисицин Д. В., Гаврилов К. В. Планирование эксперимента при оценивании параметров многофакторной модели по неоднородным наблюдениям. // Сиб. журн. индустр. матем. - 2002. - Т. V, № 4(12). - С. 14-28.

4. Гаврилов К. В., Лисицин Д. В. Локальная устойчивость в задаче оценивания параметров распределений. // Наука. Технологии. Инновации. Материалы докладов всероссийской научной конференции молодых учёных в 6-ти частях - Новосибирск: Изд-во НГТУ, 2003. - Ч. 1. - С. 17-18.

5. Гаврилов К В , Лисицин Д. В. Робастное оценивание параметра локализации финитной модели // Рос. науч.-техн. конф. "Информатика и проблемы телекоммуникаций", Новосибирск, 22 - 23 апр., 2004.: Материалы конф. - Новосибирск, 2004. - Т. 1. - С. 112.

6. Лисицин Д. В., Гаврилов К. В. О локально устойчивом оценивании параметров распределений // Сб. науч. тр НГТУ. - Новосибирск: НГТУ, 2004. -Вып. 2(36). - С. 37-46.

7. Лисицин Д. В., Гаврилов К. В. Робастное оценивание финитной модели. // Сб. науч. тр НГТУ. - Новосибирск: НГТУ, 2004. - Вып. 2(36). - С. 47-56.

8. Лисицин Д. В., Гаврилов К. В. Робастное оценивание приближённой финитной модели. // Сб. науч. тр. НГТУ. - Новосибирск: НГТУ, 2005. - Вып. 1(39).-С 39-48.

Подписано в печать 18.05.05 г. Формат 60x84x1/16 Бумага офсетная. Тираж 100 экз. Печ. л. 1.5. Заказ № £>59

Отпечатано в типографии Новосибирского государственного технического университета 630092, г. Новосибирск, пр. К. Маркса, 20

у

11645

РНБ Русский фонд

2006-4 8345

,4

Оглавление автор диссертации — кандидата технических наук Гаврилов, Константин Викторович

ВВЕДЕНИЕ.

ГЛАВА 1. СОСТОЯНИЕ ВОПРОСА И ОБОСНОВАНИЕ ЗАДАЧ I* ИССЛЕДОВАНИЙ.

1.1. Задача построения математической модели явления.

1.2. Линейные модели. Оценивание неизвестных параметров.

1.3. Основные подходы к проблеме робастности.

1.3.1. Задача оценивания параметров распределений.

1.3.2. Обзор методов робастного оценивания.

1.3.3. Принцип оптимальности на классе.

1.4. Краткий исторический обзор.

1.5. Выводы.

ГЛАВА 2. ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ РОБАСТНЫХ ЛОКАЛЬНО-УСТОЙЧИВЫХ МЕТОДОВ.

2.1. Стратегия робастного подхода.

2.2. Исходные положения задачи. т 2.3. Критерий качества оценки.

2.4. Локально-устойчивые оценки и их свойства.

2.4.1. Конструирование локально-устойчивых оценок.

2.4.2. Максимально устойчивая и условно-оптимальные оценки.

2.4.3. Радикальные оценки.

2.5. Выводы.

ГЛАВА 3. АДАПТИВНЫЙ РОБАСТНЫЙ ПОДХОД.

3.1. Квазиправдоподобные оценки.

3.2. Адаптивный -метод.

3.3. Адаптивные радикальные Ьу-оценки.

3.4. Численная процедура получения робастных Ьу-оценок.

3.5. Выводы.

ГЛАВА 4. АНАЛИЗ ФИНИТНОЙ И ПРИБЛИЖЁННОЙ ФИНИТНОЙ СТАТИСТИЧЕСКИХ МОДЕЛЕЙ.

4.1. Практическое применение.

4.2. Выбор оптимальной на классе функции потерь.

4.3. Оптимальность на классе финитных распределений.

4.4. Исследование финитной модели.

4.4.1. Оценивание параметра сдвига.

4.4.2. Оценивание параметра масштаба.

I* 4.5. Исследование приближённой финитной модели.

4.5.1. Оптимальная модель ошибок.

4.5.2. Оценивание параметра сдвига.

4.5.3. Оценивание параметра формы.

4.5.4. Оценивание параметра масштаба.

4.6. Выводы.

ГЛАВА 5. ЧИСЛЕННЫЕ ИССЛЕДОВАНИЯ.

5.1. Исследование финитной модели.

5.1.1. Влияние асимметричного засорения на различные оценки.

5.1.2. Нарушение финитности (неправильное значение /).

5.2. Исследование приближённой финитной модели.

5.2.1. Исследования с использованием моделирования.

5.2.2. Анализ экспериментальных данных.

5.3. Выводы.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Гаврилов, Константин Викторович

Актуальность темы исследований. Измерение любой экспериментальной величины всегда осуществляется при воздействии некоторых помех, которые, несмотря на стремление исследователя свести их к минимуму, никогда не могут быть полностью устранены. В силу этого обстоятельства исследователь имеет дело не с детерминированными, а со случайными величинами. Во многих случаях измеряемые величины являются случайными по своей природе. С измерением подобных величин приходится сталкиваться в физических, биологических исследованиях, в некоторых задачах химической кинетики и ряде других отраслей науки.

Необходимость применения аппарата математической статистики при обработке результатов измерений, где случайной составляющей нельзя пренебречь, очевидна, и соответствующие методы успешно развиваются и внедряются в экспериментальную практику.

В настоящее время трудно представить себе область знаний, где бы ни использовались статистические методы обработки наблюдений, ибо на языке статистики удаётся в сжатом виде представить информацию, содержащуюся в серии измерений, наблюдений, экспериментов. Потребность описать наблюдаемое явление приводит к тому, что, наверное, одной из наиболее часто встречающихся задач, стоящих перед исследователем, стала задача оценивания параметров модели по результатам наблюдений.

Статистические выводы, связанные с анализом параметрических моделей, такие как оценивание параметров или построение доверительных интервалов, согласно классической теории, делались, исходя из предположения о каком-либо определённом виде распределения наблюдений. Наиболее известным является гауссовский статистический анализ, основанный на применении центральной предельной теоремы [5, 18, 25]. Теория сосредотачивалась на оптимизации точности получаемых результатов в рамках рассматриваемой модели.

На ограниченность такого подхода, пожалуй, впервые указал А. Н. Колмогоров [20]. Исследователи обнаружили, что реальное распределение наблюдений, как правило, расходится с принятым в модели, в результате чего могут серьёзно пострадать все статистические выводы. Возникла проблема устойчивого оценивания параметров моделей. В связи с этим получили развитие так называемые непараметрические методы [33], т.е. методы, свободные от предположения нормальности, как и любого другого определённого параметрического закона для ошибок. Известны, например, работы Т. П. Хеттманспергера по ранговым методам [36], а также сравнительно недавние работы Ю. Н. Тюрина и др. по знаковому статистическому анализу [4].

Другой известный подход к проблеме устойчивости, активно развивавшийся Б. Т. Поляком и Я. 3. Цыпкиным, называется принципом оптимальности на классе [38] и основан на минимаксном принципе построения оценок для некоторого множества возможных распределений. Его частным случаем является подход П. Хьюбера [37, 43], получивший название робастного и рассматривающий конечную окрестность модельного распределения.

Позже термин «робастность» приобрёл более широкое значение, его стали употреблять для обозначения устойчивости в каком-либо определённом, заранее оговорённом, смысле. Характерно, что и минимаксный, и непараметрический подходы теряют устойчивость при нарушении симметрии возмущения распределения наблюдений.

Локально-устойчивый подход Ф. Хампеля [35], основанный на использовании функции влияния, позволил качественно выделить оценки, обладающие свойством устойчивости к асимметричному засорению. Однако введённое им понятие 5-робастности не приводит к решениям, которые обладают указанным свойством.

Л. Д. Мешалкин [47, 1] предложил семейство оценок всех параметров многомерного нормального распределения, обладающих устойчивостью к асимметричному засорению, но это решение не привлекло заметного внимания статистиков. Возможно, это было связано с недостаточным объяснением природы предложенных оценок. А. М. Шурыгин [40] развивал идеи Мешалки-на, в том числе обобщил его результаты в рамках локально-устойчивого подхода к оцениванию параметров распределений. Однако локально-устойчивый подход, предложенный Шурыгиным, несмотря на очевидную полезность, до настоящего времени не получил должного теоретического обоснования. Исследованиями по проблеме устойчивости занимались также Дж. Тьюки [49], Дж. Пфанзагль [48], Л. Жакель [44], Э. Леман [46], Д. Эндрюс [41], С. А. Смоляк, Б. П. Титаренко [30, 31], А. И. Орлов [27], Ф. П. Тарасенко и многие другие учёные.

Сейчас существует целое направление в теории оценивания [30, 35, 37], которое изучает методы, устойчивые к тем или иным отклонениям от модельных предположений. Собирательное название для таких методов и соответствующих оценок параметров - робастные. Развитие теории робастности связано с дальнейшим совершенствованием применяемых статистических моделей, описывающих реальную ситуацию [38, 40].

В связи с тем, что теория робастности не завершена и находится в стадии активного развития, А. И. Орлов [26] назвал направление, связанное с построением робастных процедур статистического анализа, одной из главных «точек роста» прикладной статистики. Указанные тенденции нашли своё отражение и в данной диссертационной работе. Поднятые в ней вопросы разработки и исследования робастных методов оценивания параметров моделей представляются весьма актуальными.

Цель и задачи исследований. Основной целью диссертационной работы является дальнейшее развитие методов робастного оценивания параметров распределений и линейных регрессионных моделей независимых наблюдений с аддитивной помехой с точки зрения применения методов и моделей для более адекватного описания реальной ситуации. Основными задачами исследований являются построение, исследование и применение робастных подходов.

Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, математического анализа, вычислительной математики, статистического моделирования. Обоснованность и достоверность научных положений, рекомендаций и выводов обеспечивается:

- применением аналитического аппарата математического анализа, математической статистики и теории вероятностей для исследования свойств рассматриваемых оценок и методов;

- подтверждением аналитических выводов и рекомендаций результатами испытаний методов с использованием статистического моделирования. Научная новизна и личный творческий вклад автора. Среди приведённого в диссертации материала автором были получены следующие основные результаты: предложен вариант теоретического обоснования робастных методов, построенных по принципу локальной устойчивости к точечному засорению и развиваемых А. М. Шурыгиным [40]; проведены теоретические исследования локально-устойчивых методов оценивания параметров, в том числе введено понятие равнооптимальной оценки, сформулирован и доказан ряд теорем, касающихся свойств локально-устойчивых оценок; предложено комбинирование принципа оптимальности на классе и робастных методов, на основе данного подхода исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания параметров данных моделей;

- предложена вычислительная процедура для оценивания параметров линейных регрессионных моделей адаптивным робастным -методом; проведены численные исследования предложенных подходов с использованием метода статистического моделирования;

- с использованием предложенных подходов построены модели процесса струйного электрофоретического осаждения, применяемого для нанесения композиционных покрытий на детали машин.

Практическая ценность результатов:

- разработанные подходы позволяют получать оценки, устойчивые к виду распределения ошибок наблюдений, в том числе к наличию выбросов в массиве данных и к асимметричному засорению;

- созданное программное обеспечение позволяет эффективно производить вычисление оценок линейных регрессионных моделей, применяя разработанные подходы к задаче робастного оценивания;

- результаты исследований используются на ФПМИ НГТУ, разработаны модели реальных технологических процессов для ОАО «Завод дорожных машин».

Положения, выносимые на защиту. На защиту выносятся новые результаты, полученные автором в процессе проведения исследований. Краткое содержание работы.

В первой главе ставятся в математической форме задачи, проводится обзор современного состояния проблемы, краткий исторический обзор и обосновываются задачи исследований.

Во второй главе строятся и исследуются робастные локально-устойчивые методы оценивания параметров, использующие подход Шурыгина [40];

В третей главе рассматривается адаптивный робастный -метод, предлагаются численные методы оценивания параметров регрессионных моделей данным методом.

В четвёртой главе исследуются финитная и приближённая финитная модели ошибок, предлагаются робастные оценки их параметров. Рассматривается адаптивный робастный подход в предположении приближённой финитности.

В пятой главе проводятся численные исследования с целью изучения предложенных робастных методов обработки наблюдений при использовании метода статистического моделирования. Рассматривается применение данных методов для моделирования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин.

В приложении 1 приводится численный алгоритм, разработанный и использующийся для реализации итерационной процедуры оценивания параметров линейных регрессионных моделей.

В приложении 2 представлено описание программной системы для адаптивного робастного оценивания параметров линейных регрессионных моделей в предположении приближённой финитности ошибок наблюдений.

В приложении 3 представлены документы о внедрении результатов исследований.

Структура работы. Диссертация состоит из введения, пяти глав основного содержания, заключения, списка использованных источников из 49 наименований и приложений. Общий объём диссертации составляет 144 страницы, включая 16 таблиц и 32 рисунка

Заключение диссертация на тему "Методы устойчивого оценивания параметров моделей по статистическим данным"

5.3. Выводы

В результате анализа выборочных данных второго эксперимента, полученных при проведении струйного электрофоретического осаждения композиционных покрытий на детали машин, выяснилось, что ошибки в экспериментально полученных наблюдениях содержат выбросы, их распределения имеют тяжёлые хвосты. Поэтому необходимо применение робастных методов.

Применение МНК и робастного метода дают, как правило, существенно различные оценки параметров для одной и той же структуры модели. Это говорит часто о непригодности классических методов обработки наблюдений для рассмотренных наборов данных, иногда - о неточных, в какой-то степени, структурах моделей.

При исследовании данных первого эксперимента установлено, что ошибки наблюдений имеют лёгкие хвосты и описываются финитной моделью.

Основные полученные результаты: разработанные методы анализа регрессионных моделей в предположении финитности и приближённой финитности ошибок наблюдений, используемые при проведении численных исследований, реализованы в виде программной системы, которая описана в приложении 2; проведены численные исследования финитной и приближённой финитной моделей ошибок с использованием метода статистических испытаний (Монте-Карло); в процессе исследований показаны основные особенности рассмотренных статистических моделей и робастных методов, построенных на их основе; показана прикладная ценность приближённой финитной статистической модели, применяемой совместно с адаптивными робастными процедурами; предложенные методы применены для исследования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин, выявлены особенности и преимущества рассмотренных робастных методов по сравнению с классическими.

127

ЗАКЛЮЧЕНИЕ

В соответствии с поставленными целями исследований получены следующие основные результаты.

1. Проведён обзор основных подходов теории робастного оценивания параметров, рассмотрена возможность различного комбинирования указанных подходов: минимаксного, адаптивного и робастного локально-устойчивого.

2. Предложен вариант теоретического обоснования робастных локально-устойчивых методов Шурыгина [40]. Проведены теоретические исследования локально-устойчивых методов оценивания параметров, в том числе введено понятие равнооптимальной оценки, сформулирован и доказан ряд теорем о свойствах локально-устойчивых оценок.

3. Предложена вычислительная процедура для оценивания параметров линейных регрессионных моделей адаптивным робастным -методом.

4. Исследованы финитная и приближённая финитная статистические модели, решена задача робастного оценивания всех параметров данных моделей, указаны теоретические предпосылки их практического использования. Методы обработки наблюдений, построенные в предположении приближённой фи-нитности ошибок, предлагается использовать на практике, в том числе, для оценивания параметров регрессионных моделей.

5. Разработана программная система для адаптивного робастного оценивания параметров линейных регрессионных моделей в предположении приближённой финитности ошибок наблюдений. Имеется также модификация данной программной системы для адаптивного робастного -оценивания.

6. Проведены численные исследования предложенных робастных методов обработки наблюдений с использованием метода статистического моделирования (Монте-Карло). Подтверждены следующие качества методов:

- устойчивость к виду распределения ошибок наблюдений, в том числе к наличию выбросов в массиве данных и к асимметричному засорению;

- сравнительно высокая эффективность оценок.

7. Разработанные методы применены для моделирования процесса струйного электрофоретического осаждения, используемого для нанесения композиционных покрытий на детали машин.

Библиография Гаврилов, Константин Викторович, диссертация по теме Теоретические основы информатики

1. Айвазян С. А., Енюков И. С., Мешалкнн Л. Д. Прикладная статистика: исследование зависимостей. М.: Финансы и статистика, 1985.

2. Благовещенский Ю. Н., Самсонова В. П., Дмитриев Е. А. Непараметрические методы в почвенных исследованиях. М.: Наука, 1987. - 96 с.

3. Богданович В. А., Вострецов А. Г. Теория устойчивого обнаружения, различения и оценивания сигналов. М.: Физматлит, 2004. - 320 с.

4. Болдин М. В., Симонова Г. И., Тюрин Ю. Н. Знаковый статистический анализ линейных моделей. М.: Наука, 1997. - 208 с.

5. Боровков A.A. Математическая статистика. М.: Наука, 1984. - 472 с.

6. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. -М. Наука, 1979.-447 с.

7. Вощинин А. П. // Заводская лаборатория. 2000. - Т. 66. - № 3. - С. 5165.

8. Гаврилов К. В. Адаптивный метод оценивания параметров в линейных регрессионных моделях. // Сб. науч. тр. НГТУ. Новосибирск: НГТУ, 1999. -Вып. 2(15).-С. 9-20.

9. Гаврилов К. В., Лисицин Д. В. Робастное оценивание параметра локализации финитной модели // Рос. науч.-техн. конф. "Информатика и проблемы телекоммуникаций", Новосибирск, 22-23 апр., 2004.: Материалы конф. Новосибирск, 2004. - Т. 1. - С. 112.

10. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. - 552 с.

11. Голицын Г. А., Левич А. П. Вариационные принципы в научном знании. // Философские науки. 2004. -№ 1. - С. 105-136.

12. Грибкова Н. В., Егоров В. А. О робастных оценках параметра сдвига, являющихся линейными комбинациями порядковых статистик // Вестник ЛГУ, 1978. -№ 13.-С. 24-57.

13. Губарев В. В. Вероятностные модели: Справочник. В 2-х ч. / Новосиб. электротехн. ин-т. Новосибирск, 1992.

14. Демиденко Е. 3. Линейная и нелинейная регрессии. М.: Финансы и статистика, 1981. - 302 с.

15. Денисов В. И., Лисицин Д. В., Гаврилов К. В. Планирование эксперимента при оценивании параметров многофакторной модели по неоднородным наблюдениям. // Сиб. журн. индустр. матем. 2002. - Т. V, № 4(12). - С. 14-28.

16. Дэйвид Г. Порядковые статистики. М.: Наука, 1979. - 336 с.

17. Ивченко Г. И., Медведев Ю. И. Математическая статистика.- М.: Высшая школа, 1984. 248 с.

18. Изместьев Д. И., Филимоненко В. Н., Лисицин Д. В. Локализация процесса электрофоретического осаждения и его математическое описание. // Сб. науч. тр. НГТУ. Новосибирск: НГТУ, 1999. - Вып. 2(15). - С. 39-44.

19. Колмогоров А. Н. Несмещённые оценки. // Изв. АН СССР, сер. мат., т. 14, с. 303-326.

20. Лисицин Д. В., Гаврилов К. В. О локально устойчивом оценивании параметров распределений // Сб. науч. тр. НГТУ. Новосибирск: НГТУ, 2004. -Вып. 2(36).-С. 37-46.

21. Лисицин Д. В., Гаврилов К. В. Робастное оценивание приближённой финитной модели. // Сб. науч. тр. НГТУ. Новосибирск: НГТУ, 2005. - Вып. 1(39).-С. 39-48.

22. Лисицин Д. В., Гаврилов К. В. Робастное оценивание финитной модели. // Сб. науч. тр. НГТУ. Новосибирск: НГТУ, 2004. - Вып. 2(36). - С. 47-56.

23. Лисицин Д. В. Конструирование робастных оценок параметров регрессии при неоднородных наблюдениях // Научный вестник НГТУ. 2004. -№3(18).-С. 43-55.

24. Мудров В. И., Кушко В. JI. Методы обработки измерений: квазиправдоподобные оценки. М.: Радио и связь, 1983. - 304 с.

25. Орлов А. И. Современная прикладная статистика. // Заводская лаборатория. 1998. Т. 64. № 3. - С. 52-60.

26. Орлов А. И. Часто ли распределение результатов наблюдений является нормальным? // Заводская лаборатория. 1991. Т. 57. № 7. - С. 64-66.

27. Редько М. Ю. Квазиправдоподобные Lp-оценки для линейной регрессии. / Новосиб. электротехнический институт. Новосибирск, 1988. - 31 с. // Деп. в ВИНИТИ 20.06.1988, № 4821-688.

28. Сархан А. Е., Гринберг Б. Г. Введение в теорию порядковых статистик. М.: Статистика, 1970. - 414 с.

29. Смоляк С. А., Титаренко Б. П. Об устойчивой оценке параметра функции распределения. // Тр. 6-й зимней школы по матем. прогр. и смежным вопросам.-М.: ЦЭМИ АН СССР, 1975.-с. 198-209.

30. Смоляк С. А., Титаренко Б. П. Устойчивые методы оценивания: (Статистическая обработка неоднородных совокупностей). — М.: Статистика, 1980.

31. Сухарев А. Г., Тимохов А. В., Фёдоров В. В. Курс методов оптимизации. М.: Наука, 1986. - 328 с.

32. Тимофеев В. С., Гаврилов К. В. К оцениванию параметров модели линейной регрессии. // Труды IV международной конференции «Актуальные проблемы электронного приборостроения». Новосибирск, 1998. — Т. 3. — с. 83-85.

33. Фёдоров В. В. Теория оптимального эксперимента (планирование регрессионных экспериментов). — М.: Наука, 1971. — 312 с.

34. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике: подход на основе функций влияния. М.: Мир, 1989. 512 с.

35. Хеттманспергер Т. П. Статистические выводы, основанные на рангах. / Пер. с англ.: Шмерлинг Д. С. М.: Финансы и статистика, 1987. - 333 с.

36. Хьюбер П. Робастность в статистике. М.: Мир, 1984. 303 с.

37. Цыпкин Я. 3. Основы информационной теории идентификации. М.: Наука, 1984. - 320 с.

38. Шокин Ю. И. Интервальный анализ. Новосибирск: Наука, 1981. -281 с.

39. Шурыгин А. М. Прикладная стохастика: робастность, оценивание, прогноз. М.: Финансы и статистика, 2000. - 224 с.

40. Andrews D. F., Bickel P. J., Hampel F. R., Huber P. J., Rodger W. H., Tukey J. W. A robust estimation for location: survey and advances. Princeton. N. Y.: Princeton Univ. Press.

41. ElfVing G. Optimum allocation in linear regression theory. Ann. Math. Stat. 23,255- 1952.

42. Huber P. J. Robust estimation of location parameter. // Ann. Math. Statist., v. 35, no. l,p. 73-101.

43. Jaeckel L. A. Robust estimators of location: symmetry and asymmetric contamination. // Ann. Math. Statist., v. 42, no. 3, p. 1020-1034.

44. Kassam S. A., Thomas J. B. Asymptotically robust detection of a known signal in contaminated non-gaussian noise // IEEE Transactions on Information Theory. 1976. - vol. 22. - P. 22-26.

45. Lehman E. L. Theory of point estimation. N.Y.: John Wiley and sons. (Перевод: Леман Э. Теория точечного оценивания. М.: Наука, 1991, 444 с.)

46. Meshalkin L. D. Some mathematical methods for the study of non-communicable diseases. Proc. 6-th Intern. Meeting of Uses of Epidemiol, in Planning Health Services. Yugoslavia, Primosten, v. 1, p. 250-256.

47. Pfanzagle J. On measurability and consistency of minimum contrast estimates. // Metrica, v. 14, p. 248-278.

48. Tukey J. W. A survey of sampling from contaminated distribution. Contribution to Probability and Statistics. Ed. I. Olkin. Stanford: Stanford Univ. Press, p. 446-486.