автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Аналитические методы построения оптимальных планов эксперимента

кандидата физико-математических наук
Шпилев, Петр Валерьевич
город
Санкт-Петербург
год
2007
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Аналитические методы построения оптимальных планов эксперимента»

Автореферат диссертации по теме "Аналитические методы построения оптимальных планов эксперимента"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Шпилев Петр Валерьевич

АНАЛИТИЧЕСКИЕ МЕТОДЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПЛАНОВ ЭКСПЕРИМЕНТА

05 13 18 — Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург 2007

003158804

Работа выполнена на кафедре статистического моделирования математике- механического факультета Санкт-Петербургского государственного универси гета

Научный руководитель

доктор физико-математических наук, профессор Мелас Вячеслав Борисович

Официальные оппоненты

доктор физико-математических наук, профессор Седунов Евгений Витальевич

кандидат физико-математических наук, доцент Буре Владимир Мансурович

Ведущая организация

Сан кт-Пегербургски й государственный иол итехн и чески й ун и верситет

Защита состоится

»

2$" » дКтаЪр* 2007 г в |£''1>0 часов на заседании

диссертационного совета Д 212 232 51 по защитам диссертаций на соискание ученой степени доктора наук при Сан к г-Петербургском государственном университете по адресу 198504, Санкт-Петербург, Старый Петергоф, Университетский нр , д 28, математико-механический факультет

С диссертацией можно ознакомиться в Научной библиотеке имени М Горькою Санкт-Петербургского государственного университета по адресу 199034, Санкт-Петербург, Университетская набережная, дом 7/9

Автореферат разослан " " 2007 г

Ученый секретарь диссертационного совета док'тор физико-математических наук,

профессор

Б К Марты йен ко

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Проблема нахождения зависимости между некоторым набором величин является одной из наиболее часто встречающихся проблем, встающих перед учеными различных специальностей Искомая зависимость может быть выведена из теории или получена на основании экспериментальных исследований Если зависимость выведена из теоретических соображений, то довольно часто она может быть представлена в аналитическом виде, заданном с точностью до нескольких неизвестных параметров. Если же в основе построения зависимости лежат экспериментальные исследования, то параметрическая зависимость постулируется При построении моделей на основе экспериментальных данных существенную роль играет оптимальный выбор условий проведения экспериментов. Математическая теория планирования регрессионных экспериментов интенсивно развивается с середины прошлого века и имеет многочисленные приложения. Большой вклад в ее развитие внесли зарубежные и отечественные ученые Дж Кифер, Дж. Вольфовиц, Дж Бокс, В В Налимов, ВВ. Федоров, Г К Круг, ЕВ. Маркова, М.В. Малютов, С.М Ермаков и другие В рамках этой теории весьма полно изучены линейные по параметрам модели При этом основное внимание уделялось планам, которые максимизируют определитель информационной матрицы Такие планы называются £>-оптимальными Во многих случаях для стандартных областей планирования (отрезок, гипершар и гиперкуб) -О-оптимальные планы найдены в явном аналитическом виде (см., например, Ермаков, Жиглявский, 1987, Федоров, 1971, Карлин, Стадден, 1976) Вместе с тем, значительный практический и теоретический интерес представляют планы, оптимальные для оценивания индивидуальных коэффициентов (е^-оптимальные планы),

а также планы, минимизирующие след дисперсионной матрицы, умноженной на некоторую заданную матрицу (L-оптимальные планы) Трудность исследования таких планов обусловлена, в частности, тем, что соответствующие им информационные матрицы часто являются вырожденными До сих пор эти планы изучены гораздо меньше, чем /^-оптимальные планы Это относится, в частности, к тригонометрической регрессионной модели, широко используемой в биологии и медицине (см , например, Currie, et al, 2000, Young, Ehrlich, 1977; Kitsos, et al 1988) Тригонометрическая модель является классической регрессионной моделью, но до недавнего времени были построены и исследованы лишь D-оптимальные планы на отрезке [—7г,7г] Недавно были проведены исследования D-, Е- и efe- планов на симметричных отрезках произвольной длины (см Dette, Mêlas, 2003), но некоторые задачи оставались не решенными Именно этим не решенным проблемам посвящена диссертация

Цель работы. Настоящая работа посвящена нахождению и исследованию efe- и i-оптимальных планов для тригонометрической регрессионной модели на интервале планирования [—тг, 7г], а также efe-оптимальных планов для этой модели на произвольном симметричном интервале планирования с помощью функционального подхода, предложенного в работе (Mêlas, 1978) и развитого в монографиях (Мелас, 1999, Mêlas, 2006).

Общая методика работы. В работе применяются методы математического анализа (теорема о неявном отображении), линейной алгебры, теории планирования регрессионных экспериментов (теоремы эквивалентности, рекуррентные формулы для вычисления разложений точек и весов плана), а также используются математические пакеты символьной обработки данных (Maple, Mathcad) для построения графиков и вычисления коэффициентов разложений неявно заданных функций в ряды Тейлора

Научная новизна. В данной работе впервые получено полное решение задачи е^-оптимального планирования для тригонометрической регрессии на интервале [—тг, ж] Впервые в ряде случаев в явном виде найдены L-оптимальные планы для этой модели Впервые предложен метод нахождения efc-оптимального плана на произвольном симметричном интервале для тригонометрической модели произвольного порядка, основанный на применении функционального подхода Кроме того, для модели третьего порядка е^-оптимальные планы на произвольном симметричном интервале найдены в явном виде

Теоретическая и практическая ценность. Теоретическая и практическая ценность результатов, полученных в диссертации, состоит в том, что они дают обоснованные ответы на вопросы оптимальной организации экспериментов с применением тригонометрической регрессионной модели. В частности, эти результаты позволяют оценить эффективность использования D-оптимальных планов в тех случаях, когда основной интерес представляют лишь один или два коэффициента модели Закономерности, найденные на примере тригонометрической модели, могут быть использованы в качестве рабочих гипотез при исследовании других регрессионных моделей, а некоторые результаты (например, теорема эквивалентности для L-критерия) применимы непосредственно к более широкому классу моделей Кроме того, оптимальные планы, построенные в диссертации, могут быть использованы в некоторых задачах биологии (например, в перекрестном анализе форм (см Curne, et al, 2000, Young, Ehrlich, 1977)) На практике (например, в задачах ритмометрии, для которых интервал планирования ограничен временным периодом циркадного ритма (см Kitsos, et. al, 1988)) часто бывает невозможно проводить измерения на полном интервале В этих случаях могут быть полезны результаты, полученные в третьей

главе

Апробация работы. Основные результаты диссертации докладывались и обсуждались на семинаре кафедры статистического моделирования математико-механического факультета СПбГУ, а также на ХХ-ой международной научной конференции (ММТТ-20) в Ярославле (май 2007).

Публикации. По теме диссертации опубликовано четыре работы, перечисленных в конце автореферата

Структура и объем диссертации. Диссертация состоит из введения, четырех глав и заключения Библиография содержит 41 наименование Общий объем работы — 119 страниц

Диссертация посвящена построению и исследованию оптимальных планов эксперимента для тригонометрической регрессионной модели

Под планом эксперимента мы будем понимать вероятностную меру £ с конечным носителем на некотором множестве х Мера £ определяется таблицей

Носитель плана £ состоит из точек, в которых проводятся наблюдения, а веса шг удовлетворяют условиям иг > 0, шг ~ 1

Задача состоит в нахождении плана эксперимента, на котором достигается экстремум (максимум или минимум) величины

где Ф — некоторая заданная функция (критерий оптимальности), М(£) — информационная матрица плана £ Для линейной по параметрам функции регрессии /Зт/(£), где /(£) = (/о(£), ,/<¿(¿0) - вектор регрессионных

СОДЕРЖАНИЕ РАБОТЫ

¿г€х, г = 1,2, ,п

функций, /3 = (/30. ; Д/)т — вектор неизвестных параметров, информационная матрица имеет вид

Как обычно, вырожденным планом будем называть план, информационная матрица которого вырожденная

Во введении кратко описаны основные результаты диссертации В первой главе дается краткий обзор основных понятий и методов теории оптимального планирования регрессионных экспериментов

Во втором параграфе этой главы формулируются базовые определения, а также рассматривается теорема Гаусса-Маркова, дающая решение задачи построения наилучшей линейной несмещенной оценки вектора параметров линейной регрессионной модели Кроме того, формулируется вариант этой теоремы для вырожденного случая (см., например, Pao, 1968).

В третьем и четвертом параграфах вводятся критерии оптимальности и эффективности планов

Основным инструментом для нахождения оптимальных планов являются теоремы эквивалентности Они устанавливают необходимые и достаточные условия оптимальности В пятом параграфе рассматриваются несколько таких теорем, использующихся в диссертации

Шестой параграф посвящен описанию исследуемой в диссертации тригонометрической регрессионной модели

В седьмом параграфе дается краткое изложение методологии функционального подхода

В главе 2 рассматривается тригонометрическая модель (модель Фурье)

y = f3Tf(t) + e, t ex,

где ¡3 = (Д), А, , /32т)т — вектор неизвестных параметров, /(i) — (l,sm t, cosí, , sm(mí),cos(mí))r = (/o(¿), ;/2mOO)T - вектор регрессионных функций, m — порядок регрессионной модели, а е — случайная величина с нулевым математическим ожиданием и положительной дисперсией а1 > О В качестве множества планирования х рассматривается интервал [—ж, 7г] Ошибки предполагаются некоррелированными

Для этой модели исследуется проблема нахождения в явном аналитическом виде планов, оптимальных для оценивания индивидуальных коэффициентов Эти планы минимизируют величину

Ф k(rf) = elM~(r])ek

на множестве всех планов г/ таких, что /3^ оцениваем для плана г/. (В последней формуле ек — единичный вектор, а М~ есть обобщенная обратная матрица для матрицы М)

Недавно в работе (Dette H and Mêlas V В , 2003) были построены планы, оптимальные для оценивания старших индивидуальных коэффициентов (точнее говоря, для коэффициентов /32/ и A¡;-i при m/3 < I < m), а также коэффициента ;30 Задача нахождения планов, оптимальных для оценивания младших индивидуальных коэффициентов (1 < I < т/3), оставалась нерешенной.

Ключевым результатом, обеспечивающим полное решение задачи, является следующая теорема

Теорема 2.2 Рассмотрим тригонометрическую регрессионную модель (*) при m > 3 и предположим, что 1 < I < т/3 (а) Пусть р = L22^] > п — Кр ~ тогда план

с' I ~tn ~tl ¿1 tn I и i\

£,21-1 = I j гДе п — КР ~ 1)J

Шп Шх Wi шп )

и = [г +

г- 1 р- 1

Ж

Шг

| 81п(7£г

г = 1,

,71

I р' 2Е"=118т(^)|

является оптимальным для оценивания параметра (Зц-х При этом значение критерия оптимальности определяется по формуле

(6) Если р = нечетпое> тогда план

йг —

2г - 1 + 2

^гг

г — 1 1 Р~ 1 + 2

-¿1

Ж

,где га = ¿(р — 1),

I оов(г«,)1

1=1,

2* р' 2£?=1|оов(^)| является оптимальным для оценивания параметра /32;, Дри этом значение критерия оптимальности определяется по формуле

**(•&) = (^¿1С08<«-)|) = (;«*(£) (с) Если р = [Щп] четное, тогда план

^21

— Ж —¿га

где та = ¿(р- 1), /л е [0,^1],

-¿2 0 ¿2 <¿>2

2(г - 1) + 2

г-1 1 р - 1 + 2

Шг

гп ж ^ £а>„ О?! — /Ху

м г = 1,

те

2/ р' г 2£?=1|сов^)| является оптимальным для оценивания параметра ¡Зц При этом значение критерия оптимальности определяется по формуле

1 X ----I /Л / ТГ \ \ ^

У* | С08(Йг)| ] = (— ССЛ ( ; \р \

ж 2р

В главе 3 рассматривается тригонометрическая модель (*) на произвольном симметричном интервале планирования х — [~а-а], 0 < а < ж Для этой модели исследуется задача нахождения планов, оптимальных для оценивания индивидуальных коэффициентов Структура оптимального плана и сложность решения зависят от значения параметра а и порядка элемента, для которого соответствующий коэффициент оценивается В некоторых случаях оптимальный план может быть найден в явном виде В общем случае нахождение плана связано с решением нелинейных систем больших размерностей

В § 3 2 на основе функционального подхода (см., например, Мелас, 1999) разработан метод, позволяющий представлять точки носителя и веса оптимального плана в виде степенных рядов по параметру а. Сложность заключается в том, что число точек носителя оптимального плана может зависеть от значения параметра а Рассмотрим набор величин 0 = < а\ < а*2 < < а* < а*+1 = тг, разбивающих отрезок (0,7г] таким образом, что при фиксированном г(0<г<р)иа€ [а*, а*+1) число точек носителя оптимального плана остается неизменным В диссертации доказано, что р может принимать значения от 0 до [4т/3] включительно В результате задача нахождения оптимального плана на интервале [—а, а], а € (0,7г] превращается в задачу нахождения значений р, ,ар и оптимальных планов на каждом из интервалов [а*, а*+1), % = 0,1 ,р, которая решается с помощью функционального подхода

Применять предложенный в § 3 2 метод для нахождения оптимального плана можно лишь при выполнении некоторых условий В § 3.3 удалось доказать, что эти условия выполнены по крайне мере для планов, оптимальных для оценивания коэффициентов /32г и 021-1 при I £ и^о > г^+т] В § 3 4 иллюстрируется работа метода на конкретном примере Решает-

ся задача нахождения плана, оптимального для оценивания коэффициента /За в тригонометрической регрессионной модели (*) четвертого порядка (т — 4) на интервале планирования [—а, а], а е (0,7г] Исследуется эффективность полученного плана по отношению к планам, обычно используемым на практике Демонстрируется, что дисперсия оценки параметра ¡Зй для данного плана примерно в 2 раза меньше, чем для стандартных планов в равноотстоящих точках

В § 3 5 найдены в явном виде планы, оптимальные для оценивания коэффициентов тригонометрической регрессионной модели (*) третьего порядка (т = 3) на интервале планирования [—а, а], а £ (0,7г]

В § 3 6 приводятся иллюстрации, демонстрирующие поведение точек и весов оптимальных планов, построенных в § 3 5 Также демонстрируется эффективность этих планов по сравнению с планами, используемыми на практике (см , например, Ермаков, Жиглявский, 1987, Федоров, 1971)

В четвертой главе исследуются ¿-оптимальные планы, которые минимизируют сумму дисперсий пар оценок коэффициентов {/32г1,32г2} и {/32}1-1, /32;2_1}, ъ\,%2 6 {0, ,т}, € {1, ,т} тригонометрической регрессионной модели (*) на интервале планирования х = В ряде случаев оптимальные планы удается найти в явном виде Основным инструментом исследования является теорема эквивалентности для ¿-оптимальных планов (теорема 4.1) Эта теорема является обобщением известной теоремы (см , например, Ермаков С М , Жиглявский А А , 1987) на случай, когда решение задачи может достигаться на вырожденном плане.

Нахождение оптимальных планов в общем случае связано с решением нелинейных систем больших размерностей. Как правило, решение таких задач не удается найти в явном виде. Однако выбор подходящей структуры множества планов, на котором ищется решение, позволяет эти задачи

существенно упростить Критериями выбора являются свойства информационной матрицы и условия оптимальности, сформулированные в теореме эквивалентности (теорема 4 1) Согласно данной теореме, проверка оптимальности обеспечивается построением экстремального многочлена

ФЛ) = f(t)M+(0LM+(0m,te [-ТГ,7Г],

где f(t) — вектор регрессионных функций модели (*), М~(£) — обобщенно обратная матрица в смысле Мура для М(£), L — некоторая неотрицательно определенная матрица соответствующей размерности Идея предложенного в главе 4 подхода заключается в том, чтобы искать оптимальные планы на множестве таких планов, для которых экстремальный многочлен tp(t, £) легко представим в явном виде. Наглядным примером такого подхода служит следующая теорема

Теорема 4.2 Рассмотрим тригонометрическую модель (*), т> 3 1. План

I —tn —tn-1 —tl tl tn \

£(2|_fj-i, 4fj-i)= I Ь 8<?e

П = 2

m

lTJ

«, = 2

n 2 n n

является Ь—оптимальным планом, минимизирующим сумму дисперсий

оценок параметров и А[§.|-1-

Причем

4[?]_1}) = ^ + | « 2 618034

Во второй части этой теоремы в явном виде указан оптимальный план, минимизирующий сумму дисперсий оценок параметров ^щ.] и

Отметим, что структура множества планов, на котором ищется оптимальный план, определяется следующими условиями Мы предполагаем,

что оптимальный план является симметричным, а его точки и веса имеют вид и = 2 [§ JI + (-l)^-1)®, Шг = г = 1, ,п,п = 2 [f J Благодаря этому предположению удается записать экстремальный многочлен в явном виде

Таким образом, нахождение оптимального плана сводится к решению уравнения = О

Использование описанного подхода позволяет в некоторых случаях находить оптимальные планы в явном виде

В заключении представлены основные результаты диссертации 1. Найдены в явном виде планы, оптимальные для оценивания младших индивидуальных коэффициентов тригонометрической регрессионной модели, точнее говоря, планы, минимизирующие дисперсию оценки параметра [Зк для случаев к — 21, к = 21 — 1, 1 < I < т/3, где т- порядок регрессионной модели

2 Исследована задача нахождения еу- оптимального плана для тригонометрической регрессионной модели на симметричном интервале планирования х = ~KaL 0 < а < ж На основе функционального подхода разработан метод, позволяющий представлять опорные точки и веса оптимального плана в виде степенных рядов по параметру а

3 Исследованы аналитические свойства опорных точек и весов оптимальных планов как неявно заданных функций от длины интервала

4 Найдены в явном виде планы, оптимальные для оценивания индивидуальных коэффициентов тригонометрической регрессионной модели третьего порядка на симметричном интервале планирования х — ~ [°> aL 0 < а < тг Исследована эффективность этих планов

5 Построены в явном виде L—оптимальные планы, минимизирующие сумму дисперсий оценок коэффициентов {Дгц, Дг^} и {023l-i-, i%2-i} тригонометрической регрессионной модели для некоторого множества индексов Ч, г2- Ji, 32, зависящего от порядка модели.

Список литературы

[1] Ермаков С М, Жиглявский А А Математическая теория оптимального эксперимента М , Из-во Наука, 1987

[2] Карлин С, Стадден В Чебышевские системы и их применение в анализе и статистике. М , 1976.

[3] Мелис В Б Общая теория функционального подхода к оптимальному планированию эксперимента Из-во СПбГУ, 1999

[4] Рао С.Р Линейные статистические методы и их применения М , 1968.

[5] Федоров В В Теория оптимального эксперимента М , Из-во Наука, 1971

[6] Сите A J, Ganeshanandam S, Noitton D A , Gamck D, Shelbourne С J A., Oragguzie N Quantiative evalution of apple (Malus x domestica Borkh.) fruit shape by prmicple component analysis of Fourier descriptors. Euphytica 111, 219-227, 2000

[7] Dette H and Melas VB Optimal designs for estimating individual coefficients in Fourier regression models The Annals of Statistics 31, 16691692, 2003.

[8] Kits os С P , Tittenngton D M., Torsney В An optimal design problem m rhythmometry Biometrics 44, 657-671, 1988

[9] Melas V.B. Optimal designs for exponetial regression Math Opeiations forsli Statist Ser Statisics 9, 45-59, 1978

[10] Melas V В Functional approach to experimental optimal design Lecture Notes m Statistics, vol 184 Heidelber Springer, 2006

[11] Young, JC, Ehrhch, Л Fourier biometrics harmonic amplitudes as multivariate shape descriptors Systematic Zoology 26, 336-342 1977

Список публикаций автора

[12] Шпилев П В. L-оптимальные планы в тригонометрической регрессионной модели на полном интервале планирования Вестн С -Петербург ун-та, СПб , Изд СПбГУ, серия 1, вып 2, с 80-89, 2007

[13] Шпилев П В. Метод численного нахождения оптимальных планов в тригонометрической регрессии на симметричных отрезках с 212-214 сб трудов XX Между нар науч конф В 10 т Т 1 Секция 1 / под общ ред В С Балакирева - Ярославль Изд-во Яросл гос техн ун-та, 2007

[14] Шпилев П.В Оптимальные планы в тригонометрической регрессионной модели на симметричных отрезках // Математические модели Теория и приложения / Под ред М К Чиркова СПб, Изд-во НИИХ СПбГУ, с 47-77, 2007

[15] Dette Н, Melas V,B and Shpilev P V Optimal designs for estimating the coefficients of the lowei frequencies m trigonometric regiession models Preprint, Ruhr-Univ Bochum, pp 22, 2005

Отпечатано копировально-множительным участком отдела обслуживания учебного процесса физического факультета СПбГУ. Приказ № 571/1 от 14.05.03. Подписано в печать 23.08.07 с оригинал-макета заказчика. Ф-т 30x42/4, Усл. печ. л. 1. Тираж 100 экз., Заказ № 563/с 198504, СПб, Ст. Петергоф, ул. Ульяновская, д. 3, тел. 929-43-00.

Оглавление автор диссертации — кандидата физико-математических наук Шпилев, Петр Валерьевич

Введение 2

1 ОБЗОР ОСНОВНЫХ ПОНЯТИЙ 12

1.1 Планирование эксперимента.12

1.2 Основные понятия.14

1.3 Критерии оптимальности .20

1.4 Критерии эффективности.22

1.5 Теоремы эквивалентности.23

1.6 Тригонометрическая регрессионная модель . 26

1.7 Функциональный подход к планированию эксперимента .29

2 е^-ОПТИМАЛЬНЫЕ ПЛАНЫ НА ПОЛНОМ ИНТЕРВАЛЕ ПЛАНИРОВАНИЯ 32

Введение 32

2.1 Постановка задачи.34

2.2 Планы, оптимальные для оценивания младших индивидуальных коэффициентов.35

2.3 Примеры.46

3 е^-ОПТИМАЛЬНЫЕ ПЛАНЫ НА НЕПОЛНОМ ИНТЕРВАЛЕ ПЛАНИРОВАНИЯ 54

Введение 54

3.1 Постановка задачи.56

3.2 Метод численного нахождения оптимальных планов .59

3.3 Условия применимости метода.63

3.4 Пример нахождения оптимального плана с помощью численного метода.71

3.5 Оптимальные планы в тригонометрической модели третьего порядка.76

4 L-оптимальные планы на полном интервале планирования 91

Введение 91

4.1 Постановка задачи.92

4.2 L—оптимальные планы в тригонометрической модели произвольного порядка. Примеры. 97

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Шпилев, Петр Валерьевич

набором величин является одной из наиболее часто встречающихся проблем, встающих перед учеными различных специальностей. Искомая зависимость может быть выведена из теории или получена на основании экспериментальных исследований. Если зависимость выведена из теоретических соображений, то довольно часто отта может быть представлена в аналитическом виде, заданном с точностью до нескольких неизвестных параметров. Если же в основе построения зависимости лежат экспериментальные исследования, то параметрическая зависимость постулируется. При построении моделей на основе экспериментальных данных существенную роль играет оптимальный выбор условий проведения экспериментов. Математическая теория планирования регрессионных экспериментов интенсивно развивается с середины прошлого века и имеет многочисленные приложения. Большой вклад в ее развитие внесли зарубежные и отечественные ученые Дж. Кифер, Дж. Вольфовиц, Дж. Бокс, В.В. Налимов, В.В. Федоров, Г.К. Круг. Е.В. Маркова, М.Б. Малютов, С.М. Ермаков и другие. В рамках этой теории весьма полно изучены линейные по параметрам модели. Мри этом основное внимание уделялось планам, которые максимизируют определитель информационной матрицы. Такие планы называются D-оптимальными. Во многих случаях для стандартных областей планирования (отрезок, гипершар и гиперкуб) /^-оптимальные планы найдены в явном аналитическом виде (см. например, Ермаков, 1983; Ермаков, Жиглявский, 1987; Федоров, 1971; Карлин, Стадден, 1976). Вместе с тем, значительный практический и теоретический интерес представляют планы, оптимальные для оценивания индивидуальных коэффициентов (е^-оптимальные планы), а также планы минимизирующие след дисперсионной матрицы, умноженный на некоторую заданную матрицу (L-оптимальные планы). Трудность исследования таких штанов обусловлена, в частности, тем, что соответствующие им информационные матрицы часто являются вырожденными. До сих пор эти планы оставались изученными гораздо меньше, чем D-оптимальные планы. Это относится, в частности, к тригонометрической регрессионной модели, широко используемой в биологии и медицине (см., например, Currie, et. al., 2000; Young, Ehrlich, 1977; Kitsos, et. al. 1988).

Настоящая работа посвящена нахождению в явном аналитическом виде efc-оптимальных планов и вырожденных L- оптимальных планов для тригонометрической регрессионной модели на полном интервале планирования, а также нахождению е^-оптимальных планов для этой модели на произвольном симметричном интервале планирования с помощью функционального подхода, предложенного в работе (Melas, 1978).

Под планом эксперимента мы будем понимать вероятностную меру £ с конечным носителем на некотором множестве х- Мера £ определяется таблицей

Носитель плана £ состоит из точек, в которых проводятся наблюдения, а веса uJi удовлетворяют условиям шг > 0, Хл-i = 13

Задача состоит в нахождении плана эксперимента, на котором достигается экстремум (максимум или минимум) величины

Ф (М(0), где Ф— некоторая заданная функция (критерий оптимальности), М(£) — информационная матрица плана Для линейной по параметрам функции регрессии fiTf(t), где f(t) = {fo(t)1 ■ ■ ■, fd(t)) — вектор регрессионных функций, /3 = (Д),. ,Pd)T — вектор неизвестных параметров, информационная матрица имеет вид

М(0 = (£f(tk)f(tk)ukj ■

Как обычно, вырожденным планом будем называть план, информационная матрица которого вырожденная.

В первой главе дается краткий обзор основных понятий и методов теории оптимального планирования регрессионных экспериментов.

Во втором параграфе этой главы формулируются базовые определения. А также рассматривается теорема Гаусса,-Маркова, дающая решение задачи построения наилучшей линейной несмещенной оценки вектора параметров линейной регрессионной модели. Кроме того, формулируется вариант этой теоремы для вырожденного случая (см., например, Рао, 1968).

В третьем и четвертом параграфах вводятся критерии оптимальности и эффективности планов.

Основным инструментом для нахождения оптимальных планов являются теоремы эквивалентности. Они устанавливают необходимые и достаточные условия оптимальности. В пятом параграфе рассматриваются несколько таких теорем, использующихся в диссертации.

Шестой параграф посвящен описанию исследуемой в диссертации тригонометрической регрессионной модели.

В седьмом параграфе дается краткое изложение методологии функционального подхода.

В главе 2 рассматривается тригонометрическая модель (модель Фурье) у = f№ + e,te х, где (5 — (Дь А, • • •, р2т)т - вектор неизвестных параметров, /(/) = (l,sin t, cos f,., sin(mt)1cos(mt))1 — {fo(t),., f2m{t))1 — вектор регрессионных функций, m — порядок регрессионной модели, а е — случайная величина с нулевым математическим ожиданием и положительной дисперсией а2 > 0. В качестве множества планирования х рассматривается интервал [—я", 7г].

Для этой модели исследуется проблема нахождения в явном аналитическом виде планов, оптимальных для оценивания индивидуальных коэффициентов. Эти планы минимизируют величину

Ф kiv) = cTkM~{ri)ek на множестве всех планов г] таких, что /Зк оцениваем для плана г/. (В последней формуле е^ — единичный вектор, а М~ есть обобщенная обратная матрица для матрицы М).

Недавно в работе (Dette Н. and Melas V.B., 2003) были построены планы, оптимальные для оценивания старших индивидуальных коэффициентов точнее говоря, для коэффициентов /3% и foi-i ПРИ ш/Ъ < I < т), а также коэффициента Д). Задача нахождения планов, оптимальных для оценивания младших индивидуальных коэффициентов (1 < I < т/3), оставалась нерешенной.

Ключевым результатом, обеспечивающим полное решение задачи, является следующая теорема.

Теорема 2.2 Рассмотрим тригонометрическую регрессионную модель (*) при т > 3 и предположим, что 1 < I < т/3. (а) Пусть р = \т^г\, п = l(p— 1), тогда план

-1 — ti—\i + tn . —ti ti . tr где n = l(p - 1),

Mn i-l p- 1

U) 1 и I . . . U)r,

7Г l-V 2E;=1|sin(/^)| является оптимальным для оценивания па,рам,em,pa foi-i- При этом значение критерия оптимальности определяется по формуле ib) Если р — нечетное, тогда план sin (Iti г, Z = 1, . ,72

2/

2г - 1 + 2 tn

UJn ••• i-l 1 р- 1 + 2

-U U

Uli LOi 7Г п

Wj = где п = l(p—l), \cos{lti)\

21-P' 2EL|cos(^)| г = 1,.,72 является оптимальным для оценивания параметра (Зц. При этом значение критерия оптимальности определяется по формуле с) Если р = четное, тогда план где n — l{p- 1), //€ [0,wi], U = (2 (г - 1) + 2 г-1 1 р-1 + 2

0 t-2 . tn 7Г

0>2 0^1 0/2 • • • Wl - ц

7Г |C0S(^)| .

2/-Р'^"гЕ^ксйадГ является оптимальным для оценивания параметра При этом значение критерия оптимальности определяется по формуле

В главе 3 рассматривается тригонометрическая модель (*) на произвольном симметричном интервале планирования х = ■ft?ft]> 0 < а < 7Г. Для этой модели исследуется задача, нахождения планов, оптимальных для оценивания индивидуальных коэффициентов. Структура оптимального плана и сложность решения зависят от значения параметра а и порядка элемента, для которого соответствующий коэффициент оценивается. В некоторых случаях оптимальный план может быть найден в явном виде. В общем случае нахождение плана связано с решением нелинейных систем больших размерностей.

В § 3.2 на основе функционального подхода (см., например, Мелас, 1999) разработан метод, позволяющий представлять точки носителя и веса оптимального плана в виде степенных рядов по параметру а. Сложность заключается в том, что число точек носителя оптимального плана может зависеть от значения параметра а. Для определенности рассмотрим набор величин 0 = Oq < ai < °2 < • • • < ар < ap+i = 71! разбивающих отрезок (0,7г] на р +1 частей; р-некоторое целое число, зависящее от номера оцениваемого коэффициента. В диссертации доказано, что р может принимать значения от 0 до [4m/3j включительно. При фиксированном г (0 < г < р) и а € [a*,a*i+l) число точек носителя оптимального плана остается неизменным. При увеличении % число точек носителя уменьшается. В результате задача нахождения оптимального плана на интервале [—a,a], a £ (0,7г] превращается в задачу нахождения совокупности планов на каждом из интервалов [а*, а*+1), % — 0,1.

Применять предложенный в § 3.2 метод для нахождения оптимального плана можно лишь при выполнении некоторых условий. В § 3.3 удалось доказать, что эти условия выполнены по крайне мере для планов, оптимальных для оценивания коэффициентов fyi и lhi-i при т + 2 то 2r + 2'2r+ 1 '

В § 3.4 иллюстрируется работа метода на конкретном примере. Решается задача нахождения плана, оптимального для оценивания коэффициента в тригонометрической регрессионной модели (*) четвертого порядка (т — 4) на интервале планирования [—a, a], a € (0,7г]. Исследуется эффекeU тивность полученного плана но отношению к планам, обычно используемым на практике. Демонстрируется, что дисперсия оценки параметра для данного клана примерно в 2 раза меньше, чем для стандартных планов в равноотстоящих точках.

В § 3.5 найдены в явном виде планы, оптимальные для оценивания коэффициентов тригонометрической регрессионной модели (*) третьего порядка (то = 3) на интервале планирования [—а, а], а 6 (0,7г].

В § З.б приводятся иллюстрации, демонстрирующие поведение точек и весов оптимальных планов, построенных в § 3.5. Также демонстрируется эффективность этих планов по сравнению с планами, используемыми на практике (см., например, Ермаков, 1983; Федоров. 1971).

В четвертой главе исследуются вырожденные L-оптимальные планы. То есть планы, минимизирующие сумму дисперсий пар оценок коэффициентов {I32il,p2i2} и {fkh-hfoh-x}, h,i2 е {0,., то}, jhj2 е {1,., то} тригонометрической регрессионной модели (*) на интервале планирования X = [—7Г, 7г]. В ряде случаев оптимальные планы удается найти в явном виде. Основным инструментом исследования является обобщенный вариант теоремы эквивалентности для L-оптималытых планов (теорема 4.1). Ее аналог для невырожденных планов можно найти в работе (Ермаков С.М., Жиглявский А.А., 1987).

Нахождение оптимальных планов в явном виде в общем случае связано с решением нелинейных систем больших размерностей. Как правило, решение таких задач не удается найти в явном виде. Однако выбор подходящей структуры множества планов, на котором ищется решение, позволяет эти задачи существенно упрости ть. Критериями выбора являются свойства информационной матрицы и условия оптимальности, сформулированные в теореме эквивалентности ( георема 4.1). Согласно данной теореме, проверка оптимальности напрямую связана с построением экстремального полинома fT(t)M+(0LM40f(t),te [ 7г,7г], где f(t) — вектор регрессионных функций модели (*), М+(£) — обобщенно обратная в смысле Мура матрица к М(£), L — некоторая неотрицательно определенная матрица соответствующей размерности. Идея предложенного в главе 4 подхода заключается в том, чтобы искать оптимальные планы на множестве таких планов, для которых экстремальный полином ip(t, £) легко представим в явном виде.

Наглядным примером такого подхода служит следующая теорема Теорема 4.2 Рассмотрим тригонометрическую модель (*), т> 3. 1. План

2[fJ-l,4f|-l) = tn Ln—l • ■ • 11 • • • tr. где у шп Шп~] . ш 1 UJi . Ш' я m г 7Г U = 2

Л. 7 2 n п = 2 ^ , (, = 2 , ^+ (-!)<'-»,, Ы( = 1 x =

2 п п является L—оптимальным планом,, минимизируюищм сумм,у дисперсий оценок параметров /^[fj-i и Д*LfJ-i

Причем trLM+(emh 4f j1}) = ^ + 2 « 2.618034.

Во второй части этой теоремы в явном виде указан оптимальный план, минимизирующий сумму дисперсий оценок параметров и A[fJ

Отметим, что структура множества планов, на котором ищется оптимальный план, определяется следующими условиями. Мы предполагаем, что оптимальный план является симметричным, а его точки и веса имеют вид и = 2 [ij I + (-1)0-%, ид = г = 1,., п, п = 2 [f J . Благодаря этому предположению удается записать экстремальный полином в явном виде

Таким образом, нахождение оптимального плана сводится к решению уравнения относительно х ^\t=x = О

Использование описанного подхода позволяет в некоторых случаях находить оптимальные планы в явном виде.

В заключении представлены основные результаты диссертации.

Заключение диссертация на тему "Аналитические методы построения оптимальных планов эксперимента"

Заключение

Сформулируем основные результаты диссертации.

1. Найдены в явном виде планы, оптимальные для оценивания младших индивидуальных коэффициентов тригонометрической регрессионной модели. То есть планы, минимизирующие дисперсию оценки параметра (Зк для случаев к = 21, к = 2/ -1, 1 <1 < т/3, где т- порядок регрессионной модели.

2. Исследована задача нахождения оптимального плана для тригонометрической регрессионной модели тта симметричном интервале планирования х = ~[а)а]? 0 < а < 7Г. На основе функционального подхода разработан метод, позволяющий представлять точки носителя и веса оптимального плана в виде степенных рядов по параметру а. i

3. Исследованы аналитические свойства точек и весов оптимальных планов как неявно заданных функций от длинны интервала.

4. Найдены в явном виде планы, оптимальные для оценивания индивидуальных коэффициентов тригонометрической регрессионной модели третьего порядка на симметричном интервале планирования х — ~ Ка]> 0 < а < 7Г. Исследована эффективность этих планов.

5. Построены в явном виде L—оптимальные планы, минимизирующие сумму дисперсий оценок коэффициентов {j3)u, /^г2} и {/^-i, 1} тригонометрической регрессионной модели для некоторого множества индексов i\, %2, ji, j2> зависящего от порядка модели.

Библиография Шпилев, Петр Валерьевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Ганншг P., Росси X. Аналитические функции многих комплексных переменных. М., Мир, 1969.

2. Ермаков С.М. Математическая теория планирования эксперимента. М., Из-во Наука, 1983.

3. Ермаков С.М., Жиглявский А.А. Математическая теория оп тимального эксперимента. М., Из-во Наука, 1987.

4. Карлш С., Стаддем В. Чебыптевские системы и их применение в анализе и статистике. М., 1976.

5. Мелас В.Б. Оптимальное планирование эксперимента для экспоненциальной регрессии // Математические методы планирования эксперимента. Новосибирск. М., Из-во Наука. 1981.

6. Мелас В.Б. Е— оптимальные планы эксперимента. Из-во СПбГУ, 1997.

7. Мелас В.Б. Общая теория функционального подхода к оптимальному планированию эксперимента. Из-во СПбГУ, 1999.

8. Мелас В.Б., Пепелышев А.Н. Планы для оценивания точки экстремума многомерной квадратичной функции регрессии, j j Проблемы oriтимизации дискретных систем ,/ Под ред. М.К. Чиркова. СПб. Изд-во НИИХ СПбГУ, с. 70-86, 2001.

9. Рао С.Р. Линейные статистические методы и их применения. М., 1968.

10. Сеге Г. Ортогональные многочлены. М., Из-во Наука, 1962.

11. И. Федоров В.В. Теория оптимального эксперимента. М., Из-во Наука, 1971.

12. Федоров В.В. Планирование при нелинейной зависимост и поверхности отклика от оцениваемых параметров. М., Из-во МГУ, 1971.

13. Шпилев II.В. Оптимальные планы в тригонометрической регрессионной модели на симметричных отрезках, j j Математические модели. Теория и приложения / Под ред. М.К. Чиркова. СПб, Изд-во НИИХ СПбГУ, с. 47-77, 2007.

14. Шпилев II.В. L-оптимальные планы в тригонометрической регрессионной модели на полном интервале планирования, j j Вестн. С.Петербург. ун-та, СПб., Изд. СПбГУ. серия 1, вып. 2. с. 80-89, 2007.

15. Currie A.J., Ganeshanandam S., Noition D.A., Gar-rick D., Shelbourne C.J.A., Oragguzie N. Quantiative evalution of apple (Mains x domestica Borkh.) fruit, shape by prinicple component analysis of Fourier descriptors. Euphytica 111, pp. 219-227, 2000.

16. Dette H., Haller G. Optimal Designs for the Identification of the Order of a Fourier Regression. The Annals of Statistics, Vol. 26, pp. 1496-1521, 1998.

17. Dette #., Melas V.B. E-optimal designs in Fourier regression models on a partial circle. Mathematical Methods of Statistics 11, e 3, pp. 259-296, 2002.

18. Dette H. and Melas V.B. Optimal designs for estimating individual coefficients in Fourier regression models. The Annals of Statistics, Vol. 31, pp. 1669-1692, 2003.

19. Dette H., Melas V.B. and Pepelyshev A. D-optimal designs for trigonometric regression models on a partial circle. Annals of the Institute of Statistical Mathematics, vol. 54, N 4, pp. 945-959, 2002

20. Dette H., Melas V.B. and Pepelyshev A. Optimal designs for estimating individual coefficient in polynomial regression a functional approach. Journal of Statistical Planning and Inference 118, pp. 201-219, 2004.

21. Dette H. Melas V.B. and Shpilev P.V. Optimal designs for estimating the coefficients of the lower frequencies in trigonometric regression models. Preprint, Ruhr-Univ. Bochum. pp. 22, 2005.

22. Eubank, R. Nonparametric regression and spline smoothing. 2nd ed. New York: Marcel Dekker, 1999.

23. Fisher R. The Desidn of Experiments. London: Oliver Boud, 1935.

24. Graybill F.A. Theory and application of the linear model. Wadsworth, Belmont CA, 1976.

25. Hoel P. Minimax design in two-dimensional regression. Ann. Math. Statist. 36, pp. 1097-1106, 1965.

26. Kiefer J. C. General equivalence theory for optimum designs (approximate theory). The Annals of Statistics 2, pp. 849-879, 1974.

27. Kiefer J., Wolfowitz J. Optimum designs in regression problems. Ann. Math. Statist. 36, pp. 271-294, 1959.

28. Kiefer JWolfowitz J. The equivalence of two extremurn problems. Canad. J. Math. Vol. 14, pp. 363-366. 1960.

29. Kitsos С.Р., Titterington D.M., Torsney B. An optimal design problem in rhythmometry. Biometrics 44, pp. 657-671, 1988.

30. Lestrel P.E. Fourier descriptors and their applications in biology. Cambridge: Cambridge University Press, 1997.

31. Lau T.S., Studden W.J. Optimal designs for trigonometric and polynomial regression. Ann. Statist, 13, pp. 383-394, 1985.

32. Mardia K. The statistics of directional data. Academic Press, New York, 1972.

33. McCool, J.I. . Systematic and random errors in least squares estimation for circular contours. Precision Engineering 1, pp. 215-220, 1979.

34. Melas V.B. Optimal designs for exponetial regression. Math. Operations forsh. Statist. Ser. Statisics 9, pp. 45-59, 1978.

35. Melas V.B. Functional approach to experimental optimal design. Heidelber. Springer, 2006

36. Pukelsheim F. Optimal Design of Experiments. Wiley, New York, 1993.

37. Riccomagno E., Schwabe R., Wynn И.Р. Lattice-based D-optimal design for Fourier regression. Ann. Statist. 25, pp. 2313-2327, 1997.

38. Shi P., Fang K.-T., Tsai C.-L. Optimal multi-criteria designs for Fourier regression models. Journal of Statistical Planning and Inference, Vol. 96, pp. 387-401, 2001.

39. Weber W.E., Liebig H.P. Fitting response functions to observerd data. Electronische Datenverarbeitung in Medizin und Biologie 12, pp. 88-92, 1981.

40. Young, J.C., Ehrlich, R. Fourier biometrics: harmonic amplitudes as multivariate shape descriptors. Systematic Zoology 26, pp. 336-342. 1977.