автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Исследование е-оптимальных планов регрессивных экспериментов

кандидата физико-математических наук
Крылова, Людмила Анатольевна
город
Санкт-Петербург
год
2000
специальность ВАК РФ
05.13.18
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование е-оптимальных планов регрессивных экспериментов»

Автореферат диссертации по теме "Исследование е-оптимальных планов регрессивных экспериментов"

Санкт-Петербургский государственный университет

На правах рукописи

Крылова Людмила Анатольевна

РГБ ОД

2 2 МАЙ 200П

ИССЛЕДОВАНИЕ Е-ОПТИМАЛЬНЫХ ПЛАНОВ РЕГРЕССИОННЫХ ЭКСПЕРИМЕНТОВ

05.13.18 — теоретические основы математического моделирования, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург 2000

Работа выполнена на кафедре статистического моделирования Санкт-Петербургского государственного университета.

Научный руководитель -доктор физико-математических наук В.Б.Мелас

Официальные оппоненты: доктор физико-математических наук, профессор Е.В.Седунов, кандидат физико-математических наук, доцент В.М.Буре.

Ведущая организация -Санкт-Петербургский государственный технический университет.

Защита состоится " Ь " июня 2000 г. б .Ш. часов на заседании диссертационного совета Д 063.57.52 по защите диссертаций на соискание ученой степени доктора наук в Санкт-Петербургском государственном университете по адресу: 198904, Санкт-Петербург, Старый Петергоф, Библиотечная площадь, 2, математико-механический факультет.

С диссертацией можно ознакомиться в Научной библиотеке им. М.Горького Санкт-Петербургского государственного университета по адресу: 199164, Санкт-Петербург, Университетская наб., д. 7/9.

Автореферат разослан 2000 г.

Ученый секретарь

диссертационного совета,

доктор физ.-мат. наук И.К.Даугавет

В-/?Л. 4, 03

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

АКТУАЛЬНОСТЬ ТЕМЫ. При математическом моделировании объектов и систем различной природы важную роль играют регрессионные модели. Теория планирования и анализа регрессионных экспериментов была развита во второй половине XX века усилиями многих зарубежных и отечественных ученых (Дж. Элвинг, Г.Чернов, Дж. Ки-фер, Дж. Вольфовиц, В.В. Налимов, В.В. Федоров, С.М. Ермаков, М.Б. Малютов и др.). В рамках этой теории наиболее полно были изучены D-оптимальные планы эксперимента, т.е. планы, максимизирующие определитель информационной матрицы. Вместе с тем, значительный интерес представляют также Е-оптимальные планы, максимизирующие минимальное собственное число такой матрицы. Однако, несмотря на целый ряд работ, посвященных этому критерию, для классической модели полиномиальной регрессии на отрезке вид Е-оптимальных планов установлен лишь для некоторых типов отрезков. Изучению этой модели и посвящена настоящая работа. Используемый в ней подход состоит в исследовании точек и весов оптимальных планов как функций длины отрезка. В работе (В.Б. Мелас. Е-оптпималъные планы эксперимента, С.-Петербург, Изд-оо С.-Петерб. ун-та, 1997) было установлено, что эти функции являются аналитическими для случая симметричных отрезков достаточно большой длины, что позволяет разложить их в ряд по обратным степеням длины. Построение таких разложений и является основной задачей диссертации.

ЦЕЛЬ РАБОТЫ. Цель работы состоит в построении и исследовании разложения в степенные ряды точек и весов Е-оптимальных планов, рассматриваемых как функции длины отрезка.

МЕТОДЫ ИССЛЕДОВАНИЯ. В работе применяются методы математического анализа (теорема о неявном отображении, многочлены Чебышева), линейной алгебры, теории планирования регрессивных экспериментов (теорема двойственности для Е-критерия), а также используются пакеты символьной обработки данных (Maple и Mathcacl) для вычисления коэффициентов степенных разложений неявно заданных функций.

НАУЧНАЯ НОВИЗНА. Впервые построены степенные разложения точек и весов Е-оптимальных планов, рассматриваемых как функции длины отрезка. Это позволяет для некоторого множества отрезков находить Е-оптимальные планы с лю'бой наперед заданной степенью точности.

ТЕОРЕТИЧЕСКАЯ И ПРАКТИЧЕСКАЯ ЦЕННОСТЬ. Разработаны методы, основанные на использовании пакетов символьной обработки данных, для разложения точек и весов оптимальных планов эксперимента в степенные ряды. Эти методы могут быть использованы для изучения оптимальных планов эксперимента для широкого класса достаточно гладких моделей и различных критериев оптимальности, представимых в виде функций от информационных матриц. Развитый подход позволяет вычислять точки и веса оптимальных планов с наперед заданной точностью. Полученные результаты могут быть использованы в практике экспериментальных исследований.

АПРОБАЦИЯ РАБОТЫ. Основные результаты диссертации докладывались и обсуждались на семинаре кафедры статистического моделирования математико-механического факультета СПбГУ, а также на 3-ем международном Санкт-Пегербургском семинаре по стохастическому моделированию (июнь 1998).

Работа над диссертацией была поддержана грантом правительства Санкт-Петербурга для молодых ученых и аспирантов, а также грантом РФФИ (Ш 96-01-00644, 98-01-00347).

ПУБЛИКАЦИИ. По теме диссертации опубликовано три статьи [1]-[3].

СТРУКТУРА И ОБЪЕМ ДИССЕРТАЦИИ. Диссертация состоит из введения, четырех глав и заключения. Библиография содержит 30 наименований. Общий объем работы — 91 страница.

СОДЕРЖАНИЕ РАБОТЫ

Диссертация посвящена исследованию Е-оптимальных планов эксперимента для полиномиальной регрессии на отрезке.

Планом эксперимента называется дискретная вероятностная мера, задаваемая таблицей

п

где Х{ ф Xj (г ф j) — точки некоторого множества X, /i,- > О, ]П ¿t,- = 1.

1=1

Задача состоит в нахождении плана эксперимента, максимизирующего величину

WM(0),

где Лт;„ (М) — минимальное собственное число матрицы Л/,

М(£) — информационная матрица:

M{i)=(YJfi{xi)fJ{xl)l^ , \i=i / ,,j=i

fi(x) — xt_1, i = 1,2, ...,ш, Л" = [г1,гг], ri < Г2 — произвольные вещественные числа. Без ограничения общности можно считать, что Г! < Х\ < ■ • ■ < хи < г2.

Во Введении кратко описаны основные результаты диссертации.

В главе 1 дается обзор предшествующих результатов. Первой работой по рассматриваемой проблеме была статья (Ковригин А.Б. Построение Е-оптимальных планов. Деп. в ВИНИТИ, N 3544-79 от 11 окпг. 1979). В этой статье было получено решение задачи для отрез-коп, являющихся подмножествами отрезка [—1,1]. Было показано, что в этом случае существует единственный Е-оптимальный план, причем п = т. Точки этого плана могут быть получены линейным преобразованием х —»■ (rj +Г2)/2 + (?'2 —г\)х/2 экстремальных точек многочлена Чебышева 1-го рода. Для весов Е-оптнмального плана (ц\,..., //т) было введено линейное уравнение, которое позволяет их вычислять (при уже известных точках плана). План, вычисляемый описанным способом, мы будем в дальнейшем называть чебышевским планом. В работе (Heligers В. E-optimal polynomial regression designs. Aahen, 1991) для случая знакоопределенных отрезков (rjr2 > 0) и симметричных

отрезков достаточно малой длины было показано, что чебышевский план является единственным Е-оптимальным планом. Вместе с тем было установлено, что для симметричных отрезков достаточно большой длины чебышевский план не мож'ет быть Е-оптимальным.

Дальнейшие результаты были получены в работе научного руководителя (Мелас, 1997). Для случая ш = 2 и произвольных гх, г2 Е-онтимальные планы были найдены в явном виде. Для то > 2 было показано, что решение задачи единственно и Е-оптимальный план включает п = т точек, две из которых совпадают с концами отрезка. Для симметричных отрезков достаточно большой длины был разработан подход, основанный на изучении точек и весов плана как функций длины отрезка. Идея этого подхода состоит во введении системы уравнений, которая определяет эти функции неявным образом. Выяснено, что для промежутков достаточно большой длины эти функции являются аналитическими.

Основной задачей диссертации является построение и исследование разложения этих функций в ряды Тейлора по обратным степеням длины отрезка.

Обозначим единственный Е-оптимальный план через

Пусть М = М(е), А* = Ат1п(М(Г)), X = [-г,г].

В.Б. Меласом было установлено, что для достаточно больших г минимальное собственное число матрицы М (£*) имеет кратность 2 и существует пара векторов и д таких, что

Мр = А*р, Мд = А*д,

171-1

(1) А* + -у(х2 - г2) Д (х - х*)2 = (рТНх))2 + (дтНх))2,

¿=2

где /т(х) = (Л (*)>••■» /т(®)) = (1, х,..., х™"1), 7 > 0.

Исследования диссертации основаны на различных преобразованиях этих уравнений.

Глава 2 посвящена исследованию Е-оптимальных планов для полиномиальной регрессии на симметричном промежутке для случая мно-

гочленов второй и третьей степени (ш = 3, 4). Для многочленов второй степени на симметричном промежутке произвольной длины получено аналитическое решение задачи.

Теорема 2.1.1. В случае т = 3, X = [—г, г] Е-оптгшальный план умеет вид

при г < у/2

- г1

г2 - 1 ъ /о

г4 г2 - 1

Л первом случае А* = --7, во втором А* = —-—•

4 + г4 гг

Для многочленов третьей степени показано, что чебышевский план является Е-оптимальным тогда и только тогда, когда г < г*, где г* на у/2.62 есть единственное положительное решение следующего уравнения

3г10 - 11г8 + ЗОг6 - бОг4 + 32г2 - 64 = 0. При г > г* Е-оптимальный план может быть записан в виде

Г /- г 1 - Ц [г (I 1 -/л\ |-г, -г^, г^, г; —, , , — |,

где 0<о<1, 0<р<1. Кроме того, имеет место уравнение

А* + 7(у - 1/г)(у - а/г)2 = ¿¡(у - Ь)2 + 7у(г/ - <*)2, где 7 > 0.

Найдены явные формулы, позволяющие рекуррентно вычислять коэффициенты разложения в ряд Тейлора величин а, г1, Ь, рассматриваемых как функции величины 2 = — в окрестности нуля. С помощью

г-

этих формул получена таблица коэффициентов разложений величин а, (I, Ь, А* и ¡1 в ряды по степеням г в окрестности нуля (табл. 1).

Таблица 1. Коэффициенты разложений а, b, d, /х, Л*.

п 0 1 2 3 4 5 6 7 8 9 10

а 0 1 -1 0 1 -2 б -13 11 58 -350

Ь 0.5 0 0 -1 2.5 -3 -1.5 26 -94.5 186 -17

d 1 -1 2 -5 8 -4 -31 147 -362 348 1464

ß 1 -1 2 -1 0 -8 38 -78 -2 579 -2064

А* 1 -4 8 -8 -4 24 -8 -132 404 -364 -1328

Эффективность планов, построенных с помощью этих разложений, исследована численными методами в главе 3. Пусть — план, построенный на основе п коэффициентов разложений из табл. 1, п = 0,1, 2,____ О качестве этого плана можно сделать вывод с помощью неравенств

Aj = Amin(M(£(n))) < А* < omax дп(у) = Л2,

где дп(у) — многочлен, коэффициенты которого можно вычислить через собственные векторы матрицы М(£(«))• Значения Ai и Аг для различных zun приведены в табл. 2.

Таблица 2. Эффективность планов (т = 4).

г п Aj А2

0,01 1 0,96010 0,96117

0,01 2 0,96079 0,96081

0,01 3 0,96079 0,96079

0,15 3 0,55219 0,56539

0,15 5 0,55247 0,55302

0,15 10 0,55257 0,55257

0,25 3 0,37407 0,46476

0,25 5 0,37403 0,38293

0,25 10 0,37705 0,37744

0,25 20 0,37721 0,37726

0,25 30 0,37722 0,37722

Проведенное исследование показывает, что разработанный метод

позволяет вычислять параметры а и с высокой точностью. Однако этот метод не пригоден для случая т > 4.

В главе 3 разработан общий метод разложения в ряды Тейлора точек и весов Е-оптимальных планов, рассматриваемых как функции 1 ^

величины 2 = -т-. Этот метод пригоден для многочленов произвольной гг

степени.

Заметим, что точки Е-оптимального плана (при X = [—г, г]) расположены симметрично относительно нуля (Мелас, 1997). Ограничим рассмотрение случаем т — 2к + 1, к = 1,2,... (случай т = 2к имеет некоторые особенности, но исследуется аналогичным образом).

Имеем -х? = х*к+2_{, ц*{ = ^2к+2_{, х = 1, = 0, =

1 - 2 Е рц. ¿=1

Положим у{ = (х*{+к+1)2, щ = 2ц*{+к+1,1 = 1,...,к. Решение задачи определяется следующими параметрами (т.к. у к = г2):

2/1,..., Ук-\; ^х,..., ик.

Пусть вектор в = в{г) включает все эти параметры, а также ненулевые компоненты векторов р и </ из равенства (1). После некоторой нормировки этот вектор имеет конечный предел 0(О) при л —» 0. Этот предел вычислен в диссертации в явном виде для нечетных тп (для случая т = 2к, к = 1,2,... он был найден в работе {Мелас, 1997)). В той же работе для случая четных т получено уравнение

(на основе ранее приведенных соотношений), где матрица 3 и вектор </г вычислены в явном виде.

Нами получено аналогичное уравнение для случая т = 2к + 1.

•7(0(2).*)

Установлено, что матрица —^- имеет при 2 —> 0 своим пределом конечную и невырожденную матрицу. Это позволяет организовать рекуррентное вычисление коэффициентов 9(п\ = — Пт й'п'(г),

п! г-+0

п = 1,2,... на основе метода неопределенных коэффициентов с использованием пакета символьных вычислений Maple. С помощью этого подхода были получены таблицы коэффициентов п — 1,2,.. .,20 для т — 4,5,6.

Эффективность планов, вычисленных с использованием построенных разложений, была исследована численными методами и оказалась весьма высокой.

Кроме того, были получены уравнения для величины г* (такой, что при г < г* чебышевский план является Е-оптимальным) для случаев т = 5 и т = 6. Единственное положительное решение этих уравнений равно г* и %/2.52 для т = 5 и г* и \/2.65 для ш = 6.

В главе 4 проведено исследование Е-оптимальных планов для квадратичной регрессии на произвольном отрезке [г^гг].

тт г2 - П п + г2 Пусть г = —-— — полу длина этого отрезка, а ш = —----

положение центра отрезка. Вектор 0, включающий точки и веса Е-оптималыгого плана, а также компоненты собственных векторов матрицы М(£*), рассматривается как функция двух величин г и иг.

Построено разложение этой вектор-функции (нормированной некоторым способом) в ряд Тейлора по степеням и с коэффициентами, зависящими от г.

В Заключении сформулированы основные результаты диссертации.

1. Найдены предельные значения нормированных некоторым образом точек и весов Е-оптимальных планов для полиномиальной регрессии четной степени на симметричных промежутках при стремлении длины промежутка к бесконечности.

2. Построены рекуррентные формулы для вычисления коэффициентов разложения точек и весов Е-оптимальных планов, рассматриваемых как функции длины промежутка, в ряды Тейлора (в окрестности бесконечности) для многочленов третьей степени.

3. Разработан метод вычисления коэффициентов (определенных в п. 2) для многочленов произвольной степени и построены таблицы коэффициентов для случая многочленов третьей, четвертой и пятой

и

степени.

4. Численно исследована эффективность планов, вычисленных с помощью построенных рядов.

5. Построено разложение точек и весов Е-оптимальных планов для квадратичной регрессии на произвольном отрезке по степеням расстояния центра отрезка от начала с коэффициентами, зависящими от длины отрезка.

По теме диссертации автором опубликованы следующие работы:

[1]. Е-оптимальные планы для кубической регрессии на симметричном отрезке. // Вестн. С.-Петербург, ун-та, Сер. 1. 1996. Вып. 3. (N 15) С. 26-30 (совместно с В.Б.Меласом).

[2]. Е-оптимальные планы для квадратичной регрессии на произвольном отрезке. // Всстн. С.-Петербург, ун-та, Сер. 1. 1998. Вып. 3. (N 15) С. 44-49 (совместно с В.Б.Меласом).

[3]. On Taylor Series for points and weights of ß-optimal designs for polynomial regression. Proceedings of the 3rd St.Petersburg Workshop on Simulation. St.Petersburg, June 28 — July 3, 1998. Saint Petersburg University Press, 1998. pp. 191-196 (Co-author V.B.Melas).

ЛР№ 040815 от 22.05.97.

Подписано к печати 21.04.2000 г. Формат бумаг и 60X90 1/16. Бумага офсетная. Печать рнзографическая. Объем I пл. Тираж 100 экз. Заказ 1327. Отпечатано в отделе оперативной полшрафии НИИХ СПбГУ с оригииал-макета заказчика. 198904, Санкт-Петербург, Старый Петергоф, Университетский пр. 2.