автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Алгоритм восстановления функций
Автореферат диссертации по теме "Алгоритм восстановления функций"
На правах рукописи
Сиверцев Олег Николаевич
Алгоритм восстановления функций
Специальность 05 13 01 — Системный анализ, управление и обработка информации
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
МОСКВА - 2007
Работа выполнена в Московском государственном институте электроники и математики Научный руководитель
доктор физико-математических наук, профессор Хаметов Владимир Минирович
Официальные оппоненты
доктор физико-математических наук
профессор Бахшиян Борис Цолакович
доктор экономических наук,
профеа ор Шаров Виталий Филиппович
Ведущая организация
Институт системного анализа Российской академии наук, г Москва
Защита состоится "23" октября 2007 года в 12 00 на заседании диссертационного совета Д 212 133 01 в Московском государственном институте электроники и математики по адресу 109028, Москва, Большой Трехевятительский пер , д 3/12
С диссертацией можно ознакомиться в библиотеке института
Автореферат разослан "_"__ 2007 г
Ученый секретарь диссертационного совета Д 212 133 01, кандидат технических паук, доцент
Бузников С Е
Введение
Актуальность темы Задача оценивания случайных функций, как и задача восстановления неизвестной функции, в частности, по наблюдениям с ошибками, возникает во многих областях науки и техники статистике, теории планирования эксперимента, радиолокации, связи, геологии, экономике, медицине, генетике и тд Эти задачи отличаются от задач классического статистического оценивания тем, что оцениваемый параметр является бесконечномерным, т е они являются задачами непараметрического оценивания
Исследования в области теории восстановления функций проводились многими авторами Так, в работе В ЬетоЬ, N Stepanova [15] рассмотрен процесс диффузионного типа, описываемый стохастическим уравнением Ито, у которого коэффициенты сноса является неслучайной аналитической функцией, а коэффициент диффузии содержит малый параметр В ней построена минимаксная оценка коэффициента сноса и исследованы ее асимптотические свойства
В монографиях В Н Валника [2, 3], основываясь на теореме Гливенко-Кантелли, разработан алгоритм восстановления неизвестной функции по наблюдениям с ошибками В этих книгах также содержатся программы, реализующие его на ЭВМ
В книге С М Ермакова и А А Жиглявского [6] рассмотрены задачи асимптотического оптимального проекционного линейного оценивания функции регрессии, для суммарной погрешности которой построены оценки снизу
В работах Б С Дарховского [4, 5] содержится подробный обзор современных результатов, связанных с решением задачи восстановления неизвестной функции как в детерминированной, так и в стохастической постановке Доказаны условия существования оптимальной оценки
неизвестной функции и найдены ее статистические свойства Кроме того, доказаны условия применимости предложенного подхода к различным статистическим задачам
В работе И А Ибрагимова [7] рассмотрена задача об оценке многомерной регрессии, при этом предполагается, что функция регрессии и ее оценка квадратично интегрируемы В этой статье установлены границы величины погрешности в терминах поперечников по Колмогорову и Бернштейну, а также е-энтропии, причем оценка функции регрессии здесь строится классическим методом наименьших квадратов
В книге И А Ибрагимова и Р 3 Хасьминского [8] для выборки из генеральной совокупности с неизвестной плотностью распределения построены ядерные оценки Парзена-Розенблатта в задаче оценивания неизвестной плотности Для этих оценок получены достаточные условия состоятельности
В книге Ю А Кутоянца [9] для случая, когда восстанавливаемая функция принадлежит гильбертову пространству с воспроизводящим ядром, для нее построены оценки и исследованы их асимптотические свойства
В статье И Л Легостаевой и А Н Ширяева [10] решена задача минимаксного оценивания неизвестных параметров полиномиального тренда, по наблюдениям за ним с некоррелированными гауссовскими ошибками
В работе Н Н Ченцова [14] построены оценки неизвестной функции /(ж) из ¿2([0,1]) и исследованы их статистические и асимптотические свойства
В работах Р Л Стратоновича [1*2,13] рассмотрена задача восстановления неизвестной функции по наблюдениям с ошибками В этих статьях, в предположении, что неизвестная функция представима в виде конечной линейной комбинации "базисных" функций, а ошибки имеют гауссовское распределение, причем измерения равноточные, построен оптимальный, в смысле критерия минимума среднеквадратической ошибки, рекуррентный алгоритм восстановления и получены условия его сходимости
Разработка новых методов решения задач восстановления неизвестных функций, а также оценивания гауссовских случайных функций по наблюдениям за ними с гауссовскими ошибками, является актуальной как теоретической, так и практической проблемой
Цель работы Разработка рекуррентных линейных алгоритмов оптимального и е-оптимального оценивания гауссовских случайных функций и восстановления функций по наблюдениям за ними с ошибками, а также их реализация в виде комплекса программ
Методика исследования В диссертационной работе применяются методы функционального анализа, теории вероятностей, математической статистики и численных методов
Научная новизна состоит в том, что построены и обоснованы 1) оптимальный (в смысле минимума среднеквадратической ошибки) линейный рекуррентный алгоритм оценивания гауссовской случайной функции, значения которой наблюдаются с ошибками, 2) е-оптимальный линейный рекуррентный алгоритм оценивания гауссовской случайной функции, значения которой наблюдаются с ошибками, 3) оптимальный и е-оптимальный алгоритмы стохастического восстановления функции из £2([0,1]), 4) комплекс программ восстановления неизвестной квадратично интегрируемой функции, значения которой наблюдаются с ошибками
Теоретическая и практическая ценность Теоретическая ценность диссертации состоит в том, что предложенные новые рекуррентные алгоритмы оптимального, е-оптимального оценивания гауссовской случайной функции и стохастического восстановления неизвестной функции из ¿2 ([0,1]) по наблюдениям с ошибками строго обоснованы Практическая ценность диссертации состоит в том, что разработан комплекс программ "МНК-тренд", реализующий £-оптимальный линейный рекуррентный алгоритм стохастического восстановления неизвестной квадратично интегрируемой функции, значения которой наблюдаются с ошибками
Апробация работы Материалы исследования докладывались и получили положительную оценку на научных форумах Международная конференция и Российская научная школа "Системные проблемы качества, математического моделирования, информационных, электронных и лазерных технологий" (Москва-Сочи, 2001), научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ, посвященная 40-летию МИЭМ (Москва, 2002), на VII симпозиуме по прикладной и промышленной математике (Кисловодск, 2006)
По теме диссертации были сделаны доклады на научно-технических конференциях студентов, аспирантов и молодых специалистов МИЭМ в 20032006 гг, а также в процессе работы Международной студенческой школы-семинара "Новые информационные технологии" в 2002, 2004 и в 2005 гг Помимо этого делались сообщения на семинарах кафедры "Исследование операций" и на семинарах кафедры "Кибернетика"
Публикации Основные результаты опубликованы в 11 печатных работах, список которых содержится в конце автореферата, в том числе свидетельство об официальной регистрации программы для ЭВМ "МНК-тренд"
Структура и объем работы Диссертационная работа состоит из введения, 4 глав, заключения, 2 приложений и библиографического списка, включающего 87 наименований Работа изложена на 185 страницах, содержит таблицу и 39 рисунков
Содержание работы
Во введении содержится обзор известных результатов теории восстановления неизвестной функции из ¿г([0,1]) и теории оценивания гауссовских случайных функций Кроме того, во введении приводится сравнительный анализ содержания статистических пакетов, реализующих методики восстановления функций Здесь также дана общая характеристика
работы, обоснована ее актуальность, научная новизна и практическая ценность В заключении приводится краткое содержание работы по главам
В главе 1 диссертационной работы содержатся необходимые для изложения результатов работы сведения из функционального анализа, теории меры, теории вероятностей и математической статистики В ней также вводятся необходимые для изложения результатов диссертации обозначения
Перейдем к краткому изложению результатов главы 2 В § 1 приводятся известные результаты из теории гауссовских мер в сепарабельных гильбертовых пространствах
В § 2 содержится постановка задачи оценивания гауссовской случайной функции по наблюдениям с ошибками Пусть х 6 [0,1], а ¿2([0,1]) — множество квадратично интегрируемых функций / [0,1] —» К1, те / /2(ж) йх < оо, пусть (Г2, Р, Р) — вероятностное пространство Пусть задана случайная функция п х П х [0,1] —> Ж1, обозначаемая через пт(х), где т € х € [0,1], которую будем называть ошибками в точке х Относительно случайной функции пт(х) будем полагать, что для любых х € [0,1] и т € ЛГ+
1
Шпт{х) = 0 и мJn2m(x) с1х = а2 < оо, о
где М — математическое ожидание относительно меры Р Положим, что для любых х 6 [0,1] и т Ф к
Мпт(х)пк(х) = 0
Пусть / П х [0,1] —> К1 — измеримая функция, обозначаемая через f(ш, х), такая, что
1
МI /2(ш, аг) Ах < оо о
Предположим, что мы наблюдаем функцию ут(х), которая является суммой
двух случайных функций /(ш,х) и пт(х), те
Ут(х) = /(ш,х) + пт(х), т = 1,2, (1)
Поскольку пространство ¿г([0,1]) — сепарабельное гильбертово пространство, в нем существует полная счетная ортонормированная система функций, которую мы обозначим {уг(а;)}г>1, (у»^) б ^{^О, 1])), те ! 1р%{х)<р,(х) йх = (5У, где 5г] — символ Кронекера, § 1<Рг(х) с1х < оо Так
О I—10
как Р-п н функция ${ш,х) е 1]), то она допускает представление
00
¡{и, X) = а0 (ш) + £ 0Сг{ш)(Рг{х),
где
1 1 аг(и>) = I¡(и),х)<Рг(х) йх, а0(и>) = ^ ¡(ш,х) йх о о
{а?г(о;)}г>0 — коэффициенты Фурье функции /(си,х), которые являются случайными величинами Пусть для любых г > 0 и т > 1
1
Ут = I Ут{х)ч>г{х) ¿Х, (2)
о
1
пт- / Пт(х)<рг(х) <1X (3)
о
В силу сделанных предположений, для любых г, то, интегралы (2) и (3) корректно определены и М(угт)2 + М(Пда)2 < оо Поэтому из (1) для любых г > 0, т > 1 имеем Р-п н
у1т = аг + пгт (4)
Обозначим 1) ^ = а{Уъ >УтУ ~ с-алгебру, порожденную случайными величинами у\, ,угт, где г > 0, 2) ^ = ^(УЬ 124л Для всех г > 0}
Ясно, что для любых то > 1 и х е [0,1] ут(х) — •Я'т-измеримая случайная величина Теперь мы можем дать необходимые для дальнейшего изложения определения, а также сформулировать постановку задачи.
Определение 1. 0 В([0,1])-измеримую функцию, обозначаемую через }т{х), такую что М ^\$т{х)\2<1х < оо, назовем оценкой случайной функции f(uJ> х) Множество таких оценок обозначим через М2,т(Р)
Очевидно, что Мг,т(Р) — гильбертово пространство Опишем критерий оптимальности оценки случайной функции Требуется построить такую оценку /то(ж) е М2,та(Р), что 1
М / [До;, х) - /т(х)]Чх . ц* (5)
¡5 ишм2,т(Р)
Определение 2. Оценку /„(ж) € М2,т(Р) назовем оптимальной, если
. т£ М ¡{¡(ш,х)-их)?йх=и}и(ш,х)-^(х)}4х (6) Определим теперь, что мы будем понимать под е^-оптималъной оценкой
Определение 3. Оценку /„(ж) € М2,т(Р) назовем е^-оптимальной. /3 > О, для любого е > 0, если
М / [/(а,, х) - ¡^(х)]Чх = „ М М / [/(«, - /т(я)]2^ + 0(е*), (7) Й /т(а)€Ма,т(Р) £
причем О(е^) — это неслучайная функция от то 6 №" и е е (0,1), обозначаемая через <р(т,е) такая, что для любых то € е € (0,1) существует положительная константа С такая, что < С < оо
Заметим, что /т(х), /(ш, х) € М2,ТО(Р) Поэтому для любого то > 1 Р-п н
оо
/тп(®) = Х)й.т<А(аО, (8)
г=0
где агт — .Я^-измеримые случайные величины, причем
1
&гт - / 1т{х)ц>г(х)с1х (9)
Определение 4. Оценки случайной функции /(ш,х) вида (8), (9), где {^(*)Ъ>о — система ортонормированных функций в £г([0,1]), называются проекционными
Через М2,т(-Р) обозначим множество бесконечномерных случайных
векторов От = (йот, &1т, ), таких, что агт — ^-измеримы и
М Е \агт\2 < оо Очевидно, что М2,т(Р) — гильбертово пространство 1=0 __
Ясно, что М2,ГО(Р) изоморфно М2,т(-Р) Поэтому
} "о 00
т{ М [/^,х)-/т(х)]2ёх = £ М[аг(со) - агт}2 (10)
/т(:г)еМ2,т(Р) Й &теМ2,т(Р)г=0
Доказано следующее утверждение
Предложение 1 Для любого т> 1 оптимальная оценка /^(ж) 6 М2,га(Р) существует тогда и только тогда, когда существует € М2,т(Р) такое, что
оо оо
М £ [а,(ы) - агт]2 = М £ КИ - йг°т]2,
{&,т}«>о€М2 т(Р) 1=0 г=0
где аг(ш) = }/(и),х)уг{х)(1х
В § 3 содержится один из основных результатов данной главы Сформулируем предположения Условия (в)
1) семейство {аг(а>)}г>о случайных величин образует гауссовскую систему некоррелированных случайных величин, причем Ьат(аг(ш)) = А^,^),
СО 00 , о
£ <2, < оо, Е \сг\ < оо,
г=0 г=0
2) для любых г > 0 и т > 1 семейство {пгт}г>о, т>1 образует гауссовскую систему некоррелированных случайных величин с Ьа'ш(пгт) = А^(0, сгг2), причем Е <т2 = сг2 < оо и а.2 > О,
г=0 »
3) для любых г > 0 и т > 1 семейства {аг(ш)}г>о и {та^Г4}г>о, то>1 — некоррелированны
Теперь сформулируем основной результат этого параграфа
Теорема 1. Пусть /(и,х) £ М2,то(-Р) Пусть выполнены условия (в) Тогда существует оптимальная проекционная оценка /^(х), т е /^(х) Р-п н допускает представление
оо
№==£<^0*0, (п)
г=0
причем для любых г > 0, т > 1 Р-пн а°т = М и Р-пн
удовлетворяют рекуррентным соотношениям
ло _ А,0 , ч___(V _
-Чт "гто-1 ' _2 1 ™ "Чт—1.м
<*г + 7т—1 (12)
аг°0 = С»,
— V — !т !пг-1 _2
+ 7т-1 (13)
70 =
где = М[(а,(сь>) — — условная дисперсия Кроме того, для
любого т > 1
1
а Л «л;
11* м / [Дш, - Мх)¥<1х = Е7т = Е-
ГР^ __л __Л I
/ IV \ / ^ /т / у о . 7
/т(ж)еМ2,т(Р) I 1=0 4=0 +
В § 4 содержится доказательство теоремы 1
В § 5 устанавливаются несмещенность и состоятельность оценок (11) Определение 5. Оценка /т(ж) гауссовской случайной функции /(о», х) называется несмещенной, если для любого х 6 [0,1]
М/т(*) = М/(ы,:с) (14)
Теорема 2. Пусть выполнены условия теоремы 1, тогда оптимальная оценка /т(х), определяемая (11), является несмещенной
Определение 6. Оценка /т(х) гауссовской случайной функции /(и;, х) называется состоятельной, если
1т{х) ¡{ш,х) И
Теорема 3. Пусть выполнены условия теоремы 1 Тогда оптимальная оценка /^(ж), определяемая (11), является состоятельной
Практическое использование оптимальной оценки /¿(ж), определяемой соотношением (11), технически затруднено из-за того, что оценок а®т необходимо построить счетное число Поэтому в § 6 мы устанавливаем условия существования ^-оптимальной оценки гауссовской случайной функции
Приведем сначала критерий существования ^-оптимальной оценки Предложение 2. Пусть выполнены условия теоремы 1, /^(ж) — оптимальная оценка неизвестной функции определяемая соотношениями (11)—(13) и пусть е > 0 Оценка ж) € М2,т(-Р) — ^-оптимальна тогда и только тогда, когда
М }[й(х)-Ш]^х = 0(е^) (15)
о
Теперь сформулируем основной результат этого параграфа Теорема 4. Пусть выполнены условия (Э) и для любого £ > 0 найдется число N0(5) такое, что для любого к > Л/о(е)
оо
Е [* + <$< 6 (16)
г=к+1
Тогда оценка
Ш = (17)
г=0
является £-оптимальной (/3 = 1), где бРът удовлетворяют Р-п н рекуррентным соотношениям (12), (13) для г <т, причем для любых т > 1 и е > О
М/[/(у,ж) - Гт{х)]Чх = ¿74 + 0{£) о з=о
В § 7 рассматривается задача стохастического восстановления неслучайной функции /(ж) € ¿г([0,1]) по наблюдениям ут(х) за ней с ошибками, те
Ут(х) = /(ж) + гст(ж), (18)
где пт(х) — ранее описанная, гауссовская случайная функция
Основным результатом здесь является следующее утверждение Теорема 5. Пусть выполнены условия (S) и f(x) 6 L2 ([0,1]) Тогда справедливы следующие утверждения
1) Оптимальная оценка f^(x) в смысле критерия
1
M / [/(*) - L(x)]dx . mf g /m(z)eM2,m(jP)
i Е
имеет вид ftjx) = £ Е причем М/ [/(ar) - f^(x)]2dx = ^
1=1 о
2) е-оптимальная оценка f^(x) € Мг,т(Р) неизвестной функции /(îc) е ¿2 ([0,1]) имеет вид
1 m к \
= причем M [f{x)-fm{x)fdx = 0{e)
Третья глава диссертации посвящена решению задачи оценивания гауссовской случайной функции /(ал ж) по наблюдениям за ней с ошибками, которые в отличие от главы два проводятся в конечном числе точек хг € [0,1], г = 1, m Поэтому модель наблюдений (1) примет вид
Уг = /(<*>,£,) +пг, (1а)
где г = Т7т, уг = у(жг), пг = гг(жг)
В § 1 содержится постановка задачи оценивания гауссовской случайной функции по наблюдениям в конечном числе точек из [0,1], а также приводятся необходимые определения
Очевидно, что для любого г — 1, m Р-п н
СЮ 00 оо
у* = ZyVjC®»), = =
J=0 .7=0 j=0
где
1 1 1
y3 = J y(x)ip3(x)dx, a? = J f{uj,x)ipJ{x)dx, n3 — j n(x)ipj{x)dx
00 0
13
Пусть 1™ 4 (г/1, ,ут)т, ^Н 4 и(и>,Х1), Лш,хт))Т, пт = (щ, , пт)Т — га-мерные случайные величины Тогда из (1 а) следует, что
Ут = Р"»+пт (19)
Предположим, что Мпгп3 = а26г] Последнее означает, что ошибки в различных точках хг некоррелированы Предположим, что над моделью (19) проведено I независимых испытаний
где к = 1,1
Обозначим ТГ = (т{УГ, , У™} Очевидно, что ТГ' с ^ Определение 7. ■7гут-оценкой гауссовской случайной функции /(ы,х) по наблюдениям У™, ,У™, проводимым в точках х\, ,хт € [0,1], обозначаемую через /к,т(х), Ук = 1,1, назовем <8> ¿?([0,1])-измеримую функцию, такую, что М$ \^к,т(х)\2(1>х < оо Множество таких оценок обозначим через Мг^^Р), где У к = 1,1
Требуется построить такую ,Гут-оценку Дт(ж) е Мгдт(Р)> что
1 1 М ¡и{и,х)-Ц1т{х)}Чх = „ и1^{ш,х)-!Кт{х)]Чх (20)
Оценку Дот(ж) е М2^,т(Р), определяемую (20), в дальнейшем будем называть оптимальной
Пусть М2,й,т(Р) — множество бесконечномерных случайных векторов &к,т — {ао!к,т> 1а™к,т> }> гДе аз,к,т — ^¿""-измеримая случайная величина, такая, что М Е^хт < 00 Очевидно, что М2дт(Р) —
ИЗОМетрИЧНО М2,й)т(Р)
Определение 8. ^""-измеримую случайную величину, обозначаемую через /|>т(а;) £ М2,й,т(Р), назовем е^-оптимальной ^"-оценкой (/3 > 0)
гауссовской случайной функции f(uj,x) такой, что М f \f(u>, x)\2dx < оо по
наблюдениям в точках xlt ,хт £ [0,1], если
1 1 М f If (со, X) - flm(x)}2dx = ^ inf М / [До,, ж) - h,m{x)fdx + Oif)
о Л,т(г)бМ2,*,т(Р) ¡5
В § 2 решается задача построения -^-оптимальных оценок гауссовской случайной функции по наблюдениям с ошибками в конечном числе точек Для формулировки условий и основного результата введем ряд обозначений Пусть а°° = {«о, «2-, } — случайный бесконечномерный вектор такой, что б°° € M2,fc,m, причем для любых г, j > О
1) Сг = Маг — среднее значение г-& компоненты вектора а°°,
2) dv = М(аг — Сг)(а} — с3) — ковариация между г и у компонентами вектора а°°,
3) = (co,ci, )Т, d = (dy) — ковариационная матрица случайного вектора а°° € М2,&,т
4) для векторов
i) <pn+\(x) = (^оО^), i vn{x))T ~ (N + 1)-мерный вектор, l~ая компонента которого является 1-ым элементом ортонормированного базиса в точке
ее €[0,1], г = о~лг,
и) {a™,JV}fceo, ,г ~~ семейство (N + 1)-мерных ^""-измеримых векторов оценок гауссовского вектора aN = (ао, , , ш) CN+1 А (со, , cNf ~(N+ 1)-вектор, где с, = Маг,
5) для матриц
i) Ар" = (<р3(хг)) - m х (N + 1) - матрица (г = T~mf j = Ojf), ц) BBT = (oftfy) — ш x m-матрица, cr| = Мп2, где 5V — символ Кронекера, ш) En+i — (Sij) — единичная матрица размера (N +1) х (N + 1),
iv) dN+1 = (ckj) — {N + 1) х (М + 1)-матрица, причем dv = M(as — сг)(а3 —с3),
v) ('Ук>т)к jj ~ семейство дисперсионных матриц, причем =
(тй?*) ~~ симметрическая (АГ +1) х (.ЛГ + 1)-матрица оценок {а^Ь^о, ,г> Через (, обозначим скалярное произведение в (ЛГ + 1)-мерном
евклидовом пространстве
Теперь мы можем сформулировать наши предположения Условия (§)
1) последовательность случайных величин {аг}г>о ~ образует гауссовскую
00 „ оо оо
систему, причем Е с, < 00, Е Е |а2?| < оо,
г=0 г—0 3=0
11) пусть {п*}г=1^5=ц — семейство гауссовских случайных величин, где п\ = п3(х)\х=хг, s > 1, удовлетворяет условиям S2) и S3) (смотри условия S) Условия (В)
1) sup sup < С, з>о же[од]
2) для любых жь , хт е [0,1] Мехр {2I Е Е (у?(^)а;)2| < оо Условия (£) для любого е £ (0, |) существуют целое число N — N(e) и константа L > О такие, что 1) М Е а? < £, и) для любого х € [0,1]
J=iV+l 3
М Е £2лх)<ь
Основным результатом данного параграфа является следующее утверждение
Теорема 6. Пусть выполнены условия (§), (В), (£) Тогда для любого е > О и целых 1 < т, к < оо л/ё-оптимальная ^"-оценка Дт(ж) 6 МадтС-Р) Р~п н допускает представление
Й,т(х) = (аТ'"'°,фм+1(х))м+1, (21)
где — ^""-измеримый (Ы + 1)-мерный случайный вектор такой, что
= (Е„+1 + (.ВВт)-г А^у1 х
х + (А™>»)т(ввт)-1 еу^, (22)
причем ее дисперсионная матрица - м(йЛГ ~ -
размера (И + 1) х (М + 1) имеет вид
7ГЛ°= + (23)
В § 3 рассматривается задача построения оптимальных оценок гауссовской случайной функции по наблюдениям с гауссовскими ошибками в конечном числе точек из [0,1]
Для удобства формулировки основного утверждения данного параграфа введем обозначения
а.
оо,0 Д Л/Г/„ ii?ym\ ioo,0 Д /лоо,0 лоо,0 \
„оо,О Д Луг Г/ Л00,0 w„ лоо,0 Мт-Ут1 _,оо,0 Д Л оо,0 \
= м [(а, - а- а^)!^ j, 7fc,m = (jfe,™^))
Теорема 7. Пусть выполнены условия теоремы б Пусть sup £ '-рЦх) < оо
яе[одр=о J
Тогда существует оптимальная оценка /£т(ж) € М2,/г,т(Р), те
mf М [ f/(w, re) - Дт(а:)1 da; = = м / [/(Wj x) - Дга(ж)]2 & = Sp725?,
гДе = Д причем
1) € Мг,й,т(-Р) и допускает представление Р-п н
(24)
С™ = [-Еоо + fcd00(A™'00)T(BBT)~1A™,00]_1:
к (25)
2) дисперсионная матрица 7^ оценок имеет вид
х(С°° + d°c(A™'°°)T(BBT)~1) £ У™,
S=1
= [^00 + А:й00(А™>00)г(ВВт)-1Л-'00]-1 сГ (26)
В § 4 решается задача е-оптимального стохастического восстановления функции Цх) € 1,2([0,1]) по наблюдениям с ошибками в конечном числе точек из отрезка [0,1] Приведем основной результат данного параграфа
Теорема 8. Пусть семейство m-мерных гауссовских случайных векторов {п™}к = 1,1 удовлетворяет условиям (S) Пусть для любого е > 0 существует N(e) такое, что для всех п > N(e) справедливы
О 11/0*0 -/n(^)lll2([o,i]) ^ е> гДе fn{x) = Е atjipjix), а а, — коэффициенты Фурье,
и) существует константа L\ > 0 такая, что для любого п sup Е iPj(x) < U
Путь матрица {ВВТ} А™>п — невырождена и существует
положительная константа L2(m) > 0 такая, что
||[(Л™'")Г {ВВтуг Л™'"]-11| < 1/2(то) Пусть 6 М2Аот(Р) и имеет вид
где ârojfej — J~m компонента (п + 1)-мерного случайного вектора который имеет вид
âZf = \к (A?nf (.ВВг)"1 А£0] {А™'п)Т (.ВВт)~г £ У3т (28)
Тогда оценка (27) является ^-оптимальной ^""-измеримой проекционной оценкой, те
м / [/(*) - h%(x)]2 = + 0(e), (29)
где
7™'™'° = [к №п)Т (.ВВ(30)
В пятом параграфе рассматривается случай тригонометрического ортонормированного базиса В этом параграфе рассматривается задача выбора точек хг € [0,1], г ~ 1, то, в которых следует проводить наблюдения при £-оптимальном стохастическом восстановлении функции из L%([0,1]) В предположении, что для любого г а2(хг) = <г2, показано, что оптимальными
18
(в смысле 1г-критерия [6]) являются точки хг — где г = 1,то, те равномерное разбиение отрезка [0,1]
В главе 4 содержится обоснование и описание программной реализации алгоритма стохастического восстановления функции вида \а3 sm (jf-ъ) + Рз cos ^f^)] по наблюдениям с ошибками Так, в § 1 рассматривается следующая модель наблюдений
'г = £ (sm ¡y1) + & 008
2тт
+ пг,
(31)
з=о \ \2з ]
где г е Т} — оцениваемые параметры, а3, Д, 6 I1, € \ {0},
причем Т3 |3=о= оо, {пг}г^+ — последовательность ошибок, причем они некоррелированы и ХаЦп,) = ЛГ(0,<т2) Модель (31) является обобщением модели наблюдений, рассмотренной в главе 3 Здесь строятся оптимальные оценки по методу наименьших квадратов Таким образом, (31) приводит к задаче
Е
г=1
3=0
2тг \ . /2тг а, sm | —г | + р} cos [ —;
Г,
Т,
mf
00, а}, ft ей1 Т3б®+\{0} 3> 1
(32)
Ясно, что задача (32) сводится к решению бесконечной системы нелинейных уравнений, построение решения которой в явном виде является сложной задачей В этом параграфе разработан специальный численный метод построения решения задачи (32), основанный на идее метода динамического программирования Поэтому рассмотрим следующее семейство задач
Е
г=1
-Е
3=0
a, sm
Т, J
+ ¡3j cos
2тг
Ti
mf ,
а„ А ей1 т3ем+\{0} J=1.S
(33)
где s € М+-любое
Пусть Bm(s) — функция Беллмана для задачи (33), те
Bm(s) A inf £
Г3бК+\{0}
Уг-Т,
0=О
, 27Г \ „ /2тг Qfj sin I —г + ßj cos I —г
Чтобы избежать громоздких выражений введем следующие обозначения
1) д3 = (а3,Р3,Т})т — трехмерный вектор, где а^, Д, € 1
3 е {1,2, }, причем в0 = р0е Ж1, ц) © = Ж2 х {М+ \ {0}},
т) в3 4 (въ , в3)т, где V« > 1, очевидно, что в3 € В'5,
iv)
■m fns\ A
E
г=1
J=0
■ 2тг . „
а3 sm —г I + Д, cos
2тт
Т3 ^ \Tj
(35)
' 2тг„
V) ФТ (es~\ в.) ± -2 jc |у2 - Д [a, sm (|г) + Д, cos (2
х jas sm (Щг) + 0S cos + Д \as sm + Д, cos (ifг)]2 Справедливо утверждение
Предложение 3. 1) Пусть для любого s > 0 период Ts е М+ \ {0} Тогда для любого $ > 0 существует g ©, зависящее от у\, , ут, такое,
что
Bs(m) = Bs_i(m) + mm (в0'3'1,9S 0se9
Bs(m)|s=0 = mm E [у, - До]2
(36)
/Зоек1 j=i
2) Пусть выполняются условия
a) для з < s существуют (9§, Щ, , G ©, такие, что
flg 4 argmmFo™ (Д0), где (Д0) — Е — Д)|2, (те Т0 = 1), АеК1 »=1
б? - arg mm Ф^ = arg mm Ф™ {в°0,в1,в2) (4 argmm$f (0Ь02)) ,
^ = агрттФ7(0о0,^, fe arg nun Ф» J < в,
b) для любых з Bj(m) удовлетворяет рекуррентному соотношению
5,(тп) = B,_i(m) + ш Ф™ в,)
Тогда для любого 3 < в
Предложение 3 приводит нас к следующему численному алгоритму построения искомых оценок Опишем его по шагам Шаг 1- з) Пусть
гъ(Тг)=Уг-(Ро + аг V» = (37)
¿г
где уг — наши наблюдения, Аь^ъ А — оцениваемые параметры, причем 0 < Т1 — задано п) Обозначим
т
Ят(Ро, (ХЪ А, Тг) 4 £ [^(Ц)]2 (38)
2=1
III) Для заданного Т1 методом наименьших квадратов (МНК) оценим значения параметров /?о,<*1,/?1, в результате имеем
ШШ = Я),
где /^(ТО,а1т(Т\),^1т(Т{) — оптимальные МНК оценки, которые зависят от значения Т1
IV) Рассмотрим теперь следующую задачу
Яш(Тг) -» (39)
^ ^ у Цед+ио} 4 '
Пусть задача (39) имеет решение, те существует Т^тп) такое, что
1п£ (ЭтСШ = <дт(Т?(т)) Тогда остатки в модели (37) при Тх = 2?(т) Т1елг+\{1}
примут вид
МТКш)) 4у,-/38(1?(т))-а?(1?(т)) сов(|^)-/3°(1?(т))
(40)
Шаг 2. Образуем разность
Ы2?,Та) 4 ^,(2?) - (а2 • сов^^т1) + /% зт(^^))),
Vi = 1 ,m, где а2,02,Т2 e © — оцениваемые параметры, причем 0 < Т2 — задано и Г2 ^ 1?(тп)
Применим к 02г(7?! процедуру, описанную на шаге 1, в результате которой находим оценки параметров Т2°. a$(Tf, Т2°), /^(Tf, Т2°)
Продолжая этот процесс далее, в результате получаем процедуру оценки параметров модели (31)
В § 2, основываясь на известной процедуре ортогонализации Грама-Шмидта, приводится методика построения ортонормированного базиса по результатам наблюдений {ух, , ут}
В § 3 содержится подробное описание алгоритма стохастического восстановления неизвестной функции по наблюдениям {у\. ,ут}> а также описание комплекса программ, названного "МНК-тренд", который реализует этот алгоритм оптимального восстановления функций Отметим, что комплекс программ "МНК-тренд" зарегистрирован в Реестре программ для ЭВМ
§ 4 посвящен применению комплекса программ "МНК-тренд" для построения модели, описывающей эволюцию котировок валют RUB/USD и RUB/JPY, где RUB — российский рубль, USD — доллар США, JPY — японская иена
В § 5 рассматривается применение полученных результатов на примере задачи восстановления слайдов генных карт Исходная информация была взята с информационного ресурса "The Jackson Laboratory" в сети Internet (по адресу http //www jах org)
Слайд генной карты представляет собой фотографию, на которой изображено 48 блоков, причем каждый блок содержит 650 областей овальной формы Каждая область овальной формы имеет цвет, который является результатом интерференции трех цветов красного, зеленого и синего различной интенсивности По условиям эксперимента каждой овальной области соответствует экспрессия одного гена Под экспрессией
гена понимается ответная реакция гена на воздействие на него некоторого вещества В предположении, что цвет всех точек внутри овала одинаков, в этом параграфе приводится решение задачи оптимального стохастического восстановления слайдов генных карт, которое основано на применении теоремы 6 Кроме того разработана программа, с помощью которой было осуществлено это восстановление
На защиту выносятся следующие результаты.
1) процедуры оптимального и е-оптимального, проекционного оценивания гауссовской случайной функции, наблюдаемой с гауссовскими ошибками,
2) процедуры оптимального и е-оптимального непараметрического, проекционного оценивания функций из 2,2([0, 1]) в задаче стохастического восстановления,
3) процедуры л/е-оптимального и оптимального, проекционного оценивания гауссовской случайной функции, наблюдаемой со случайными гауссовскими ошибками в конечном числе точек из отрезка [0,1],
4) процедура -у/ё-оптимального непараметрического, проекционного оценивания функций из Ьг([0,1]) в задаче стохастического восстановления по наблюдениям в конечном числе точек из отрезка [0,1],
5) алгоритм стохастического восстановления неизвестной функции по наблюдениям за ней с гауссовскими ошибками в конечном числе точек и комплекс программ его реализующий
Библиографический список
1 Айвазян С А, Мхитарян В С Прикладная статистика и основы эконометрики Учебник для вузов — М ЮНИТИ, 1998 — 1022 с
2 Вапник В Н Алгоритмы и программы восстановления зависимостей — М Наука, Главная редакция физико-математической литературы, 1984 -816 с
3 Вапник В Н Восстановление зависимостей по эмпирическим данным — М Наука, 1979 - 447 с
4 ДарховскийБ С Новый подход к стохастической задаче восстановления // Теория вероятностей и ее применения — 2004 — Т49 — Вып 1 — С 36-53
5 Дарховский Б С О стохастической задаче восстановления // Теория вероятностей и ее применения — 1998 — Т 43 — Вып 2 — С 357-364
6 Ермаков С М, Жиглявский А А Математическая теория оптимального эксперимента Учебное пособие — М Наука, Главная редакция физико-математической литературы, 1987 — 320 с
7 Ибрагимов И А Об оценке многомерной регрессии // Теория вероятностей и ее применения — 2003 — Т 48 — Вып 2 — С 301-320
8 Ибрагимов И А, Хасьминский Р 3 Асимптотическая теория оценивания — М Наука, Главная редакция физико-математической литературы, 1979 — 528 с
9 Кутоянц Ю А Оценивание параметров случайных процессов, Ереван Издаельство АН АССР, 1980 — 251 с
10 Легостаева И Л , Ширяев А Н Минимаксные веса в задаче выделения тренда случайного процесса // Теория вероятностей и ее применения — 1971 — Т XVI - Вып 2 - С 339-345
11 Магнус Я Р, Катышев П К, Пересецкий А А Эконометрика Начальный курс Учебник — М Дело, 2001 — 400 с
12 Стратонович Р JI Оптимальное расширение функционального подпространства в алгоритмах восстановления плотности и функции распределения// Известия АН СССР, Техническая кибернетика 1970 — №2 - С 57-64
13 Стратонович Р JI Эффективность методов математической статистики в задачах синтеза алгоритмов восстановления неизвестной функции / / Известия АН СССР, Техническая кибернетика 1969 — № 1 — С 32-46
14 Ченцов Н Н Статистические решающие правила и оптимальные выводы — М Наука, 1972 — 520 с
15 В Levit, N Stepanova Efficient estimation of multivariate analytic functions m the cube-like domains Math Methods Statist, v 13, No 3 (2004) — P253-281
16 Szabo A , Boucher К , et al, Variable Selection and Pattern with Gene Expression Data Generated by the Microarray Technology Mathematical biosciences - 2002 Mar - 176(1) — P 71-98
Список опубликованных работ по теме диссертации
1 Сиверцев О Н е-оптимальный алгоритм восстановления слайдов генных карт // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ Тезисы докладов - М МИЭМ, 2006, С 2223
2 Сиверцев О Н Алгоритм восстановления функций // Новые информационные технологии Тезисы докладов XII Международной студенческой школы-семинара - М МГИЭМ, 2004, С 232-234
3 Сиверцев О Н Алгоритм е-оптимального восстановления случайных функций из L2[0,1] // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ Тезисы докладов - М МИЭМ, 2005, С 29-30
4 Сиверцев О Н Математические модели генетики // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ Тезисы докладов - М МИЭМ, 2003, С 34-35
5 Сиверцев О Н Модель эволюции курсов валют // Научно-техническая конференция студентов, аспирантов и молодых специалистов института, посвященная 40-летию МИЭМ Тезисы докладов - М МИЭМ, 2002, С 21-23
6 Сиверцев ОНО состоятельности оценок в задаче восстановления квадратично интегрируемых случайных функций // Новые информационные технологии Тезисы докладов XIII Международной студенческой школы-семинара - М МГИЭМ, 2005, С 113-115
7 Сиверцев О Н Один метод восстановления функций // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ Тезисы докладов - М МИЭМ, 2004, С 39-41
8 Сиверцев О Н Постановка задачи для модели прогнозирования финансового кризиса на основании динамики курса валют // Системные проблемы качества, математического моделирования, информационных, электронных и лазерных технологий / Материалы Международной конференции и Российской научной школы Часть 1 - Москва ГНПО "Агат", 2001, С 113
9 Сиверцев О Н Прогноз котировок валют // Новые информационные технологии Тезисы докладов X Юбилейной Международной студенческой школы-семинара в 2-х томах - М МГИЭМ, 2002 Т1, С 292-294
10 Сиверцев О Н, Хаметов В М Задача восстановления функций Обозрение прикладной и промышленной математики, 2006, Т 13, выпуск 2, С 354-356
11 Сиверцев О Н, Хаметов В М Свидетельство об официальной регистрации программы для ЭВМ № 2004612393, от 20 10 2004 г "МНК-тренд"
Подписано в печать 19 09 2007 г Исполнено 19 09 2007 г г Печать трафаретная
Заказ № 740 Тираж 100 экз
Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш , 36 (495) 975-78-56 www autoreferat ru
Оглавление автор диссертации — кандидата физико-математических наук Сиверцев, Олег Николаевич
Страница
Введение
Глава 1. Необходимые сведения из функционального анализа, теории вероятностей и математической статистики.
§ 1 Некоторые сведения из функционально анализа
§ 2 Сведения из теории меры.
§ 3 Некоторые сведения из теории вероятностей.
§ 4 Некоторые сведения из математической статистики
Глава 2. Оптимальное и е^-оптималыюе (/3 > 0) оценивание гауссовской случайной функции по наблюдениям с гауссовскнми ошибками
§ 1 Гауссовские меры в гильбертовом пространстве.
§ 2 Постановка задачи.
§ 3 Формулировка основного результата.
§ 4 Доказательство теоремы 2.3.
§ 5 Несмещенность и состоятельность оптимальных оценокG М2>|В(Р).
§ 6 ^-оптимальные оценки гауссовской случайной функции
§ 7 Оптимальные и е-оптнмальные непараметрическне проекционные оценки неизвестной функции из Z/2([0,1])
Глава 3. Оптимальное и е^-оптималыюе оценивание гауссовской случайной функции по наблюдениям за пей с гауссовскнми ошибками в конечном числе точек
§ 1 Постановка задачи. Обозначения и определения
§ 2 ^-оптимальное оценивание гауссовской случайной функции по наблюдениям за пей с гауссовскими ошибками в конечном числе точек из отрезка [0,1].
§ 3 Оптимальное оценивание гауссовскои случайной функции но наблюдениям, проводимым в конечном числе точек из [0,1].
§ 4 е-оптималыюс стохастическое восстановление функций из L2([0,1]) по наблюдениям за пей с гауссовскими ошибками в конечном числе точек из [ОД] (Общий случай).
§ 5 £-онтнмалыюе стохастическое восстановление функции из L2QO, 1]) по наблюдениям за ней с гауссовскими ошибками в конечном числе точек из [0,1], II (случай тригонометрического базиса)
Глава 4. Алгоритм стохастического восстановления функции (описание и его программная реализация).
§ 1 Алгоритм восстановления неизвестной функции, представляющей собой линейную комбинацию тригонометрических функций с неизвестными периодами.
§ 2 Построение ортонормироваипого базиса с помощью оценок {71/} •>1.
§ 3 Описание алгоритма восстановления неизвестной функции.
§ 4 Применение комплекса программ "МНК-тренд" для описания эволюции котировок валют RUB/USD и RUB/JPY.
§ 5 Восстановление экспрессии генов слайдов генных карт.
Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Сиверцев, Олег Николаевич
1. В многочисленных областях науки и техники [0, 12, 23, 35, 59, 68, 69, 72, 77, 7S, S3] возникает потребность в построении математических моделей описывающих различные процессы и явления. Задачи построения таких моделей как правило разбивают на несколько этапов. Одним из таких этапов является задача восстановления зависимостей. Особенностью этой задачи является то, что значения восстанавливаемой функции могут быть измерены в некотором конечном числе точек. При этом па основании проведенных измерений требуется ее восстановить во всей области определения. Эта проблема становится особенно актуальной, когда измерения значений функции являются дорогостоящими. Например, если f(x,y) — глубина залегания нефтяного слоя в точке с географическими координатами х, у, то для точного измерения значения f(x,y) приходится бурить скважину в этой точке.
Данная диссертация посвящена решению задачи стохастического восстановления функций. В ней рассматриваются проблемы:
• синтеза оптимальных и квазиоитимальных алгоритмов восстановления функций из L2([0,1]) и исследуются их свойства;
• релизации алгоритмов восстановления функций на ЭВМ.
2. Обзор результатов теоретических исследований, связанных с решением задачи восстановления функций.
В настоящее время существуют два подхода к задаче восстановления функций: детерминированный [24] и стохастический [24]. 2.1. Приведем детерминированную постановку задачи восстановления, следуя [21].
Пусть X, У — линейные пространства, а X* — пространство, сопряженное к X. Пусть < х*,х > — значение линейного непрерывного функционала х* 6 X* па элементе х 6 X. Пусть F : X —> Y — функция обозначаемая через
F(x). Пусть ip : Y —» R1 — функция, а К — некоторый класс таких функций. Пусть ЯЛ С X — некоторое фиксированное множество.
Требуется найти решение задачи: < х*,х > -<р(у)| inf sup . (1)
Vек хет, y€F(x)
Решению этой задачи посвящено большое количество публикаций, подробный обзор которых можно найти в [15].
Отметим, что впервые задача восстановления функций была рассмотрена в 1853 г. П. JL Чебышсвым в [63].
С проблемой восстановления функций тесно связана задача аппроксимации функций. В настоящее время существует несколько подходов к решению задачи аппроксимации функций. В работах [5, б, 7, 40, 48] содержатся материалы об аппроксимации функции рядами Фурье. О приближении функций рациональными дробями говорится в работах [10, 49, 50, 51, 52]. Аппроксимация полипомами описана в работе [11], о приближении экспоненциальными суммами говорится в [37]. Экстремальные задачи теории приближения рассмотрены в [38].
В монографии В. И. Бердышева [12] рассмотрены аппроксимативные методы восстановления численной информации.
2.2. Перейдем к обзору результатов связанных со стохастической постановкой.
Пусть на иекоотром вероятностном пространстве (Q^T^P) задано семейство случайных функций п : N+ х х [0,1] —> К1, обозначаемое через {rijfc(a/, и называемое ошибками. Предположим, что это семейство обладает следующими стойотвами: i) для любых х и к Мщ(ш,х) = 0; ii) для любых к и I Mnk(uj,x)ni(uj,x) = сг1(х)5ы, где — символ Кропекера и М/n\{uj,x)dx = а1 < оо; iii) семейство {nk(uJ,x)}k>\ образует гауссовскую систему. Пусть / : [0,1] —► R1 — измеримая функция, причем J f2(x)dx < оо. Предположим, что мы наблюдаем семейство {ук{ш, х)}
По результатам т наблюдений {у\(х),., ут{%)) требуется построить оценку где через М- обозначена операция интегрирования относительно вероятностной меры Р.
Задача (3) — это типичная постановка задачи стохастического восстановления неизвестной функции f{x), которая рассматривалась многими авторами, например [24] и др.
Перейдем теперь к изложению результатов, близких к задаче [24]. В работе И. JI. Легостасвой и А. Н. Ширяева [11] решена задача минимаксного оценивания неизвестных параметров полиномиального тренда, по наблюдениям за ним с некоррелированными гауссовскими ошибками.
В работе П. П. Ченцова [04] построены оценки неизвестной функции f(x) из 1/г([0> 1]) и исследованы статистические и асимптотические свойства этих оценок.
В работе В. Levit, N. Stepanova [71] рассмотрен процесс с непрерывным временем, описываемый стохастическим уравнением Ито, коэффициент сноса которого является оцениваемой аналитической функцией, а перед стохастическим интегралом Ито стоит малый параметр. В работе построены мишшакспые оценки коэффициента сноса и исследованы их асимптотические свойства, когда малый параметр стремится к нулю.
В работах Б. С. Дарховского [24, 25] содержится подробный обзор современных результатов, связанных с решением задачи восстановления неизвестной функции как в детермииироваппой, так и в стохастической
Ук(х) = f(x)+nk(x).
2) fm(x) такую, что
3) постановке. Установлены условия существования оптимальной оценки неизвестной функции и исследованы ее статистические свойства.
В работе И. А. Ибрагимова [30] рассмотрена задача об оценке многомерной регрессии, при этом предполагается, что функция регрессии и ее оценка квадратично интегрируемы. В этой статье установлены границы величины погрешности в терминах поперечников по Колмогорову и Берпштейну
ЭНТрОПИИ.
В книге И. А. Ибрагимова и Р. 3. Хасьминского [31] для выборки из генеральной совокупности с неизвестной плотностью распределения построены ядерные оценки Парзеиа-Розенблатта в задаче оценивания неизвестной плотности. Для этих оценок также получены достаточные условия состоятельности.
В работах Р. Л. Стратоновича [57, 58] рассмотрена задача восстановления неизвестной функции по наблюдениям с ошибками. Предположено, что неизвестная функция иредставима в виде конечной линейной комбинации "базисных" функций, а ошибки имеют гауссовское распределение, причем измерения равноточные. В них был установлен оптимальный рекуррентный алгоритм восстановления неизвестной функции и исследованы его асимптотические свойства.
В книге В. И. Тихонова, Н. К. Кульмана [59], построена оценка максимального правдоподобия неизвестной функции, представляющая собой конечную линейную комбинацию некоторых "базисных" функций по наблюдениям за ней с ошибками.
В работах В. Н. Вапника [16, 17], основываясь на теореме Гливенко-Кантелли, был разработан алгоритм восстановления неизвестной функции по наблюдениям с ошибками, а также приводятся программы, реализующие его на ЭВМ.
В работах С. М. Ермакова и А. А. Жиглявского [28], а также С. М. Ермакова и др. [27], посвященных теории планирования эксперимента, рассмотрена задача стохастического восстановления. В них содержится методика построения непараметрических оценок неизвестной функции и исследуются их асимптотические свойства.
3. Обзор статистических пакетов. Реализация задач восстановления случайных функций в современных условиях предполагает использование ЭВМ. Системы анализа данных на ЭВМ (статистические пакеты) являются, по сравнению с другими наукоемкими программами наиболее широко применяемыми в практической и исследовательской работе. По официальным данным Международного статистического института число различных наименований статистических программных продуктов (СПП), распространяемых на рынке, приближается к тысяче.
В работах Айвазяна С. А. [70] и [3] была предложена классификация статистических пакетов. Подробное рассмотрение функционального наполнения СПП приведено в ['!]. Сравнение пакетов по мощности, степени интеллектуализации и удобству взаимодействия с ними осуществляется на основании десяти показателей качества СПП: 1) разнообразие и стенень совершенства методов статистического анализа, а также средств управления данными; 2) скорость вычислений и выдачи результатов анализа; 3) качество выходных форм; 4) простота использования; 5) легкость обучения; 6) общий уровень технологичности использования; 7) удобство и полнота общей справочной службы; 8) качество и иолиота автоматизированных статистических консультаций "на входе" задачи; 9) качество и полпота автоматизированных статистических консультаций в процессе проводящегося статистического анализа; 10) качество и полнота автоматизированных статистических консультаций "па выходе" статистического анализа. Кроме того, статистические пакеты классифицируют по трем категориям: универсальные (интегральные), специализированные и пакеты, занимающие нишу между универсальными и специализированными.
Универсальные статистические пакеты общего назначения предназначены для решения широкого класса задач. К ним относятся: система SAS (см. [85]); пакет SPSS [65]; система SYSTAT [74, 75, 82, 85]; пакет MINITAB [S.1, 82, 85]; пакет Statgraphics [85, 26, 47, 61]; пакет Statisti-са [76, 82, 1.4].
К специализированным пакетам относятся:
• Класс-Мастер — решение задач кластерного анализа;
• Stat-Media — решение задач классификации, включая снижение размерности и визуализацию данных, а также ряд смежных разделов разведочного, компонентного анализа, проверки гипотез, анализа данных смешанной природы и др. При этом, за счет ряда математических или алгоритмических приемов ([2, 8, 53, 60] и др.), пакет работает лучше многих аналогов;
• Palmoda — предназначен для анализа данных и распознавания образов, решения задач классификации и прогноза, поиска логических закономерностей и поддержки принятия решений в условиях неопределенности;
• STARC — решение задач: классификации "с учителем", кластерного анализа и сжатия данных, статистических вычислений и графики, преобразования признаков;
• КВАЗАР — предназначен для решения задач классификации на ПЭВМ [33];
• PolyAnalyst — предназначен для обнаружения знаний, скрытых в базах данных. Научное направление, к которому относится программа, называется Data Mining and Khowledge Discovery ("добыча данных и обнаружение знаний"). О финансовых приложениях программы Poly-Analyst можно прочесть в [34];
• MVSP — выполняет анализ главных компонент и проецирование на плоскость, натянутую па пару двух доминирующих компонент, производит анализ соответствий, кластерный анализ с 18-ю различными метриками и выбором одного из различных подходов к группировке;
• CART — предназначен для автоматического разведочного анализа данных. Этот пакет строит классификационные и регрессионные деревья. Пакет является превосходным продуктом по сравнению с аналогами типа CHAID из пакета SPSS или Knowledge Seeker. Существует ряд специализированных и универсальных СПП: STADIA, ОЛИМП, РОСТАН, ODA, WinSTAT, Statit, UNISTAT, Multivariancc, JMP, SOLO, МЕЗОЗАВР, STATlab, которые образуют третью категорию. По сравнению с универсальными им не хватает функциональной мощности последних (по статистическим методам).
Отметим, что помимо указанных выше ирограмиых пакетов существует "R Project" [8-1] и разработанная на его основе узкоспециальная система статистического анализа данных "Maanova: Tools for analyzing Micro Array experiments" [SO], широко используемая в генетике.
4. Актуальность темы диссертационной работы. Теория оценивания бесконечномерного параметра является наиболее активно развивающимся направлением математической статистики, о чем говорит большое количество публикаций, вышедших в последнее время. Одним из важных разделов этого направления являются задачи стохастического восстановления. Отличительной особенностью задачи стохастического восстановления от задач теории оценивания классической математической статистики является бескопечпомерпость оцениваемого параметра. (Поэтому задачи стохастического восстановления относят к области пепараметрического оценивания.) Последнее обстоятельство приводит к необходимости создания новых методов: а) оценивания этих параметров, б) анализа асимптотических свойств построенных оценок.
Известно, что задача стохастического восстановления имеет много различных приложений. Приведем некоторые из них: 1) выделение полезного сигнала f(x), х G [0,1] на фоне помех п(х) тина гауссовского белого шума, когда полезный сигнал f{x) принадлежит некоторому функциональному пространству (например L2QO, 1])) или его подмножеству [31]; 2) оценивание функции регрессии по наблюдениям за ней с аддитивными независимыми ошибками в эконометрике и планировании эксперимента [30]; 3) выделение трендов и сезонных колебаний стоимостей активов в экономике [1, 46]; 4) восстановление реакции генов на внешние раздражители [77, 78, 83].
Из вышесказанного следует актуальность темы диссертационной работы. 5. Методы исследования и научная новизна.
В диссертации рассматривается задача оценивания гауссовской случайной функции по наблюдениям за ней с ошибками.
Мы предполагаем, что: i) оцениваемая функция / : Q х [0,1] —> Ж1 — гауссовская случайная функция с М f\f(uj,x)\2 dx < 00; ii) ошибки n:N+xftx[0,l] —> R1 — также гауссовская случайная функция с М / п\{и), x)dx < 00 для любого к = 1,2,.; iii) наблюдаемая последовательность х) представляет собой аддитивную смесь случайной функции f(u,x) и nk(w,x), т.е.
По результатам наблюдений {yi(x),., yi{u>, х) }, где\/х Е [0,1], требуется построить оценку гауссовской случайной функции f(u,x), обозначаемую через fi(x), наилучшую в смысле следующего критерия: о ук(и, х) = f(w, х) + пк{и, х).
4) о
Здесь нижняя грань берется по множеству оценок }{х) таких, что 1 Л 2
М / f(x) dx < 00. о
Ясно, что рассматриваемая задача обобщает постановку задачи стохастического восстановления (описанную в пункте 2.2), так как /(о;, х) — случайная функция. Следует также отметить, что в диссертации рассмотрены два варианта наблюдаемых последовательностей.
Случай 1. Предполагается, что наблюдению доступен счетный набор последовательностей {у\} г>о,, причем к=Ц 1 угк = J yk{u,x)(pi(x)dx, (6) о где {у>г(я)}г> о — некоторое семейство ортопормированпых функций из L2([0,1]).
При дополнительных предположениях технического характера автором построены: а) алгоритм оптимального оценивания гауссовской случайной функции (теорема 2.1, б) алгоритм £-оптималыюго стохастического оценивания (теорема 2.2).
Опираясь па эти результаты в диссертации: i) для оптимального алгоритма установлены свойства несмещенности (теорема 2.4) и состоятельности (теорема 2.5) оценок гауссовской случайной функции f(LU,x); ii) для ^-оптимального алгоритма установлены свойства асимптотической несмещенности и состоятельности (когда е —► 0).
Кроме того, в диссертации установлено, что из этих результатов следует существование оптимального и ^-оптимального решения задачи стохастического восстановления в постановке (3).
Случай 2. Наблюдения проводятся в конечном числе точек хп е [0,1], причем наблюдаемая последовательность имеет вид ук(ш, Xi) = f{oj, Xi) + nk{uj, Xi), (7) где к = 1,1. Для такой схемы наблюдений устанавливаются условия существования: i) алгоритма у^-оптималыюго оценнвания гауссовской случайной функции /(со,х) по наблюдениям с ошибками (теорема 2.6); и) алгоритма оптимального оценивания гауссовской случайной функции по наблюдениям с ошибками(теорема 2.7).
Опираясь па эти результаты, здесь также построены оптимальные п у/ё-оптимальиые решения задач непараметрического проекционного оценивания неизвестной функции f(x) 6 ([0,1]) в смысле критерия (3).
Следует также отмстить еще два новых момента связанных со всеми выше описанными результатами: i) все алгоритмы (оптимальные н ^-оптимальные, f3 > 0) являются рекуррентными; ii) ^-оптимальные алгоритмы решения задачи стохастического восстановления приводят к схеме Калмана-Быоси оценки неизвестных параметров.
Приведенные выше результаты, касающиеся задачи у^-оптимальпого восстановления по наблюдениям в конечном числе точек при использовании тригонометрического базиса в Z>2([0,1]) позволяют обосновать методику выбора точек х\,.,хп 6 [0,1] в которых следует проводить наблюдения (теоремы 3.1 и 3.4). Доказано, что в этом случае оптимальным в смысле минимума следа дисперсионной матрицы оценок является равномерное разбиение отрезка [0,1]. Опираясь на этот результат, в работе дается описание и обоснование алгоритма, который позволяет численно построить решение стохастической задачи восстановления на ЭВМ. 6. Перейдем к краткому изложению работы.
В первой главе содержатся необходимые для изложения результатов работы сведения из функционального анализа, теории меры, теории вероятностен и математической статистики. Здесь вводятся также необходимые для изложения обозначения и определения.
Вторая глава посвящена решению задачи оценивания гауссовской случайной функции, значения которой наблюдаются с ошибками. В первых двух параграфах вводятся основные обозначения, даются определение оценки гауссовской случайной функции, оптимальной оценки, а также приводится постановка задачи оценивания гауссовской случайной функции. В §§ 3 и 4 формулируется и доказывается основной результат — теорема о существовании оптимальной оценки неизвестной функции по наблюдениям за семейством {угк} случайных величин, описываемых (6). В § 5, опираясь на результаты § 4, устанавливаются: i) условия несмещенности построенных оценок; и) условия состоятельности оценок. В § б устанавливаются условия существования е-оптимальных оценок гауссовской случайной функции по наблюдениям (б), а также некоторые свойства этих оценок. В § 7 рассматривается задача стохастического восстановления функций из I/2([0,1])- В нем построены и обоснованы процедуры оптимального и ^-оптимального восстановления.
Третья глава диссертации посвящена оптимальному и ^-оптимальному (/3 > 0) оцениванию гауссовской случайной функции по наблюдениям за ней с гауссовскнми случайными ошибками, проводимым в конечном числе точек отрезка [0,1].
В § 1 содержится постановка задачи и необходимые для изложения материала определения и обозначения. В § 2 устанавливаются условия существования оценок гауссовской случайной функции по наблюдениям за ней в конечном числе точек отрезка [0,1]. В § 3, опираясь на результаты § 2, получены условия существования решения задачи оптимального оценивания гауссовской случайной функции по паблюдепням за ней с гауссовскнми ошибками в конечном числе точек из [0,1]. В § 4 устанавливаются условия существования ^-оптимальных непараметрических проекционных оценок неизвестной функции из L2QO, 1]) по наблюдениям за пей с гауссовскнми ошибками в конечном числе точек отрезка [0,1]. § 5 посвящен решению задачи аналогичной рассмотренной в § 4 с той лишь разницей, что здесь в качестве ортонормироваипого базиса используется тригонометрический. Кроме того, в этом параграфе решается задача выбора точек в которых следует проводить наблюдения.
Четвертая глава диссертации посвящена разработке, обоснованию и описанию алгоритма, реализующего решение задачи стохастического восстановления (3) по наблюдениям с ошибками с конечном числе точек, в виде комплекса программ для ПЭВМ.
§ 1 посвящен построению и обоснованию методики восстановления неизвестной функции, представляющей собой линейную комбинацию тригонометрических функций с неизвестными периодами. В § 2, опираясь на результаты § 1, приводится и обосновывается процедура построения ортонормироваипого базиса по результатам наблюдений. § 3 посвящен описанию комплекса программ, реализующих алгоритм восстановления неизвестной функции. В § 4 и § 5, соответственно, рассмотрены применения комплекса программ, реализующих алгоритм восстановления неизвестной функции, для задач:
1) восстановление динамики котировок валют рубль (Россия)-йена (Япония) и рубль (Россия)-доллар (США);
2) восстановление зависимостей экснресснй слайдов генных карт.
Диссертация также включает два приложения. В приложении 1 содержится описание и порядок работы с комплексом программ "МНК-тренд", реализующим алгоритм восстановления неизвестной функции в операционных системах Windows 2000 и Windows ХР, построенный в § 3 главы 4 диссертации. В приложении 2 содержится описание и порядок работы с комплексом программ "CardScan", осуществляющим полуавтоматическую оцифровку данных экспрессии генов блоков слайдов генных карт.
Результаты диссертации опубликованы в одиннадцати работах, список которых приведен в конце диссертации.
7. В диссертации принята обычная двойная нумерация теорем, формул и рисунков, самостоятельная в каждой главе. При ссылках на теорему, определение, замечание или формулу помер главы ставится впереди. В приложениях принята одинарная нумерация теорем, формул, рисунков и таблиц, самостоятельная в каждом приложении. В каждом параграфе, а также во введении и в приложениях введена самостоятельная двойная нумерация пунктов. Ссылки на труды, указанные в библиографическом списке, приведены в квадратных скобках.
Автор выражает признательность своему научному руководителю профессору Владимиру Миннровнчу Хаметову за постоянную помощь и внимание к работе над диссертацией. Автор выражает признательность Борису Петровичу Тюхову и Андрею Игоревичу Топунову за консультации при создании программы "CardScan", а также Ивану Михайловичу Гостеву за полезные обсуждения.
Заключение диссертация на тему "Алгоритм восстановления функций"
Заключение
В диссертационной работе получены следующие результаты:
1) получены условия существования состоятельной, несмещенной проекционной оптимальной (в смысле критерия минимума среднеквадратической ошибки (СКО)) оценки гауссовской случайной функции, которая наблюдается со случайными гауссовскими ошибками (теоремы 2.3, 2.4, 2.5);
2) получены условия существования СКО ^-оптимальной гауссовской случайной функции, которая наблюдается со случайными гауссовскими ошибками (теорема 2.6);
3) получены условия существования СКО оптимальных и е-оптимальных, проекционных, непараметрических оценок в задаче стохастического восстановления неизвестной функции из I/2([0,1]) (теоремы 2.8, 2.9);
4) получены условия существования СКО ^/ё-оптимального и оптимального, проекционного оценивания гауссовской случайной функции, которая наблюдается со случайными гауссовскими ошибками в конечном числе точек из отрезка [0,1] (теоремы 3.1, 3.2);
5) получены условия существования СКО ^-оптимальных, непараметрических, проекционных оценок в задаче стохастического восстановления неизвестной функции из L2([0,1]) по наблюдениям в конечном числе точек из отрезка [0,1] (теорема 3.3);
6) алгоритм СКО оптимального стохастического восстановления неизвестной функции по наблюдениям, представляющим собой аддитивную смесь неизвестной функции и случайных гауссовских ошибок, проводимым в конечном числе точек отрезка [0,1].
На защиту выносятся следующие результаты:
1) процедуры оптимального и £-оптимальпого проекционного оценивания гауссовской случайной функции, наблюдаемой со случайными гауссовскими ошибками;
2) процедуры оптимального и ^-оптимального, непараметрического проекционного оценивания функции из Ь2([0,1]) в задаче стохастического восстановления;
3) процедуры у^-оптимальпого и оптимального, проекционного оценивания гауссовской случайной функции, наблюдаемой со случайными гауссовскими ошибками в конечном числе точек из отрезка [0,1];
4) процедура ^-оптимального неиараметрического, проекционного оценивания функции из Ь2([0,1]) в задаче стохастического восстановления по наблюдениям в конечном числе точек из отрезка [0,1];
5) алгоритм стохастического восстановления неизвестной функции по наблюдениям за ней с гауссовскими ошибками в конечном числе точек.
Библиография Сиверцев, Олег Николаевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: Учебник для вузов. — М.: ЮНИТИ, 1998. — 1022 с.
2. Айвазян С. А. Прикладная статистика: Классификация и снижение размерности: Справ, изд. /Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкип JI. Д. — М.:Финансы и статистика, 1989. — 607 с.
3. Айвазян С. А. Программное обеспечение персональных ЭВМ но статистическому анализу данных // Компьютер н экономика: экономические проблемы компьютеризации общества. — М.: Наука, 1991. -С. 91-107.
4. Айвазян С. А., Степанов В. С. Программное обеспечение по статистическому анализу данных: методология сравнительного анализа и выборочный обзор рынка // http://www.cemi.rssi.ru/rus/publicat/e-pubs/ep97001t.htm
5. Бадков В. М. Аппроксимативные свойства рядов Фурье по ортогональным полипомам. // Успехи матем. Наук. — 1978 — Т.ЗЗ. — № 4. С.51-106.
6. Бадков В. М. Асимптотические и экстремальные свойства ортогональных полиномов при наличии особенностей у веса // Тр. МИРАН. 1992. - Т.198 - С.41-88.
7. Бадков В. М. Приближение функций в равномерной метрике суммами Фурье по ортогональным полиномам // Тр. МИАН СССР. — 1980 — Т. 145 С.20-62.
8. Барсов Д. А. Минимизация ошибки классификации при использовании смещенных дискримииантных функций // Статистика. Вероятность. Экономика. — М.: Наука, 1985. — С.376-379.
9. Бслоглазов И. Н., Джанжгава Г. И., Чигип Г. П. Основы навигации по геофизическим полям. — М.: Наука, 1985. — 328с.
10. Белых В. М. О решении вырожденных задач наилучшей дробно-рациональной аппроксимации // Вестн. Ленингр. ун-та. — 1976. — № 7. — С.5-12.
11. И. Бердышев В. И. Аппроксимация обобщенными полиномами, обеспечивающая наилучшую привязку // Мат. Заметки. — 1996. — Т.60. № 5. - С.655-669.
12. Бердышев В. И., Петрак JL В. Аппроксимация функций, сжатие численной информации, приложения. Екатеринбург: УрО РАН, 1999. — 279с.
13. Бертсекас Д., Шрив С. Стохастическое оптимальное управление: случай дискретного времени. — М.:11аука,1985. — 279 с.
14. Боровиков В. П., Боровиков И.П. Statistica® — Статистический анализ и обработка данных в среде Windows®. Изд. 2е, стереотипное — М.: Информационно-издательский дом "Филинъ", 1998. — 608 с.
15. Боровков А. А. Математическая статистика: Учебник. — М.: Наука. Главная редакция физико-математической литературы, 1984. — 472 с.
16. Вапник В. Н., Гладкова Т. Г., Кощеев В. А., Михальский А. И., Червоненкис А.Я. Алгоритмы и программы восстановления зависимостей. — М: Наука, Главная редакция физико-математической литературы, 1984. — 816 с.
17. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979. 447 с.
18. Вирт Н. Алгоритмы и структуры данных. — М.: Мир, 1989. — 360 с.
19. Волков Е. А. Численные методы: Учебное пособие для вузов. — М.: Наука, Главная редакция физико-математической литературы, 1987. — 248 с.
20. Габасов Р. Ф., Кириллова Ф. М. Основы динамического программирования. Мн.: Изд-во БГУ, 1975. —264 с.
21. Гиляров М. С. Биологический энциклопедический словарь. М.: Сов. энциклопедия, 1986. —831 с.
22. Го Х.С. Гауссовские меры в банаховых пространствах. — М.: Мир, 1979. 176 с.
23. Давеипорт В. В., Рут В. J1. Введение в теорию случайных сигналов и шумов. М.: ИЛ, I960. - 468 с.
24. Дарховскнй Б. С. Новый подход к стохастической задаче восстановления // Теория вероятностей и ее применения. — 2004. — Т.49 — Вып. 1. — С.36-53.
25. Дарховский Б. С. О стохастической задаче восстановления // Теория вероятностей и ее применения. — 1998. — Т.43 — Вып. 2 — С.357-364.
26. Дюк В. А., Мирошпиков А.И. Эволюция STATGRAPHICS //Мир ПК. -1995. № 12 - С.32-34.
27. Ермаков С. М. и др. Математическая теория планирования эксперимента (под редакцией С. М. Ермакова) —М.: Наука, 1983. — 392 с.
28. Ермаков С. М., Жиглявский А. А. Математическая теория оптимального эксперимента: Учебное пособие. — М.: Наука, Главная редакция физико-математической литературы, 1987. — 320 с.
29. Закс Ш. Теория статистических выводов. — М.: Мир, 1975. — 776 с.
30. Ибрагимов И. А. Об оценке многомерной регрессии // Теория вероятностей и ее применения. — 2003. — Т.48 — Вып. 2. — С.301-320.
31. Ибрагимов И. А., Хасьмипский Р. 3. Асимптотическая теория оценивания. — М.: Наука, Главная редакция физико-математической литературы, 1979. — 528 с.
32. Иосида К. Функциональный анализ. — М.: Мир, 1967. — 624 с.
33. Казанцев В. С. Задачи классификации и их программное обеспечение (пакет КВАЗАР). М.: Наука, 1990. - 136 с.
34. Киселев М. В. Data Mining в управлении портфелем ГКО-ОРФ // Банковские технологии, декабрь 1996. — с.86-88.
35. Козлов В. А., Хомепко J1. А., Кондратьев В. П. Реография поджелудочной железы. — Свердловск: Изд-во Уральского университета, 1990. — 88 с.
36. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. — М.: Наука, Главная редакция физико-математической литературы, 1976. —542 с.
37. Кондратьев В. П. Приближение экспоненциальными суммами // Программы оптимизации. — Свердловск: УНЦ АН СССР, 1975. — С.З-17.
38. Корнейчук Н. П. Экстремальные задачи теории приближения. — М.: Наука, 1976. 320 с.
39. Кутоянц Ю. А. Оценивание параметров случайных процессов. — Ереван.: Изд-во АН АССР, 1980. 251 с.
40. Лабуиец В. Г. Алгебраическая теория сигналов и систем. Быстрое многомерное преобразование Фурье. — Свердловск: Изд-во Уральского университета, 1989. — 195 с.
41. Легостаева И. Л., Ширяев А. П. Минимаксные веса в задаче выделения тренда случайного процесса // Теория вероятностей и ее применения. — 1971. T.XVI. - Вып. 2. - С.339-345.
42. Лемаи Э. Проверка статистических гипотез. — М.: Наука, 1964. — 297 с.
43. Липцер Р. Ш. Ширяев А.Н. Статистика случайных процессов (нелинейная фильтрация и смежные вопросы) — М.: Наука, 1974. — 696с.
44. Лоэв М. Теория вероятностей. — М.: ИЛ, 1962. — 720 с.
45. Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения — М.: Эдиториал УРСС, 2000, 174 с.
46. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс: Учебник — М.: Дело, 2001. — 400 с.
47. Макаров A. A. STADIA против Statgraphics, или Кто ваш "лоцман" в море статистических данных //Мир ПК. — 1992. — № 3 — С.58-66.
48. Нуссбаумер Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток. — М.: Радио и связь, 1985. — 248 с.
49. Петрак JI. В. Приближение функций многих переменных рациональными дробями // Труды ИММ УНЦ АН СССР. — 1975. — Вып. 6: Программы оптимизации (приближение функций). — С. 130-144.
50. Петрак Л. В. Приближение функций одного переменного рациональными дробями // Труды ИММ УНЦ АН СССР. — 1975. — Вып. 6: Программы оптимизации (приближение функций). — С. 110-129.
51. Петрак JI. В. Среднеквадратичное приближение функций многих неременных обобщенными рациональными дробями // Алгоритмы приближения функций: Материалы по мат. обеспечению ЭВМ. — 1987. — С.89-106.
52. Порхапова А. А. Чебышевская аппроксимация дробно-рациональными выражениями // Вычислительная математика в современном научно-техническом прогрессе. — Киев: Знание, 1974. — С.300-308.
53. Сердобольский В. И. О минимальной вероятности ошибки в дискримипантном анализе // ДАН СССР. 1983. - № 5. - С.1066-1070.
54. Сипгер М., Берг П. Гены и геномы. М.: Мир, 1998. - Т.1 - 373 с.
55. Скороход А. В. Интегрирование в гильбертовом пространстве. — М.: Наука, Главная редакция физико-математической литературы издательства, 1975. — 230 с.
56. Спирин А. С. Молекулярная биология: структура рибосомы и биосинтез белка. — М.: Высш. шк., 1986. — 303 с.
57. Стратопович P. JI. Оптимальное расширение функционального подпространства в алгоритмах восстановления плотности и функции распределения // Известия АН СССР, Техническая кибернетика. — 1970. № 2. - С.57-64.
58. Стратопович P. JI. Эффективность методов математической статистики в задачах синтеза алгоритмов восстановления неизвестной функции // Известия АН СССР, Техническая кибернетика. — 1969. — № 1. — С.32-46.
59. Тихонов В. И., Кульман Н. К. Нелинейная фильтрация и квазикогерентиый прием сигналов. — М.:Советское радио, 1975. — 704с.
60. Тыокки Дж. У. Анализ результатов наблюдений. — М.: Мир, 1981. — 693с.
61. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере. — М.: Иифра-М, 1995. 384 с.
62. Фихтенгольц Г. М. Курс дифференциального и интегрального исчислеиия. Т. 3. — М.: Наука, 1966. — 656 с.
63. Чебышев П. Л. Избранные труды. М.: АН СССР, 1955. - 926 с.
64. Ченцов Н. Н. Статистические решающие правила и оптимальные выводы. М.: Наука, 1972. — 520 с.
65. Шанчев P. SPSS-7.5 прокладывает курс в океане данных. — PC Week, 1997. № 12 (86). - С.6.
66. Шилов Г. Е. Математический анализ. Специальный курс. — М.: ГИФМЛ, 1961. 436 с.
67. Ширяев А. Н. Вероятность. М.: Наука, ГРФМЛ, 1980. - 575 с.
68. Ширяев А. Н. Основы стохастической финансовой математики. Факты. Модели. Т.1. - М.: Фазис, 1998. - 512с.
69. Шостак А. М., Марченков Н. А., Бердышев В. И, Пацко Н. JI. Разработка алгоритма многопараметрового акустико-эмиссиониого прогнозирования прочности нагруженных конструкций //Дефектоскопия. 1983. - № 6. - С.88-92.
70. Aivazian S. A. Model and Method-Oriented Intelligent Software for Statistical Data Analysis. — In: Model-Oriented Data Analysis System. Springer-Verlag: N.-Y., 1987. P. 153-158.
71. B. Levit, N. Stepanova. Efficient estimation of multivariate analytic functions in the cube-like domains. Math. Methods Statist., v. 13, No. 3 (2004). — P.253-281.
72. Berdyshev V. I., Berdyshev S. V. On compression and modeling of images // Russ. J. Numer. Anal, and Math. Modelling. 1996. - V.ll - № 4. -P.275-285.
73. CSIRO Mathematical and Information Sciences, Image Analysis Group. Spot: Software for Analysis of Microarray Images. http://spot.cmis.csiro.au/spot/index.php, 2005.
74. Fridlund A. J. CTI Catalogue of Economics Software: STATISTICAL ANALYSIS. P.21
75. Fridlund A. J. Powerful SYSTAT Limited by Outdated Interface. Info World. 21-st Oct., 1995. - V. 17 - № 40. - P.99.
76. Fridlund A. J. Sophisticated STATISTICA Is a Slick Jack-of-all-tradcs. -InfoWorld. 30-th Oct., 1995. P.106.
77. Hastie Т., Tibshirani R., Botstein D., Brown P. Supervised harvesting of expression trees, Tech. rep., Stanford University, http://www-stat.stanford.edu/~tibs (August 2000).
78. Kerr M. К., Churchill G. A. Experimental design for gene expression microarrays, Tech. rep., The Jackson Laboratory, http://www.jax.org/research/churchill/pubs/index.html (August 2000).
79. Kerr M. K., Churchill G. A. Statistical Design and the Analysis of Gene Expression Microarray Data, The Jackson Laboratory, http: / / www.jax.org/staff/churchill/labsite/research / expression / review.pdf
80. Maanova: Tools for analyzing Micro Array experiments. http://www.jax.org/staff/churchill/labsite/software/Rmaanova/
81. Schervish M. J. MINITAB. CHANCE: New Directions for Statistics and Computing. 1993. - V.6 - № 1. - P.54-61.
82. Stein P. G., Matey J. R., Pitts K. A. Review of Statistical Software for the Apple Macintosh. — The American Statistician, 1997. — Feb. — V.51 — № 1 P.67-82.
83. Szabo A., Boucher K., et al. Variable Selection and Pattern with Gene Expression Data Generated by the Microarray Technology. Mathematical biosciences. 2002 Mar. - 176(1) - P.71-98.
84. The R Project for Statistical Computing, http://www.r-project.org.
85. Wass J. A. How Statistical Software Can Be Assessed. — Scientific Computing & Automation. 1996 (October) P. 14-24.
86. Wolfinger R. D., Gibson G., Wolfinger E. D., Bennett L., Hamadeh H., Bushel P., Afshari C., Paules R. S. Assessing gene significance from cDNA microarray expression data via mixed models, (2000).
87. Yang Y. H., Buckley M. J., and Speed. T. P. Analysis of cDNA microarray images. — Briefings in Bioinformatics, 2(4), 2001.
88. Список опубликованных работ по теме диссертации
89. Сиверцев О. Н. s-оптимальный алгоритм восстановления слайдов генных карт // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. М. : МИЭМ, 2006, С.22-23.
90. Сиверцев О. Н. Алгоритм восстановления функций // Новые информационные технологии. Тезисы докладов XII Международной студенческой школы-семинара М.: МГИЭМ, 2004, С.232-234.
91. Сиверцев О. Н. Алгоритм s-оптимального восстановления случайных функций из Ьг0,1. // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. М.: МИЭМ, 2005, С.29-30.
92. Сиверцев О. Н. Математические модели генетики // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. М. : МИЭМ, 2003, С.34-35.
93. Сиверцев О. Н. Модель эволюции курсов валют // Научно-техническая конференция студентов, аспирантов и молодых специалистов института, посвященная 40-летию МИЭМ. Тезисы докладов. М.: МИЭМ, 2002, С.21-23.
94. Сиверцев О. Н. О состоятельности оценок в задаче восстановления квадратично интегрируемых случайных функций // Новые информационные технологии. Тезисы докладов XIII Международной студенческой школы-семинара- М.: МГИЭМ, 2005, С.113-115.
95. Сиверцев О. Н. Один метод восстановления функций // Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. М. : МИЭМ, 2004, С.39-41.
96. Сиверцев О. Н. Прогноз котировок валют // Новые информационные технологии. Тезисы докладов X Юбилейной Международной студенческой школы-семинара в 2-х томах М.: МГИЭМ, 2002. T.l, С.292-294.
97. Сиверцев О. Н., Хаметов В. М. Задача восстановления функций. Обозрение прикладной и промышленной математики, 20Об, Т. 13, выпуск 2, С. 354-356.
98. Сиверцев О. Н., Хаметов В. М. Свидетельство об официальной регистрации программы для ЭВМ № 2004612393, от 20.10.2004 г. "МНК-тренд".
-
Похожие работы
- Разработка и исследование алгоритма восстановления разностного уравнения объекта по его временным характеристикам
- Восстановление изображений, искажённых свёрткой с неизвестной функцией
- Анализ применения нейронных сетей в некоторых задачах цифровой обработки изображений
- Исследование процедуры дискретизации и восстановления реализаций случайных процессов в радиотехнических системах по функции условного среднего
- Исследование процедуры дискретизации и восстановления реализаций случайных процессов в радиотехнических системах по функции условного среднего
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность