автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математическое моделирование и оценивание распределений в зависимости доза-эффект
Автореферат диссертации по теме "Математическое моделирование и оценивание распределений в зависимости доза-эффект"
На правах рукописи
Яр о щук Марина Владимировна
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ОЦЕНИВАНИЕ РАСПРЕДЕЛЕНИЙ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ
05.13.18 - Математическое моделирование, численные методы и комплексы программ
4856100
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
* * I и(/
Нижний Новгород - 2011
4856100
Работа выполнена в Нижегородском государственном университете им. Н.И. Лобачевского (национальный исследовательский университет).
Научный руководитель: доктор физико-математических наук, профессор
Тихов Михаил Семенович
Официальные оппоненты: доктор физико-математических наук, профессор
Насыров Фарит Сагитович
доктор технических наук, профессор Лапидус Вадим Аркадьевич
Ведущая организация: Российский Университет Дружбы Народов
Защита состоится «Л» J-z20И г. на заседании диссертационного совета Д 212.166.13 при Нижегородском государственном университете им. Н.И. Лобачевского по адресу: 603950, г. Нижний Новгород, пр. Гагарина, 23, корпус 2, ауд. 209. € ^
С диссертацией можно ознакомиться в фундаментальной библиотеке Нижегородского государственного университета им. Н.И. Лобачевского.
С текстом автореферата можно ознакомиться на официальном сайте Нижегородского государственного университета им. Н.И. Лобачевского http ://www.unn.ru
Автореферат разослан « ^ » /-А2011 г.
Ученый секретарь диссертационного совета кандидат физико-математических наук, доцент
В.П. Савельев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Анализ связи между дозой и эффектом и их количественное определение является одной из актуальных проблем, возникающих при разработке новых лекарственных средств, т.е. веществ, обладающих фармакологической активностью, прошедших клинические испытания и предназначенных для изготовления лекарственных форм. Под дозой мы понимаем некоторое значение агента (фактора), которое может изменить состояние исследуемого объекта, а под эффектом - наблюдаемый качественный (альтернативный) отклик объекта на введенную дозу. Решение этой задачи представляет большой теоретический интерес и имеет обширные практические приложения во многих областях медицины и биологии.
Основу решения проблемы количественного оценивания связи между введенной дозой и наблюдаемым эффектом составляет функция эффективности, под которой понимается зависимость вероятности наблюдения эффекта от введенной дозы (зависимость доза-эффект). Задача оценивания функции эффективности по экспериментальным данным, а именно, введенной дозе и наличию или отсутствию эффекта, является главной задачей зависимости доза-эффект.
Функция эффективности имеет очень важное, а иногда и принципиальное значение в фармакологии - при оценке эффективности лекарственных препаратов, в токсикологии и радиологии — при исследовании количественной токсичности ядов и поражающих свойств ионизирующих излучений, в гигиене - при нормировании критических уровней вредных факторов. В экологии анализ зависимости доза-эффект дает возможность определить пределы устойчивости экосистемы.
Построение функции эффективности является статистической задачей, способ решения которой предъявляет соответствующие требования к планированию эксперимента и виду получаемых исходных данных. Биологический эксперимент на завершающем этапе требует методологически обоснованных точных статистических оценок результатов, учитывающих погрешности получения исходных данных и их влияние на конечные результаты. Поэтому с прикладной стороны актуальность темы диссертации не вызывает сомнений.
В некоторых случаях отсутствует понятие дозы в вышеопределенном смысле. Примером могут служить эконометрические модели с дискретными зависимыми переменными при случайной константе регрессионной зависимости1, оценка инкубационного периода. Тем не менее, такие задачи
1 Тихов, М.С. Эконометрические дискретные модели бинарного выбора / М.С. Тихов // Прикладная статистика в социально-экономических проблемах: материалы межд. конф. (под ред. Стронгиной Н.Р.) - Нижний Новгород: изд-во ННГУ - 2003. - Т. 1. - С. 104106.
Tikhov, M.S. Econometric models with discrete dependent variables // 8-th Intern. Vilnius Con. on Probab. Theory and Math. Stat. Abstracts. - TEV. - Vilnius - 2002. - P. 325.
укладываются в рассмотренную в диссертации модель доза-эффект и могут быть решены предложенными в ней методами.
В диссертационной работе нас интересует проблема нахождения функции эффективности и оценка средних или летальных эффективных доз2 EDma или LDma, соответственно, в широком диапазоне значений О < се < 1, по результатам наблюдений. Мы строим математическую модель зависимости доза-эффект, где рассматриваем минимальную границу, с которой начинается реакция организма, как латентную случайную величину X. Если нижняя граница чувствительности X и введенная доза U независимы как случайные величины, то функция эффективности будет функцией распределения величины X, однако даже в этом случае для оценки функции эффективности и категорий эффективных доз мы не можем воспользоваться классическими методами математической статистики, поскольку исследуемая величина ненаблюдаема, а вместо нее наблюдаются менее информативные величины: введенные дозы Un и индикаторы эффекта W.=I(U,>X.), / = 1,2,... , п. Для оценки функции эффективности мы используем непараметрические методы математической статистики, а именно, ядерные оценки регрессии по выборке объема п. По-
требности практики обуславливают необходимость одновременного определения как эффективных доз от EDS до ED95, так и вида самой функции эффективности.
Для построения кривой доза-эффект и оценки дозы EDsa обычно применяется официальная методика в модификациях Литчфилда-Вилкоксона3 (J.T. Litchfield, F.W. Wilcoxon) и Д. Финни4 (DJ. Finney), а также метод Спирмена-Кербера5 (Е. Spearman, Т. Karber) и метод Рида-Менча6 (L. Reed, Н. Muench). Используются также методы сплайн-аппроксимации. Существенные недостатки традиционных методов определения средне-эффективных доз состоят в том, что они позволяют оценивать эффектив-
2Дозы, гарантирующие наступление эффекта с заданной вероятностью а (например, EDsa - средне-эффективная доза - для 50% объектов наблюдается эффект, LD„- 90% летальная доза - 90% объектов, получивших дозу, погибает).
3Litchfield, J.T. A simplified method of evaluating dose-effect experiments/ J.T. Litchfield, F.W. Wilcoxon // J. Pharmacol. Exper. Ther. - 1949. - V. 96. - P. 99-113.
4Finney, D.J. Probit Analysis / D.J. Finney, 3 ed. - Cambridge: University Press, 1980. -333 p.
5 Закс, JI. Статистическое оценивание / Л. Закс. М.: Статистика, 1976. - 598 с
6 Лакин, Г.Ф. Биометрия / Г.Ф. Лакин. М.: Высшая школа, 1990. - 352 с.
ные дозы в основном в окрестности £DJ0. Методы сплайн-аппроксимации не позволяют строить доверительные интервалы.
Кроме указанных методов для оценивания зависимости доза-эффект и средне-эффективных доз EDS0 (называемых еще медианными средне-эффективными дозами) используются модели бинарного выбора - пробит- и логит-модели, основанные на использовании нормальной или логистической функций распределения. Модели бинарного выбора хорошо работают в окрестности медианных средне-эффективных доз. Эти методы реализованы в большинстве современных эконометрических компьютерных программных пакетов (ЭКПП): SPSS, XL STAT-Dose, BioStat 2007, Probit Analysis, Stat-Plus (Статистика+). С помощью этих ЭКПП можно произвести обработку кривой зависимости доза-эффект, вычислить эффективную дозу, а также соответствующие доверительные интервалы, но в окрестности медианы.
Существуют различные модификации пробит- и логит-анализа, которые, имея в своей основе главную идею - преобразование процентов встречаемости эффекта в пробиты, - различаются алгоритмами линеаризации и статистической обработки. Большая часть этих программ основывается на алгоритме метода максимального правдоподобия для регрессионной схемы в модели бинарного выбора. Некоторые авторы (L.S. Miller & M.L. Tainter7, J.T. Litchfield & F.W. Wilcoxon) используют для этой цели метод наименьших квадратов.
Таким образом, как при пробит-анализе, так и при использовании других моделей, функции распределения рассматриваемых случайных величин хорошо аппроксимируются линейными или нелинейными функциями, но только в окрестности медианы. В диссертации показано, что если истинное распределение отличается от нормального распределения N(a,a2), то оценки «граничных» эффективных доз могут значительно отличаться от значений квантилей истинного распределения. Кроме того, при практической реализации про-бит-анализа или его модификаций отсутствует возможность проведения единичных испытаний (согласно официальной методике испытания должны носить групповой характер), отсутствует возможность построения доверительных интервалов, существующие методы не учитывают погрешность измерений.
В работах М.С. Тихова (1993)8 и М.С. Тихова, C.B. Криштопенко (1997)9 был предложен непараметрический метод оценивания функции эффективно-
7 МШег, L.S. Estimation of the ED50 and its error by means of Jogariphmic probit graph paper/L.S. Miller, M.L. Tainter//Proc.Soe.Exp.Biol.Med.- 1944,-V.7.-P. 261-264.
8Тихов, М.С. Построение и анализ статистических оценок для неполностью известных семейств распределений: дис. д-ра физ.-мат. наук: 01.01.05/С.-Пегербургский гос.ун-т. СПб. 1993.-377 с.
.'Криштопенко, C.B. Токсикометрия эффективных доз/ C.B. Криштопенко, М.С. Тихов - Нижний Новгород: Изд-во ННГУ, 1997. - 156 е.; Криштопенко, C.B. Парадоксальная токсичность/ C.B. Криштопенко, М.С. Тихов, Е.Б. Попова - Нижний Новгород: Изд-во НГМА, 2001. - 164 е.; Криштопенко, C.B. Доза-эффект / C.B. Криштопенко, М.С. Тихов, Е.Б. Попова - М.: Медицина, 2008. - 288 с.
сти, который задачу определения функции эффективности сводит к задаче оценивания функции регрессии и использования для этой цели непараметрических (ядерных) оценок регрессии с параметром сглаживания h— ширины окна просмотра данных. Такой подход позволяет по результатам единичных испытаний оценивать средне-эффективную дозу EDS0 не хуже, чем методы пробит-анализа, а малые и большие дозы, близкие, например, к ED5 или к ED9S, оценивать эффективнее, чем с помощью пробит-анализа, строить доверительные интервалы, достаточно узкие как в середине, так и на краях распределения. С помощью метода, изложенного в этих работах, можно оценивать и немонотонные функции эффективности. Указанный подход позволяет также производить планирование эксперимента. Однако, рассмотренные в работах М.С. Тихова, C.B. Криштопенко оценки функции эффективности (в основном, оценки Надарая-Ватсона) хотя и сходятся к истинному распределению при л—и h—>0, л/г—не являются, во-первых, -Jnh - состоятельными (их предельное математическое ожидание отлично от нуля), а во-вторых, предельная дисперсия оценок для случайных доз U с плотностью
, Ч „ 2 / л F(x)(l-F(x))
распределения g(x) > 0 пропорциональна величине а (х)=-,
g(x)
где F(x)- неизвестная функция распределения минимальной границы, т.е. предельная дисперсия оценок зависит от плотности распределения вводимой дозы в заданной точке х : для EDma при малых или больших значениях а значение g(EDma) мало, поэтому дисперсия ог(х) может оказаться довольно большой. В диссертации для оценки функции распределения F(x), вместо оценок Надарая-Ватсона мы используем kNN-оценки (оценки к ближайших соседей). Для kNN-оценок предельная дисперсия пропорциональна величине F(x)(l-F(x)) и не зависит от плотности g(x), т.е. эти оценки равномерно сходятся к функции распределения, однако kNN -оценки не являются асимптотически несмещенными. Чтобы сделать их асимптотически несмещенными, мы конструируем двухшаговые оценки, у которых предельная дисперсия такая же, как и у kNN-оценок, но предельное математическое ожидание равно нулю.
Кроме того, математическую модель зависимости доза-эффект мы рассматриваем для случая прямых и непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрены случаи фиксированного плана (вводимая доза выбирается заранее и является неслучайной величиной) и случайного плана эксперимента (вводимая доза является случайной величиной). Таким образом, рассмотренные постановки охватывают возможные практические ситуации, встречающиеся в проблеме доза-эффект. К тому же измерение доз с ошибкой - это типичная практическая ситуация, которая ранее не рассматривалась, а ошибки измерения ранее не учитывались в оценках средне-эффективных доз и оценках среднеквадратичного отклонения.
При изучении вопросов, связанных с конкретным применением рассматриваемых процедур для конечных выборок, возникает проблема выбора оптимального значения параметра сглаживания h, который присутствует в рассматриваемых оценках функции эффективности. Как показывает практика, качество оценок в большей степени зависит от параметра сглаживания, нежели от вида ядерной функции, поэтому так важно выбирать оптимальное значение h. Автоматическому выбору оптимальной ширины окна в задачах оценивания регрессии посвящены работы W.Hardle, P. Hall and J.S. Marron, M. Neumann, R.Eubank and W.Schucany, J.Beran, Y.Feng and S. Heiler, H.-G. Muller and U. Stadtmuller, J.S. Wu and C.K. Chu, J.Rice and M.Rosenblatt, B.W. Silverman и др. В них предлагается использовать процедуру кросс-проверки (cross-validation), метод штрафных функций и метод подстановки. Однако исследования проводились для моделей, отличающихся от модели доза-эффект, и для случая прямых наблюдений. Мы строим комбинированный алгоритм метода подстановки и метода кросс-проверки. Показано, что в условиях непрямых наблюдений этот алгоритм приводит к состоятельным асимптотически нормальным оценкам оптимального значения параметра сглаживания. Указанный комбинированный подход приводит к меньшему риску оценивания, чем метод кросс-проверки или метод подстановки, ориентированные на выбор одного значения параметра h для широкого интервала значений переменной х. Предложенные в диссертации оценки исследованы как теоретическими, так и имитационными численными методами.
Таким образом, поставленные в диссертационном исследовании задачи характеризуются недостаточной научной проработанностью, актуальны и требуют своего решения в широком спектре практического анализа, поскольку они важны для практического применения полученных результатов и являются востребованными в токсикологии, фармакологии, биологии, экологии.
Цель и задачи работы. Целью данной работы является разработка и развитие методов построения -состоятельных оценок функции распределения в зависимости доза-эффект, дисперсия которых равномерно мала при больших п, а также систематическое исследование асимптотических свойств построенных оценок. В рамках этого направления требовалось решить задачи непараметрического оценивания как теоретического, так и прикладного характера.
Задачами диссертации являются:
1. Построение оценок, дисперсия которых не зависит от распределения дозы, т.е. равномерно сходящихся к функции распределения.
2. Построение
-состоятельных оценок с учетом погрешности измерений доз и уменьшение этих погрешностей.
3. Разработка алгоритмов выбора ширины окна и исследование поведения оценок ширины окна просмотра данных.
4. Исследование свойств построенных оценок неизвестной функции распределения имитационными численными методами.
Объект и инструмент исследования. Объектом исследования являются математические конструкции, формализующие исходные объекты зависимости доза-эффект - статистические оценки функции распределения по неполным выборкам. Рассмотрены случайные и фиксированные планы эксперимента в схеме прямых и непрямых наблюдений. Исследования проводились с использованием методов теории вероятностей, математической статистики, теории функций, математического анализа и имитационного моделирования (метод Монте-Карло). Инструментом исследования являются асимптотические методы теории вероятностей и численные методы компьютерного моделирования.
Достоверность полученных в работе результатов обеспечивается строгостью рассуждений, использованием фундаментальных методов теории вероятностей и математической статистики, согласованностью теоретических выводов и численных результатов экспериментов, непротиворечивостью полученных результатов с ранее известными результатами.
Методы исследования. Математический аппарат построения оценок функции распределения по результатам независимых единичных испытаний разработан на основе метода ядерного сглаживания непараметрических оценок регрессии. Построение кЫ№-оценок основывается на использовании порядковых статистик в задаче непараметрического оценивания. Для доказательства состоятельности и асимптотической нормальности оценок использовался аппарат характеристических функций, классические предельные теоремы теории вероятностей и результаты асимптотической теории порядковых статистик.
Для получения оценок с автоматическим выбором оптимальной ширины окна в модели доза-эффект применялась комбинированная процедура кросс-проверки.
Научная новизна и научная значимость. Все основные результаты диссертационной работы являются новыми и впервые опубликованы в работах диссертанта.
Для модели доза-эффект построены непараметрические Гк- и у[пй-состоятельные оценки функции распределения и проведен их асимптотический анализ для случайного и фиксированного планов эксперимента. Доказана асимптотическая нормальность и асимптотическая несмещенность двухшаговых оценок, рассмотрены методы уменьшения погрешности наблюдений для случая непрямых наблюдений. Для фиксированного и случайного планов эксперимента построены комбинированные кросс-проверочные оценки с автоматическим выбором ширины окна. Проведен численный анализ имитационной модели, адаптированный к практической ситуации.
Теоретическая и практическая ценность. Теоретическая ценность работы заключается в построении асимптотически несмещенных оценок и исследовании их свойств. Практическая ценность исследования состоит в том, что разработано программное обеспечение, которое может быть ис-
пользовано для оценки уровня биологической активности веществ в опытах на токсичность на основании альтернативных кривых «доза-эффект», при планировании клинических испытаний новых лекарственных средств. Программа позволяет оценивать эффективные дозы уровней от 5% до 95%, в том числе и дозы, близкие к границам интервала распределения, строить оценки в случае, когда значения воздействовавшей дозы измеряются с погрешностью, получать оценки с автоматическим выбором ширины окна по непрямым наблюдениям.
Методы оценивания, разработанные в диссертации, были применены для построения функции распределения и определения категорий эффективных доз при исследовании чувствительности организма к адреналину. Основные результаты, выносимые на защиту. На защиту выносятся:
1. kNN-оценки и двухшаговые kNN-оценки для неизвестной функции распределения в зависимости доза-эффект, результаты их теоретического асимптотического анализа в схеме прямых и непрямых наблюдений для модели со случайными и фиксированными планами эксперимента, а также численное исследование построенных оценок.
2. -Jk- и -Jñh- состоятельные оценки и результаты их асимптотического анализа с учетом погрешности испытанных доз для модели с фиксированным планом эксперимента и способы уменьшения погрешности
. наблюдений.
3. Адаптивный алгоритм построения оценок с автоматическим выбором ширины окна просмотра данных для модели с фиксированными и случайными планами эксперимента, реализованный в разработанном диссертантом программном комплексе.
4. Численное сравнение оценок функции эффективности в моделях с прямыми и непрямыми наблюдениями.
Апробация работы. Результаты диссертации были представлены на следующих конференциях:
10-я междисциплинарная научная конференция «Нелинейный мир» (Нижний Новгород, 2005 г.);
XII Всероссийская школа-коллоквиум по стохастическим методам (Дагомыс, 2005 г.);
7-й Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Йошкар-Ола, 2006);
Международная конференция RelStat'2006 (Рига, 2006 г.);
XIV Всероссийская школа-коллоквиум по стохастическим методам (Адлер, 2007 г.);
XX Международная конференция «Математические методы в технике и технологиях» (Ярославль, 2007 г.);
8-я международная конференция «Компьютерный анализ данных и моделирование» CDAM'2007 (Минск, 2007г.);
X Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Дагомыс, 2009 г.).
Опубликованность результатов и личный вклад соискателя. По
теме диссертации опубликовано 15 работ (общим объемом 9,5 п.л.), из них 6 в изданиях, рекомендованных ВАК Российской Федерации. Две работы, опубликованные в журналах из списка ВАК, написаны без соавторов. Всего без соавторов изданы 5 работ из общего числа объемом 6,1 п.л.
В совместных работах постановка задачи и основные методы исследования принадлежат научному руководителю. Вкладом соискателя являются формулировка и доказательства утверждений, теоретические расчеты, программная реализация и исследование имитационной модели.
Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, списка литературы, содержащего 128 наименований, приложений с численными результатами имитационного моделирования в виде таблиц и графиков. Объем основного текста работы составляет 157 страниц.
Во введении анализируется состояние проблемы оценивания распределений и категорий эффективных доз по неполным данным в зависимости доза-эффект, отмечается, что тема диссертации является актуальной, формулируются цели и задачи исследования, дается обзор содержания глав.
В главе 1 производится построение математической модели зависимости доза^эффект, используемой в дальнейшем в диссертации, и ставится задача оценивания неизвестной функции распределения для случайных и фиксированных планов эксперимента в случае прямых и непрямых наблюдений.
В параграфе 1.1 излагается математическая модель зависимости доза-эффекг, основой которой является следующее представление: в организм вводится доза I/; минимальный уровень дозы, с которого начинается реакция организма X, есть латентная переменная. Если 1/>Х, то эффект от введенной дозы присутствует, в противном случае, если и < X, то - отсутствует. Определяется величина ¡V - индикатор события {£/ > X), т.е.
Величина X может принимать различные значения даже при одинаковых условиях эксперимента, что объясняется индивидуальной чувствительностью организма к вводимому препарату, состоянием организма в целом на момент эксперимента. Однако, для однородных групп объектов наблюдения переменная X считается случайной величиной.
Таким образом, мы рассматриваем модель, в которой распределение с.в. X, заданное функцией распределения ^(х) = Р(Х<х), неизвестно. При случайном плане эксперимента мы считаем, что С/-случайная величина, а при фиксированном - значения вводимых неслучайных доз и: выбираются заранее (с постоянным или переменным шагом).
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
если и > X, если и<Х.
Если измерения вводимой дозы U проводятся без ошибок, т.е. измеренная доза есть введенная доза, то мы будем говорить о прямых наблюдениях. В экспериментальной практике измерения вводимых доз проводятся, как правило, с погрешностями, иногда весьма значительными. Такие наблюдения мы будем называть непрямыми. Пусть измерения вводимой дозы U осуществляются с погрешностью е, имеющей плотность q(x), тогда вместо с.в. U наблюдается с.в. Y. Если ошибка е накладывается аддитивно, т.е. Y = U + £, то плотность условного распределения величины Y равна q(y-u). В общем случае пара (Y,U) имеет совместную и маргинальные плотности распределения g(y,u) и • q(y)~ jg(y, u)du, g(u)~ [g(y> u)dy соответственно, a распределение ошибки £ описывается условной плотностью q{y\u).
Если случайные величины U и X независимы, то условное математическое ожидание величины W при фиксированном значении дозы U (то есть при U = х) будет функцией распределения величины X :
E(W\U = x) = V(W = l\U = = Р (X<U\U=x)=F (X<x) = F(x). В таком случае функция распределения здесь есть регрессия.
В общем случае условное математическое ожидание с.в. W при U = т.е. E(fV\U = x) = P(X<x\U = x) = F(x\x) уже может быть немонотонной функцией. Мы назовём F(x \ х) функцией эффективности. В нашей модели в основном рассматривается случай, когда U и X независимы, поэтому для оценивания функции распределения F(x) используются непараметрические (ядерные) оценки регрессии по выборке {(С/.,Щ)}"м (в схеме прямых наблюдений) или по выборке {(Yj,^)}"^ (в схеме непрямых наблюдений).
В таком случае основная задача формулируется следующим образом: по выборке или по выборке t (в схеме прямых или не-
прямых наблюдений) построить -Jnh- состоятельные оценки, дисперсия которых не зависит от плотности распределения дозы, т.е. построить оценки, равномерно сходящиеся к функции распределения F(x) величины X.
Для зависимости доза-эффект в работах М.С. Тихова и С.В. Кришто-пенко10 в качестве оценки функции распределения было предложено рассматривать ядерные оценки регрессии типа оценок Надарая-Ватсона, которые в схеме прямых наблюдений имеют вид: Fm{x) = Sln(x)[Su{x),tели Sln(x)ïO, и FViI.(x) = 0, если Sln(x) = 0, (1)
10Криштопенко, С.В. Статистическое оценивание эффективной дозы зависимости «доза-эффект» с использованием как прямых, так и непрямых наблюдений / С.В. Кришто-пенко, М.С. Тихов // Вторая Всероссийская школа-коллоквиум по стохастическим методам. - М. - 1995. - С.81-82.
где
Мы будем называть их Л'Ж-оценками. Здесь К(х)-ядерная функция. В случае непрямых наблюдений мы используем МГ-оценки вида:
/?(х) = 52„(Х)ДДХ) , (3)
где
" ;=1 " 1=1 Асимптотическое поведение МГ-оценок для зависимости доза-эффект изучено в работе М.С. Тихова". В ней показано, что если Ъ = сп^ь и выполнены некоторые условия регулярности, то МГ-оценки являются асимптотически нормальными:
^\Рт(х)-Р{х))-^Ы(у\{х),аг1{х)), (5)
с асимптотическим смещением
. Л*Жх) + 2 /Сх)/(х)>
и асимптотической дисперсией
где
V2 = J x2K(x)dx, IК f = f K\x)dx.
Таким образом, если а ,(дг) ^ 0, то оценка имеет ненулевое
асимптотическое смещение, то есть не является у/пй — состоятельной, а предельная дисперсия оценки <т?(х) зависит от значения плотности g(x) (в схеме прямых наблюдений, или д(х)~ в схеме непрямых наблюдений). Поэтому, если значение плотности близко к нулю, то предельная дисперсия оценки может оказаться довольно большой. Причина этого состоит
в том, что интервал (х- Ь, х + А) имеет фиксированную длину 2Л, и если в него попадает мало значений с.в. С/, то оценка Рт(х) может иметь большой разброс.
В диссертации при построении оценок мы предлагаем брать границы интервала {х — И,х + К) переменными, чтобы в него попало заданное количество наблюдений. Эти оценки мы получим из оценок Надарая-Ватсона, если возьмем ширину окна просмотра данных /г так, чтобы в интервал
"Tikhov, M.S. Statistical Estimation on the Basis of Interval-Cencored Data/ M.S. Tikhov// J. Math. Sciences. - 2004'. -V. 119, N. 3. - P. 321 - 335.
(x-h,x + h) попадало ровно к выборочных значений случайной величины U. Тогда параметр h будет случайной величиной. Мы выберем h специальным образом. Именно, пусть для заданного х: F(x)-A (0<Л<1) и {U^,l<i<n} есть вариационный ряд, построенный по выборке Ut,U2,...,Un, a {Wln'],l<i<n} есть индуцированные порядковые статистики, т.е. если С/'0 = С/у, то fVj0 =W}, где Uf1 есть i-ая порядковая статистика. Рассмотрим последовательность ранговых номеров т = т(п), такую что
— = Я + о|-т=] при п °°. Возьмем т =т-[к/2], тг = т + [fc/2], где [а] п \у1П)
- целая часть а. Положим h-U[m2) -U[m,).
Определим AAW-оценку соотношением
(8)
где
п i=\ п (=1
Пусть теперь величины С/,, являются неслучайными, т.е. пусть м, <м2 <...<ип-выборка с фиксированными упорядоченными значениями. Будем считать, что а<и,<Ь, и, не умаляя общности, рассмотрим случай, когда а = 0, b = 1.
Положим в этом случае
W^iXfa-*). ^«—¿^(ч-*). (10)
п 1=1 п ,=1
где Щ =/(и. > X.) - индикатор события [и. > X.].
Для неслучайного плана эксперимента с ut - i / п NW—оценку определим следующим образом:
F(x) = SJX)/SJX). (11)
Для непостоянного шага &и,=им-и, в схеме прямых наблюдений в качестве оценки функции распределения наряду с AW-оценками мы используем оценки типа оценок Пристли-Чао (РС-оценки):
Ffc{x) = Y{um -uj)WiKh (и,-х). (12)
¡=1
Для случайного плана эксперимента рассмотрим также РС-оценку
(13)
i=i
где U^-i-ая порядковая статистика, a ffj'1 - г'-ая индуцированная порядковая статистика.
В диссертации мы изучаем поведение ЫИ'- и РС-оценок для случайных и неслучайных планов эксперимента в схеме прямых и непрямых наблюдений и доказываем их асимптотическую нормальность.
Для устранения асимптотического смещения ЖУ- и к1Ш-оценок, т.е. для получения -/пй- и - состоятельных оценок, мы используем двух-шаговую процедуру, которая для оценки плотности была предложена в работе ИЖДег^аЛпег12. Мы модифицируем эту процедуру для оценивания регрессии, т.е. для оценивания отношения двух статистик - оценки функции распределения. Модифицированная процедура оценивания состоит в следующем.
1) Задаем ^-С^п'", где 1/10<а< 1/5, и вычисляем ядерные оценки для плотности g(x) и произведения <р(х) = F(x)g(x) соответственно в виде:
гХх)Л±КК{игх), (14)
п у=1 п у I
2) Берем /г, = С2и~"5 и оцениваем отношения а(х) = и
р(х) = . - с помощью статистик <р(х)
а(х) Лр^-х)^ к Жх) --^^(и-х)-^. (15)
3) Умножаем оценку а(х)яа оценку для плотности g(x) на g*(x), получаем оценку знаменателя
Ш (с/,.)
умножаем оценку 0(х) на <р*{х), получаем оценку числителя
4) Вычисляем функции
Г2п{х)--^.Кк{игх).М.{х) и (16)
п у=1 п
где
12Hengartner, N.W. Asymptotic unbiased density estimators / N.W. Hengartner // E. Matz-ner-Lober// ESAIM. - 2009. - V. 13,- P. 1-14.
= ±1У,Кк (и-х) (и, -С/,). (17)
/=1 / ¿=1
5) Определяем финальную оценку /^'(х) для .Р(х) как отношение
Г(х)=у;п(х)/у;а(х). (18)
Доказано, что оценка Р'п(х) имеет нулевое асимптотическое смещение.
Для непрямых наблюдений Щ)}"м двухшаговая оценка функции F(x) строится аналогичным образом с заменой и, на Уг
В параграфе 1.3 формулируются основные предположения, при которых исследуется качество построенных оценок функции распределения.
Условия
Условие ( К ). Функция К(х) является неотрицательной, нормированной, четной, ограниченной, финитной функцией.
Таким образом, в качестве ядер мы берем симметричные плотности. Если выполнены условия (К), то V2 < ||АГ||2 < .
Пусть А = А(н) — ширина окна просмотра данных.
Условие (Н ). При А = А(л)-> 0 и иА->°°.
Асимптотически оптимальная ширина окна, для которой выполнены условие (Н) есть А ~ л"1'5, при таком А асимптотическое смещение Дооценки и её дисперсия уравновешены.
При построении ШЫ-оценки мы берём к-[п^5].
При вычислении двухшаговой оценки функции распределения мы используем вспомогательную величину - ширину окна просмотра скорость сходимости к нулю у которой ниже, чем у основной величины А,, а именно:
/¡0 = , где ае К = С2и~1/5, С,,С2-некоторые константы.
Для выбранных таким образом А0 и А, выполнены соотношения:
А. —>0, А0 —>0, нА. лА0 —»«>, — —>0 при /г—
К
Для случайных планов эксперимента в схеме прямых наблюдений, где (Х.,1/.), / = 1,2,...,п - независимые одинаково распределенные случайные величины с совместной непрерывной функцией распределения F(;<;)G(и), (х,и)е И2 и плотностью f(x)g(u)>0 мы требуем выполнения следующих условий.
Условие ( Б ). Функции F(x) и g(x)> 0 непрерывны, ограничены и имеет ограниченные производные до третьего порядка включительно.
В схеме непрямых наблюдений определим условные плотности распределения q(y\u) = g(y, ii)/g(u), и g(u\y) = g(y,u)/q(y). Обозначим
m(x)= ? F(u)g(x,u)du и R(x) = f F(u)g(u\x)du=^.
L L ?M
Условие ( N ). Функции q{y) и m(x) непрерывны и ограничены, имеют ограниченные производные до третьего порядка включительно.
Для фиксированных планов эксперимента, когда Uj—u, есть неслучайная величина, мы предполагаем, что maxi m, -mi4 I = 0(п~1) при и—
л
л-1
Пусть V(f) -supУ, |у(Çl+t) — f(£j)I — вариация функции f(x), где
р /=0
/"-множество всевозможных разбиений отрезка [а, 6] точками я = £0 <£<...<£,
Условие ( F ). Функции f(x) и К(х) имеют конечные вариации, т.е. V(f)<°°,V(K)<o°.
В схеме непрямых наблюдений при фиксированных планах эксперимента потребуем, чтобы было выполнено
Условие ( G ). Функция g(y) четырежды непрерывно дифференцируема и имеет ограниченные производные до четвертого порядка включительно, а функция т(х) трижды непрерывно дифференцируема и имеет ограниченные производные до третьего порядка включительно.
В главе 2 изучено асимптотическое поведение kNN—оценок в схеме прямых наблюдений для случайных планов эксперимента. Доказана состоятельность и асимптотическая нормальность kNN—оценок. Приведем основные результаты главы 2.
Теорема 2.1.3. Пусть выполнены условия (К), (H), (S). Тогда
.2 g\x)'
Из теоремы 2.1.3 получаем, что построенные kNN-оценки имеют ненулевое асимптотическое смещение. В теореме 2.2.4 показано, что применение двухшаговой процедуры приводит к оценкам с такой же предельной дисперсией, что и у оценок Fn(x), но уже с нулевым асимптотическим смещением. Поскольку оценки F„(x) являются асимптотически нормальными, то это позволяет построить для F{x) доверительные границы.
Теорема 2.2.4. Пусть выполняются условия (К), (Н), (S).
Тогда -Jk(F^ (х) - F(x)) сходится по распределению в точке х к нормальной случайной величине с ожиданием, равным нулю, и дисперсией F(x)(1-F(x))||42, т.е.
Jk(F;(x) - F(x))-^N(0,aj(x)).
В теореме 2.3.1 доказана состоятельность и асимптотическая нормальность оценки квантиля функции распределения F(x).
Пусть хл =F"'(Л)-квантиль порядка 0<Л<1 функции распределения F(x), где /(х)>0. В качестве оценки функции F~'(A), рассмотрим статистику
л
где
¿ГЩК^-х) Ш = -. Це Л[0,1].
/=1
Теорема 2.3.1. Пусть для всех ^(0)<Я<^(1) плотность /(х) положительна и выполнены условия (К), (Н), (Б). Тогда
(i) если linД = с. то ^¡^(^-Щ-^Н "i
' Л(1-Л)а22(Л)" { ' 8(хл)Яхл) )
г0М1-лМ] 'g^ftx*) )
(и) если Ит— = 0, то '
* 2 1 2 0 ст2 (Я) = Щк(н> + с/(хя)(у - и))К(м/)К(и)К(у)с1м!с1и Л>.
Из теоремы 2.3.1 следует, что уже при умеренных объемах выборки оценки эффективных доз близки к истинным значениям.
В главе 3 диссертации изучается асимптотическое поведение оценок в зависимости доза-эффект при случайном плане эксперимента в схеме непрямых наблюдений. Здесь доказано, что предельное распределение ШЫ-оценок является нормальным. В параграфе 3.2 показано, что двухшаговая процедура, в случае непрямых наблюдений также приводит к %/лЛ-со-
стоятельным оценкам и что двухшаговые оценки являются асимптотически нормальными с той же предельной дисперсией, что и у kNN-оценок.
Приведем один из основных результатов этой главы.
Теорема 3.4.1. Пусть выполнены предположения (К), (H), (N). Тогда Jk( F„{x) - R(x))^r^N(0,R(x)(l - 7?(x))||Af),
где R(x) = J F(u)g(u | x)du.
Из этой теоремы следует, что в случае непрямых наблюдений оценка Fjx) сходится к «средней» функции распределения R(x).
В главе 4 исследуется поведение оценок функции распределения F(x) для фиксированных планов эксперимента. Это связано с тем, что модели с фиксированным планом эксперимента при наличии погрешности измерения в основном отражают применяемую методику проведения клинических испытаний лекарственных препаратов. Изучены асимптотические свойства оценок Надарая-Ватсона Fn(x) (11) в случае постоянного шага и оценок Пристли-Чао FPC(x) (12) - в случае переменного шага. В схеме прямых и непрямых наблюдений строятся двухшаговые оценки, которые являются -Jnh — состоятельными оценками. В параграфе 4.4 предлагаются способы уменьшения погрешности наблюдений в случаях, когда распределение ошибки е нормально. Показано, что оценки по улучшенным выборкам сходятся к истинной функции распределения F(x), а не к усредненной функции распределения R(x). В пункте 4.6 изучены оценки Пристли-Чао (12), и найдено их асимптотическое распределение. В теореме 4.6.2 для фиксированных планов при непостоянном шаге доказана состоятельность и асимптотическая нормальность РС-оценок.
В главе 5 изучение модели доза-эффект производится средствами имитационного моделирования. Программная реализация имитационной модели "Dose-Effect" выполнена на основе Borland Turbo Delphi Explorer. В параграфе 5.1. решается проблема выбора оптимального значения ширины окна просмотра h численными методами.
Показано, что если выбор оптимального значения параметра h производится из дискретного множества Qn и мощность этого множества |gj не превосходит некоторой степени п, то кросс-проверочная оценка параметра h является состоятельной оценкой ширины окна, полученного при минимизации квадратичного уклонения. Именно, пусть для каждого значения параметра he Qn статистики F(,,)(x) и F^\x) есть оценки функции распределения F(x) по выборкам U(n) ={(U„Wl),...,(Un,fVll)} и ¿/(«-о _ vin) \{([/у.,Гу.)} соответственно.
Кросс-проверочное значение параметра Л определим из равенства Я = Я„ = агёшт - ,
а кросс-проверочную оценку функции распределения получим, полагая
В теореме 5.1.4 показано, что оценка кросс-проверочного значения Я является состоятельной оценкой параметра Л и при л—квадратичное уклонение при СУ - значении параметра А ведет себя также, как и оптимальное значение Л.
Алгоритм выбора оптимального параметра сглаживания Л:
1. По результатам наблюдений вычисляем оценку:
п ~ 1 ¡=1. 1*1
2. Строим функцию кросс-проверки:
п м
3. Определяем оптимальное значение параметра Л:
Я = агятт(СК(/|)). *
В теореме 5.1.4 показано, что данный алгоритм приводит к асимптотически оптимальным значениям параметра сглаживания.
Хе. N(0.5, 0.25).
В параграфе 5.2 исследование модели при фиксированном плане эксперимента проведено на примерах реальных данных, взятых из литературы, а случайного плана - в параграфе 5.3, на модельных данных. Численные расчеты показали, что двухшаговые оценки лучше оценивают неизвестную функцию распределения Р(х).
Рис.2. График оценки Надарая-Ватсона и Рис.3. График двухшаговой оценки Нада-интегральной функции нормального рас- рая-Ватсона и интегральной функции пределения N{0.5, 0.25) для выборки нормального распределения N(0.5, 0.25) объема и=100 при «,. = //100, j =1,...,100, Для выборки объема л=100 при с.в. X е N(0.5, 0.25) кросс-проверочное и, = ¿/100, ¿ = 1,...,100, значение h = 0.3. с.в. Л-s N(0.5, 0.25), кросс-проверочное
значение И = 0.3.
В параграфе 5.3 произведен сравнительный анализ нескольких способов получения £AW-0ueH0K в программной реализации. Изучено поведение оценок при использовании финитных и нефинитных ядер, в результате чего установлено, что применение нефинитных ядер приводит к оценкам с существенным смещением по сравнению с использованием финитных ядер, причем использование некоторых финитных ядер, например, кварти-ческого13, позволяет уменьшить смещение (в сравнении, например, с ядром Епанечникова14). Показано, что при подборе подходящих значений ширины окна для модельных данных, имеющих нормальное или логистическое распределение, оценки и доверительные интервалы получаются не хуже, чем доверительные интервалы, полученные с помощью пакетов прикладных программ SPSS и Probit Analysis, а для распределения Вейбулла они получаются лучше. При этом преимущество оценок, построенных в диссертационной работе, состоит в том, что их можно получать как по результатам единичных независимых испытаний, так и по данным, сгруппированным в однородные группы, тогда как для применения классических методов требуется только наличие однородных групп, причем на каждом уровне требуется испытать не менее 6 доз. Если же рассматриваемое распределение не является нормальным или логистическим, например, рассматривается распределение Коши - распределение с тяжелыми хвостами, то с помощью пробит- и логит-моделей получаются оценки, менее точные по сравнению с нашей моделью, даже для доз, не слишком далеких от 50% (35%, 60%), а 5% и 95% уровни доз оцениваются уже со значительной погрешностью.
14 ед=Д(1-*2)/(Н<1)
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ
В диссертационной работе проведен статистический и численный анализ различных оценок для функции распределения в зависимости доза-эффект для случайного й фиксированного плана эксперимента как в случае прямых, так и непрямых наблюдений.
Построены tíViV-оценки и двухшаговые асимптотически несмещенные /ciVjV-оценки неизвестной функции распределения при случайных планах эксперимента. Установлено, что построенные оценки равномерно сходятся к функции распределения. Построены -состоятельные оценки для модели с фиксированным планом эксперимента в схеме непрямых наблюдений. Показана их асимптотическая нормальность.
Построены \fñh - состоятельные оценки неизвестной функции распределения с учетом погрешности измерений. Предложен метод уменьшения погрешности измерений.
Разработан комбинированный адаптивный алгоритм автоматического выбора оптимальной ширины окна просмотра данных.
Проведен численный анализ построенных оценок. В результате исследования численными методами делается вывод, что предложенные в диссертации оценки функции распределения F(x) более точно оценивают «малые» или «большие» эффективные дозы по сравнению с существующими методами.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в журналах из списка ВАК Российской Федерации:
1. Ярощук, М.В. Статистическое оценивание зависимости доза-эффект с помощью kNN- оценок / М.В. Ярощук, М.С. Тихов // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2005. - т. 12, в. 3, С. 683-684.
2. Ярощук, М.В. Модифицированные оценки Янга в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов // Обозрение Прикл. и Пром. Математики -М.: Изд-во ТВП-2006.-т. 13,в. 1,С. 144.
3. Ярощук, М.В. Асимптотическая нормальность kNN-оценок в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов // Вестник Нижегородского университета. Серия: Математика - 2006. Вып.1(4), С. 129-137.
4. Ярощук, М.В. Об оценивании распределений в зависимости доза-эффект / М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП -2007,-т. 14, в. 1, С.178-180.
5. Ярощук, М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений / М.В. Ярощук, М.С. Тихов//Нелинейный мир -М.: изд-во Радиотехника - 2007. - т.5, №1,2, С. 4-8.
6. Ярощук, М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности / М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2009. - т. 16, в. 6, С.1148-1150.
Публикации в иных печатных изданиях:
7. Ярощук, М.В. Статистическое оценивание нелинейной зависимости доза-эффект с помощью kNN - оценок / М.В. Ярощук, М.С. Тихов // Десятая междисциплинарная научная конференция «Нелинейный мир» - Нижний Новгород: изд-во ННГУ - 2005. - С. 139.
8. Ярощук, М.В. Оценивание распределений в зависимости доза-эффект при фиксированном плане эксперимента / М.В. Ярощук, М.С. Тихов, Д.С. Кришто-пенко // Статистические методы оценивания и проверки гипотез: межвуз. сб. научных трудов - Пермь: Изд-во Пермского ун-та. - 2006. - С. 66-77.
9. Yarochuk, M.V. Asymptotic normality ¿-Nearest Neighbor estimators in dependence dose-response / M.V.Yarochuk, M.S. Tikhov // Ташкент.: Изд-во Ташкентского ун-та. - 2006. - С. 46-49.
10. Ярощук, М.В. Об асимптотической нормальности kNN - оценок в зависимости доза-эффект / М.В. Ярощук. Нижегородский гос. ун-т - Н.Н. -2006. -49 с. - Деп. в ВИНИТИ 1536 - В2006
11. Ярощук, М.В. Предельные распределения kNN - оценок в зависимости доза-эффект в схеме непрямых наблюдений / М.В. Ярощук. Нижегородский гос. унт - Н.Н. - 2006,- 39 с. - Деп. в ВИНИТИ 1535- В2006
12. Yarochuk, M.V. Statistical estimation of distributions in dose-response dependence / M.V. Yarochuk, M.S. Tikhov // Reliability and Statistics in Transport and Communication: Proc. of the 6th Intern. Conf., Riga, Latvia. - 2006 - P.374-375.
13. Ярощук, М.В. Исследование оценок функции распределения в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов, Д.С. Криштопенко // Математические методы в технике и технологиях - ММТТ-20: сб.трудов XX Междунар. науч. конф., - Ярославль: Изд-во Ярославского гос. техн. ун-та. - 2007. - т.З, С. 171175.
14. Yarochuk, M.V. Computer-based data analysis in dose-response dependence / M.V. Yarochuk // Computer Data Analysis and Modeling: Proc. of 8th Intern. Conf., Minsk, September 11-15. - 2007,- Vol. 1, P. 186-189.
15. Yarochuk, M.V. Asymptotic normality of the integrated square error at the fixed plan of experiment for indirect observations / M.V.Yarochuk, M.S. Tikhov, D.S. Krish-topenko // Computer Modeling and New Technologies. - 2007. - Vol. 11, No 1, Riga, Latvia, P. 46-56.
Подписано в печать 13.01.11. Формат 64x80 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. I. Зак. 28. Тир. 100 экз.
Типография Нижегородского госуниверситета им. Н.И. Лобачевского. 603000, Н. Новгород, ул. Б. Покровская, 37.
Оглавление автор диссертации — кандидата физико-математических наук Ярощук, Марина Владимировна
Введение.
1 Зависимость доза-эффект и статистическое оценивание распределений в зависимости доза-эффект.
1.1 Построение модели зависимости доза-эффект.
1.2 Непараметрическое оценивание распределений в зависимости доза-эффект.
1.3 Условия и предположения.
1.4 Вспомогательные результаты.
2 ШУ-оценки в зависимости доза-эффект при случайном плане эксперимента в схеме прямых наблюдений.
2.1 Состоятельность и асимптотическая нормальность оценок.
2.2 Двухшаговые кА'А! - оценки и их асимптотический анализ.
2.3 Оценивание эффективных доз в зависимости доза-эффект.
2.4 Оценки Пристли-Чао для случайных планов эксперимента.
3 Предельные распределения kNN - оценок для случайного плана эксперимента в схеме непрямых наблюдений.
3.1 ШЫ - оценки в схеме непрямых наблюдений и их асимптотический анализ.
3.2 Предельные распределения двухшаговых ШМ — оценок.*.
4 Оценивание распределений для фиксированного плана эксперимента в схеме прямых и непрямых наблюдений.
4.1 Оценки Надарая-Ватсона при постоянном шаге деления в случае прямых наблюдений.
4.2 Двухшаговые оценки в схеме прямых наблюдений.
4.3 Асимптотический анализ оценок функции распределения в схеме непрямых наблюдений.
4.4 Устранение погрешности наблюдений.
4.5 Асимптотически несмещенные оценки в схеме непрямых наблюдений.
4.6 Оценки Пристли-Чао при переменном шаге деления в схеме прямых наблюдений.
5 Имитационное моделирование зависимости доза-эффект.
5.1 Выбор ширины окна просмотра данных с помощью процедуры кросс-проверки и метода штрафных функций.
5.2 Численное исследование оценок распределений при фиксированном плане эксперимента
5.3 Численный анализ kNN- оценок при случайном плане эксперимента.
5.4 Практический пример оценивания функции распределения и категорий эффективных доз.
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Ярощук, Марина Владимировна
Актуальность темы диссертации
При разработке новых лекарственных средств (т.е. веществ, обладающих фармакологической активностью, прошедших клинические испытания и предназначенных для изготовления лекарственных форм) анализ связи между дозой и эффектом и их количественное определение имеет большое значение. Под дозой мы понимаем некоторое значение агента (фактора), которое может изменить состояние исследуемого объекта, а под эффектом — наблюдаемый качественный (альтернативный) отклик объекта на введенную дозу. Основу решения проблемы количественного оценивания связи между наблюдаемым эффектом и введенной дозой составляет функция эффективности, под которой мы понимаем зависимость вероятности наблюдения эффекта от введенной дозы. Задача оценивания функции эффективности по экспериментальным данным: введенной дозе и наличию или отсутствию эффекта является важнейшей задачей зависимости доза-эффект. Решение отмеченной задачи представляет большой теоретический интерес и имеет обширные практические приложения во многих областях медицины и биологии.
Функция эффективности имеет очень важное, а иногда и принципиальное значение в фармакологии - при оценке эффективности лекарственных препаратов, в токсикологии и радиологии - при исследовании количественной токсичности ядов и поражающих свойств ионизирующих излучений, в гигиене - при нормировании критических уровней вредных факторов. Построение функции эффективности является статистической задачей, способ решения' которой предъявляет соответствующие требования к планированию эксперимента и виду получаемых исходных данных. Биологический эксперимент на завершающем этапе требует методологически обоснованных точных статистических оценок результатов, учитывающих погрешности получения исходных данных и их влияние на конечные результаты. Поэтому с прикладной стороны актуальность темы диссертации не вызывает сомнений.
В некоторых случаях, однако, отсутствует понятие дозы в вышеопределенном смысле. Примером могут служить эконометрические модели с дискретными зависимыми переменными при случайной константе регрессионной зависимости (см. [56, 122]). Тем не менее, такие задачи укладываются в рассмотренную в диссертации модель доза-эффект и могут быть решены предложенными в ней методами.
Наиболее часто оценивают дозы LD50 и ED5Q :LDS0— это доза, при которой 50% от количества объектов, получивших дозу, погибает (средняя летальная доза), EDS0 — это средне-эффективная доза (для 50% объектов наблюдается эффект). На современном этапе в токсикометрии востребованными являются величины доз, которые вызывают появление эффекта, учитываемого в экспериментальной группе тест-объектов с заданной вероятностью 0,01 - 0,1; 0,9 - 0,99. Такие дозы получили название доз EDX -EDW, ED90 -ED99. Потребности практики обуславливают необходимость одновременного определения как полного перечня категорий эффективных доз от EDX до ED99, так и вида самой функции эффективности. Здесь возможен и другой подход, принцип которого заключается в первоначальном определении по исходным данным категорий эффективных доз. Затем по найденным категориям эффективных доз устанавливается вид и распределение функции эффективности. Разработка новых токсикометрических моделей оценки токсичности должна быть направлена на максимально возможное уменьшение числа токсикологических испытаний на живых тест-объектах при сохранении заданной надежности конечных показателей токсичности, то есть на сокращение материальных затрат. Так, например, в Швейцарии в 1987 году для определения LDS0 было использовано 1,3 миллиона лабораторных животных (см. [128]).
В диссертационной работе нас интересует проблема нахождения функции эффективности и оценка доз EDWOa , в широком диапазоне значений 0 < а < 1, по результатам наблюдений: введенным дозам и наличию или отсутствию эффекта. Мы строим математическую модель зависимости доза-эффект, в которой рассматриваем минимальную границу, с которой начинается реакция организма, как латентную случайную величину. Если нижняя граница чувствительности X и введенная доза U - независимы как случайные величины, то функция эффективности является функцией распределения, однако даже в этом случае для оценки функции эффективности и категорий эффективных доз мы не можем воспользоваться классическими методами математической статистики, поскольку исследуемая величина ненаблюдаема, а вместо нее наблюдаются менее информативные величины: индикаторы эффекта И] = l{Ui > Xt) и введенные дозы Ut, i — \,.,n. Для оценки функции эффективности мы используем непараметрические методы математической статистики, а именно, ядерные оценки регрессии.
Степень проработанности проблемы
Наибольшее прикладное значение в зависимости доза-эффект имеет направление, связанное с вопросами оценки показателей токсичности (средне-эффективных доз). Токсикометрия средне-эффективных доз охватывает широкую область применения в токсикологии, при прогнозировании опасности для человека вредных факторов производства, при разработке лекарственных препаратов и методов лечения, в исследованиях патогенеза интоксикации.
Существенные недостатки традиционных методов определения средне-эффективных доз состоят в том, что для своего адекватного применения они предъявляют ряд граничных условий к планированию и выполнению токсикологического эксперимента как в отношении градаций испытываемых доз, так и в отношении числа тест-объектов в экспериментальных группах.
Для построения кривой доза-эффект и оценки ED50 обычно применяется официальная методика в модификациях Литчфилда-Вилкоксона [96] и Финни [76], а также метод Спирмена-Кербера [27] и метод Рида и Менча [38]. Алгоритм Спирмена-Кербера основывается на предположении о симметричности распределения минимальной границы — случайной величины (с.в.) X. Для корректного применения метода Спирмена-Кербера требуется испытание на каждом уровне не менее 6 доз, при этом интервал между дозами должен быть одинаков. На каждом уровне обязательным является как наличие, так и отсутствие эффектов. Этим методом оценивается средне-эффективная доза и среднеквадратичное отклонение (см. [27]). Выполнить условия Спирмена-Кербера на практике бывает трудно, поэтому надежность результатов, полученных данным методом, обычно мала. Кроме того, этот метод ориентирован на оценку доз ED50 или близких к ним.
Использование метода Рида и Менча предполагает испытания доз, логарифмы которых отстоят друг от друга на одинаковое расстояние. В основе этого метода лежит предположение о том, что если испытание некоторой дозы дало 100% эффект, то испытание большей дозы заведомо даст положительный эффект, поэтому большие дозы не испытываются. Аналогично, если испытание какой-либо дозы не привело к наступлению эффекта, то нет необходимости испытывать меньшие дозы — они также эффекта не дадут. В эту схему не укладывается феномен парадоксальной токсичности, изложенный в монографии C.B. Криштопенко, М.С. Тихова и Е.Б. Поповой [37], и означающий уменьшение вероятности эффекта при увеличении испытанных доз. Метод Рида и Менча сильно зависит от точности оценки ED*5Q и требует большого количества экспериментапыгых данных, малые или большие уровни доз с помощью данного метода не определяются.
Метод Финни основан на соотношении log EDl00a = ц + сгФ~\а), где Ф"1 (х) - обратная функция стандартного нормального закона, ¡л, сг - математическое ожидание и дисперсия.
Рекомендации по использованию того или иного метода, не адаптированные к конкретным ситуациям, приводят к нежелательным последствиям. Обычно предполагается, что функция распределения должна иметь нормальное распределение, но, построенная в примере, рассмотренном в [37] (стр. 159-160), оценка говорит о том, что функция распределения имеет показательное распределение. Связано это с тем, что, по-видимому, исходное распределение было равномерным, а логарифмирование доз привело к показательному распределению. Значит, формальное применение официальной методики может привести к ошибкам.
Кроме указанных методов для оценивания зависимости доза-эффект и средне-эффективных доз (называемых еще медианными средне-эффективными дозами) используются модели бинарного выбора - пробит и логит, основанные на использовании нормальной и логистической функций распределения. Модели бинарного выбора хорошо работают в окрестности медианных средне-эффективных доз. Эти методы реализованы в большинстве современных эконометрических компьютерных программных пакетов (ЭКПП): SPSS, XL STAT-Dose, BioStat 2007, Probit Analysis, StatPlus (Статистика*). С помощью этих ЭКПП можно произвести обработку кривой зависимости доза-эффекг, вычислить эффективную дозу, а также соответствующие доверительные интервалы. Существуют различные модификации пробит- и логит-анализа, которые, имея в своей основе главную идею — преобразование процентов встречаемости эффекта в пробиты, - различаются алгоритмами линеаризации и статистической обработки. Большая часть этих программ основывается на алгоритме метода максимального правдоподобия для регрессионной схемы в модели бинарного выбора (Д.Финни (D.J. Finney [76])), некоторые авторы (Миллер и Тейнтер (L.S. Miller, M.L. Tainter [100]), Литчфилд и Вилкоксон (J.T. Litchfield, F.W. Wilcoxon [96])) используют для этой цели метод наименьших квадратов. Однако применение пробит- и логит-моделей дает большие погрешности в определении доз на краях распределения [44].
Иногда для построения функции эффективности используется сплайн-аппроксимация [24]. Программа сплайн-аппроксимации, описанная в работе [24], предназначена для расчета параметров кривых доза-эффект, однако рассмотренный там метод сильно привязан к конкретному эксперименту и для состоятельного оценивания требует большого числа наблюдений. Метод сплайн-аппроксимации не использует каких-либо вероятностных моделей, ввиду чего тяжело оценить качество построенных кривых, а также затруднительно построить доверительные интервалы. Таким образом, как при пробит-анализе, так и при использовании других моделей, функции распределения рассматриваемых случайных величин хорошо аппроксимируются линейными или нелинейными функциями, но только в окрестности медианы, и при этом ценой больших ошибок на краях распределения (см. [23]), особенно если реальная модель распределения отличается от нормального распределения. Кроме того, при практической реализации пробит-анализа или его модификаций отсутствует возможность проведения единичных испытаний, согласно официальной методики, испытания должны носить групповой характер.
Основной недостаток официально применяемых методов состоит в том, что указанные методы ориентируются, в основном, на оценку средне-эффективной дозы ЕВ50 или близких к ней и не позволяют состоятельно оценивать малые или большие дозы, тогда как малые и большие дозы являются востребованными для практических нужд. Доверительные интервалы для крайних доз ЕВХ - ЕО10, ЕИ90 - Ж>99, имеющие важное практическое значение в медико-биологической практике (см. [16-19, 28]), при помощи этих же методов получаются либо довольно широкими, либо ненадежными. Кроме того, часть ЭВМ-программ оценки зависимости доза-эффект и определения ЕИШа не работают при малых или больших значениях а . В ряде случаев, например, при исследовании эффектов сверхмалых доз характерны немонотонные функции эффективности (см. [25]), а пробит-анализ или лошт-модели не позволяют строить оценки в таких ситуациях, поскольку ориентированы на монотонное преобразование данных. В некоторых случаях (см., например, [105]) лучшей моделью функции эффективности авторы считают распределение Вейбулла или распределение экстремальных значений. Связано это со спецификой эксперимента, рассмотренного в этих работах. Большинство практиков придерживается мнения, что нормальное распределение не очень хорошо подходит для описания зависимости доза-эффект, ввиду специфичности рассматриваемых задач. В диссертации (в приложении 1) показано, что использование нормального распределения вместо асимметричных распределений или распределений с тяжелыми хвостами приводит к большим ошибкам в оценивании крайних доз. Наряду с тем, что методы пробит-анализа плохо оценивают категории доз, близких к границам интервала распределения, они также не учи тывают, что значения воздействовавшей дозы измеряются с погрешностью. Реально же в экспериментальной практике возникает необходимость строить оценки по исходным данным, содержащим ошибки, распределение которых неизвестно. Рассмотренные выше распределения: нормальное, Вейбулла, распределение экстремальных значений, логистическое являются унимодальными и традиционно используемые методы про-бит-анализа плохо работают, например, для смесей распределений, бимодальных и полимодальных распределений. Недостатком параметрических методов является то, что они эффективны, если реальная модель близка к гипотетической, и сильно теряют в эффективности при отклонении от предполагаемой модели.
Таким образом, данная проблема на сегодняшний момент характеризуется недостаточной теоретической проработанностью, а современные требования практики требуют эффективных способов оценивания категорий доз в зависимости доза-эффект на границах распределения. Нынешнее состояние знания в проблеме оценивания функции эффективности не позволяет этого сделать. Здесь требуются исследования возможных путей решения данной проблемы и их практической реализации.
В работах Тихова М.С. и Крииггопенко C.B. [35-37] был предложен непараметрический метод оценки функции эффективности (ФЭ), который задачу оценки ФЭ сводит к задаче оценивания функции регрессии и использования для этой цели непараметрических (ядерных) оценок регрессии с шириной окна просмотра данных h — параметра сглаживания. Такой подход позволяет по результатам единичных испытаний оценивать средне-эффективную дозу ED50 не хуже, чем методы пробит-анализа, а малые и большие дозы, близкие к 0% или к 100%, оценивать эффективнее, чем пробит-анализом, строить доверительные интервалы, достаточно узкие как в середине, так и на краях распределения. С помощью метода, изложенного в работах [35-37], можно оценивать и немонотонные функции эффективности. Данный метод позволяет также производить планирование эксперимента. Предложенный в,[35-37] непараметрический подход использовался также в работах других авторов, например, в работе [44], в статьях [47,112] исследовалось воздействие диоксинов на окружающую среду и здоровье человека, где также использовалась методология работ [35-37]. Однако, изученные в работах [35-37] оценки функции эффективности (в основном оценки Надарая-Ватсона) при п —» оо, h —» 0, nh —» оо хотя и сходятся со скоростью yfnh к истинному распределению, не являются, во-первых, \fnh — состоятельными (их предельное математическое ожидание отлично от нуля), а во-вторых, предельная дисперсия оценок для случайных доз U с плотностью распределения g(x) > 0 пропорциональна величине cr2(x) = F(x)(l - F(x))/g(x), где F(x) - неизвестная функция распределения минимальной границы, т.е. предельная дисперсия оценок зависит от плотности распределения вводимой дозы в заданной точке х: для EDma при малых или больших значениях а значение g(EDl00a) мало, поэтому дисперсия а2 может оказаться довольно большой. Чтобы устранить влияние плотности распределения вводимой дозы для оценю! функции распределения F(x), вместо оценок Надарая-Ватсона в настоящей диссертации мы используем kNN - оценки (оценки к ближайших соседей). Для kNN - оценок предельная дисперсия пропорциональна величине F(x) (l — F(x)J и не зависит от плотности g(x). Мы используем также оценки Янга и модифицированные оценки Янга [2], которые асимптотически эквивалентны kNN — оценкам (см. [2]), имеют такую же предельную дисперсию, что и kNN - оценки, при этом построение оценок Янга проще реализуется с использованием современных пакетов программ, чем kNN - оценка. Однако, как kNN — оценки, так и оценки Янга не являются - состоятельными. Чтобы сделать их -Jk — состоятельными, мы конструируем двухшаговые оценки, у которых предельная дисперсия такая же, как и у kNN - оценок и оценок Янга и которые являются асимптотически несмещенными. Двухшаговые оценки для плотности распределения предложены и исследованы в работах [88, 97]. Мы их строим для оценки функции регрессии. Для построения асимптотически несмещенных оценок функции эффективности мы используем модифицированную конструкцию и доказываем yfk - состоятельность построенных оценок.
Более того, математическую модель зависимости доза-эффект мы рассматриваем как задачу статистического анализа для случая прямых и непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрены случаи фиксированного плана (вводимая доза выбирается заранее и является неслучайной величиной) и случайного плана эксперимента (вводимая доза является случайной величиной). Таким образом, рассмотренные постановки охватывают широкий спектр разнообразных практических ситуаций в проблеме доза-эффект. К тому же измерение доз с ошибкой — это типичная практическая ситуация, которая ранее не рассматривалась, и не учитывались ошибки измерения в оценках средне-эффективных доз и оценках среднеквадратичного отклонения. Если задача оценки плотности для свертки распределений изучалась в работах [67, 104, 110, 111]), то задача оценки функции распределения в модели непрямых наблюдений в зависимости доза-эффекг рассмотрена впервые. В диссертации мы решаем эту проблему. Математическая модель зависимости доза-эффект в предложенной постановке дает возможность использовать для решения проблем дозозависимых эффектов широкий набор мощных средств математической статистики.
При изучении вопросов, связанных с конкретным применением рассматриваемых процедур для конечных выборок, возникает проблема выбора оптимального значения параметра сглаживания h, который присутствует в рассматриваемых оценках функции эффективности. Как показывает практика, качество оценок в большей степени зависит от параметра сглаживания, нежели от вида ядерной функции, поэтому так важно выбирать оптимальное значение h. Автоматическому выбору оптимальной ширины окна в задачах оценивания регрессии посвящены работы W.Hardle, P. Hall and J.S. Marron, M. Neumann, R.Eubank and W.Schucany, J.Beran, Y.Feng and S. Heiler, H.-G. Muller and U. Stadtmuller, J.S. Wu and C.K. Chu, J.Rice and M.Rosenblatt, B.W. Silverman и др. [63, 72, 78, 82, 84, 85, 101, 102, 110, 115, 123, 126], в них предлагается использовать процедуру кросс-проверки (cross-validation), штрафные функции и метод подстановки. Однако исследования проводились там для других моделей и для случая прямых наблюдений. Мы строим комбинированный алгоритм метода подстановки и кросс-проверки в зависимости доза-эффект. Показано, что в условиях непрямых наблюдений этот алгоритм приводит к состоятельным асимптотически нормальным оценкам оптимального значения параметра сглаживания. Причем указанный метод приводит к меньшему риску оценивания, чем метод кросс-проверки или метод подстановки. Предложенные в диссертации оценки исследованы как теоретическими, так и численными методами.
Таким образом, поставленные в диссертационном исследовании по выбранной теме задачи характеризуются недостаточной научной проработанностью, актуальны и требуют своего решения в широком спектре практического анализа, поскольку они важны для практического применения полученных результатов и являются востребованными в токсикологии, фармакологии, биологии, экологии.
Цель и задачи исследования , Целью данной работы является разработка и развитие методов построения у/к — состоятельных оценок функции распределения в зависимости доза-эффект, дисперсия которых равномерно мала при больших п, а также систематическое исследование асимптотических свойств построенных оценок. В рамках этого направления требовалось решить задачи непараметрического оценивания как теоретического, так и прикладного характера.
Задачами диссертации являются:
1. Построение оценок, дисперсия которых не зависит от распределения дозы, т.е. равномерно сходящихся к функции распределения.
2. Построение -состоятельных оценок с учетом погрешности измерении доз и уменьшение этих погрешностей.
3. Разработка алгоритмов выбора ширины окна и исследование поведения оценок ширины окна просмотра данных.
4. Исследование свойств построенных оценок неизвестной функции распределения имитационными численными методами.
Объект и инструмент исследования
Объектом исследования являются математические конструкции, формализующие исходные объекты зависимости доза-эффект и статистические оценки функции распределения по неполным выборкам. Рассмотрены случайные и фиксированные планы эксперимента в схеме прямых и непрямых наблюдений. Исследования проводились с использованием методов теории вероятностей, математической статистики, теории функций, математического анализа и имитационного моделирования (метод Монте-Карло). Инструментом исследования являются асимптотические методы теории вероятностей и численные методы компьютерного моделирования.
Достоверность полученных в работе результатов обеспечивается строгостью рассуждений, использованием фундаментальных методов теории вероятностей и математической статистики, согласованностью теоретических выводов и численных результатов экспериментов, непротиворечивостью полученных результатов с ранее известными результатами.
Методы проведенного исследования
Математический аппарат построения оценок функции распределения по результатам независимых единичных испытаний разработан на основе метода ядерного сглаживания непараметрических оценок регрессии. Построение кЬШ — оценок основывается на использовании порядковых статистик в задаче непараметрического оценивания. Для доказательства состоятельности и асимптотической нормальности оценок использовался аппарат характеристических функций, классические предельные теоремы теории вероятностей и результаты асимптотической теории порядковых статистик.
Для получения оценок с автоматическим выбором оптимальной ширины окна в модели доза-эффект применялась комбинированная процедура кросс-проверки.
Научная новизна и научная значимость полученных результатов
Все основные результаты диссертационной работы являются новыми и впервые опубликованы в работах диссертанта.
Для модели доза-эффект построены непараметрические и у/пй — состоятельные оценки функции распределения и проведен их асимптотический анализ для случайного и фиксированного планов эксперимента. Доказана асимптотическая нормальность и асимптотическая несмещенность двухшаговых оценок, рассмотрены методы уменьшения погрешности наблюдений для случая непрямых наблюдений. Для фиксированного и случайного планов эксперимента построены пенализированные оценки с автоматическим выбором ширины окна. Проведен численный анализ имитационной модели, адаптированный к практической ситуации.
Практическая значимость полученных результатов
Результаты диссертации могут быть использованы для оценки уровня биологической активности веществ в опытах на токсичность на основании альтернативных кривых «доза-эффект», при планировании клинических испытаний новых лекарственных средств. Разработано программное обеспечение, реализующее предложенный в диссертации метод построения оценок функции эффективности, которое позволяет оценивать эффективные дозы уровней от 5% до 95%, в том числе и категории доз, близкие к границам интервала распределения, строить оценки также и в случае, когда значения воздействовавшей дозы измеряются с погрешностью. Программа позволяет пользователям получать оценки с автоматическим выбором ширины окна при фиксированном плане эксперимента по непрямым наблюдениям.
Методы оценивания, разработанные в диссертации, были применены для построения функции распределения и категорий эффективных доз при исследовании чувствительности к адреналину. Данные были взяты из литературы (см. [37]).
Основные положения, выносимые на защиту На защиту выносятся:
1. кЫЫ - оценки и двухшаговые - оценки для неизвестной функции распределения в зависимости доза-эффект, результаты их теоретического асимптотического анализа в схеме прямых и непрямых наблюдений для модели со случайным и фиксированным планами эксперимента, а также численное исследование построенных оценок.
2. л/к — и — состоятельные оценки и результаты их асимптотического анализа с учетом погрешности испытанных доз для модели с фиксированным планом эксперимента и способы уменьшения погрешности наблюдений.
3. Адаптивный алгоритм построения оценок с автоматическим выбором ширины окна просмотра данных для моделей с фиксированными и случайными планами эксперимента, реализованный в разработанном диссертантом программном комплексе.
4. Численное сравнение оценок функции эффективности в моделях с прямыми и непрямыми наблюдениями.
Опубликованность результатов
Результаты диссертации опубликованы автором в пятнадцати работах [1-15]. Из них шесть работ [1-6] в журналах из списка ВАК. Две работы - [4, 6], опубликованные в журналах из списка ВАК, написаны без соавторов. Всего без соавторов изданы 5 работ из общего числа.
Среди публикаций из списка ВАК — одна статья в «Вестнике Нижегородского университета», одна статья в журнале «Нелинейный мир», четыре работы в журнале «Обозрение прикладной и промышленной математики». Кроме того, шесть статей опубликованы в материалах международных конференций, одна статья в рецензируемом межвузовском сборнике научных трудов, две статьи депонированы ВИНИТИ.
В совместных работах [1-3, 5, 7, 9, 12] автору принадлежит использование методов анализа оценок в зависимости доза-эффект и выполнение данного анализа, а соавтору — идея работы. В работах [8, 13, 15] автору также принадлежит использование методов анализа и его выполнение для исследования оценок при фиксированном плане эксперимента, первому соавтору — идея работы, а второму соавтору исследование интегрированных среднеквадратичных ошибок в схеме непрямых наблюдений.
Апробация результатов диссертации
Основные результаты диссертации докладывались на следующих конференциях и научных семинарах:
10-я междисциплинарная научная конференция «Нелинейный мир» (Нижний Новгород, 2005 г.);
XII Всероссийская школа-коллоквиум по стохастическим методам (Дагомыс, 2005г.);
7-й Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Йошкар-Ола, 2006);
Международная конференция 11е181а1:'2006 (Рига, 2006 г.);
XIV Всероссийская школа-коллоквиум по стохастическим методам (Адлер, 2007 г.);
XX Международная конференция «Математические методы в технике и технологиях» (Ярославль, 2007 г.);
8-я международная конференция «Компьютерный анализ данных и моделирование» СБАМ'2007 (Минск, 2007 г.);
X Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Дагомыс, 2009 г.).
В 2006 году исследования проводились при поддержке Российского Фонда Фундаментальных Исследований (грант № 04-02-17191-а).
В 2006-2010 гг. по результатам диссертации делались доклады на семинарах по теории вероятностей и математической статистике кафедры теории статистических решений и кафедры прикладной теории вероятностей факультета ВМК ННГУ им. Н.И.Лобачевского.
Структура, объем и краткое содержание диссертации
Диссертация состоит из введения, пяти глав, заключения, списка литературы, включающего 128 наименований, и приложений на 60 страницах. В приложениях в виде таблиц и графиков приведены результаты имитационного моделирования, описанные в пятой главе диссертации, также в приложения вынесены некоторые доказательства. Общий объем работы составляет 217 страниц, объем основного текста — 157 страниц.
Заключение диссертация на тему "Математическое моделирование и оценивание распределений в зависимости доза-эффект"
Основные результаты исследования зависимости доза-эффект для случайного и фиксированного плана эксперимента в случае прямых наблюдений, а также наблюдений с погрешностью, сводятся к следующему.
Впервые рассмотрена задача оценивания неизвестной функции распределения в зависимости доза-эффект с помощью ШЫ — оценок. Для случайного плана эксперимента в схеме прямых и непрямых наблюдений были построены кАгМ - оценки и двухшаговые асимптотически несмещенные ШМ- оценки и проведен их асимптотический анализ. Установлена их состоятельность и асимптотическая нормальность. Оказалось, что их предельная дисперсия не зависит от неизвестной плотности. Для фиксированного плана эксперимента изучены оценки Надарая—Ватсона (в случае постоянного шага) и оценки
Пристли-Чао (для переменного шага). Построены 4пЬ - состоятельные оценки для модели с фиксированным планом эксперимента. Кроме того, асимптотическое поведение оценок Пристли—Чао было изучено и для случайных планов наблюдений. Для фиксированного плана в схеме непрямых наблюдений было установлено, что оценки, полученные при предположении нормальности, имеют такое же предельное распределение, что и оценки в схеме прямых наблюдений, т. е. уменьшена погрешность наблюдения.
Таким образом, для изучения модели доза-эффект были применены непараметрические ядерные оценки различных типов, рассмотрен важный для практики случай наблюдений с ошибкой и для него построены состоятельные, асимптотически несмещенные и асимптотически нормальные оценки.
Кроме аналитического исследования было проведено изучение имитационной модели. Ввиду асимптотического характера исследования, проведенного в диссертации, на практике возникает проблема оптимального подбора значений параметров модели, в частности, — ширины окна просмотра И. Для моделей с фиксированными и случайными планами эксперимента разработан комбинированный адаптивный алгоритм выбора оптимальной ширины окна. Осуществлено построение оценок с автоматическим выбором оптимальной ширины окна методами кросс-проверки, подстановки, штрафных функций, а также с помощью разработанного алгоритма. Проведен численный анализ построенных оценок. При решении задачи численной оптимизации делается вывод, что предложенные в диссертационной работе оценки более точно оценивают «малые» и «большие» дозы и приводят к получению более узких доверительных интервалов по сравнению с существующими методами.
Основные аналитические результаты диссертации — асимптотическая нормальность оценок и процедура построения у[гИг — и у[к - состоятельных оценок согласуются с численными оценками, полученными в ходе изучения имитационной модели для выборок конечного объема.
Полученные в диссертационной работе результаты могут быть применены для системного изучения свойств непараметрических оценок и дальнейшего развития анализа зависимости доза-эффект, а также при разработке модулей статистических пакетов.
Заключение
Библиография Ярощук, Марина Владимировна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Ярощук, М.В. Статистическое оценивание зависимости доза-эффект с помощью kNN —оценок / М.С. Тихов, М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2005. - Т. 12, в. 3. - С. 683 - 684.
2. Ярощук, М.В. Модифицированные оценки Янга в зависимости доза-эффект / Тихов М.С., Ярощук М.В // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП — 2006. — Т. 13, в. 1. - С. 144.
3. Ярощук, М.В. Асимптотическая нормальность kNN — оценок в зависимости доза-эффект / М.С. Тихов, М.В. Ярощук // Вестник Нижегородского университета. Серия: Математика. 2006. Вып.1(4), - С. 129-137.
4. Ярощук, М.В. Об оценивании распределений в зависимости доза-эффект / М.В. Ярощук // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП -2007. - Т. 14, в. 1.-С. 178-180.
5. Ярощук. М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений / М.С. Тихов, М.В. Ярощук//Нелинейный мир М.: изд-во Радиотехника— 2007, Т.5, №1,2, С.4-8.
6. Ярощук М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности/ М.В. Ярощук // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП -2009. - Т. 16, в. 6. - С. 1148-1150.
7. Ярощук, М.В. Статистическое оценивание нелинейной зависимости доза-эффект с помощью kNN оценок / М.С. Тихов, М.В. Ярощук // Десятая междисциплинарная научная конференция «Нелинейный мир». Тезисы докладов — Нижний Новгород: изд-во ННГУ - 2005. - С.139.
8. Yarochuk, M.V. Asymptotic normality ^-Nearest Neighbor estimators in dependence dose-response / M.S. Tikhov, M.V.Yarochuk — изд-во Ташкентского ун-та, Ташкент, 2006. С. 46- 49.
9. Ярощук, М.В. Об асимптотической нормальности kNN — оценок в зависимости доза-эффект / М.В. Ярощук. Нижегородский гос. ун-т — Н.Н., 2006 49 с. -Библиогр.: 11 назв. - Рус. - Деп . в ВИНИТИ 1536- В2006
10. П.Ярощук, М.В. Предельные распределения kNN оценок в зависимости доза-эффект в схеме непрямых наблюдений / М.В. Ярощук. Нижегородский гос. ун-т — Н.Н., 2006. - 39 с. - Библиогр.: 11 назв. - Рус. - Деп. в ВИНИТИ 1535- В2006
11. Yarochuk, M.V. Statistical estimation of distributions in dose-response dependence / M.S. Tikhov, M.V.Yarochuk // Reliability and Statistics in Transport and Communication: Proc. of the 6th Intern. Conf., Riga, Latvia. — 2006. — P. 374-375.
12. Yarochuk, M.V. Computer-based data analysis in dose-response dependence / M.V. Yarochuk // Computer Data Analysis and Modeling: Proc. of 8th Intern. Conf., Minsk, September 11-15.-2007.- V. l.-P. 186-189.
13. Yarochuk, M.V. Asymptotic normality of the integrated square error at the fixed plan of experiment for indirect observations / M.S. Tikhov, D.S.Krishtopenko, M.V.Yarochuk // J. "Computer Modeling and New Technologies". 2007. - V. 11, No 1. - P. 46-56.
14. Авалиани, С.JT. Вероятностные методы оценки пороговых концентраций при гигиеническом регламентировании атмосферных загрязнений / C.JI. Авалиани, З.П. Григоревская, Е.В. Печенникова // Гигиена и санитария. 1987. №8. - С. 10-13.
15. Богданов, А.А. Метод анализа зависимости «доза-эффект» в многофакторных медико-биологических экспериментах / А.А. Богданов, В.Д. Шлендов // Бюлл. эксперим. биол. и медицины. -1994. № 33. — С. 228-331.
16. Беленький, M.JI. Элементы количественной оценки фармакологического эффекта / M.JI. Беленький. JI.: Медгиз, 1963. -152 с.
17. Бессмертных, Б.С. Математическая статистика в клинической, профилактической и экспериментальной медицине / Б.С. Бессмертных. М., 1967. 215 с.
18. Газенко, О.Г. Словарь физиологических терминов / О.Г. Газенко — М.: Наука, 1987. -445 с.
19. Гнеденко, Б.В. Курс теории вероятностей / Б.В. Гнеденко М.: Наука, 1988.- 448 с.
20. Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений / И.С. Градштейн, И.М. Рыжик — М.: Физматгиз, 1963. — 1100 с.
21. Гублер, Е.В. Применение непараметрических критериев статистики в медико-биологических исследованиях / Е.В.Гублер, А.А. Генкин — JL: Медицина, Ленингр. отд-ние, 1973. — 141 с.
22. Гуревич, К.Г. Оценка параметров кривой «доза-эффект» методом сплайн-интерполяции / К.Г. Гуревич // Вести. Моск. Ун-та. — Сер. 2. — Химия. 2000. -Т.41, № 200. - С. 69-70.
23. Гуревич, К.Г. Фармакологический анализ бимодальных дозовых зависимостей / К.Г. Гуревич // Рос. хим. журн. 2002. - Т.46, № 6. - С. 68-73.
24. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности I В.А. Епанечников // Теор. вероятн. и ее примен. — 1969, Т. 14. — С. 156-161.
25. Закс, JI. Статистическое оценивание / JI. Закс. М.: Статистика, 1976. 598 с.
26. Заугольников, С.Д. Экспрессные методы определения токсичности и опасности химических веществ / С.Д. Заугольников, М.М. Кочанов, А.О. Лойт, И.И. Ставчанский. JL: Медицина, 1978. 184 с.
27. Ибрагимов, И.А. Асимптотическая теория оценивания / И.А. Ибрагимов, Р. 3. Хасьминский. М.: Наука, 1979. 528 с.
28. Ибрагимов, И.А. О непараметрическом оценивании регрессии / И.А. Ибрагимов, Р. 3. Хасьминский. Доклады АН СССР. 1980. - № 21. - С. 810-814.
29. Катковник, В.Я. Сходимость линейных и нелинейных непараметрических оценок ядерного типа / В.Я. Катковник // Автоматика и телемеханика. — 1983. №4. - С. 108-120.
30. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, C.B. Фомин. М.: Наука, 1976.-542 с.
31. Криштопенко, C.B. Токсикометрия эффективных доз/ C.B. Криштопенко, М.С. Тихов Нижний Новгород: Изд-во ННГУ, 1997. - 156 с.
32. Криштопенко, C.B. Парадоксальная токсичность/ C.B. Криштопенко, М.С. Тихов, Е.Б. Попова Нижний Новгород: Изд-во НГМА, 2001. - 164 с.
33. Криштопенко, C.B. Доза-эффект / C.B. Криштопенко, М.С. Тихов, Е.Б. Попова -М.: Медицина, 2008. 288 с.
34. Лакин, Г.Ф. Биометрия / Г.Ф. Лакин. М.: Высшая школа, 1990. 352 с.
35. Лапач, С.М. Статистическое методы в медико-биологических исследованиях с использованием Excel / С.М. Лапач, A.B. Чубенко, П.М. Бабич. К.: Морион, 2001. - 408 с.
36. Лоэв, М. Теория вероятностей / М. Лоэв. М.: ИЛ., 1962. 720 с.
37. Надарая, Е.А. Об оценке регрессии/ Е.А. Надарая // Теория вероятн. и ее примен. -1964. Т. 9, в.1. — С.157- 159.
38. Надарая, Э.А. О непараметрических оценках плотности вероятности и регрессии / Э.А. Надарая // Теория вероятн. и ее примен. 1965. Т. 10, в.1. - С.199 - 203.
39. Невельсон, М.Б. Стохастическая аппроксимация и рекуррентное оценивание / М.Б. Невельсон, Р.З. Хасьминский. М: Наука, 1972. — 304 с.
40. Осипов, А.Л. Непараметрический метод построения зависимости «доза-эффект» /
41. A.Л. Осипов, С.Н. Аношкин // ж. «Автометрия».-2006. Т. 42, №6. С. 63-69.
42. Прудников, А.П. Интегралы и ряды. Элементарные функции / А.П. Прудников, Ю.А. Брычков, О.И. Маричев. М.: Наука, 1981. -800 с.
43. Pao, С.Р. Линейные статистические методы и их применение / С.Р. Pao. М.: Наука, 1968.-548 с.
44. Румак, B.C. Воздействие диоксинов на окружающую среду и здоровье человека /
45. B.C. Румак, Чинь Куок Кхань, А.Н. Кузнецов и др. // Вестник РАН: Проблемы экологии. 2009. - Т. 79, №2. - С. 124-130.
46. Слуцкий, Е.Е. Избранные труды: теория вероятностей, математическая статистика / Е.Е. Слуцкий М.: изд-во АН СССР, 1960. - 292 с.
47. Смирнов, Н.В. Приближение законов распределения случайных величин по эмпирическим данным / Н.В. Смирнов // Успехи мат. наук 1944. Т. 10. - С. 179206.
48. Смирнов, Н.В. Теория вероятностей и математическая статистика. Избранные труды/ Н.В. Смирнов М.: Наука, 1970. - 288 с.
49. Тихов М.С. Асимптотические методы в теории порядковых статистик и их приложения: учебное пособие. Горький, изд-во Горьк. ун-т, 1985. — 80 с.
50. Тихов, М.С. Оценивание дисперсий оценок функции распределения в зависимости доза—эффект/ М.С. Тихов, В.В. Агеев // Обозрение Прикл. и Пром. Математики — М.: Изд-во ТВП 2009. - Т. 16, в. 6. - С. 581 - 582.
51. Тихов, М.С. Оценки параметров нерегулярных в окрестности квантилей плотностей по отрезкам вариационного ряда / М.С. Тихов // Теория вероятностей и ее применение. 1987. - Т. 32, в. 2. - С. 382 - 387.
52. Тихон, М.С. Построение и анализ статистических оценок для неполностью известных семейств распределений: Дис. . д-ра физ.-мат.наук. Н.Новгород, 1993. -354 с.
53. Тихов, М.С. Линейные функции индуцированных порядковых статистик и непараметрическое оценивание распределений в зависимости доза-эффект / М.С. Тихов // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП — 1999. - Т.6, B.1.-C. 244.
54. Тихов, М.С. Эконометрические дискретные модели бинарного выбора / М.С. Тихов // Прикладная статистика в социально-экономических проблемах: материалы межд. конф. Нижний Новгород: изд-во ННГУ - 2003. - Т.1. - С.104-106.
55. Хардле, В. Прикладная непараметрическая регрессия / В. Хардле. М.: Мир, 1983. -349 с.
56. Цыбаков, А.Б. О выборе ширины окна в ядерной непараметрической регрессии / А.Б. Цыбаков // ТВП М.: Изд-во ТВП-1987. -Т. 32, в. 1. - С. 153-159.
57. Ширяев, А.Н. Вероятность / А.Н. Ширяев // в 2-х книгах М.:МЦНМО, 2007. Кн. 1 - 552 с. -Кн. 2 -416 с.
58. Barbe, P. Joint approximation of process based on spacings and order statistics. / P. Barbe // Stochastic process and their Applications, 53. -1994. P. 339-349.
59. Benedetti, J.K. On the nonparametric estimation of regression functions / J.K. Benedetti // Journal of the Royal Statistical Society, Series B, 39 1977, P. 248-253.
60. Beran, R. Discussion of "Jackknife, bootstrap and resampling methods in nonparametric regression analysis"/ R. Beran, C.F.J.Wu // Aim. Statist. 1986. - V. 14, P.1295-1298.
61. Beran, J. Modifying the double smoothing bandwidth selector in nonparametric regression / J. Beran, Y. Feng and S. Heiler // Statistical Methodology. 2009. - V. 6, Issues 5. -P. 447-465.
62. Bross, I.D. Taking a covariable into account / I.D.Bross // J. Amer.Statist. Assoc.59 — 1964, P. 725-736.
63. Cheng, K.F. Nonparametric estimation of a regression function / K.F. Cheng, P.E. Lin // Zeitschrift fur Wahrscheinlichkeitstheorie und verwandte Gebiete, 57 — 1981, P. 223233.
64. Collomb, G. Quelques properietes de la methode du noyau pour l'estimation non-parametrique de la regression en un point fixe / G. Collomb // C.R. Acad. Sc. Paris, 285. -1977, P. 289-292.
65. David, H.A. Order Statistics / H.A. David, H.N.Nadaraja Wiley, 2003. - 458 p.
66. Dette, H. A Note on Nonparametric Estimation of the Effective Dose in Quantal Bioassay / H. Dette, N. Neumeyer, K.F. Pilz // Journal of the American Statistical Association. 2005. - V. 100. - P. 503- 510.
67. Dvoretzky, A Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator / A Dvoretzky, J. Kiefer and J. Wolfowitz // Annals of Mathematical Statistics. 1956. - V.27. - P. 642 -669.
68. Einmahl, U. Uniform in Bandwidth Consistency of Kernel-type Function Estimators/ U. Einmahl, D.M. Mason // Ann. Statist. 2005. - V. 33, № 3. - P. 1380 - 1403.
69. Eubank, R. Adaptive bandwidth choice for kernel regression / R. Eubank, W. Schucany // Technical Report № SMU.DS.TR.241 department of Statistical Science. -1990.
70. Fan, J. Nonparametric regression with errors in variables / J. Fan, Y. Truong // The Annals of Statistics. 1993. - V.21, №4. - P.1900-1925.
71. Faraway, J.J Bootstrap selection of bandwidth and confidence bands for nonparametric regression/ J.J. Faraway // J. Statist. Comput. Simulation-1990. V. 37. -P.37-44.
72. Faraway, J.J. Bootstrap choice of bandwidth for density estimation / J.J. Faraway, M. Jhun // J. Amer. Statiat. Assoc. -1990. V. 85. - P. 1119-1122
73. Finney, D.J. Probit Analysis / D.J. Finney, 3 ed. Cambridge: University Press, 1980. -333 p.
74. Gasser, T. Estimating regression function and their derivatives by the kernel method / T. Gasser, H.G. Muller// Scand. J. Statist. -1984. -V. 11. P. 171-185.
75. Gasser, T. Kernel estimation of regression functions. Smoothing techniques for Curve estimation / T. Gasser, H.G. Muller // Lecture Notes in Math., Springer, New York -1979.-V. 757.-P. 23-68.
76. Gasser, T. Kernels for nonparametric curve estimation / T. Gasser, H.G. Muller, V. Mammitzsch // J. Roy. Statist. Soc. -1985. Ser.B, V. 47. -P. 238-252.
77. Gasser, T. Residual variance and residual pattern in nonlinear regression / T. Gasser, L. Sroka, C. Jennen-Steinmetz // Biometrika. 1986. - V. 73. -P. 625-633.
78. Geisser, S. A predictive sample reuse method with application / S. Geisser // Journal of American Statistical Association. 1975. - V. 70. - P. 320-328.
79. Hall, P. A Local Cross-Validation Algorithm / P. Hall, W.R. Schucany // Statistics and Probability Letters. -1989. V. 8. - P.109-117.
80. Hardle, W. Bootstrapping in Nonparametric Regression: Local Adaptive Smoothing and Confidence Bands / W. Hardle, A.W. Bowman // Journal of the American Statistical association. 1988. -V. 83. -P. 102-110.
81. Hardle, W. How far are automatically chosen regression smoothing parameters from their optimum / W. Hardle, P. Hall, J.S. Marron // J. Amer. Statist. Assoc. -1988. -V. 83. -P. 86-99.
82. Hardle, W. Regression smoothing parameters that are not far from their optimum / W. Hardle, P.Hall, J.S. Marron//J. Amer. Statist. Assoc.-1992.-V. 87. -P. 227-233.
83. Hardle, W. Applied nonparametric Methods, in Handbook of Econometrics / W. Hardle, O. Linton // North Holland Elsevier Science, 1994. -V.4. P. 44-88.
84. Hardle, W. Optimal Bandwidth in nonparametric regression function estimation / W. Hardle, J.S. Marron //The Annals of Statistics. 1985.-V.13, № 4.-P. 1465-1481.
85. Hengartner, N.W. Asymptotic unbiased density estimators / N.W. Hengartner // E. Matzner-Lober // ESAIM. 2009. - V. 13. - P. 1-14.
86. Hlawka, E. Losung von Integralgleichungen mittels zahlentheoretisher Methoden I / E. Hlavvka // Siztzungsber., Abt. II. Osterr. Akad. Wiss., Math. -Naturwiss. Kl. 1962. -V. 171, № 1 -P. 103 -123.
87. Hodges, J.L. The efficiency of some nonparametric competitors of the t-test / J.L. Hodges, E.L. Lehmann // Annals of Mathematical Statistics. 1956. -V. 27. - P. 324335.
88. Hoeffding, W. Probability inequalities for sums of bounded random variables/ W. Hoeffding // Siztzungsber. Abt. II. Oster. Acad. Wiss., Math.-Naturwiss. Kl. 1962. - V. 171, № l.-P. 103-123.
89. Kolmogoroff, A. Sulla determinazione empirica di una legge di distribuzione / A. Kolmogoroff // Giornale dell' Institute italianj degli Attuari 1933. - V. 4- P. 83 -91.
90. Jennen-Steinmetz, C. A unifying approach to nonparametric regression estimation / C. Jennen-Steinmetz, T. Gasser // Unpublished manuscript. -1988.
91. Lewbel, A. Estimator for Inverse Density Weighted expectations / A. Lewbel, S. Schennach // Journal of Econometrics. 2007. -V. 136, № 1 -P. 189-211.
92. Li, Q. Nonparametric Econometrics: Theory and Practice / Q. Li, J.S. Racine // Princeton University press, 2007. 768 p.
93. Litchfield, J.T. A simplified method of evaluating dose-effect experiments/ J.T. Litchfield, F.W. Wilcoxon // J. Pharmacol. Exper. Ther. 1949. - V. 96. - P. 99-113.
94. Loftsgaarden, D.O. A nonparametric estimate of a multivariate density function/ D.O. Loftsgaarden, G.P. Quesenberry// Ann. Mathem. Statist. 1965. - V. 36. - P. 1049 -1051.
95. Mack, Y.P. Local properties of k NN Regression Estimates/ Y.P. Mack // SIAM J. Alg. Disc. Meth. - 1981. - V. 2. -P. 311 -323.
96. McDiarmid, C. On the method of bounded difference / C. McDiarmid // In Surveys in Combinatorics. Cambridge University press: Cambridge. - 1989. - P. 148-188.
97. Miller, L.S. Estimation of the ED50 and its error by means of logariphmic probit graph paper/ L.S. Miller, M.L. Tainter // Proc.Soc.Exp.Biol.Med. 1944. - V.7. - P. 261-264.
98. Muller, H.-G. Variable bandwidth kernel estimators of regression curves / H.-G. Muller, U. Stadtmuller // Ann. Statist. 1987. -V. 15. -P. 182-201.
99. Neumann, M. Automatic bandwith choice and confidence intervals in nonparametric regression / M. Neumann // The Annals of Statistics. 1995. - V. 23. - P. 1937-1959.
100. Niederreiter, H. Random Number Generation and Quasi-Monte Carlo Methods / H. Niederreiter SIAM Philadelphia, Pensylvania, 1992.-241 p.
101. Parsen, E. On estimation of a probability density function and mode / E. Parsen // Ann. Math.Statist. 1962. - V. 33. - P. 1056-1076.
102. Peleg, M. Mathematical interpretation of dose-response curves / M. Peleg, M.D. Normand, E. Damrau // Bulletin of Mathematical Biology. -1997.-V. 59, № 4 P. 747767.
103. Priestley, M.B. Nonparametric function fitting / M.B. Priestley and M.T. Chao // Journal of the Royal Statistical Society. -1972. -Ser. B. -V. 34. -P. 385-392.
104. Racine, Jeffrey S. Nonparametric econometrics: a primer/ Jeffrey S.Racine // Quantile. -2008.-№4.-P. 7-56.
105. Reinsch, H. Smoothing by spline functions / H.Reinsch // Numerische mathematic. -1967. -№ 10. -P.177-183.
106. Renyi, A. On the theory of order statistics / A. Renyi // Acta math. Acad. Sci. hung. -1953. -P.191-231.
107. Rice, J. Smoothing splines: regression, derivatives and deconvolution / J. Rice and M. Rosenblatt // Ann.Statistic. 1983. - V.l 1. - P.141-156.
108. Rosenblatt, M. Remarks on some nonparametric estimates of a density function / M. Rosenblatt // Ann. Math. Statist. 1956. -V.27, № 3. - P. 832-837.
109. Rumak, V.S. The Effect of Dioxins on the Environment and Human Health / V.S. Rumak, Trinh Quoc Khanh, A.N. Kuznetsov // Herald of the Russian Academy of Sciences. 2009. - V. 79, № 1. - P.50-56.
110. Schucany, W.R. On nonparametric regression with higher-order kernels / W.R Schucany //Journal of Statistical Planning and Inference. 1989. -№ 23. -P.145-151.
111. Shibata, R. An optimal selection of regression variables / R. Shibata // Biometrica. -1981.-V.68.-P. 45-54.
112. Silverman, B.W. Some aspects of the spline smoothing approach to non-parametric regression curve fitting (with discussion) / B.W. Silverman // J. Roy. Statist. Soc. -1985. Ser.B, V.47. - P. 1-52.
113. Simonoff, J.S. Smoothing Methods in Statistics / J.S. Simonoff. New York: Springer Verlag, 1996.- 338 p.
114. Stone, C.J. Cross-validatory choice and assessment of statistical predictions (with discussion) / C.J. Stone // Journal of Royal Statistical Society. -1974. № 36. - P. 111-147.
115. Stute, W. Asymptotic normality of nearest neighbor regression function estimates / W. Stute// Annals of Statistics.- 1984.-№12.-P. 917-926.
116. Taylor, C.C. Bootstrap choice of the smoothing parameter in kernel density estimation / C.C. Taylor // Biometrika. -1989. V.76. - P. 705-712.
117. Tikhov M.S. Statistical Estimation based on Interval Censored Data. / Tikhov M.S. // Param. and Semiparam. Models with Appl. to Rel., Surv. Analisys, and Qual. of Life: Springer-Verlag: Theor.& Meth. 2004. -V. XLIV. - P. 209-215.
118. Tikhov, M.S. Statistical Estimation on the Basis of Interval-Cencored Data/ M.S. Tikhov // J. Math. Sciences. 2004. -V . 119, N. 3. - P. 321- 335.
119. Tikhov, M.S. Econometric models with discrete dependent variables // 8-th Intern. Vilnius Con. on Probab. Theory and Math. Stat. Abstracts. TEV. - Vilnius - 2002. -P. 325.
120. Wahba, G. A completely automatic French curve: fitting spline functions by cross-validation / G. Wahba, and S. Wold // Comm. Statist. -1975. V. 4. - P. 1—17.
121. Wand, M.P. Kernel Smoothing / Wand M.P. and M.C. Jones. Boston: CRC Press., 1995.-230 p.
122. Watson, G.S. Smooth regression analysis/ G.S. Watson// Sankliya. -1964. V. 26. P. 359-372.
123. Wu, J.S. Nonparametric function estimation and bandwidth selection for discontinuous regression functions / J.S. Wu and C.K. Chu // J. Statistica Sinica. -1993. V. 3. P. 557-576.
124. Yang, S. Linear functions of concomitants of order statistics with application to nonparametric estimation of a regression function / S. Yang // Journal of the American statistical association. 1981. - V.76. - P. 658-662.
125. Zbinden, G. Les methods alternatives, present et avenir / G. Zbinden // The-rapie. -1990.-V. 45, №5. -P. 347-350.
-
Похожие работы
- Тестирование распределений в зависимости доза-эффект
- Методы оценивания характеристик тяжело-хвостовых случайных величин по конечным выборкам
- Оценка числовых характеристик параметров технических объектов при нечётких исходных данных
- Метод и математические модели оценивания готовности однокамерных судоходных шлюзов
- Оценка числовых характеристик параметров технических объектов при нечетких исходных данных
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность