автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математическое моделирование и оценивание распределений в зависимости доза-эффект

кандидата физико-математических наук
Ярощук, Марина Владимировна
город
Нижний Новгород
год
2011
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Математическое моделирование и оценивание распределений в зависимости доза-эффект»

Автореферат диссертации по теме "Математическое моделирование и оценивание распределений в зависимости доза-эффект"

На правах рукописи

Яр о щук Марина Владимировна

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ОЦЕНИВАНИЕ РАСПРЕДЕЛЕНИЙ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ

05.13.18 - Математическое моделирование, численные методы и комплексы программ

4856100

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

* * I и(/

Нижний Новгород - 2011

4856100

Работа выполнена в Нижегородском государственном университете им. Н.И. Лобачевского (национальный исследовательский университет).

Научный руководитель: доктор физико-математических наук, профессор

Тихов Михаил Семенович

Официальные оппоненты: доктор физико-математических наук, профессор

Насыров Фарит Сагитович

доктор технических наук, профессор Лапидус Вадим Аркадьевич

Ведущая организация: Российский Университет Дружбы Народов

Защита состоится «Л» J-z20И г. на заседании диссертационного совета Д 212.166.13 при Нижегородском государственном университете им. Н.И. Лобачевского по адресу: 603950, г. Нижний Новгород, пр. Гагарина, 23, корпус 2, ауд. 209. € ^

С диссертацией можно ознакомиться в фундаментальной библиотеке Нижегородского государственного университета им. Н.И. Лобачевского.

С текстом автореферата можно ознакомиться на официальном сайте Нижегородского государственного университета им. Н.И. Лобачевского http ://www.unn.ru

Автореферат разослан « ^ » /-А2011 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук, доцент

В.П. Савельев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Анализ связи между дозой и эффектом и их количественное определение является одной из актуальных проблем, возникающих при разработке новых лекарственных средств, т.е. веществ, обладающих фармакологической активностью, прошедших клинические испытания и предназначенных для изготовления лекарственных форм. Под дозой мы понимаем некоторое значение агента (фактора), которое может изменить состояние исследуемого объекта, а под эффектом - наблюдаемый качественный (альтернативный) отклик объекта на введенную дозу. Решение этой задачи представляет большой теоретический интерес и имеет обширные практические приложения во многих областях медицины и биологии.

Основу решения проблемы количественного оценивания связи между введенной дозой и наблюдаемым эффектом составляет функция эффективности, под которой понимается зависимость вероятности наблюдения эффекта от введенной дозы (зависимость доза-эффект). Задача оценивания функции эффективности по экспериментальным данным, а именно, введенной дозе и наличию или отсутствию эффекта, является главной задачей зависимости доза-эффект.

Функция эффективности имеет очень важное, а иногда и принципиальное значение в фармакологии - при оценке эффективности лекарственных препаратов, в токсикологии и радиологии — при исследовании количественной токсичности ядов и поражающих свойств ионизирующих излучений, в гигиене - при нормировании критических уровней вредных факторов. В экологии анализ зависимости доза-эффект дает возможность определить пределы устойчивости экосистемы.

Построение функции эффективности является статистической задачей, способ решения которой предъявляет соответствующие требования к планированию эксперимента и виду получаемых исходных данных. Биологический эксперимент на завершающем этапе требует методологически обоснованных точных статистических оценок результатов, учитывающих погрешности получения исходных данных и их влияние на конечные результаты. Поэтому с прикладной стороны актуальность темы диссертации не вызывает сомнений.

В некоторых случаях отсутствует понятие дозы в вышеопределенном смысле. Примером могут служить эконометрические модели с дискретными зависимыми переменными при случайной константе регрессионной зависимости1, оценка инкубационного периода. Тем не менее, такие задачи

1 Тихов, М.С. Эконометрические дискретные модели бинарного выбора / М.С. Тихов // Прикладная статистика в социально-экономических проблемах: материалы межд. конф. (под ред. Стронгиной Н.Р.) - Нижний Новгород: изд-во ННГУ - 2003. - Т. 1. - С. 104106.

Tikhov, M.S. Econometric models with discrete dependent variables // 8-th Intern. Vilnius Con. on Probab. Theory and Math. Stat. Abstracts. - TEV. - Vilnius - 2002. - P. 325.

укладываются в рассмотренную в диссертации модель доза-эффект и могут быть решены предложенными в ней методами.

В диссертационной работе нас интересует проблема нахождения функции эффективности и оценка средних или летальных эффективных доз2 EDma или LDma, соответственно, в широком диапазоне значений О < се < 1, по результатам наблюдений. Мы строим математическую модель зависимости доза-эффект, где рассматриваем минимальную границу, с которой начинается реакция организма, как латентную случайную величину X. Если нижняя граница чувствительности X и введенная доза U независимы как случайные величины, то функция эффективности будет функцией распределения величины X, однако даже в этом случае для оценки функции эффективности и категорий эффективных доз мы не можем воспользоваться классическими методами математической статистики, поскольку исследуемая величина ненаблюдаема, а вместо нее наблюдаются менее информативные величины: введенные дозы Un и индикаторы эффекта W.=I(U,>X.), / = 1,2,... , п. Для оценки функции эффективности мы используем непараметрические методы математической статистики, а именно, ядерные оценки регрессии по выборке объема п. По-

требности практики обуславливают необходимость одновременного определения как эффективных доз от EDS до ED95, так и вида самой функции эффективности.

Для построения кривой доза-эффект и оценки дозы EDsa обычно применяется официальная методика в модификациях Литчфилда-Вилкоксона3 (J.T. Litchfield, F.W. Wilcoxon) и Д. Финни4 (DJ. Finney), а также метод Спирмена-Кербера5 (Е. Spearman, Т. Karber) и метод Рида-Менча6 (L. Reed, Н. Muench). Используются также методы сплайн-аппроксимации. Существенные недостатки традиционных методов определения средне-эффективных доз состоят в том, что они позволяют оценивать эффектив-

2Дозы, гарантирующие наступление эффекта с заданной вероятностью а (например, EDsa - средне-эффективная доза - для 50% объектов наблюдается эффект, LD„- 90% летальная доза - 90% объектов, получивших дозу, погибает).

3Litchfield, J.T. A simplified method of evaluating dose-effect experiments/ J.T. Litchfield, F.W. Wilcoxon // J. Pharmacol. Exper. Ther. - 1949. - V. 96. - P. 99-113.

4Finney, D.J. Probit Analysis / D.J. Finney, 3 ed. - Cambridge: University Press, 1980. -333 p.

5 Закс, JI. Статистическое оценивание / Л. Закс. М.: Статистика, 1976. - 598 с

6 Лакин, Г.Ф. Биометрия / Г.Ф. Лакин. М.: Высшая школа, 1990. - 352 с.

ные дозы в основном в окрестности £DJ0. Методы сплайн-аппроксимации не позволяют строить доверительные интервалы.

Кроме указанных методов для оценивания зависимости доза-эффект и средне-эффективных доз EDS0 (называемых еще медианными средне-эффективными дозами) используются модели бинарного выбора - пробит- и логит-модели, основанные на использовании нормальной или логистической функций распределения. Модели бинарного выбора хорошо работают в окрестности медианных средне-эффективных доз. Эти методы реализованы в большинстве современных эконометрических компьютерных программных пакетов (ЭКПП): SPSS, XL STAT-Dose, BioStat 2007, Probit Analysis, Stat-Plus (Статистика+). С помощью этих ЭКПП можно произвести обработку кривой зависимости доза-эффект, вычислить эффективную дозу, а также соответствующие доверительные интервалы, но в окрестности медианы.

Существуют различные модификации пробит- и логит-анализа, которые, имея в своей основе главную идею - преобразование процентов встречаемости эффекта в пробиты, - различаются алгоритмами линеаризации и статистической обработки. Большая часть этих программ основывается на алгоритме метода максимального правдоподобия для регрессионной схемы в модели бинарного выбора. Некоторые авторы (L.S. Miller & M.L. Tainter7, J.T. Litchfield & F.W. Wilcoxon) используют для этой цели метод наименьших квадратов.

Таким образом, как при пробит-анализе, так и при использовании других моделей, функции распределения рассматриваемых случайных величин хорошо аппроксимируются линейными или нелинейными функциями, но только в окрестности медианы. В диссертации показано, что если истинное распределение отличается от нормального распределения N(a,a2), то оценки «граничных» эффективных доз могут значительно отличаться от значений квантилей истинного распределения. Кроме того, при практической реализации про-бит-анализа или его модификаций отсутствует возможность проведения единичных испытаний (согласно официальной методике испытания должны носить групповой характер), отсутствует возможность построения доверительных интервалов, существующие методы не учитывают погрешность измерений.

В работах М.С. Тихова (1993)8 и М.С. Тихова, C.B. Криштопенко (1997)9 был предложен непараметрический метод оценивания функции эффективно-

7 МШег, L.S. Estimation of the ED50 and its error by means of Jogariphmic probit graph paper/L.S. Miller, M.L. Tainter//Proc.Soe.Exp.Biol.Med.- 1944,-V.7.-P. 261-264.

8Тихов, М.С. Построение и анализ статистических оценок для неполностью известных семейств распределений: дис. д-ра физ.-мат. наук: 01.01.05/С.-Пегербургский гос.ун-т. СПб. 1993.-377 с.

.'Криштопенко, C.B. Токсикометрия эффективных доз/ C.B. Криштопенко, М.С. Тихов - Нижний Новгород: Изд-во ННГУ, 1997. - 156 е.; Криштопенко, C.B. Парадоксальная токсичность/ C.B. Криштопенко, М.С. Тихов, Е.Б. Попова - Нижний Новгород: Изд-во НГМА, 2001. - 164 е.; Криштопенко, C.B. Доза-эффект / C.B. Криштопенко, М.С. Тихов, Е.Б. Попова - М.: Медицина, 2008. - 288 с.

сти, который задачу определения функции эффективности сводит к задаче оценивания функции регрессии и использования для этой цели непараметрических (ядерных) оценок регрессии с параметром сглаживания h— ширины окна просмотра данных. Такой подход позволяет по результатам единичных испытаний оценивать средне-эффективную дозу EDS0 не хуже, чем методы пробит-анализа, а малые и большие дозы, близкие, например, к ED5 или к ED9S, оценивать эффективнее, чем с помощью пробит-анализа, строить доверительные интервалы, достаточно узкие как в середине, так и на краях распределения. С помощью метода, изложенного в этих работах, можно оценивать и немонотонные функции эффективности. Указанный подход позволяет также производить планирование эксперимента. Однако, рассмотренные в работах М.С. Тихова, C.B. Криштопенко оценки функции эффективности (в основном, оценки Надарая-Ватсона) хотя и сходятся к истинному распределению при л—и h—>0, л/г—не являются, во-первых, -Jnh - состоятельными (их предельное математическое ожидание отлично от нуля), а во-вторых, предельная дисперсия оценок для случайных доз U с плотностью

, Ч „ 2 / л F(x)(l-F(x))

распределения g(x) > 0 пропорциональна величине а (х)=-,

g(x)

где F(x)- неизвестная функция распределения минимальной границы, т.е. предельная дисперсия оценок зависит от плотности распределения вводимой дозы в заданной точке х : для EDma при малых или больших значениях а значение g(EDma) мало, поэтому дисперсия ог(х) может оказаться довольно большой. В диссертации для оценки функции распределения F(x), вместо оценок Надарая-Ватсона мы используем kNN-оценки (оценки к ближайших соседей). Для kNN-оценок предельная дисперсия пропорциональна величине F(x)(l-F(x)) и не зависит от плотности g(x), т.е. эти оценки равномерно сходятся к функции распределения, однако kNN -оценки не являются асимптотически несмещенными. Чтобы сделать их асимптотически несмещенными, мы конструируем двухшаговые оценки, у которых предельная дисперсия такая же, как и у kNN-оценок, но предельное математическое ожидание равно нулю.

Кроме того, математическую модель зависимости доза-эффект мы рассматриваем для случая прямых и непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрены случаи фиксированного плана (вводимая доза выбирается заранее и является неслучайной величиной) и случайного плана эксперимента (вводимая доза является случайной величиной). Таким образом, рассмотренные постановки охватывают возможные практические ситуации, встречающиеся в проблеме доза-эффект. К тому же измерение доз с ошибкой - это типичная практическая ситуация, которая ранее не рассматривалась, а ошибки измерения ранее не учитывались в оценках средне-эффективных доз и оценках среднеквадратичного отклонения.

При изучении вопросов, связанных с конкретным применением рассматриваемых процедур для конечных выборок, возникает проблема выбора оптимального значения параметра сглаживания h, который присутствует в рассматриваемых оценках функции эффективности. Как показывает практика, качество оценок в большей степени зависит от параметра сглаживания, нежели от вида ядерной функции, поэтому так важно выбирать оптимальное значение h. Автоматическому выбору оптимальной ширины окна в задачах оценивания регрессии посвящены работы W.Hardle, P. Hall and J.S. Marron, M. Neumann, R.Eubank and W.Schucany, J.Beran, Y.Feng and S. Heiler, H.-G. Muller and U. Stadtmuller, J.S. Wu and C.K. Chu, J.Rice and M.Rosenblatt, B.W. Silverman и др. В них предлагается использовать процедуру кросс-проверки (cross-validation), метод штрафных функций и метод подстановки. Однако исследования проводились для моделей, отличающихся от модели доза-эффект, и для случая прямых наблюдений. Мы строим комбинированный алгоритм метода подстановки и метода кросс-проверки. Показано, что в условиях непрямых наблюдений этот алгоритм приводит к состоятельным асимптотически нормальным оценкам оптимального значения параметра сглаживания. Указанный комбинированный подход приводит к меньшему риску оценивания, чем метод кросс-проверки или метод подстановки, ориентированные на выбор одного значения параметра h для широкого интервала значений переменной х. Предложенные в диссертации оценки исследованы как теоретическими, так и имитационными численными методами.

Таким образом, поставленные в диссертационном исследовании задачи характеризуются недостаточной научной проработанностью, актуальны и требуют своего решения в широком спектре практического анализа, поскольку они важны для практического применения полученных результатов и являются востребованными в токсикологии, фармакологии, биологии, экологии.

Цель и задачи работы. Целью данной работы является разработка и развитие методов построения -состоятельных оценок функции распределения в зависимости доза-эффект, дисперсия которых равномерно мала при больших п, а также систематическое исследование асимптотических свойств построенных оценок. В рамках этого направления требовалось решить задачи непараметрического оценивания как теоретического, так и прикладного характера.

Задачами диссертации являются:

1. Построение оценок, дисперсия которых не зависит от распределения дозы, т.е. равномерно сходящихся к функции распределения.

2. Построение

-состоятельных оценок с учетом погрешности измерений доз и уменьшение этих погрешностей.

3. Разработка алгоритмов выбора ширины окна и исследование поведения оценок ширины окна просмотра данных.

4. Исследование свойств построенных оценок неизвестной функции распределения имитационными численными методами.

Объект и инструмент исследования. Объектом исследования являются математические конструкции, формализующие исходные объекты зависимости доза-эффект - статистические оценки функции распределения по неполным выборкам. Рассмотрены случайные и фиксированные планы эксперимента в схеме прямых и непрямых наблюдений. Исследования проводились с использованием методов теории вероятностей, математической статистики, теории функций, математического анализа и имитационного моделирования (метод Монте-Карло). Инструментом исследования являются асимптотические методы теории вероятностей и численные методы компьютерного моделирования.

Достоверность полученных в работе результатов обеспечивается строгостью рассуждений, использованием фундаментальных методов теории вероятностей и математической статистики, согласованностью теоретических выводов и численных результатов экспериментов, непротиворечивостью полученных результатов с ранее известными результатами.

Методы исследования. Математический аппарат построения оценок функции распределения по результатам независимых единичных испытаний разработан на основе метода ядерного сглаживания непараметрических оценок регрессии. Построение кЫ№-оценок основывается на использовании порядковых статистик в задаче непараметрического оценивания. Для доказательства состоятельности и асимптотической нормальности оценок использовался аппарат характеристических функций, классические предельные теоремы теории вероятностей и результаты асимптотической теории порядковых статистик.

Для получения оценок с автоматическим выбором оптимальной ширины окна в модели доза-эффект применялась комбинированная процедура кросс-проверки.

Научная новизна и научная значимость. Все основные результаты диссертационной работы являются новыми и впервые опубликованы в работах диссертанта.

Для модели доза-эффект построены непараметрические Гк- и у[пй-состоятельные оценки функции распределения и проведен их асимптотический анализ для случайного и фиксированного планов эксперимента. Доказана асимптотическая нормальность и асимптотическая несмещенность двухшаговых оценок, рассмотрены методы уменьшения погрешности наблюдений для случая непрямых наблюдений. Для фиксированного и случайного планов эксперимента построены комбинированные кросс-проверочные оценки с автоматическим выбором ширины окна. Проведен численный анализ имитационной модели, адаптированный к практической ситуации.

Теоретическая и практическая ценность. Теоретическая ценность работы заключается в построении асимптотически несмещенных оценок и исследовании их свойств. Практическая ценность исследования состоит в том, что разработано программное обеспечение, которое может быть ис-

пользовано для оценки уровня биологической активности веществ в опытах на токсичность на основании альтернативных кривых «доза-эффект», при планировании клинических испытаний новых лекарственных средств. Программа позволяет оценивать эффективные дозы уровней от 5% до 95%, в том числе и дозы, близкие к границам интервала распределения, строить оценки в случае, когда значения воздействовавшей дозы измеряются с погрешностью, получать оценки с автоматическим выбором ширины окна по непрямым наблюдениям.

Методы оценивания, разработанные в диссертации, были применены для построения функции распределения и определения категорий эффективных доз при исследовании чувствительности организма к адреналину. Основные результаты, выносимые на защиту. На защиту выносятся:

1. kNN-оценки и двухшаговые kNN-оценки для неизвестной функции распределения в зависимости доза-эффект, результаты их теоретического асимптотического анализа в схеме прямых и непрямых наблюдений для модели со случайными и фиксированными планами эксперимента, а также численное исследование построенных оценок.

2. -Jk- и -Jñh- состоятельные оценки и результаты их асимптотического анализа с учетом погрешности испытанных доз для модели с фиксированным планом эксперимента и способы уменьшения погрешности

. наблюдений.

3. Адаптивный алгоритм построения оценок с автоматическим выбором ширины окна просмотра данных для модели с фиксированными и случайными планами эксперимента, реализованный в разработанном диссертантом программном комплексе.

4. Численное сравнение оценок функции эффективности в моделях с прямыми и непрямыми наблюдениями.

Апробация работы. Результаты диссертации были представлены на следующих конференциях:

10-я междисциплинарная научная конференция «Нелинейный мир» (Нижний Новгород, 2005 г.);

XII Всероссийская школа-коллоквиум по стохастическим методам (Дагомыс, 2005 г.);

7-й Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Йошкар-Ола, 2006);

Международная конференция RelStat'2006 (Рига, 2006 г.);

XIV Всероссийская школа-коллоквиум по стохастическим методам (Адлер, 2007 г.);

XX Международная конференция «Математические методы в технике и технологиях» (Ярославль, 2007 г.);

8-я международная конференция «Компьютерный анализ данных и моделирование» CDAM'2007 (Минск, 2007г.);

X Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Дагомыс, 2009 г.).

Опубликованность результатов и личный вклад соискателя. По

теме диссертации опубликовано 15 работ (общим объемом 9,5 п.л.), из них 6 в изданиях, рекомендованных ВАК Российской Федерации. Две работы, опубликованные в журналах из списка ВАК, написаны без соавторов. Всего без соавторов изданы 5 работ из общего числа объемом 6,1 п.л.

В совместных работах постановка задачи и основные методы исследования принадлежат научному руководителю. Вкладом соискателя являются формулировка и доказательства утверждений, теоретические расчеты, программная реализация и исследование имитационной модели.

Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, списка литературы, содержащего 128 наименований, приложений с численными результатами имитационного моделирования в виде таблиц и графиков. Объем основного текста работы составляет 157 страниц.

Во введении анализируется состояние проблемы оценивания распределений и категорий эффективных доз по неполным данным в зависимости доза-эффект, отмечается, что тема диссертации является актуальной, формулируются цели и задачи исследования, дается обзор содержания глав.

В главе 1 производится построение математической модели зависимости доза^эффект, используемой в дальнейшем в диссертации, и ставится задача оценивания неизвестной функции распределения для случайных и фиксированных планов эксперимента в случае прямых и непрямых наблюдений.

В параграфе 1.1 излагается математическая модель зависимости доза-эффекг, основой которой является следующее представление: в организм вводится доза I/; минимальный уровень дозы, с которого начинается реакция организма X, есть латентная переменная. Если 1/>Х, то эффект от введенной дозы присутствует, в противном случае, если и < X, то - отсутствует. Определяется величина ¡V - индикатор события {£/ > X), т.е.

Величина X может принимать различные значения даже при одинаковых условиях эксперимента, что объясняется индивидуальной чувствительностью организма к вводимому препарату, состоянием организма в целом на момент эксперимента. Однако, для однородных групп объектов наблюдения переменная X считается случайной величиной.

Таким образом, мы рассматриваем модель, в которой распределение с.в. X, заданное функцией распределения ^(х) = Р(Х<х), неизвестно. При случайном плане эксперимента мы считаем, что С/-случайная величина, а при фиксированном - значения вводимых неслучайных доз и: выбираются заранее (с постоянным или переменным шагом).

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

если и > X, если и<Х.

Если измерения вводимой дозы U проводятся без ошибок, т.е. измеренная доза есть введенная доза, то мы будем говорить о прямых наблюдениях. В экспериментальной практике измерения вводимых доз проводятся, как правило, с погрешностями, иногда весьма значительными. Такие наблюдения мы будем называть непрямыми. Пусть измерения вводимой дозы U осуществляются с погрешностью е, имеющей плотность q(x), тогда вместо с.в. U наблюдается с.в. Y. Если ошибка е накладывается аддитивно, т.е. Y = U + £, то плотность условного распределения величины Y равна q(y-u). В общем случае пара (Y,U) имеет совместную и маргинальные плотности распределения g(y,u) и • q(y)~ jg(y, u)du, g(u)~ [g(y> u)dy соответственно, a распределение ошибки £ описывается условной плотностью q{y\u).

Если случайные величины U и X независимы, то условное математическое ожидание величины W при фиксированном значении дозы U (то есть при U = х) будет функцией распределения величины X :

E(W\U = x) = V(W = l\U = = Р (X<U\U=x)=F (X<x) = F(x). В таком случае функция распределения здесь есть регрессия.

В общем случае условное математическое ожидание с.в. W при U = т.е. E(fV\U = x) = P(X<x\U = x) = F(x\x) уже может быть немонотонной функцией. Мы назовём F(x \ х) функцией эффективности. В нашей модели в основном рассматривается случай, когда U и X независимы, поэтому для оценивания функции распределения F(x) используются непараметрические (ядерные) оценки регрессии по выборке {(С/.,Щ)}"м (в схеме прямых наблюдений) или по выборке {(Yj,^)}"^ (в схеме непрямых наблюдений).

В таком случае основная задача формулируется следующим образом: по выборке или по выборке t (в схеме прямых или не-

прямых наблюдений) построить -Jnh- состоятельные оценки, дисперсия которых не зависит от плотности распределения дозы, т.е. построить оценки, равномерно сходящиеся к функции распределения F(x) величины X.

Для зависимости доза-эффект в работах М.С. Тихова и С.В. Кришто-пенко10 в качестве оценки функции распределения было предложено рассматривать ядерные оценки регрессии типа оценок Надарая-Ватсона, которые в схеме прямых наблюдений имеют вид: Fm{x) = Sln(x)[Su{x),tели Sln(x)ïO, и FViI.(x) = 0, если Sln(x) = 0, (1)

10Криштопенко, С.В. Статистическое оценивание эффективной дозы зависимости «доза-эффект» с использованием как прямых, так и непрямых наблюдений / С.В. Кришто-пенко, М.С. Тихов // Вторая Всероссийская школа-коллоквиум по стохастическим методам. - М. - 1995. - С.81-82.

где

Мы будем называть их Л'Ж-оценками. Здесь К(х)-ядерная функция. В случае непрямых наблюдений мы используем МГ-оценки вида:

/?(х) = 52„(Х)ДДХ) , (3)

где

" ;=1 " 1=1 Асимптотическое поведение МГ-оценок для зависимости доза-эффект изучено в работе М.С. Тихова". В ней показано, что если Ъ = сп^ь и выполнены некоторые условия регулярности, то МГ-оценки являются асимптотически нормальными:

^\Рт(х)-Р{х))-^Ы(у\{х),аг1{х)), (5)

с асимптотическим смещением

. Л*Жх) + 2 /Сх)/(х)>

и асимптотической дисперсией

где

V2 = J x2K(x)dx, IК f = f K\x)dx.

Таким образом, если а ,(дг) ^ 0, то оценка имеет ненулевое

асимптотическое смещение, то есть не является у/пй — состоятельной, а предельная дисперсия оценки <т?(х) зависит от значения плотности g(x) (в схеме прямых наблюдений, или д(х)~ в схеме непрямых наблюдений). Поэтому, если значение плотности близко к нулю, то предельная дисперсия оценки может оказаться довольно большой. Причина этого состоит

в том, что интервал (х- Ь, х + А) имеет фиксированную длину 2Л, и если в него попадает мало значений с.в. С/, то оценка Рт(х) может иметь большой разброс.

В диссертации при построении оценок мы предлагаем брать границы интервала {х — И,х + К) переменными, чтобы в него попало заданное количество наблюдений. Эти оценки мы получим из оценок Надарая-Ватсона, если возьмем ширину окна просмотра данных /г так, чтобы в интервал

"Tikhov, M.S. Statistical Estimation on the Basis of Interval-Cencored Data/ M.S. Tikhov// J. Math. Sciences. - 2004'. -V. 119, N. 3. - P. 321 - 335.

(x-h,x + h) попадало ровно к выборочных значений случайной величины U. Тогда параметр h будет случайной величиной. Мы выберем h специальным образом. Именно, пусть для заданного х: F(x)-A (0<Л<1) и {U^,l<i<n} есть вариационный ряд, построенный по выборке Ut,U2,...,Un, a {Wln'],l<i<n} есть индуцированные порядковые статистики, т.е. если С/'0 = С/у, то fVj0 =W}, где Uf1 есть i-ая порядковая статистика. Рассмотрим последовательность ранговых номеров т = т(п), такую что

— = Я + о|-т=] при п °°. Возьмем т =т-[к/2], тг = т + [fc/2], где [а] п \у1П)

- целая часть а. Положим h-U[m2) -U[m,).

Определим AAW-оценку соотношением

(8)

где

п i=\ п (=1

Пусть теперь величины С/,, являются неслучайными, т.е. пусть м, <м2 <...<ип-выборка с фиксированными упорядоченными значениями. Будем считать, что а<и,<Ь, и, не умаляя общности, рассмотрим случай, когда а = 0, b = 1.

Положим в этом случае

W^iXfa-*). ^«—¿^(ч-*). (10)

п 1=1 п ,=1

где Щ =/(и. > X.) - индикатор события [и. > X.].

Для неслучайного плана эксперимента с ut - i / п NW—оценку определим следующим образом:

F(x) = SJX)/SJX). (11)

Для непостоянного шага &и,=им-и, в схеме прямых наблюдений в качестве оценки функции распределения наряду с AW-оценками мы используем оценки типа оценок Пристли-Чао (РС-оценки):

Ffc{x) = Y{um -uj)WiKh (и,-х). (12)

¡=1

Для случайного плана эксперимента рассмотрим также РС-оценку

(13)

i=i

где U^-i-ая порядковая статистика, a ffj'1 - г'-ая индуцированная порядковая статистика.

В диссертации мы изучаем поведение ЫИ'- и РС-оценок для случайных и неслучайных планов эксперимента в схеме прямых и непрямых наблюдений и доказываем их асимптотическую нормальность.

Для устранения асимптотического смещения ЖУ- и к1Ш-оценок, т.е. для получения -/пй- и - состоятельных оценок, мы используем двух-шаговую процедуру, которая для оценки плотности была предложена в работе ИЖДег^аЛпег12. Мы модифицируем эту процедуру для оценивания регрессии, т.е. для оценивания отношения двух статистик - оценки функции распределения. Модифицированная процедура оценивания состоит в следующем.

1) Задаем ^-С^п'", где 1/10<а< 1/5, и вычисляем ядерные оценки для плотности g(x) и произведения <р(х) = F(x)g(x) соответственно в виде:

гХх)Л±КК{игх), (14)

п у=1 п у I

2) Берем /г, = С2и~"5 и оцениваем отношения а(х) = и

р(х) = . - с помощью статистик <р(х)

а(х) Лр^-х)^ к Жх) --^^(и-х)-^. (15)

3) Умножаем оценку а(х)яа оценку для плотности g(x) на g*(x), получаем оценку знаменателя

Ш (с/,.)

умножаем оценку 0(х) на <р*{х), получаем оценку числителя

4) Вычисляем функции

Г2п{х)--^.Кк{игх).М.{х) и (16)

п у=1 п

где

12Hengartner, N.W. Asymptotic unbiased density estimators / N.W. Hengartner // E. Matz-ner-Lober// ESAIM. - 2009. - V. 13,- P. 1-14.

= ±1У,Кк (и-х) (и, -С/,). (17)

/=1 / ¿=1

5) Определяем финальную оценку /^'(х) для .Р(х) как отношение

Г(х)=у;п(х)/у;а(х). (18)

Доказано, что оценка Р'п(х) имеет нулевое асимптотическое смещение.

Для непрямых наблюдений Щ)}"м двухшаговая оценка функции F(x) строится аналогичным образом с заменой и, на Уг

В параграфе 1.3 формулируются основные предположения, при которых исследуется качество построенных оценок функции распределения.

Условия

Условие ( К ). Функция К(х) является неотрицательной, нормированной, четной, ограниченной, финитной функцией.

Таким образом, в качестве ядер мы берем симметричные плотности. Если выполнены условия (К), то V2 < ||АГ||2 < .

Пусть А = А(н) — ширина окна просмотра данных.

Условие (Н ). При А = А(л)-> 0 и иА->°°.

Асимптотически оптимальная ширина окна, для которой выполнены условие (Н) есть А ~ л"1'5, при таком А асимптотическое смещение Дооценки и её дисперсия уравновешены.

При построении ШЫ-оценки мы берём к-[п^5].

При вычислении двухшаговой оценки функции распределения мы используем вспомогательную величину - ширину окна просмотра скорость сходимости к нулю у которой ниже, чем у основной величины А,, а именно:

/¡0 = , где ае К = С2и~1/5, С,,С2-некоторые константы.

Для выбранных таким образом А0 и А, выполнены соотношения:

А. —>0, А0 —>0, нА. лА0 —»«>, — —>0 при /г—

К

Для случайных планов эксперимента в схеме прямых наблюдений, где (Х.,1/.), / = 1,2,...,п - независимые одинаково распределенные случайные величины с совместной непрерывной функцией распределения F(;<;)G(и), (х,и)е И2 и плотностью f(x)g(u)>0 мы требуем выполнения следующих условий.

Условие ( Б ). Функции F(x) и g(x)> 0 непрерывны, ограничены и имеет ограниченные производные до третьего порядка включительно.

В схеме непрямых наблюдений определим условные плотности распределения q(y\u) = g(y, ii)/g(u), и g(u\y) = g(y,u)/q(y). Обозначим

m(x)= ? F(u)g(x,u)du и R(x) = f F(u)g(u\x)du=^.

L L ?M

Условие ( N ). Функции q{y) и m(x) непрерывны и ограничены, имеют ограниченные производные до третьего порядка включительно.

Для фиксированных планов эксперимента, когда Uj—u, есть неслучайная величина, мы предполагаем, что maxi m, -mi4 I = 0(п~1) при и—

л

л-1

Пусть V(f) -supУ, |у(Çl+t) — f(£j)I — вариация функции f(x), где

р /=0

/"-множество всевозможных разбиений отрезка [а, 6] точками я = £0 <£<...<£,

Условие ( F ). Функции f(x) и К(х) имеют конечные вариации, т.е. V(f)<°°,V(K)<o°.

В схеме непрямых наблюдений при фиксированных планах эксперимента потребуем, чтобы было выполнено

Условие ( G ). Функция g(y) четырежды непрерывно дифференцируема и имеет ограниченные производные до четвертого порядка включительно, а функция т(х) трижды непрерывно дифференцируема и имеет ограниченные производные до третьего порядка включительно.

В главе 2 изучено асимптотическое поведение kNN—оценок в схеме прямых наблюдений для случайных планов эксперимента. Доказана состоятельность и асимптотическая нормальность kNN—оценок. Приведем основные результаты главы 2.

Теорема 2.1.3. Пусть выполнены условия (К), (H), (S). Тогда

.2 g\x)'

Из теоремы 2.1.3 получаем, что построенные kNN-оценки имеют ненулевое асимптотическое смещение. В теореме 2.2.4 показано, что применение двухшаговой процедуры приводит к оценкам с такой же предельной дисперсией, что и у оценок Fn(x), но уже с нулевым асимптотическим смещением. Поскольку оценки F„(x) являются асимптотически нормальными, то это позволяет построить для F{x) доверительные границы.

Теорема 2.2.4. Пусть выполняются условия (К), (Н), (S).

Тогда -Jk(F^ (х) - F(x)) сходится по распределению в точке х к нормальной случайной величине с ожиданием, равным нулю, и дисперсией F(x)(1-F(x))||42, т.е.

Jk(F;(x) - F(x))-^N(0,aj(x)).

В теореме 2.3.1 доказана состоятельность и асимптотическая нормальность оценки квантиля функции распределения F(x).

Пусть хл =F"'(Л)-квантиль порядка 0<Л<1 функции распределения F(x), где /(х)>0. В качестве оценки функции F~'(A), рассмотрим статистику

л

где

¿ГЩК^-х) Ш = -. Це Л[0,1].

/=1

Теорема 2.3.1. Пусть для всех ^(0)<Я<^(1) плотность /(х) положительна и выполнены условия (К), (Н), (Б). Тогда

(i) если linД = с. то ^¡^(^-Щ-^Н "i

' Л(1-Л)а22(Л)" { ' 8(хл)Яхл) )

г0М1-лМ] 'g^ftx*) )

(и) если Ит— = 0, то '

* 2 1 2 0 ст2 (Я) = Щк(н> + с/(хя)(у - и))К(м/)К(и)К(у)с1м!с1и Л>.

Из теоремы 2.3.1 следует, что уже при умеренных объемах выборки оценки эффективных доз близки к истинным значениям.

В главе 3 диссертации изучается асимптотическое поведение оценок в зависимости доза-эффект при случайном плане эксперимента в схеме непрямых наблюдений. Здесь доказано, что предельное распределение ШЫ-оценок является нормальным. В параграфе 3.2 показано, что двухшаговая процедура, в случае непрямых наблюдений также приводит к %/лЛ-со-

стоятельным оценкам и что двухшаговые оценки являются асимптотически нормальными с той же предельной дисперсией, что и у kNN-оценок.

Приведем один из основных результатов этой главы.

Теорема 3.4.1. Пусть выполнены предположения (К), (H), (N). Тогда Jk( F„{x) - R(x))^r^N(0,R(x)(l - 7?(x))||Af),

где R(x) = J F(u)g(u | x)du.

Из этой теоремы следует, что в случае непрямых наблюдений оценка Fjx) сходится к «средней» функции распределения R(x).

В главе 4 исследуется поведение оценок функции распределения F(x) для фиксированных планов эксперимента. Это связано с тем, что модели с фиксированным планом эксперимента при наличии погрешности измерения в основном отражают применяемую методику проведения клинических испытаний лекарственных препаратов. Изучены асимптотические свойства оценок Надарая-Ватсона Fn(x) (11) в случае постоянного шага и оценок Пристли-Чао FPC(x) (12) - в случае переменного шага. В схеме прямых и непрямых наблюдений строятся двухшаговые оценки, которые являются -Jnh — состоятельными оценками. В параграфе 4.4 предлагаются способы уменьшения погрешности наблюдений в случаях, когда распределение ошибки е нормально. Показано, что оценки по улучшенным выборкам сходятся к истинной функции распределения F(x), а не к усредненной функции распределения R(x). В пункте 4.6 изучены оценки Пристли-Чао (12), и найдено их асимптотическое распределение. В теореме 4.6.2 для фиксированных планов при непостоянном шаге доказана состоятельность и асимптотическая нормальность РС-оценок.

В главе 5 изучение модели доза-эффект производится средствами имитационного моделирования. Программная реализация имитационной модели "Dose-Effect" выполнена на основе Borland Turbo Delphi Explorer. В параграфе 5.1. решается проблема выбора оптимального значения ширины окна просмотра h численными методами.

Показано, что если выбор оптимального значения параметра h производится из дискретного множества Qn и мощность этого множества |gj не превосходит некоторой степени п, то кросс-проверочная оценка параметра h является состоятельной оценкой ширины окна, полученного при минимизации квадратичного уклонения. Именно, пусть для каждого значения параметра he Qn статистики F(,,)(x) и F^\x) есть оценки функции распределения F(x) по выборкам U(n) ={(U„Wl),...,(Un,fVll)} и ¿/(«-о _ vin) \{([/у.,Гу.)} соответственно.

Кросс-проверочное значение параметра Л определим из равенства Я = Я„ = агёшт - ,

а кросс-проверочную оценку функции распределения получим, полагая

В теореме 5.1.4 показано, что оценка кросс-проверочного значения Я является состоятельной оценкой параметра Л и при л—квадратичное уклонение при СУ - значении параметра А ведет себя также, как и оптимальное значение Л.

Алгоритм выбора оптимального параметра сглаживания Л:

1. По результатам наблюдений вычисляем оценку:

п ~ 1 ¡=1. 1*1

2. Строим функцию кросс-проверки:

п м

3. Определяем оптимальное значение параметра Л:

Я = агятт(СК(/|)). *

В теореме 5.1.4 показано, что данный алгоритм приводит к асимптотически оптимальным значениям параметра сглаживания.

Хе. N(0.5, 0.25).

В параграфе 5.2 исследование модели при фиксированном плане эксперимента проведено на примерах реальных данных, взятых из литературы, а случайного плана - в параграфе 5.3, на модельных данных. Численные расчеты показали, что двухшаговые оценки лучше оценивают неизвестную функцию распределения Р(х).

Рис.2. График оценки Надарая-Ватсона и Рис.3. График двухшаговой оценки Нада-интегральной функции нормального рас- рая-Ватсона и интегральной функции пределения N{0.5, 0.25) для выборки нормального распределения N(0.5, 0.25) объема и=100 при «,. = //100, j =1,...,100, Для выборки объема л=100 при с.в. X е N(0.5, 0.25) кросс-проверочное и, = ¿/100, ¿ = 1,...,100, значение h = 0.3. с.в. Л-s N(0.5, 0.25), кросс-проверочное

значение И = 0.3.

В параграфе 5.3 произведен сравнительный анализ нескольких способов получения £AW-0ueH0K в программной реализации. Изучено поведение оценок при использовании финитных и нефинитных ядер, в результате чего установлено, что применение нефинитных ядер приводит к оценкам с существенным смещением по сравнению с использованием финитных ядер, причем использование некоторых финитных ядер, например, кварти-ческого13, позволяет уменьшить смещение (в сравнении, например, с ядром Епанечникова14). Показано, что при подборе подходящих значений ширины окна для модельных данных, имеющих нормальное или логистическое распределение, оценки и доверительные интервалы получаются не хуже, чем доверительные интервалы, полученные с помощью пакетов прикладных программ SPSS и Probit Analysis, а для распределения Вейбулла они получаются лучше. При этом преимущество оценок, построенных в диссертационной работе, состоит в том, что их можно получать как по результатам единичных независимых испытаний, так и по данным, сгруппированным в однородные группы, тогда как для применения классических методов требуется только наличие однородных групп, причем на каждом уровне требуется испытать не менее 6 доз. Если же рассматриваемое распределение не является нормальным или логистическим, например, рассматривается распределение Коши - распределение с тяжелыми хвостами, то с помощью пробит- и логит-моделей получаются оценки, менее точные по сравнению с нашей моделью, даже для доз, не слишком далеких от 50% (35%, 60%), а 5% и 95% уровни доз оцениваются уже со значительной погрешностью.

14 ед=Д(1-*2)/(Н<1)

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ

В диссертационной работе проведен статистический и численный анализ различных оценок для функции распределения в зависимости доза-эффект для случайного й фиксированного плана эксперимента как в случае прямых, так и непрямых наблюдений.

Построены tíViV-оценки и двухшаговые асимптотически несмещенные /ciVjV-оценки неизвестной функции распределения при случайных планах эксперимента. Установлено, что построенные оценки равномерно сходятся к функции распределения. Построены -состоятельные оценки для модели с фиксированным планом эксперимента в схеме непрямых наблюдений. Показана их асимптотическая нормальность.

Построены \fñh - состоятельные оценки неизвестной функции распределения с учетом погрешности измерений. Предложен метод уменьшения погрешности измерений.

Разработан комбинированный адаптивный алгоритм автоматического выбора оптимальной ширины окна просмотра данных.

Проведен численный анализ построенных оценок. В результате исследования численными методами делается вывод, что предложенные в диссертации оценки функции распределения F(x) более точно оценивают «малые» или «большие» эффективные дозы по сравнению с существующими методами.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в журналах из списка ВАК Российской Федерации:

1. Ярощук, М.В. Статистическое оценивание зависимости доза-эффект с помощью kNN- оценок / М.В. Ярощук, М.С. Тихов // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2005. - т. 12, в. 3, С. 683-684.

2. Ярощук, М.В. Модифицированные оценки Янга в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов // Обозрение Прикл. и Пром. Математики -М.: Изд-во ТВП-2006.-т. 13,в. 1,С. 144.

3. Ярощук, М.В. Асимптотическая нормальность kNN-оценок в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов // Вестник Нижегородского университета. Серия: Математика - 2006. Вып.1(4), С. 129-137.

4. Ярощук, М.В. Об оценивании распределений в зависимости доза-эффект / М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП -2007,-т. 14, в. 1, С.178-180.

5. Ярощук, М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений / М.В. Ярощук, М.С. Тихов//Нелинейный мир -М.: изд-во Радиотехника - 2007. - т.5, №1,2, С. 4-8.

6. Ярощук, М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности / М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2009. - т. 16, в. 6, С.1148-1150.

Публикации в иных печатных изданиях:

7. Ярощук, М.В. Статистическое оценивание нелинейной зависимости доза-эффект с помощью kNN - оценок / М.В. Ярощук, М.С. Тихов // Десятая междисциплинарная научная конференция «Нелинейный мир» - Нижний Новгород: изд-во ННГУ - 2005. - С. 139.

8. Ярощук, М.В. Оценивание распределений в зависимости доза-эффект при фиксированном плане эксперимента / М.В. Ярощук, М.С. Тихов, Д.С. Кришто-пенко // Статистические методы оценивания и проверки гипотез: межвуз. сб. научных трудов - Пермь: Изд-во Пермского ун-та. - 2006. - С. 66-77.

9. Yarochuk, M.V. Asymptotic normality ¿-Nearest Neighbor estimators in dependence dose-response / M.V.Yarochuk, M.S. Tikhov // Ташкент.: Изд-во Ташкентского ун-та. - 2006. - С. 46-49.

10. Ярощук, М.В. Об асимптотической нормальности kNN - оценок в зависимости доза-эффект / М.В. Ярощук. Нижегородский гос. ун-т - Н.Н. -2006. -49 с. - Деп. в ВИНИТИ 1536 - В2006

11. Ярощук, М.В. Предельные распределения kNN - оценок в зависимости доза-эффект в схеме непрямых наблюдений / М.В. Ярощук. Нижегородский гос. унт - Н.Н. - 2006,- 39 с. - Деп. в ВИНИТИ 1535- В2006

12. Yarochuk, M.V. Statistical estimation of distributions in dose-response dependence / M.V. Yarochuk, M.S. Tikhov // Reliability and Statistics in Transport and Communication: Proc. of the 6th Intern. Conf., Riga, Latvia. - 2006 - P.374-375.

13. Ярощук, М.В. Исследование оценок функции распределения в зависимости доза-эффект / М.В. Ярощук, М.С. Тихов, Д.С. Криштопенко // Математические методы в технике и технологиях - ММТТ-20: сб.трудов XX Междунар. науч. конф., - Ярославль: Изд-во Ярославского гос. техн. ун-та. - 2007. - т.З, С. 171175.

14. Yarochuk, M.V. Computer-based data analysis in dose-response dependence / M.V. Yarochuk // Computer Data Analysis and Modeling: Proc. of 8th Intern. Conf., Minsk, September 11-15. - 2007,- Vol. 1, P. 186-189.

15. Yarochuk, M.V. Asymptotic normality of the integrated square error at the fixed plan of experiment for indirect observations / M.V.Yarochuk, M.S. Tikhov, D.S. Krish-topenko // Computer Modeling and New Technologies. - 2007. - Vol. 11, No 1, Riga, Latvia, P. 46-56.

Подписано в печать 13.01.11. Формат 64x80 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. I. Зак. 28. Тир. 100 экз.

Типография Нижегородского госуниверситета им. Н.И. Лобачевского. 603000, Н. Новгород, ул. Б. Покровская, 37.

Оглавление автор диссертации — кандидата физико-математических наук Ярощук, Марина Владимировна

Введение.

1 Зависимость доза-эффект и статистическое оценивание распределений в зависимости доза-эффект.

1.1 Построение модели зависимости доза-эффект.

1.2 Непараметрическое оценивание распределений в зависимости доза-эффект.

1.3 Условия и предположения.

1.4 Вспомогательные результаты.

2 ШУ-оценки в зависимости доза-эффект при случайном плане эксперимента в схеме прямых наблюдений.

2.1 Состоятельность и асимптотическая нормальность оценок.

2.2 Двухшаговые кА'А! - оценки и их асимптотический анализ.

2.3 Оценивание эффективных доз в зависимости доза-эффект.

2.4 Оценки Пристли-Чао для случайных планов эксперимента.

3 Предельные распределения kNN - оценок для случайного плана эксперимента в схеме непрямых наблюдений.

3.1 ШЫ - оценки в схеме непрямых наблюдений и их асимптотический анализ.

3.2 Предельные распределения двухшаговых ШМ — оценок.*.

4 Оценивание распределений для фиксированного плана эксперимента в схеме прямых и непрямых наблюдений.

4.1 Оценки Надарая-Ватсона при постоянном шаге деления в случае прямых наблюдений.

4.2 Двухшаговые оценки в схеме прямых наблюдений.

4.3 Асимптотический анализ оценок функции распределения в схеме непрямых наблюдений.

4.4 Устранение погрешности наблюдений.

4.5 Асимптотически несмещенные оценки в схеме непрямых наблюдений.

4.6 Оценки Пристли-Чао при переменном шаге деления в схеме прямых наблюдений.

5 Имитационное моделирование зависимости доза-эффект.

5.1 Выбор ширины окна просмотра данных с помощью процедуры кросс-проверки и метода штрафных функций.

5.2 Численное исследование оценок распределений при фиксированном плане эксперимента

5.3 Численный анализ kNN- оценок при случайном плане эксперимента.

5.4 Практический пример оценивания функции распределения и категорий эффективных доз.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Ярощук, Марина Владимировна

Актуальность темы диссертации

При разработке новых лекарственных средств (т.е. веществ, обладающих фармакологической активностью, прошедших клинические испытания и предназначенных для изготовления лекарственных форм) анализ связи между дозой и эффектом и их количественное определение имеет большое значение. Под дозой мы понимаем некоторое значение агента (фактора), которое может изменить состояние исследуемого объекта, а под эффектом — наблюдаемый качественный (альтернативный) отклик объекта на введенную дозу. Основу решения проблемы количественного оценивания связи между наблюдаемым эффектом и введенной дозой составляет функция эффективности, под которой мы понимаем зависимость вероятности наблюдения эффекта от введенной дозы. Задача оценивания функции эффективности по экспериментальным данным: введенной дозе и наличию или отсутствию эффекта является важнейшей задачей зависимости доза-эффект. Решение отмеченной задачи представляет большой теоретический интерес и имеет обширные практические приложения во многих областях медицины и биологии.

Функция эффективности имеет очень важное, а иногда и принципиальное значение в фармакологии - при оценке эффективности лекарственных препаратов, в токсикологии и радиологии - при исследовании количественной токсичности ядов и поражающих свойств ионизирующих излучений, в гигиене - при нормировании критических уровней вредных факторов. Построение функции эффективности является статистической задачей, способ решения' которой предъявляет соответствующие требования к планированию эксперимента и виду получаемых исходных данных. Биологический эксперимент на завершающем этапе требует методологически обоснованных точных статистических оценок результатов, учитывающих погрешности получения исходных данных и их влияние на конечные результаты. Поэтому с прикладной стороны актуальность темы диссертации не вызывает сомнений.

В некоторых случаях, однако, отсутствует понятие дозы в вышеопределенном смысле. Примером могут служить эконометрические модели с дискретными зависимыми переменными при случайной константе регрессионной зависимости (см. [56, 122]). Тем не менее, такие задачи укладываются в рассмотренную в диссертации модель доза-эффект и могут быть решены предложенными в ней методами.

Наиболее часто оценивают дозы LD50 и ED5Q :LDS0— это доза, при которой 50% от количества объектов, получивших дозу, погибает (средняя летальная доза), EDS0 — это средне-эффективная доза (для 50% объектов наблюдается эффект). На современном этапе в токсикометрии востребованными являются величины доз, которые вызывают появление эффекта, учитываемого в экспериментальной группе тест-объектов с заданной вероятностью 0,01 - 0,1; 0,9 - 0,99. Такие дозы получили название доз EDX -EDW, ED90 -ED99. Потребности практики обуславливают необходимость одновременного определения как полного перечня категорий эффективных доз от EDX до ED99, так и вида самой функции эффективности. Здесь возможен и другой подход, принцип которого заключается в первоначальном определении по исходным данным категорий эффективных доз. Затем по найденным категориям эффективных доз устанавливается вид и распределение функции эффективности. Разработка новых токсикометрических моделей оценки токсичности должна быть направлена на максимально возможное уменьшение числа токсикологических испытаний на живых тест-объектах при сохранении заданной надежности конечных показателей токсичности, то есть на сокращение материальных затрат. Так, например, в Швейцарии в 1987 году для определения LDS0 было использовано 1,3 миллиона лабораторных животных (см. [128]).

В диссертационной работе нас интересует проблема нахождения функции эффективности и оценка доз EDWOa , в широком диапазоне значений 0 < а < 1, по результатам наблюдений: введенным дозам и наличию или отсутствию эффекта. Мы строим математическую модель зависимости доза-эффект, в которой рассматриваем минимальную границу, с которой начинается реакция организма, как латентную случайную величину. Если нижняя граница чувствительности X и введенная доза U - независимы как случайные величины, то функция эффективности является функцией распределения, однако даже в этом случае для оценки функции эффективности и категорий эффективных доз мы не можем воспользоваться классическими методами математической статистики, поскольку исследуемая величина ненаблюдаема, а вместо нее наблюдаются менее информативные величины: индикаторы эффекта И] = l{Ui > Xt) и введенные дозы Ut, i — \,.,n. Для оценки функции эффективности мы используем непараметрические методы математической статистики, а именно, ядерные оценки регрессии.

Степень проработанности проблемы

Наибольшее прикладное значение в зависимости доза-эффект имеет направление, связанное с вопросами оценки показателей токсичности (средне-эффективных доз). Токсикометрия средне-эффективных доз охватывает широкую область применения в токсикологии, при прогнозировании опасности для человека вредных факторов производства, при разработке лекарственных препаратов и методов лечения, в исследованиях патогенеза интоксикации.

Существенные недостатки традиционных методов определения средне-эффективных доз состоят в том, что для своего адекватного применения они предъявляют ряд граничных условий к планированию и выполнению токсикологического эксперимента как в отношении градаций испытываемых доз, так и в отношении числа тест-объектов в экспериментальных группах.

Для построения кривой доза-эффект и оценки ED50 обычно применяется официальная методика в модификациях Литчфилда-Вилкоксона [96] и Финни [76], а также метод Спирмена-Кербера [27] и метод Рида и Менча [38]. Алгоритм Спирмена-Кербера основывается на предположении о симметричности распределения минимальной границы — случайной величины (с.в.) X. Для корректного применения метода Спирмена-Кербера требуется испытание на каждом уровне не менее 6 доз, при этом интервал между дозами должен быть одинаков. На каждом уровне обязательным является как наличие, так и отсутствие эффектов. Этим методом оценивается средне-эффективная доза и среднеквадратичное отклонение (см. [27]). Выполнить условия Спирмена-Кербера на практике бывает трудно, поэтому надежность результатов, полученных данным методом, обычно мала. Кроме того, этот метод ориентирован на оценку доз ED50 или близких к ним.

Использование метода Рида и Менча предполагает испытания доз, логарифмы которых отстоят друг от друга на одинаковое расстояние. В основе этого метода лежит предположение о том, что если испытание некоторой дозы дало 100% эффект, то испытание большей дозы заведомо даст положительный эффект, поэтому большие дозы не испытываются. Аналогично, если испытание какой-либо дозы не привело к наступлению эффекта, то нет необходимости испытывать меньшие дозы — они также эффекта не дадут. В эту схему не укладывается феномен парадоксальной токсичности, изложенный в монографии C.B. Криштопенко, М.С. Тихова и Е.Б. Поповой [37], и означающий уменьшение вероятности эффекта при увеличении испытанных доз. Метод Рида и Менча сильно зависит от точности оценки ED*5Q и требует большого количества экспериментапыгых данных, малые или большие уровни доз с помощью данного метода не определяются.

Метод Финни основан на соотношении log EDl00a = ц + сгФ~\а), где Ф"1 (х) - обратная функция стандартного нормального закона, ¡л, сг - математическое ожидание и дисперсия.

Рекомендации по использованию того или иного метода, не адаптированные к конкретным ситуациям, приводят к нежелательным последствиям. Обычно предполагается, что функция распределения должна иметь нормальное распределение, но, построенная в примере, рассмотренном в [37] (стр. 159-160), оценка говорит о том, что функция распределения имеет показательное распределение. Связано это с тем, что, по-видимому, исходное распределение было равномерным, а логарифмирование доз привело к показательному распределению. Значит, формальное применение официальной методики может привести к ошибкам.

Кроме указанных методов для оценивания зависимости доза-эффект и средне-эффективных доз (называемых еще медианными средне-эффективными дозами) используются модели бинарного выбора - пробит и логит, основанные на использовании нормальной и логистической функций распределения. Модели бинарного выбора хорошо работают в окрестности медианных средне-эффективных доз. Эти методы реализованы в большинстве современных эконометрических компьютерных программных пакетов (ЭКПП): SPSS, XL STAT-Dose, BioStat 2007, Probit Analysis, StatPlus (Статистика*). С помощью этих ЭКПП можно произвести обработку кривой зависимости доза-эффекг, вычислить эффективную дозу, а также соответствующие доверительные интервалы. Существуют различные модификации пробит- и логит-анализа, которые, имея в своей основе главную идею — преобразование процентов встречаемости эффекта в пробиты, - различаются алгоритмами линеаризации и статистической обработки. Большая часть этих программ основывается на алгоритме метода максимального правдоподобия для регрессионной схемы в модели бинарного выбора (Д.Финни (D.J. Finney [76])), некоторые авторы (Миллер и Тейнтер (L.S. Miller, M.L. Tainter [100]), Литчфилд и Вилкоксон (J.T. Litchfield, F.W. Wilcoxon [96])) используют для этой цели метод наименьших квадратов. Однако применение пробит- и логит-моделей дает большие погрешности в определении доз на краях распределения [44].

Иногда для построения функции эффективности используется сплайн-аппроксимация [24]. Программа сплайн-аппроксимации, описанная в работе [24], предназначена для расчета параметров кривых доза-эффект, однако рассмотренный там метод сильно привязан к конкретному эксперименту и для состоятельного оценивания требует большого числа наблюдений. Метод сплайн-аппроксимации не использует каких-либо вероятностных моделей, ввиду чего тяжело оценить качество построенных кривых, а также затруднительно построить доверительные интервалы. Таким образом, как при пробит-анализе, так и при использовании других моделей, функции распределения рассматриваемых случайных величин хорошо аппроксимируются линейными или нелинейными функциями, но только в окрестности медианы, и при этом ценой больших ошибок на краях распределения (см. [23]), особенно если реальная модель распределения отличается от нормального распределения. Кроме того, при практической реализации пробит-анализа или его модификаций отсутствует возможность проведения единичных испытаний, согласно официальной методики, испытания должны носить групповой характер.

Основной недостаток официально применяемых методов состоит в том, что указанные методы ориентируются, в основном, на оценку средне-эффективной дозы ЕВ50 или близких к ней и не позволяют состоятельно оценивать малые или большие дозы, тогда как малые и большие дозы являются востребованными для практических нужд. Доверительные интервалы для крайних доз ЕВХ - ЕО10, ЕИ90 - Ж>99, имеющие важное практическое значение в медико-биологической практике (см. [16-19, 28]), при помощи этих же методов получаются либо довольно широкими, либо ненадежными. Кроме того, часть ЭВМ-программ оценки зависимости доза-эффект и определения ЕИШа не работают при малых или больших значениях а . В ряде случаев, например, при исследовании эффектов сверхмалых доз характерны немонотонные функции эффективности (см. [25]), а пробит-анализ или лошт-модели не позволяют строить оценки в таких ситуациях, поскольку ориентированы на монотонное преобразование данных. В некоторых случаях (см., например, [105]) лучшей моделью функции эффективности авторы считают распределение Вейбулла или распределение экстремальных значений. Связано это со спецификой эксперимента, рассмотренного в этих работах. Большинство практиков придерживается мнения, что нормальное распределение не очень хорошо подходит для описания зависимости доза-эффект, ввиду специфичности рассматриваемых задач. В диссертации (в приложении 1) показано, что использование нормального распределения вместо асимметричных распределений или распределений с тяжелыми хвостами приводит к большим ошибкам в оценивании крайних доз. Наряду с тем, что методы пробит-анализа плохо оценивают категории доз, близких к границам интервала распределения, они также не учи тывают, что значения воздействовавшей дозы измеряются с погрешностью. Реально же в экспериментальной практике возникает необходимость строить оценки по исходным данным, содержащим ошибки, распределение которых неизвестно. Рассмотренные выше распределения: нормальное, Вейбулла, распределение экстремальных значений, логистическое являются унимодальными и традиционно используемые методы про-бит-анализа плохо работают, например, для смесей распределений, бимодальных и полимодальных распределений. Недостатком параметрических методов является то, что они эффективны, если реальная модель близка к гипотетической, и сильно теряют в эффективности при отклонении от предполагаемой модели.

Таким образом, данная проблема на сегодняшний момент характеризуется недостаточной теоретической проработанностью, а современные требования практики требуют эффективных способов оценивания категорий доз в зависимости доза-эффект на границах распределения. Нынешнее состояние знания в проблеме оценивания функции эффективности не позволяет этого сделать. Здесь требуются исследования возможных путей решения данной проблемы и их практической реализации.

В работах Тихова М.С. и Крииггопенко C.B. [35-37] был предложен непараметрический метод оценки функции эффективности (ФЭ), который задачу оценки ФЭ сводит к задаче оценивания функции регрессии и использования для этой цели непараметрических (ядерных) оценок регрессии с шириной окна просмотра данных h — параметра сглаживания. Такой подход позволяет по результатам единичных испытаний оценивать средне-эффективную дозу ED50 не хуже, чем методы пробит-анализа, а малые и большие дозы, близкие к 0% или к 100%, оценивать эффективнее, чем пробит-анализом, строить доверительные интервалы, достаточно узкие как в середине, так и на краях распределения. С помощью метода, изложенного в работах [35-37], можно оценивать и немонотонные функции эффективности. Данный метод позволяет также производить планирование эксперимента. Предложенный в,[35-37] непараметрический подход использовался также в работах других авторов, например, в работе [44], в статьях [47,112] исследовалось воздействие диоксинов на окружающую среду и здоровье человека, где также использовалась методология работ [35-37]. Однако, изученные в работах [35-37] оценки функции эффективности (в основном оценки Надарая-Ватсона) при п —» оо, h —» 0, nh —» оо хотя и сходятся со скоростью yfnh к истинному распределению, не являются, во-первых, \fnh — состоятельными (их предельное математическое ожидание отлично от нуля), а во-вторых, предельная дисперсия оценок для случайных доз U с плотностью распределения g(x) > 0 пропорциональна величине cr2(x) = F(x)(l - F(x))/g(x), где F(x) - неизвестная функция распределения минимальной границы, т.е. предельная дисперсия оценок зависит от плотности распределения вводимой дозы в заданной точке х: для EDma при малых или больших значениях а значение g(EDl00a) мало, поэтому дисперсия а2 может оказаться довольно большой. Чтобы устранить влияние плотности распределения вводимой дозы для оценю! функции распределения F(x), вместо оценок Надарая-Ватсона в настоящей диссертации мы используем kNN - оценки (оценки к ближайших соседей). Для kNN - оценок предельная дисперсия пропорциональна величине F(x) (l — F(x)J и не зависит от плотности g(x). Мы используем также оценки Янга и модифицированные оценки Янга [2], которые асимптотически эквивалентны kNN — оценкам (см. [2]), имеют такую же предельную дисперсию, что и kNN - оценки, при этом построение оценок Янга проще реализуется с использованием современных пакетов программ, чем kNN - оценка. Однако, как kNN — оценки, так и оценки Янга не являются - состоятельными. Чтобы сделать их -Jk — состоятельными, мы конструируем двухшаговые оценки, у которых предельная дисперсия такая же, как и у kNN - оценок и оценок Янга и которые являются асимптотически несмещенными. Двухшаговые оценки для плотности распределения предложены и исследованы в работах [88, 97]. Мы их строим для оценки функции регрессии. Для построения асимптотически несмещенных оценок функции эффективности мы используем модифицированную конструкцию и доказываем yfk - состоятельность построенных оценок.

Более того, математическую модель зависимости доза-эффект мы рассматриваем как задачу статистического анализа для случая прямых и непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрены случаи фиксированного плана (вводимая доза выбирается заранее и является неслучайной величиной) и случайного плана эксперимента (вводимая доза является случайной величиной). Таким образом, рассмотренные постановки охватывают широкий спектр разнообразных практических ситуаций в проблеме доза-эффект. К тому же измерение доз с ошибкой — это типичная практическая ситуация, которая ранее не рассматривалась, и не учитывались ошибки измерения в оценках средне-эффективных доз и оценках среднеквадратичного отклонения. Если задача оценки плотности для свертки распределений изучалась в работах [67, 104, 110, 111]), то задача оценки функции распределения в модели непрямых наблюдений в зависимости доза-эффекг рассмотрена впервые. В диссертации мы решаем эту проблему. Математическая модель зависимости доза-эффект в предложенной постановке дает возможность использовать для решения проблем дозозависимых эффектов широкий набор мощных средств математической статистики.

При изучении вопросов, связанных с конкретным применением рассматриваемых процедур для конечных выборок, возникает проблема выбора оптимального значения параметра сглаживания h, который присутствует в рассматриваемых оценках функции эффективности. Как показывает практика, качество оценок в большей степени зависит от параметра сглаживания, нежели от вида ядерной функции, поэтому так важно выбирать оптимальное значение h. Автоматическому выбору оптимальной ширины окна в задачах оценивания регрессии посвящены работы W.Hardle, P. Hall and J.S. Marron, M. Neumann, R.Eubank and W.Schucany, J.Beran, Y.Feng and S. Heiler, H.-G. Muller and U. Stadtmuller, J.S. Wu and C.K. Chu, J.Rice and M.Rosenblatt, B.W. Silverman и др. [63, 72, 78, 82, 84, 85, 101, 102, 110, 115, 123, 126], в них предлагается использовать процедуру кросс-проверки (cross-validation), штрафные функции и метод подстановки. Однако исследования проводились там для других моделей и для случая прямых наблюдений. Мы строим комбинированный алгоритм метода подстановки и кросс-проверки в зависимости доза-эффект. Показано, что в условиях непрямых наблюдений этот алгоритм приводит к состоятельным асимптотически нормальным оценкам оптимального значения параметра сглаживания. Причем указанный метод приводит к меньшему риску оценивания, чем метод кросс-проверки или метод подстановки. Предложенные в диссертации оценки исследованы как теоретическими, так и численными методами.

Таким образом, поставленные в диссертационном исследовании по выбранной теме задачи характеризуются недостаточной научной проработанностью, актуальны и требуют своего решения в широком спектре практического анализа, поскольку они важны для практического применения полученных результатов и являются востребованными в токсикологии, фармакологии, биологии, экологии.

Цель и задачи исследования , Целью данной работы является разработка и развитие методов построения у/к — состоятельных оценок функции распределения в зависимости доза-эффект, дисперсия которых равномерно мала при больших п, а также систематическое исследование асимптотических свойств построенных оценок. В рамках этого направления требовалось решить задачи непараметрического оценивания как теоретического, так и прикладного характера.

Задачами диссертации являются:

1. Построение оценок, дисперсия которых не зависит от распределения дозы, т.е. равномерно сходящихся к функции распределения.

2. Построение -состоятельных оценок с учетом погрешности измерении доз и уменьшение этих погрешностей.

3. Разработка алгоритмов выбора ширины окна и исследование поведения оценок ширины окна просмотра данных.

4. Исследование свойств построенных оценок неизвестной функции распределения имитационными численными методами.

Объект и инструмент исследования

Объектом исследования являются математические конструкции, формализующие исходные объекты зависимости доза-эффект и статистические оценки функции распределения по неполным выборкам. Рассмотрены случайные и фиксированные планы эксперимента в схеме прямых и непрямых наблюдений. Исследования проводились с использованием методов теории вероятностей, математической статистики, теории функций, математического анализа и имитационного моделирования (метод Монте-Карло). Инструментом исследования являются асимптотические методы теории вероятностей и численные методы компьютерного моделирования.

Достоверность полученных в работе результатов обеспечивается строгостью рассуждений, использованием фундаментальных методов теории вероятностей и математической статистики, согласованностью теоретических выводов и численных результатов экспериментов, непротиворечивостью полученных результатов с ранее известными результатами.

Методы проведенного исследования

Математический аппарат построения оценок функции распределения по результатам независимых единичных испытаний разработан на основе метода ядерного сглаживания непараметрических оценок регрессии. Построение кЬШ — оценок основывается на использовании порядковых статистик в задаче непараметрического оценивания. Для доказательства состоятельности и асимптотической нормальности оценок использовался аппарат характеристических функций, классические предельные теоремы теории вероятностей и результаты асимптотической теории порядковых статистик.

Для получения оценок с автоматическим выбором оптимальной ширины окна в модели доза-эффект применялась комбинированная процедура кросс-проверки.

Научная новизна и научная значимость полученных результатов

Все основные результаты диссертационной работы являются новыми и впервые опубликованы в работах диссертанта.

Для модели доза-эффект построены непараметрические и у/пй — состоятельные оценки функции распределения и проведен их асимптотический анализ для случайного и фиксированного планов эксперимента. Доказана асимптотическая нормальность и асимптотическая несмещенность двухшаговых оценок, рассмотрены методы уменьшения погрешности наблюдений для случая непрямых наблюдений. Для фиксированного и случайного планов эксперимента построены пенализированные оценки с автоматическим выбором ширины окна. Проведен численный анализ имитационной модели, адаптированный к практической ситуации.

Практическая значимость полученных результатов

Результаты диссертации могут быть использованы для оценки уровня биологической активности веществ в опытах на токсичность на основании альтернативных кривых «доза-эффект», при планировании клинических испытаний новых лекарственных средств. Разработано программное обеспечение, реализующее предложенный в диссертации метод построения оценок функции эффективности, которое позволяет оценивать эффективные дозы уровней от 5% до 95%, в том числе и категории доз, близкие к границам интервала распределения, строить оценки также и в случае, когда значения воздействовавшей дозы измеряются с погрешностью. Программа позволяет пользователям получать оценки с автоматическим выбором ширины окна при фиксированном плане эксперимента по непрямым наблюдениям.

Методы оценивания, разработанные в диссертации, были применены для построения функции распределения и категорий эффективных доз при исследовании чувствительности к адреналину. Данные были взяты из литературы (см. [37]).

Основные положения, выносимые на защиту На защиту выносятся:

1. кЫЫ - оценки и двухшаговые - оценки для неизвестной функции распределения в зависимости доза-эффект, результаты их теоретического асимптотического анализа в схеме прямых и непрямых наблюдений для модели со случайным и фиксированным планами эксперимента, а также численное исследование построенных оценок.

2. л/к — и — состоятельные оценки и результаты их асимптотического анализа с учетом погрешности испытанных доз для модели с фиксированным планом эксперимента и способы уменьшения погрешности наблюдений.

3. Адаптивный алгоритм построения оценок с автоматическим выбором ширины окна просмотра данных для моделей с фиксированными и случайными планами эксперимента, реализованный в разработанном диссертантом программном комплексе.

4. Численное сравнение оценок функции эффективности в моделях с прямыми и непрямыми наблюдениями.

Опубликованность результатов

Результаты диссертации опубликованы автором в пятнадцати работах [1-15]. Из них шесть работ [1-6] в журналах из списка ВАК. Две работы - [4, 6], опубликованные в журналах из списка ВАК, написаны без соавторов. Всего без соавторов изданы 5 работ из общего числа.

Среди публикаций из списка ВАК — одна статья в «Вестнике Нижегородского университета», одна статья в журнале «Нелинейный мир», четыре работы в журнале «Обозрение прикладной и промышленной математики». Кроме того, шесть статей опубликованы в материалах международных конференций, одна статья в рецензируемом межвузовском сборнике научных трудов, две статьи депонированы ВИНИТИ.

В совместных работах [1-3, 5, 7, 9, 12] автору принадлежит использование методов анализа оценок в зависимости доза-эффект и выполнение данного анализа, а соавтору — идея работы. В работах [8, 13, 15] автору также принадлежит использование методов анализа и его выполнение для исследования оценок при фиксированном плане эксперимента, первому соавтору — идея работы, а второму соавтору исследование интегрированных среднеквадратичных ошибок в схеме непрямых наблюдений.

Апробация результатов диссертации

Основные результаты диссертации докладывались на следующих конференциях и научных семинарах:

10-я междисциплинарная научная конференция «Нелинейный мир» (Нижний Новгород, 2005 г.);

XII Всероссийская школа-коллоквиум по стохастическим методам (Дагомыс, 2005г.);

7-й Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Йошкар-Ола, 2006);

Международная конференция 11е181а1:'2006 (Рига, 2006 г.);

XIV Всероссийская школа-коллоквиум по стохастическим методам (Адлер, 2007 г.);

XX Международная конференция «Математические методы в технике и технологиях» (Ярославль, 2007 г.);

8-я международная конференция «Компьютерный анализ данных и моделирование» СБАМ'2007 (Минск, 2007 г.);

X Всероссийский симпозиум по прикладной и промышленной математике (ВСППМ), (Дагомыс, 2009 г.).

В 2006 году исследования проводились при поддержке Российского Фонда Фундаментальных Исследований (грант № 04-02-17191-а).

В 2006-2010 гг. по результатам диссертации делались доклады на семинарах по теории вероятностей и математической статистике кафедры теории статистических решений и кафедры прикладной теории вероятностей факультета ВМК ННГУ им. Н.И.Лобачевского.

Структура, объем и краткое содержание диссертации

Диссертация состоит из введения, пяти глав, заключения, списка литературы, включающего 128 наименований, и приложений на 60 страницах. В приложениях в виде таблиц и графиков приведены результаты имитационного моделирования, описанные в пятой главе диссертации, также в приложения вынесены некоторые доказательства. Общий объем работы составляет 217 страниц, объем основного текста — 157 страниц.

Заключение диссертация на тему "Математическое моделирование и оценивание распределений в зависимости доза-эффект"

Основные результаты исследования зависимости доза-эффект для случайного и фиксированного плана эксперимента в случае прямых наблюдений, а также наблюдений с погрешностью, сводятся к следующему.

Впервые рассмотрена задача оценивания неизвестной функции распределения в зависимости доза-эффект с помощью ШЫ — оценок. Для случайного плана эксперимента в схеме прямых и непрямых наблюдений были построены кАгМ - оценки и двухшаговые асимптотически несмещенные ШМ- оценки и проведен их асимптотический анализ. Установлена их состоятельность и асимптотическая нормальность. Оказалось, что их предельная дисперсия не зависит от неизвестной плотности. Для фиксированного плана эксперимента изучены оценки Надарая—Ватсона (в случае постоянного шага) и оценки

Пристли-Чао (для переменного шага). Построены 4пЬ - состоятельные оценки для модели с фиксированным планом эксперимента. Кроме того, асимптотическое поведение оценок Пристли—Чао было изучено и для случайных планов наблюдений. Для фиксированного плана в схеме непрямых наблюдений было установлено, что оценки, полученные при предположении нормальности, имеют такое же предельное распределение, что и оценки в схеме прямых наблюдений, т. е. уменьшена погрешность наблюдения.

Таким образом, для изучения модели доза-эффект были применены непараметрические ядерные оценки различных типов, рассмотрен важный для практики случай наблюдений с ошибкой и для него построены состоятельные, асимптотически несмещенные и асимптотически нормальные оценки.

Кроме аналитического исследования было проведено изучение имитационной модели. Ввиду асимптотического характера исследования, проведенного в диссертации, на практике возникает проблема оптимального подбора значений параметров модели, в частности, — ширины окна просмотра И. Для моделей с фиксированными и случайными планами эксперимента разработан комбинированный адаптивный алгоритм выбора оптимальной ширины окна. Осуществлено построение оценок с автоматическим выбором оптимальной ширины окна методами кросс-проверки, подстановки, штрафных функций, а также с помощью разработанного алгоритма. Проведен численный анализ построенных оценок. При решении задачи численной оптимизации делается вывод, что предложенные в диссертационной работе оценки более точно оценивают «малые» и «большие» дозы и приводят к получению более узких доверительных интервалов по сравнению с существующими методами.

Основные аналитические результаты диссертации — асимптотическая нормальность оценок и процедура построения у[гИг — и у[к - состоятельных оценок согласуются с численными оценками, полученными в ходе изучения имитационной модели для выборок конечного объема.

Полученные в диссертационной работе результаты могут быть применены для системного изучения свойств непараметрических оценок и дальнейшего развития анализа зависимости доза-эффект, а также при разработке модулей статистических пакетов.

Заключение

Библиография Ярощук, Марина Владимировна, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Ярощук, М.В. Статистическое оценивание зависимости доза-эффект с помощью kNN —оценок / М.С. Тихов, М.В. Ярощук // Обозрение Прикл. и Пром. Математики - М.: Изд-во ТВП - 2005. - Т. 12, в. 3. - С. 683 - 684.

2. Ярощук, М.В. Модифицированные оценки Янга в зависимости доза-эффект / Тихов М.С., Ярощук М.В // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП — 2006. — Т. 13, в. 1. - С. 144.

3. Ярощук, М.В. Асимптотическая нормальность kNN — оценок в зависимости доза-эффект / М.С. Тихов, М.В. Ярощук // Вестник Нижегородского университета. Серия: Математика. 2006. Вып.1(4), - С. 129-137.

4. Ярощук, М.В. Об оценивании распределений в зависимости доза-эффект / М.В. Ярощук // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП -2007. - Т. 14, в. 1.-С. 178-180.

5. Ярощук. М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений / М.С. Тихов, М.В. Ярощук//Нелинейный мир М.: изд-во Радиотехника— 2007, Т.5, №1,2, С.4-8.

6. Ярощук М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности/ М.В. Ярощук // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП -2009. - Т. 16, в. 6. - С. 1148-1150.

7. Ярощук, М.В. Статистическое оценивание нелинейной зависимости доза-эффект с помощью kNN оценок / М.С. Тихов, М.В. Ярощук // Десятая междисциплинарная научная конференция «Нелинейный мир». Тезисы докладов — Нижний Новгород: изд-во ННГУ - 2005. - С.139.

8. Yarochuk, M.V. Asymptotic normality ^-Nearest Neighbor estimators in dependence dose-response / M.S. Tikhov, M.V.Yarochuk — изд-во Ташкентского ун-та, Ташкент, 2006. С. 46- 49.

9. Ярощук, М.В. Об асимптотической нормальности kNN — оценок в зависимости доза-эффект / М.В. Ярощук. Нижегородский гос. ун-т — Н.Н., 2006 49 с. -Библиогр.: 11 назв. - Рус. - Деп . в ВИНИТИ 1536- В2006

10. П.Ярощук, М.В. Предельные распределения kNN оценок в зависимости доза-эффект в схеме непрямых наблюдений / М.В. Ярощук. Нижегородский гос. ун-т — Н.Н., 2006. - 39 с. - Библиогр.: 11 назв. - Рус. - Деп. в ВИНИТИ 1535- В2006

11. Yarochuk, M.V. Statistical estimation of distributions in dose-response dependence / M.S. Tikhov, M.V.Yarochuk // Reliability and Statistics in Transport and Communication: Proc. of the 6th Intern. Conf., Riga, Latvia. — 2006. — P. 374-375.

12. Yarochuk, M.V. Computer-based data analysis in dose-response dependence / M.V. Yarochuk // Computer Data Analysis and Modeling: Proc. of 8th Intern. Conf., Minsk, September 11-15.-2007.- V. l.-P. 186-189.

13. Yarochuk, M.V. Asymptotic normality of the integrated square error at the fixed plan of experiment for indirect observations / M.S. Tikhov, D.S.Krishtopenko, M.V.Yarochuk // J. "Computer Modeling and New Technologies". 2007. - V. 11, No 1. - P. 46-56.

14. Авалиани, С.JT. Вероятностные методы оценки пороговых концентраций при гигиеническом регламентировании атмосферных загрязнений / C.JI. Авалиани, З.П. Григоревская, Е.В. Печенникова // Гигиена и санитария. 1987. №8. - С. 10-13.

15. Богданов, А.А. Метод анализа зависимости «доза-эффект» в многофакторных медико-биологических экспериментах / А.А. Богданов, В.Д. Шлендов // Бюлл. эксперим. биол. и медицины. -1994. № 33. — С. 228-331.

16. Беленький, M.JI. Элементы количественной оценки фармакологического эффекта / M.JI. Беленький. JI.: Медгиз, 1963. -152 с.

17. Бессмертных, Б.С. Математическая статистика в клинической, профилактической и экспериментальной медицине / Б.С. Бессмертных. М., 1967. 215 с.

18. Газенко, О.Г. Словарь физиологических терминов / О.Г. Газенко — М.: Наука, 1987. -445 с.

19. Гнеденко, Б.В. Курс теории вероятностей / Б.В. Гнеденко М.: Наука, 1988.- 448 с.

20. Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений / И.С. Градштейн, И.М. Рыжик — М.: Физматгиз, 1963. — 1100 с.

21. Гублер, Е.В. Применение непараметрических критериев статистики в медико-биологических исследованиях / Е.В.Гублер, А.А. Генкин — JL: Медицина, Ленингр. отд-ние, 1973. — 141 с.

22. Гуревич, К.Г. Оценка параметров кривой «доза-эффект» методом сплайн-интерполяции / К.Г. Гуревич // Вести. Моск. Ун-та. — Сер. 2. — Химия. 2000. -Т.41, № 200. - С. 69-70.

23. Гуревич, К.Г. Фармакологический анализ бимодальных дозовых зависимостей / К.Г. Гуревич // Рос. хим. журн. 2002. - Т.46, № 6. - С. 68-73.

24. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности I В.А. Епанечников // Теор. вероятн. и ее примен. — 1969, Т. 14. — С. 156-161.

25. Закс, JI. Статистическое оценивание / JI. Закс. М.: Статистика, 1976. 598 с.

26. Заугольников, С.Д. Экспрессные методы определения токсичности и опасности химических веществ / С.Д. Заугольников, М.М. Кочанов, А.О. Лойт, И.И. Ставчанский. JL: Медицина, 1978. 184 с.

27. Ибрагимов, И.А. Асимптотическая теория оценивания / И.А. Ибрагимов, Р. 3. Хасьминский. М.: Наука, 1979. 528 с.

28. Ибрагимов, И.А. О непараметрическом оценивании регрессии / И.А. Ибрагимов, Р. 3. Хасьминский. Доклады АН СССР. 1980. - № 21. - С. 810-814.

29. Катковник, В.Я. Сходимость линейных и нелинейных непараметрических оценок ядерного типа / В.Я. Катковник // Автоматика и телемеханика. — 1983. №4. - С. 108-120.

30. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, C.B. Фомин. М.: Наука, 1976.-542 с.

31. Криштопенко, C.B. Токсикометрия эффективных доз/ C.B. Криштопенко, М.С. Тихов Нижний Новгород: Изд-во ННГУ, 1997. - 156 с.

32. Криштопенко, C.B. Парадоксальная токсичность/ C.B. Криштопенко, М.С. Тихов, Е.Б. Попова Нижний Новгород: Изд-во НГМА, 2001. - 164 с.

33. Криштопенко, C.B. Доза-эффект / C.B. Криштопенко, М.С. Тихов, Е.Б. Попова -М.: Медицина, 2008. 288 с.

34. Лакин, Г.Ф. Биометрия / Г.Ф. Лакин. М.: Высшая школа, 1990. 352 с.

35. Лапач, С.М. Статистическое методы в медико-биологических исследованиях с использованием Excel / С.М. Лапач, A.B. Чубенко, П.М. Бабич. К.: Морион, 2001. - 408 с.

36. Лоэв, М. Теория вероятностей / М. Лоэв. М.: ИЛ., 1962. 720 с.

37. Надарая, Е.А. Об оценке регрессии/ Е.А. Надарая // Теория вероятн. и ее примен. -1964. Т. 9, в.1. — С.157- 159.

38. Надарая, Э.А. О непараметрических оценках плотности вероятности и регрессии / Э.А. Надарая // Теория вероятн. и ее примен. 1965. Т. 10, в.1. - С.199 - 203.

39. Невельсон, М.Б. Стохастическая аппроксимация и рекуррентное оценивание / М.Б. Невельсон, Р.З. Хасьминский. М: Наука, 1972. — 304 с.

40. Осипов, А.Л. Непараметрический метод построения зависимости «доза-эффект» /

41. A.Л. Осипов, С.Н. Аношкин // ж. «Автометрия».-2006. Т. 42, №6. С. 63-69.

42. Прудников, А.П. Интегралы и ряды. Элементарные функции / А.П. Прудников, Ю.А. Брычков, О.И. Маричев. М.: Наука, 1981. -800 с.

43. Pao, С.Р. Линейные статистические методы и их применение / С.Р. Pao. М.: Наука, 1968.-548 с.

44. Румак, B.C. Воздействие диоксинов на окружающую среду и здоровье человека /

45. B.C. Румак, Чинь Куок Кхань, А.Н. Кузнецов и др. // Вестник РАН: Проблемы экологии. 2009. - Т. 79, №2. - С. 124-130.

46. Слуцкий, Е.Е. Избранные труды: теория вероятностей, математическая статистика / Е.Е. Слуцкий М.: изд-во АН СССР, 1960. - 292 с.

47. Смирнов, Н.В. Приближение законов распределения случайных величин по эмпирическим данным / Н.В. Смирнов // Успехи мат. наук 1944. Т. 10. - С. 179206.

48. Смирнов, Н.В. Теория вероятностей и математическая статистика. Избранные труды/ Н.В. Смирнов М.: Наука, 1970. - 288 с.

49. Тихов М.С. Асимптотические методы в теории порядковых статистик и их приложения: учебное пособие. Горький, изд-во Горьк. ун-т, 1985. — 80 с.

50. Тихов, М.С. Оценивание дисперсий оценок функции распределения в зависимости доза—эффект/ М.С. Тихов, В.В. Агеев // Обозрение Прикл. и Пром. Математики — М.: Изд-во ТВП 2009. - Т. 16, в. 6. - С. 581 - 582.

51. Тихов, М.С. Оценки параметров нерегулярных в окрестности квантилей плотностей по отрезкам вариационного ряда / М.С. Тихов // Теория вероятностей и ее применение. 1987. - Т. 32, в. 2. - С. 382 - 387.

52. Тихон, М.С. Построение и анализ статистических оценок для неполностью известных семейств распределений: Дис. . д-ра физ.-мат.наук. Н.Новгород, 1993. -354 с.

53. Тихов, М.С. Линейные функции индуцированных порядковых статистик и непараметрическое оценивание распределений в зависимости доза-эффект / М.С. Тихов // Обозрение Прикл. и Пром. Математики М.: Изд-во ТВП — 1999. - Т.6, B.1.-C. 244.

54. Тихов, М.С. Эконометрические дискретные модели бинарного выбора / М.С. Тихов // Прикладная статистика в социально-экономических проблемах: материалы межд. конф. Нижний Новгород: изд-во ННГУ - 2003. - Т.1. - С.104-106.

55. Хардле, В. Прикладная непараметрическая регрессия / В. Хардле. М.: Мир, 1983. -349 с.

56. Цыбаков, А.Б. О выборе ширины окна в ядерной непараметрической регрессии / А.Б. Цыбаков // ТВП М.: Изд-во ТВП-1987. -Т. 32, в. 1. - С. 153-159.

57. Ширяев, А.Н. Вероятность / А.Н. Ширяев // в 2-х книгах М.:МЦНМО, 2007. Кн. 1 - 552 с. -Кн. 2 -416 с.

58. Barbe, P. Joint approximation of process based on spacings and order statistics. / P. Barbe // Stochastic process and their Applications, 53. -1994. P. 339-349.

59. Benedetti, J.K. On the nonparametric estimation of regression functions / J.K. Benedetti // Journal of the Royal Statistical Society, Series B, 39 1977, P. 248-253.

60. Beran, R. Discussion of "Jackknife, bootstrap and resampling methods in nonparametric regression analysis"/ R. Beran, C.F.J.Wu // Aim. Statist. 1986. - V. 14, P.1295-1298.

61. Beran, J. Modifying the double smoothing bandwidth selector in nonparametric regression / J. Beran, Y. Feng and S. Heiler // Statistical Methodology. 2009. - V. 6, Issues 5. -P. 447-465.

62. Bross, I.D. Taking a covariable into account / I.D.Bross // J. Amer.Statist. Assoc.59 — 1964, P. 725-736.

63. Cheng, K.F. Nonparametric estimation of a regression function / K.F. Cheng, P.E. Lin // Zeitschrift fur Wahrscheinlichkeitstheorie und verwandte Gebiete, 57 — 1981, P. 223233.

64. Collomb, G. Quelques properietes de la methode du noyau pour l'estimation non-parametrique de la regression en un point fixe / G. Collomb // C.R. Acad. Sc. Paris, 285. -1977, P. 289-292.

65. David, H.A. Order Statistics / H.A. David, H.N.Nadaraja Wiley, 2003. - 458 p.

66. Dette, H. A Note on Nonparametric Estimation of the Effective Dose in Quantal Bioassay / H. Dette, N. Neumeyer, K.F. Pilz // Journal of the American Statistical Association. 2005. - V. 100. - P. 503- 510.

67. Dvoretzky, A Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator / A Dvoretzky, J. Kiefer and J. Wolfowitz // Annals of Mathematical Statistics. 1956. - V.27. - P. 642 -669.

68. Einmahl, U. Uniform in Bandwidth Consistency of Kernel-type Function Estimators/ U. Einmahl, D.M. Mason // Ann. Statist. 2005. - V. 33, № 3. - P. 1380 - 1403.

69. Eubank, R. Adaptive bandwidth choice for kernel regression / R. Eubank, W. Schucany // Technical Report № SMU.DS.TR.241 department of Statistical Science. -1990.

70. Fan, J. Nonparametric regression with errors in variables / J. Fan, Y. Truong // The Annals of Statistics. 1993. - V.21, №4. - P.1900-1925.

71. Faraway, J.J Bootstrap selection of bandwidth and confidence bands for nonparametric regression/ J.J. Faraway // J. Statist. Comput. Simulation-1990. V. 37. -P.37-44.

72. Faraway, J.J. Bootstrap choice of bandwidth for density estimation / J.J. Faraway, M. Jhun // J. Amer. Statiat. Assoc. -1990. V. 85. - P. 1119-1122

73. Finney, D.J. Probit Analysis / D.J. Finney, 3 ed. Cambridge: University Press, 1980. -333 p.

74. Gasser, T. Estimating regression function and their derivatives by the kernel method / T. Gasser, H.G. Muller// Scand. J. Statist. -1984. -V. 11. P. 171-185.

75. Gasser, T. Kernel estimation of regression functions. Smoothing techniques for Curve estimation / T. Gasser, H.G. Muller // Lecture Notes in Math., Springer, New York -1979.-V. 757.-P. 23-68.

76. Gasser, T. Kernels for nonparametric curve estimation / T. Gasser, H.G. Muller, V. Mammitzsch // J. Roy. Statist. Soc. -1985. Ser.B, V. 47. -P. 238-252.

77. Gasser, T. Residual variance and residual pattern in nonlinear regression / T. Gasser, L. Sroka, C. Jennen-Steinmetz // Biometrika. 1986. - V. 73. -P. 625-633.

78. Geisser, S. A predictive sample reuse method with application / S. Geisser // Journal of American Statistical Association. 1975. - V. 70. - P. 320-328.

79. Hall, P. A Local Cross-Validation Algorithm / P. Hall, W.R. Schucany // Statistics and Probability Letters. -1989. V. 8. - P.109-117.

80. Hardle, W. Bootstrapping in Nonparametric Regression: Local Adaptive Smoothing and Confidence Bands / W. Hardle, A.W. Bowman // Journal of the American Statistical association. 1988. -V. 83. -P. 102-110.

81. Hardle, W. How far are automatically chosen regression smoothing parameters from their optimum / W. Hardle, P. Hall, J.S. Marron // J. Amer. Statist. Assoc. -1988. -V. 83. -P. 86-99.

82. Hardle, W. Regression smoothing parameters that are not far from their optimum / W. Hardle, P.Hall, J.S. Marron//J. Amer. Statist. Assoc.-1992.-V. 87. -P. 227-233.

83. Hardle, W. Applied nonparametric Methods, in Handbook of Econometrics / W. Hardle, O. Linton // North Holland Elsevier Science, 1994. -V.4. P. 44-88.

84. Hardle, W. Optimal Bandwidth in nonparametric regression function estimation / W. Hardle, J.S. Marron //The Annals of Statistics. 1985.-V.13, № 4.-P. 1465-1481.

85. Hengartner, N.W. Asymptotic unbiased density estimators / N.W. Hengartner // E. Matzner-Lober // ESAIM. 2009. - V. 13. - P. 1-14.

86. Hlawka, E. Losung von Integralgleichungen mittels zahlentheoretisher Methoden I / E. Hlavvka // Siztzungsber., Abt. II. Osterr. Akad. Wiss., Math. -Naturwiss. Kl. 1962. -V. 171, № 1 -P. 103 -123.

87. Hodges, J.L. The efficiency of some nonparametric competitors of the t-test / J.L. Hodges, E.L. Lehmann // Annals of Mathematical Statistics. 1956. -V. 27. - P. 324335.

88. Hoeffding, W. Probability inequalities for sums of bounded random variables/ W. Hoeffding // Siztzungsber. Abt. II. Oster. Acad. Wiss., Math.-Naturwiss. Kl. 1962. - V. 171, № l.-P. 103-123.

89. Kolmogoroff, A. Sulla determinazione empirica di una legge di distribuzione / A. Kolmogoroff // Giornale dell' Institute italianj degli Attuari 1933. - V. 4- P. 83 -91.

90. Jennen-Steinmetz, C. A unifying approach to nonparametric regression estimation / C. Jennen-Steinmetz, T. Gasser // Unpublished manuscript. -1988.

91. Lewbel, A. Estimator for Inverse Density Weighted expectations / A. Lewbel, S. Schennach // Journal of Econometrics. 2007. -V. 136, № 1 -P. 189-211.

92. Li, Q. Nonparametric Econometrics: Theory and Practice / Q. Li, J.S. Racine // Princeton University press, 2007. 768 p.

93. Litchfield, J.T. A simplified method of evaluating dose-effect experiments/ J.T. Litchfield, F.W. Wilcoxon // J. Pharmacol. Exper. Ther. 1949. - V. 96. - P. 99-113.

94. Loftsgaarden, D.O. A nonparametric estimate of a multivariate density function/ D.O. Loftsgaarden, G.P. Quesenberry// Ann. Mathem. Statist. 1965. - V. 36. - P. 1049 -1051.

95. Mack, Y.P. Local properties of k NN Regression Estimates/ Y.P. Mack // SIAM J. Alg. Disc. Meth. - 1981. - V. 2. -P. 311 -323.

96. McDiarmid, C. On the method of bounded difference / C. McDiarmid // In Surveys in Combinatorics. Cambridge University press: Cambridge. - 1989. - P. 148-188.

97. Miller, L.S. Estimation of the ED50 and its error by means of logariphmic probit graph paper/ L.S. Miller, M.L. Tainter // Proc.Soc.Exp.Biol.Med. 1944. - V.7. - P. 261-264.

98. Muller, H.-G. Variable bandwidth kernel estimators of regression curves / H.-G. Muller, U. Stadtmuller // Ann. Statist. 1987. -V. 15. -P. 182-201.

99. Neumann, M. Automatic bandwith choice and confidence intervals in nonparametric regression / M. Neumann // The Annals of Statistics. 1995. - V. 23. - P. 1937-1959.

100. Niederreiter, H. Random Number Generation and Quasi-Monte Carlo Methods / H. Niederreiter SIAM Philadelphia, Pensylvania, 1992.-241 p.

101. Parsen, E. On estimation of a probability density function and mode / E. Parsen // Ann. Math.Statist. 1962. - V. 33. - P. 1056-1076.

102. Peleg, M. Mathematical interpretation of dose-response curves / M. Peleg, M.D. Normand, E. Damrau // Bulletin of Mathematical Biology. -1997.-V. 59, № 4 P. 747767.

103. Priestley, M.B. Nonparametric function fitting / M.B. Priestley and M.T. Chao // Journal of the Royal Statistical Society. -1972. -Ser. B. -V. 34. -P. 385-392.

104. Racine, Jeffrey S. Nonparametric econometrics: a primer/ Jeffrey S.Racine // Quantile. -2008.-№4.-P. 7-56.

105. Reinsch, H. Smoothing by spline functions / H.Reinsch // Numerische mathematic. -1967. -№ 10. -P.177-183.

106. Renyi, A. On the theory of order statistics / A. Renyi // Acta math. Acad. Sci. hung. -1953. -P.191-231.

107. Rice, J. Smoothing splines: regression, derivatives and deconvolution / J. Rice and M. Rosenblatt // Ann.Statistic. 1983. - V.l 1. - P.141-156.

108. Rosenblatt, M. Remarks on some nonparametric estimates of a density function / M. Rosenblatt // Ann. Math. Statist. 1956. -V.27, № 3. - P. 832-837.

109. Rumak, V.S. The Effect of Dioxins on the Environment and Human Health / V.S. Rumak, Trinh Quoc Khanh, A.N. Kuznetsov // Herald of the Russian Academy of Sciences. 2009. - V. 79, № 1. - P.50-56.

110. Schucany, W.R. On nonparametric regression with higher-order kernels / W.R Schucany //Journal of Statistical Planning and Inference. 1989. -№ 23. -P.145-151.

111. Shibata, R. An optimal selection of regression variables / R. Shibata // Biometrica. -1981.-V.68.-P. 45-54.

112. Silverman, B.W. Some aspects of the spline smoothing approach to non-parametric regression curve fitting (with discussion) / B.W. Silverman // J. Roy. Statist. Soc. -1985. Ser.B, V.47. - P. 1-52.

113. Simonoff, J.S. Smoothing Methods in Statistics / J.S. Simonoff. New York: Springer Verlag, 1996.- 338 p.

114. Stone, C.J. Cross-validatory choice and assessment of statistical predictions (with discussion) / C.J. Stone // Journal of Royal Statistical Society. -1974. № 36. - P. 111-147.

115. Stute, W. Asymptotic normality of nearest neighbor regression function estimates / W. Stute// Annals of Statistics.- 1984.-№12.-P. 917-926.

116. Taylor, C.C. Bootstrap choice of the smoothing parameter in kernel density estimation / C.C. Taylor // Biometrika. -1989. V.76. - P. 705-712.

117. Tikhov M.S. Statistical Estimation based on Interval Censored Data. / Tikhov M.S. // Param. and Semiparam. Models with Appl. to Rel., Surv. Analisys, and Qual. of Life: Springer-Verlag: Theor.& Meth. 2004. -V. XLIV. - P. 209-215.

118. Tikhov, M.S. Statistical Estimation on the Basis of Interval-Cencored Data/ M.S. Tikhov // J. Math. Sciences. 2004. -V . 119, N. 3. - P. 321- 335.

119. Tikhov, M.S. Econometric models with discrete dependent variables // 8-th Intern. Vilnius Con. on Probab. Theory and Math. Stat. Abstracts. TEV. - Vilnius - 2002. -P. 325.

120. Wahba, G. A completely automatic French curve: fitting spline functions by cross-validation / G. Wahba, and S. Wold // Comm. Statist. -1975. V. 4. - P. 1—17.

121. Wand, M.P. Kernel Smoothing / Wand M.P. and M.C. Jones. Boston: CRC Press., 1995.-230 p.

122. Watson, G.S. Smooth regression analysis/ G.S. Watson// Sankliya. -1964. V. 26. P. 359-372.

123. Wu, J.S. Nonparametric function estimation and bandwidth selection for discontinuous regression functions / J.S. Wu and C.K. Chu // J. Statistica Sinica. -1993. V. 3. P. 557-576.

124. Yang, S. Linear functions of concomitants of order statistics with application to nonparametric estimation of a regression function / S. Yang // Journal of the American statistical association. 1981. - V.76. - P. 658-662.

125. Zbinden, G. Les methods alternatives, present et avenir / G. Zbinden // The-rapie. -1990.-V. 45, №5. -P. 347-350.