автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Статистический анализ моделей случайного цензурирования и их применение в теории надежности
Автореферат диссертации по теме "Статистический анализ моделей случайного цензурирования и их применение в теории надежности"
Московский государственный технический университет
СТАТИСТИЧЕСКИЙ ДИАЛИЗ МОДЕЛЕЙ СЛУЧАЙНОГО ЦЕНЗУРИРОВАНИЯ И ИХ ПРИМЕНЕНИЕ В ТЕОРИИ НАДЕЖНОСТИ
05.13.16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ диссертации на (»искание ученой степени доктора физико-математических наук
им. Н.Э.Баумана
Р Г Б
3 1 ШОП 1995
На правах рукописи УДК 519.ЗТ
БАСКАКОВ Валерий Николаевич
Москва 1995
Работа выполнена в Московском государственном техническом университете им. Н.Э.Баумана
Официальные оппоненты:
доктор.физико-математических наук, профессор БЛАГОВЕЩЕНСКИЙ Ю.Н.
доктор фиуико-мцтематических наук, профессор КАШТАНОВ В.А.
доктор технических наук, профессор ТЕСКИН О.И.
Ведущая организация: Государственный научный цонтр РФ
ЦНИИХМ
Защита состоится 10 октября 1ЭД5 г. в 1-1 час. 00 мин. на заседании диссертационного совета по за щит о. докторских диссертаций Д 053.1Ь.12 при Московском государственном техническом университете им. Н.Э.Баумана по адресу: 10/005, Москва, 2-ая Бауманская ул., д.5 .
С диссертацией можно ознакомиться в библиотеке МГТУ им Н.Э.Баумана
Автореферат разослан "_"_1995 г.
Ваш отзыв ни автореферат в одном экземпляре, заве ;нный печатью учреждения, просим высылать по адресу. 10 7005, Москва, 2-ая Бауманская ул., д.Ь, МГТУ им.Н.Э.Баумана, Ученому секретарю диссертационного совета
Ученый секретарь диссертационного совота, кандидат техни' ежих наук доцент
'ь
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Большая часть статистической информации при эксплуатационных наблюдениях и ресурсных испытаниях на надежность, в медицинских и биологических экспериментах, демографии, страховании и других областях представляется в виде цензурированных данных, процесс формирования которых описывают модели случайного цензурирования. Широкое распространение цензурированных данных обусловлено рядом причин. С одной стороны это сокращает продолжительность испытаний, позволяет проводить оперативный контроль испытываемых изделий и экономит материальные ресурсы, с другой - такие данные часто бывают единственно доступными для анализа.
Причины возникновения цензурированных данных весьма разнообразны и достаточно подробно рассмотрены в научной литературе. Рассмотрим некоторые из них. Например, снятие с испытаний или эксплуатации части изделий по организационным причинам или из-за отказов их составных частей, надежность которых не исследуется. Другой возможной причиной цензурирования является необходимость оценки надежности до наступления отказа всех испытываемых изделий или по результатам разовых обследований их надежности.
Указанные причины и ряд других, вообще говоря, случайных факторов порождают разнообразие схем и моделей формирования цензурированных данных. Особенности их структуры приводят к тому, что многие классические методы статистической обработки результатов наблюдений оказываются неприменимыми. Это предопределило развитие специальных статистических методов, которые получили интенсивное развитие после опубликования работы EL.Kaplan и P.Meier, где для модели конкурирующих рисков предложена оценка вероятности безотказной работы, являющаяся аналогом обычного эмпирического распределения. В последующем свойства этой оценки исследованы на высоком теоретическом уровне в [заботах Ю.К.Беляева, Ю.Н.Благовещенского, O.O.Aalen, R.D.Gill, J.B.Robertson и других авторов.
В настоящее время модели одностороннего цензурирования являются наиболее изученными. Разным аспектам анализа таких моделей посвящены работы И.В.Павлова, В.М Скрипника, О.И.Тескина, И.А.Ушакова, M.Ayer, A.C.Cohen, B.Etron, W.Nelson, W.J.Padgett. Более сложные схемы случайного цензурирования, в том числе многомерные модели, возникают, например, при восстановлении совместной функции распределения наработок или кратковременной стойкости в нескольких режимах форсированных испытаний; оценивании характеристик надежности по постепенным отказам; в задачах распознавания образов; при обьединении разнородной информации и других задачах. Такие модели изучались лишь фрагментарно в работах В.В.Агеева, Г.Д.Карташова, М.С.Тихова, E.Gombay, M.N.Chang, R.M.Korwar, R.Peto, B.W. Turnbull.
Для того, чтобы охарактеризовать ситуацию в этой области исследований, необходимо отметить, что различные схемы и модели цензурирования до последнего времени изучались изолированно друг от друга. Это привело к тому, что многие исследования носят частный характер. При этом незначительное изменение постановки задачи часто приводит к необходимости коренного пересмотра расчетного алгоритма, что сдерживает развитие прикладных исследований и разработку программного обеспечения.
Ввиду изложенного, анализ цензурированных данных должен основываться на некой математической модели рассматриваемого явления, обобщающей известные схемы цензурирования. Построение и исследование такой модели позволит разр ботать общие принципы и методы статистического анализа цензурированных данных самого различного типа, обеспечить постановку и решение новых фундаментальных задач, связанных с анализом данных.
Целью работы является построение обобщенной математической модели случайного цензурирования, разработка и исследование на ее основе методов, позволяющих проводить статистический анализ цензурированных данных с единых методических позиций, а также применение полученных теоретических результатов в теории надежности.
Основными задачами исследования являются:
1. Анализ известных моделей формирования цензурированных данных и их классификация.
2. Построение обобщенной математической модели случайного цензурирования.
3. Разработка методов статистического анализа цензурированных данных, позволяющих проводить исследование различных схем и моделей цензурирования с единых методических позиций.
4. Исследование точности и достоверности разработанных методов с помощью математического моделирования и вычислительной техники.
5. Применение полученных теоретических результатов для решения практических задач теории надежности.
6. Разработка программного обеспечения.
7. Апробация и внедрение результатов исследования в нормативно-техническую документацию и производство.
Научная новизна работы заключается в том, что на основании разработанной обобщенной математической модели случайного цензурирования впервые:
- различные схемы и модели формирования цензурированных данных, в том числе многомерные, исследованы с единых методических позиций;
- для широкого класса цензурированных данных получен аналог обычного эмпирического распределения и изучены его основные свойства;
- обобщен ряд методов классической статистики по оцениванию распределений и выборочных характеристик на случай цензурированных данных и исследованы свойства полученных оценок, в том числе по малым выборкам.
Основные результаты, выносимые на защиту:
1. Разработана обобщенная математическая модель случайного цензурирования и на ее основе разработаны подходы и методы, позволяющие с единых методических позиций исследовать различные схемы и модели формирования цензурированных данных, в том числе многомерные.
2. Для обобщенной модели случайного цензурирования разработан аналог фундаментального понятия математической
статистики - эмпирическое распределение и изучены ею основные свойства.
3. На основе обобщения ряда методов классической статистики разработаны классы оценок распределений .1 выборочных характеристик по случайно цензурированным данным и исследованы их свойства, в том число по малым выборкам.
4. Исследованы модели и схемы случайного цензурирования, хорошо описывающие структуры данных, характерные для широкого круга практически важных задач теории надежности.
Практическая ценность работы заключается в том, что на основании проведенных теоретических исследований:
- разработаны и доведены до программной реализации алгоритмы статистического оценивания и проверки гипотез но цензурированным данным;
усовершенствована методика построения динамики изнашивания деталей машин по результатам их разовых обследований и методика планирования ускоренных испытаний, когда надежность изделий определяется рядом одновременно не наблюдаемых случайных параметров.
Полученные результаты использовались:
- при разработке нормативно-технической документации, внедренной в трех межотраслевых методических документах и учебном пособии для студентов и аспирантов МИИСП им. В.П.Горячкина;
- при разработке- пакета прикладных программ для оценки надежности изделий машиностроения, который внедрен на вычислительных центрах НПО НАТИ, ГСКБ МТЗ, ПО ВТЗ и ПО ХЗТСШ;
- при проектировании и формировании отраслевого банка данных, внедренного в ОИНТ НПО НАТИ и содержащего сведения по износостойкости более 5000 деталей тракторов;
- при изучении закономерностей изнашивания и надежности деталей сельскохозяйственных тракторов, двигателей внутреннего сгорания и др. изделий, а так же при разработке рекомендаций по повышению их долговечности, которые приняты к опытному производству тракторов ДТ-75М (ВгТЗ);
С
- при разработке значений предельных износов деталей тракторов, внедренных в межотраслевой нормативно-технический документ.
По результатам исследований пол учено два авторских свидетельства на изобретение.
Диссертация связа) : с хоздоговорными темами:
- № Д-8022-2474 (ПО ЮМЗ) "Разработка рекомендаций по повышению эксплуатационной надежности тракторов типа ЮМЗ-6КЛ с целью обеспечения их работоспособности без капитального ремонта за нормативный срок службы";
- N1? Д-В022-671 (ПО МТЗ) "Разработка, экспериментальная проверка и опытное внедрение комплекса организационно-технических мероприятий по повышению эксплуатационной надежности с целью исключения капитальных ремонтов тракторов МГЗ";
- № Д-802204-871/91 (ПО ПТЗ) "Разработка критериев предельного состояния основных деталей шасси трактора ДТ-75М в комплектациях";
- N° Д-2204-90 (ПО ВТЗ) "Разработка, экспериментальная проверка и опытное внедрение комплекса организационно -технических мероприятий по повышению эксплуатационной надежности с целью исключения капитальных ремонтов тракторов Г-2БА (130/30А)";
- № Д-2204-90 (ХЗТСШ) "Разработка, экспериментальная проверка и опытное внедрение комплекса организационно-технических мероприятий по повышению эксплуатационной надежности о целью исключения капитальных ремонтов самоходных шасси Т-16М/МГ (СШ-28)";
- № Д-802204-546/91 (РПОМ) "Сбор данных об отказах двигателей Д-65Н в реальных условиях эксплуатации в различных почтенно-климатических зонах".
• N° Д-94-&3/02124 (ГС К Б ВгТЗ) "Повышение долговечности и 1ИНГОГ.ЮЙГoc.ru подшипниковых у.зпов трансмиссии";
- № ¿1 40 81-50 9480 (МТиСХМ| "Совершенствование отраслевой снуемы упр.шпения надежностью тракторов и целью 1У)!л,.:|1К>и1'л ургд1п;| их надежное.! и".
Апробация работы. Основные результаты диссертации докладывались на: Московской научно-технической конференции "Триботехника машиностроению" (г.Москва, 1981 г.); Всесоюзной научно-технической конференции "Исследование и совершенствование тракторных конструкций", НПО НАТИ, (г.Москва, 1983 - 1985 гг.); Рабочем совещании Научного совета по трению и смазкам АН СССР "Развитие методов расчета деталей машин на износ и прогнозирование их износостойкости" (г. Москва, 1984 г.); Республиканской научно-технической конференции "Композиционные материалы на основе полимеров", ИММС АН БССР (г.Гом'ель 1984 г.); Всесоюзной научно-технической конференции "Совершенствование методов контроля надежности машиностроительной продукции и их стандартизация" (Госстандарт СССР, г.Горький, 1985); Международной научной конференции "Трение, износ и смазочные материалы" (АН СССР, г.Ташкент, 1985 г.); Семинаре "Эксплуатация радиоэлектронных систем и надежность их элементоа" (БелНИИНТИ, г.Минск, 1989 г.); Научно-технической конференции "Повышение технического уровня, надежности и долговечности машин", г.Минск, 1990 г.; Конференции "Надежность и эксплуатация технических систем и комплектующих изделий" (РДЭНТП, г.Симферополь, 1990 г.); Всесоюзной школе-семинаре "Диагностирование, надежность, неразрушающий контроль электронных устройств и систем" (ДВПИ, г.Владивосток, 1990 г.); Международном научно-техническом семинаре "Моделирование и контроль качества в задачах обеспечения надежности радиоэлектронных устройств" (АЕН РФ, Литва, г.Шауляй, 1992 г.); Второй международной чаучно-технической конференции "Актуальные проблемы фундаментальных наук" (МГТУ им.Н.Э. Баумана, г.Москва, 1994 г.); Межрегиональной научно-технической конференции "Энерго- и ресурсосберегающие экологически чистые технологии, повышение конструктивно-технологических показателей и качества промышленной продукции народного хо -чйства РФ" (Комитет по высшему образованию РФ, г.Фрязино М.О., 1995 г.); на постоянно действующих семинарах ."Надежность и прогрессивные методы контроля качества продукции" при Политехническом музее, "Вероятносные методы в технике" при Механико-математическом () кудьтете МГУ им.
Ь
М.В.Ломоносова, кафедры "Высшая математика" МГТУ им. Н.Э. Баумана, 1989- 1935 гг.
Публикации. Основные результаты диссертации опубликованы в 26 печатных работах.
Объем работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы из 131 наименования. Текст изложен на 311 страница- включая 28 рисунков, 24 таблицы и четыре приложения.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность проблемы, сформулирована ее цель, определены научная новизна и практическая ценность работы. Кратко изложены основные результаты выполненный исследований.
В первой главе изучаются статистические эксперименты, в которых у части реализаций (A'i, ..:, Х„) случайного вектора t, по ряду причин наблюдаются не конкретная величина, а некоторое множество возможных значений, которые определяют структуру выборки. Дается описание обобщенной математической модели такого типа эксперимеота и связанных с ним понятий.
В параграфе 1.1. предложена обобщенная математическая модель случайного цензурирования в виде отображения О : П-> Q пространства значений Q случайной величины С, в себя такое, что для любого X е£) справедливо
(i) CV'm = {х: G(x) = А'},
(ii) А' бСГ'(А') .
При этом, вне зависимости от схемы или модели формирования цензурированиях данных, каждая реализация .1" случайной величины I единообразно представляется цензурирующим множеством С, которое определяется как аа полный прообраз в эксперименте О, а наблюдаемая статистика (или ценчурированная выборка) имеет вид
где --О к I,. ..и. и - обьем выборки. В дальнейшем
также используется обозначение - G где Xr, ~ (A'],...,A'„).
Показательным примером эксперимента такого типа является отображение случайного вектора Л' = (хз ,х2) при Р(Х] = х2) = 0:
с-НХкУ
1(Х,,1
(1)
х2) : X] е(х2к,<х>), х2 =-*2Ь 0сли х\к >х2к х2> •' х1=х1 к> х2 е(*и>с°). если хи <х2к, соответствующее модели конкурирующих рисков. На рис. 1 приведена схема цензурированной выборки, соответствующей рассмотренному отображению, где сплошной линией выделены цензурирующие множества Ск, к = 1 ,...,п
Далее, в рамках предложенной модели исследуются известные схемы цензурирования, впервые дается классификация многомерных цензурированием данных по их структуре, которая обобщает известные "одномерные" классификации и используется в последующих разделах диссертации при совершенствовании теории их статистического анализа. Построение обобщенной математической модели случайного цензурирования явилось первым этапом на пути разработки общих методов статист! еского анализа цензурированных данных различной структуры. Вторым ключевым моментом для разработки таких методов явилось построение в рамках обобщенной модели цензурирования аналога обычного эмпирического распределения.
С этой целью в параграфе 1.2 для цензурированной выборки
0"'(ХП) на к юсе всех возможных распределений С определен функционал
Рис.)
11 к - ]
?(В)е&\ ВеЯ
(2)
и изучается ег о неподвижная точка
£(») = - Ы,(В\Ск ), Р*(В) еР, В «=<К , (3)
"1-1
названная кпаэиэмпирическим распределением, где \\ЩС) -условная вероятность события К\ 91 - а-алгебра борелевсжих множеств.
Поясним вероятностный смысл квазиэмпирического распрв-деления на следующим примере. Рассмотрим цензурировамную справа выборку, полученную в рамках модели независимых конкурирую щих рисков (1), содержащую всего одно цензурированное наблюдение с помором г. При построении обычного эмпирического распределения вес каждого наблюдения принимается равным 1/п. Для цензурированого наблюдения поступаем аналогичным образом. Однако не ясно, какому элементу выборочного пространства эгот вес приписать. Квазиэмпирическое распределение решает эту проблему и регламентирует перераспределять вес цензурированного наблюдения пропорционально распределению исследуемой случайной величины при условии, что наблюдение цонзурировано множеством
Функционал (2) для рассмотренной выборки имеет вид
Г,
п
к - 1
_ н и{Г„-Г'"г)
а его неподвижная точка
к <г
к > г,
(4)
к - 1 ^ тах(0.& - г) п п(п-г)
Очевидно при к- п значение квазиэмпиричоского распределения равно 1, а вклад цензурированного наблюдения, соответствующий второму слагаемому и (4), равен |/н.
Построение обобщенной модели случайного цензурирования и квазиэмпирического распределения позволило подойти, к разработке методов статистического анализа цензуриропанных
данных по классической схеме, используемой для полных данных. Такие исследования проведены в параграфах 1.2 - 1.3.
Получено выражение для дисперсии квазиэмпирического распределения и найдена ее несмещенная оценка в общем слу\_.е цензурирования в виде:
= -—-г — + )(1 - Р»(В1Ск
/1-1 11(.П-1)1С=\
Легко заметить, что квазиэмпирическое распределение и его выборочная дисперсия обобщают аналогичные выражения для полных данных. И более того, квазиэмпирическое распределение наследует основные свойо ва эмпирического распределения такие, как состоятельность и асимптот ическая нормальность.
Установлено (теорема 1.1), что если функционал (1) имеет единственную неподвижную точку для любого В е У!, то при л —> да последовательность кваэиэмпиричвских распределений (аналогично случаю полных данных) неограничено об лижа сися с исходным распределением Р наблюдаемой случайной величины:
рв(Л)=-2:адс*)—при
"*=I пн
Го есть неизвестное распределение Р (в каждой "точке" В) может быть сколь угодно точно восстановлено по цензурированной
выборке О ' {Хп) достаточно большого обьема. Однако имеет место и более сильное утверждение (теорема 1.2 и ее следствия) о том, что такая сходимость в определенном смысле равномерна по В, то есть
51ф|Р„(Я^-Р(Я)!->0, при н-»со.
В 1:9?
Это утверждение является обобщением фундаментальной теоремы Гливенко-Кантвлли о равномерной сходимости распределений, которое получено при дополнительном предположении, чп поток
"вложенных о-алгебр £91^,' с...с9^' £91,., порожденный выборками {(.*|,С.2.....('„}, п = 1,2,3, , образует конечно-
аппроксимируемый, относительно пары {0,Р}, класс множеств 3 из
Это означает, что для любого е >0 можно указать п< °° такое,
что для любого ВеЗ найдутся множества Л\ и Л2 из со свойствами:
Л, сВсЛ2, Р (А]-А2)<г.
Исследование асимптотического распределения величины Р„(В) показало (теорема 1.3), что она представима в виде
Р„(В) = Р(Я) + ^, л/и
где случайная величина т]„ слабо сходится к нормальному
распределению с параметрами (0, =1)[Р„(Д)]).
В параграфе 1.4. показано, что определение квазиэмпирического распределения в виде (1) не единственно возможное, а в ряде случаев и не самое естественное. Так, если заранее известно, что исходное распределение Р имеет плотность, то принятое определение не удобно тем, что оно является сингулярным относительно меры Лебега, и стало быть не имеет плотности. Для таких случаев, в рамках исследуемой математической модели эксперимента О, получено выражение для сглаженных (ядерных) распределений и плотностей в виде
где /Г' (II - х) - множество точек у е С , для которых х + у!г„ е Л;
Ип -» 0 при п— > со; я - некоторая плотность; - кваэиэмпирическая
функция распределения, соответствующая (3). Полученные при таком подходе оценки обладают основными типами сходимости плотностей, присущими аналогичным оценкам по полным данным.
В параграфе 1.5. исследуются два класса статистик, которые строятся с помощью двух видов функционалов от функции
распределения С?.
I. Функционалы вида ™«3) = Л(Ндг)<10(:г)). где у/ - заданная борелевская функция, Л - функция, непрерывна? г точке а = ]и(.х)с1Р(л), где И - функция распределениях
И. Функционалы W(Q), непрерывные в "точке" Р в
равномерной метрике: ?/((}„)->■ если 5ир|С^я(х)-Г(х)|—>0
х
и носители распределения принадлежат носителю Р. Здесь Р так же означает функцию распределения Л'.
Установлено (теорема 1.5), что широкий класс функционалов от квазиэмпирического распределения с ростом объема выборки неограничено сближаются с соответствующими "теоретическими" значениями, то есть
Оценки функционалов I типа, кроме того, являются (теорема 1.6) асимптотически нормальными.
Таким образом, цензурированная выборка позволяет оценивать не только само распрёделение, но и функционалы от этого распределения (по крайней мере те, которые принадлежат одному из исследованных в работе классов). Этот факт имеет принципиальное значение, так как показатели надежности и другие выборочные характеристики являются функционалами от соответствующих распределений.
Во второй главе проведено исследование методов с, ¡тисти-ческого анализа моделей случайного цензурирования, изучены классы как параметрических, так и непараметрических оценок распределений и функционалов от них.
В параграфе 2.1. рассматривается обобщенная оценка максимального правдоподобия функции распределения по многомерным цензурированным данным, под которой понимается такая мера Р на О, для которой
ПР(С*) = тахПР(С*), *=1
где максимум берется по всем Y еР таким, что P[G '(Хп)]>0. Определены необходимые и достаточные признаки (теорема 2.1) того, что вероятностное распределение Р является обобщенной оценкой максимального правдоподобия для Р на Q. Показано (теорема 2.2), что квазиэмпирическое распределение является обобщенной оценкой максимального правдоподобия и, что любая другая оценка максимального правдоподобия необходимо является квазиэмпирическим распределением, то есть они совпадают.
Исследование функции правдоподобия показало, что сама функция и множество значений, в которых достегается ее максимум, выпуклы (теорема 2.3). Однако это не доказывает, что максимум должен быть единственным. Единственное решение уравнения максимального правдоподобия имеет место, когда итерационный алгоритм, основанный на выражении (3) квазиэмпирического распределения,' является сжимающим отображением. Условия сжимаемости зависят от выбора метрического пространства. В диссер.ации рассмотрены два варианта - пространство
с метрикой р(х,у) - max|-Ti ~ Уч\ и пространство с метрикой
1£1<Н
in Л1А
р(х,>>)= ~Z(xi -y¡) . A"51 которых получены достаточные условия единственности решения уравнения максимального правдоподобия (теорема 2.4).
Более подробно в работе рассмотрен класс многомерных моделей цензурирования с дискретно разделимым семейством вероятностных мер, ранее исследованный Ю.К.Беляёвым применительно к схеме одностороннего цензурирования справа. Преимущество этого класса моделей заключается в том, что оценка маргинальных распределений проводится на основе единых формул. При этом упрощается их использование и разработка соответствующего программного обеспечения.
Исследования многих авторов показывают, что в ряде случаев цензурирования оценка максимального правдоподобия теряет свои оптимальные свойства. Например, в работах Благовещенского Ю.Н.
показано, что даже для модели конкурирующих рисков существуют оценки, которые при малых выборках дают лучшие результаты. В сложных и, тем более, многомерных схемах цензурирования ситуация еще более усложняется. Поэтому представляется рациональным разработка альтернативных классов оценок и исследование их свойств.
В этой связи в параграфе 2.2. предложен класс аддитивных оценок функций распределения по многомерным цензурированным данным в виде:
. "1 **
F„ (*) = mi»(l, 2>tPn (jf|Ct)), (6)
k-A
обобщающий класс оценок максимального правдоподобия (при fih k = 1,...,/( выражение (5) совпадает с (3)), где рк е(0,1) -
вес А-ого элемента выборки, Ä=1.....п. Доказано (теорема 2.7), что
при условии
lim I ns sup|l - [л\п\ = С < да
n-*°ov к J
И
lim fns supjl - /4'л|I = <
n—»oüV к J
оценки этого класса эквивалентны с асимптотикой /Г5, s> 0 для всего класса оценок, то есть
к
где F' и F"- аддитивные оценки, а //'и//"- соответствующие им веса, С = С'+ С" < оо - некоторые константы.
Выражение (5) позволяет построить серию оценок с "хорошими" асимптотическими свойствами. Например, для схемы ; одностороннего цензурирования справа оценки этого класса получены в явном виде (теорема 2.8)
1 . SrPr
1- 5>„
<6)
m<r
где ök - индикаторная функция принимающая значения О или 1, если fc-ая реализация полная или цензурированная справа, соответственно. В диссертации показано, что это выражение обобщает известные статистики LG.Jonson, W.Nelson, E.L.Kaplan и P.Meier. Построены их аналоги для различных схем и моделей цензурирования.
Настоящая работа ориентирована, в основном, на разработку непараметрических оценок. Это связано прежде всего с тем, что цензурирование по своей природе всегда многомерно, а поэтому во многих случаях сложно или даже невозможно подобрать параметрическое семейство, способное адекватным образом описать данные такого типа. Однако ряд практических задач надежности, особенно задачи связанные с обобщением и представлением статистической информации в сжатом виде, требуют оценки параметров распределений.
Поэтому в параграфе 2.3 рассмотрены методы оценивания неизвестных параметров распределений и других выборочных характеристик. При их разработке исходили из принятого в работе требования к расчетным алгоритмам - они должны быть простыми и, в тоже время, универсальными. Этим требованиям более всего удовлетворяет принцип подстановки эмпирического распределения, который заключается в следующем. Пусть неизвестный параметр в представим в виде некоторого функционала W от распределения F,
то есть 9 = W(F), а F* означает эмпирическую функцию распределения. Тогда метод подстановки предписывает в качестве оценки взять величину
0*=W(i;*). (7)
Принцип подстановки естественным образом обобщается на случай цензурированных данных. Для этого в выражении (7) в качестве следует использовать квазиэпирическую функцию распределения.
г
Используя результаты параграфа 1.5. показано (теорема 2.8), что при определенных условиях оценки по методу подстановки квазиэпирического распределения являются состоятельными и асимптотически нормальными.
Для приложений представляет интерес реализация принципа подстановки квазиэмпирического распределения, основанная на методе минимального расстояния. В этом случае за оценку неизвестного параметра 0 принимается значение 9 е©, для которого
в£в
где р(1\С>) - некоторый функционал от двух распределений, обладающий тем свойством, что, как функция от (}, он достигает минимума при <^>1 и > р(р, Г') при У * I'. При этом величину
р(Р,р) интерпретируют как "расстояние" между Г и С), а Е' - как значение при котором р(р,(2) достигает своего наименьшего
значения. В качестве К* - может быть использована квазиэмпи-
п
рическая функция распределения в любой рассмотренной ранее форме.
*
Наиболее просто метод реализуется, если в качестве 1;п использовать неподвижную точку функционала
пк=\
который дает сглаженную оценку квазиэмпирическсй функции распределения. Для построения таких оценок разработан итерационный алгоритм, основанный на методе последовательных приближений.
В третьей главе рассматриваются алгоритмы и методы анализа цензурированных данных, основанные на использовании ЭВМ и математического моделирования.
Оценивание параметров распределения тесно связано с задачей проверки их согласия. В настоящее время точных критериев не существует для многих параметрических семейств
распределений даже для полных данных. При разработке критериев согласия по цензурированным данным необходимо дополнительно учитывать модель цензурирования, что еще более осложняет задачу.
Поэтому в параграфе 3.1 рассматривается алгоритм приближенного построения критериев согласия по цензурированным выборкам и оценивания его мощности при простой альтернативе на основе бутстреп-метода. Предложенный алгоритм отличается простотой и универсальностью - легко настраивается на различные статистики (расстояния) критерия и модернизируется под любые модели цензурирования.
Исследование свойств критериев согласия методом математического моделирования показало:
- точность оценивания распределения статистики критерия зависит от числа "бутстрепов". Последний показатель определяется рядом параметров модели цензурирования и структуры выборки. Наиболее заметное влияние оказывают объем выборки и доля полных наблюдений - при их увеличении возрастает точность, а поэтому требуется меньше "бутстрепов";
- вид распределения статистики критерия определяется структурой выборки и стабилизируется одновременно с ней;
' - критерий удовлетворительно "улавливает" возможные отклонения параметров, характеризующих масштаб распределения и, в меньшей степени, отклонения параметров, характеризующих форму распределения от соответствующих параметров основной гипотезы.
Предложенный алгоритм может быть достаточно эффективно использован для сравнения различных критериев по мощности при простои альтернативе. Это иллюстрирует рис.2, на котором
Рис. 2
приведена зависимость мощности критерия от показателя степени р статистики критерия
р«г,н)=(я<г(/)-р(о|/'<1/)'
у.
при различных критических значениях.
Кроме этого, математическое моделирование использовалось для проверки точности разработанных методов. Для изучения точности оценивания наиболее важных с практической точки зрения показателей надежности (вероятности безотказной работы и у-процентного ресурса) спланировано и проведено сг. циальное моделирование в широком диапазоне изменения параметров модели.
Методика моделирования рассмотрена в параграфе 3.2 на примере схемы одностороннего цензурирования справа. В качестве характеристики точности используется величина
' п ■
связывающая теоретическое значение у - процентного ресурса с
его оценкой /*, где Я = г +(/,, -/г)/(/г + 1 - 1Г); Я* = -*+(/*-)/ *
- * •); г (г ) ■- ранг порядковой статистики (г = тах/к,
к\1к<1г (¡г- = тах^., к : ¡¡¡<1*) общего вариационного ряда, состоящего из полных и ценэурированных наблюдений; п - объем
выборки. При этом нижняя доверительная граница уровня а
оценки у - процентного ресурса выражается через порядковые статистики общего вариационного ряда как
где Яа =Я* + (1 га - ранг статистики 1Г = тах^, к < е"
- квантиль уровня а распределения погрешности сг
В предложенной методике величина е" определялась по
результатам статистического моделирования как функция от ранговых статистик
Щ =~ Т,к'5к,к = 1,2,3,...,
где / - порядок момента; - индикаторная функция равная 1, если к-ое наблюдение цензурировано, и 0 в противном случае.
Моделирование, проведенное с целью изучения свойств непараметрических аддитивных оценок функции распределения по односторонне и двусторонне цензурированным выборкам, показало:
модель цензурирования определяет устойчивую в статистическом смысле структуру выборки; точность оценивания существенным образом зависит от взаимного расположения полных и цензурированных наблюдений в общем вариационном ряду, то есть от структуры выборки;
предложенные ранговые статистики позволяют с приемлемой для практических целей точностью идентифицировать структуру выборки;
- с увеличением объема выборки ее структура достаточно быстро стабилизируется. Математическое ожидание большинства ранговых статисгик стабилизируется начиная с обьема выборки п > 30, а среднее квадрат ическое отклонение - начиная с п > 60;
- точность оценивания увеличивается с ростом объема выборки. При этом наиболее информативными являются полные наблюдения и увеличение их доли приводит к резкому повышению точности оценок;
М = пц\
Л = (/N3 - 3/»2щ +2) / о3; Е = (пц - щ + впьгп^ - Ът¡*) / ст4
где
21
- смещение оценок относительно их среднего значения и медианы обратно пропорционально точности: чем выше точность -тем меньше смещение.
По результатам моделирования получены регрессионные зависимости, позволяющие рассчитывать непараметрические доверительные границы и смещение исследуемых показателей надежности по малым выборкам.
В четвертой главе рассмотрено применение многомерных моделей случайного цензурирования для описания данных о надежности различных технических систем.
а- В параграфе 4.1. рассматриваются модели цензурирования, возникающие в задачах оценивания показателей надежности деталей машин по постепенным отказам - в следствии их износа, роста усталостных трещин и других монотонных параметров деградации изделий. В этом случае основной характеристикой надежности является динамика их процесса старения, под которой понимается эавк имость средней или у - процентной наргботки от
значения параметр;! процесса, соответственно 1(11}) или ty(Uj).
В диссертации рассматривается самая сложная и наиболее распространенная ситуация, когда инс|юрмация о процессе старения деталей, например об их износе в процессе тксплуатации, собирается методом разовых обследований при поступлении машины в ремонт,'в результате чего исходная информация о процессе изнашивания £,((/) имеет вид
{ик,хк}, ¿ = 1.....и, (8)
где ик - износ к-ой детали при наработке т^; п -объем выборки (количество обследованных деталей). Графически- такая информация представляется в виде "облака" точек Ни плоскости II х Г.
Расчет динамики изнашивания проводится последовательно для ряда уровней износа V^, / = 1....,т из интервала наблюдаемых
значений II^ е(0. птахн;). С этой целью на каждом исследуемом уровне износа (/у формируется выборка наработок ею достижения реализациями процесса изнашивания £,(£/), по которой
оценивается ее функция распределения среднее / или у -
процентное значение. Выявленная зависимость 1(11 ^) или /^({У,), ] - 1.....т является искомой динамикой изнашивания.
Ключевым моментом рассматриваемой методики является формирование выборок наработок = достижения
реализациями уровня износа IIу Ввиду того, что информация о процессе имеет вид (3), данные о наработках представляются двусторонне цензурированной выборкой. Схема формирования указанных выборок иллюстрируется следующим примером.
Рассмотрим произвольный элемент (ик,хк) выборки (3), полученный в результате разового замера износа к-ой детали (см. рис. 3). Из монотонности реализаций реального процесса изнашивания следует, что до момента контроля хк исследуемая реализация как-то развивалась внутри прямоугольной области, ограниченной осями координат и прямыми и = ик и / = В момент т^ она достигла уровня износа (/ = !<£ , что и было зафиксировано в результате микрометража детали. Если продолжить эксплуатацию к-ой детали далее (за момент контроля хк), то, очевидно, реализация ее процесса изнашивания будет развиваться в области с износом и ^ и^. . На рис.3 определенная таким образом область заштрихована.
Анализ рис.3 показывает, что момент пересечения А-ой реализацией процесса Е.(¿/) уровня износа (/у цензурирован слова при 11.<ик и принадлежи т интеркиту (0,1к) или цензурирован
*г
Ч
Рис. 3
справа при и принадлежит интервалу (тк,<в). Если
подобным образом проанализировать все и элементов выборки (8), то для каждого исследуемого уровня износа (/, е(0,тахиу), в общем случае, найдутся наблюдения, цензурированные как слева, так и справа. Следовательно искомая выборка - двусторонне цензурирована, а для ее обработки можно использовать методы, разработанные в главе 2.
Предложенный способ построения динамики изнашивания по данным разовых обследований защищен авторским свидетельством на, изобретение, реализован в виде межотраслевой методики, учебного пособия и пакета прикладных программ для ЭВМ, который внедрен в ряде научно-исследовательских организаций и машиностроительных заводах. Метод нашел широкое применение при изучении закономерностей изнашивания и надежности деталей сельскохозяйственных тракторов и двигателей внутреннего
4 приведена динамика изнашивания первичного вала КП трактора ДТ-75М по наружному диаметру шлиц.
В результате выполненных исследований решен ряд практических задач:
- обоснованы вы-браковочные характеристики (предельные и допустимые износы) деталей сельскохозяйственных тракторов общего назначения класса 30 кН;
- оценены показатели надежности и выявлена номенклатура деталей лимитирующих ресурс трактора;
- для наиболее важных (с точки зрения надежности) типовых элементов конструкции трактора - неподвижных цилиндрических соединений (корпус, стакан, подшипник и вал) и переключаемых шестерен коробки передач - разработаны и внедрены мероприятия
сгорания. В ка1 -стве примера на рис.
Нжрйботка, тис. мин» -ч
Рис. 4
по повышению их износостойкости. Полученная при этом новая, износостойкая геометрия торцев зубьев переключаемых шестерен защищена авторским свидетельством на изобретение.
В параграфе 4.2. полученные результаты применены к задаче ускоренных испытаний, когда надежность изделий определяется рядом одновременно ненаблюдаемых случайных параметров, впервые рассмотренной Г.Д.Карташовым. Применение методов, разработанных в главе 2, позволило снять предположения, касающиеся параметризации распределений и их непрерывности. Поясним сказанное на примере плана эксперимента по изучению статической прочности клеевых цилиндрических соединений при осевом сдвиге в зависимости от температуры испытаний.
Положим, что случайные величины ^ и ¡;2 характеризуют статическую прочность клеевого соединения при температурах ^ и Ь, соответственно. Задаются некоторой случайной величиной распределенной независимо г.т и Произвольно выбранное изделие помещают в камеру с температурой /1 и повышают осевую нагрузку до значения В результате определяется величина <; = причем
наблюдения организуют так, что всегда известно какое из событий или (5,>Ы произошло. Если окажется, что (5)<53), то эксперимент прекращают, в противном случае при (* ] > ) изделие переводят в камеру с температурой и постепенно повышая нагрузку доводят его до разрушения Тем самым получают реализацию вектора (5.^,^э) при При этом,
С,
с.
. . ;С1
Рис. б
2Ь
конечно, предполагается, что если изделие не отказало в режиме /], то оно и не утратило свои первоначальные свойства.
Формально эксперимент такого типа задается отображением
(Х!,Х2,Х3) : X, =Хц,Х2 б(-»,а5),х3 = (ги,сс), если хп <хи (к,,к2,х3) : X! е(ли,<о),х2 = л:2ЬХз = ХзЬ если >хи. На рис. 5 приведены проекции цензурирующих множеств , к = 1,2 на координатные плоскости х х <,2 * ^з-
Задача заключается в построении совместного распределения Г] 2 случайного вектора ({,] ,£,;> )■ Учитывая, что в
рассматриваемом эксперименте цензурирующее множество может быть только двух типов
п ¡(-ХИ' если хп <хи.
-х2к)- если .Гц >хц., то кавазиэмпирическое распределение имеет вид
т./2>«;;
, Р(х,=.*и.х2 <12)иг , , ч.
Это выражение фактически определяет алгоритм построения оценки совместною распределения методом после/юза гельных приближений. Показано (теорема 4.1 и ее следсшие), что рассматривав ,ая задача имеет единственное решение, получено точное выражение оценки квазиэмпирического распределения, доказана ее состоятельное! ь и асимптотическая нормальность.
Результаты исследований использовались при разработке типовых методик ускоренных испытаний РЭА на безотказность и дол!онечность (РМ В 22.31.144-УО), который прошли апробацию на широком классе комплектующих изделий и РЭА военного назначения.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ
В диссертации разработаны принципы и методы позволяющие с единых позиций изучать оценки распределений и Функционалов от них по цензурированным данным с различными схемами и моделями их формирования.
Основные результаты работы заключаются в следующим: '
1. Разработана обобщенная математическая модель случайного цензурирования, которая обобщает различные схемы и модели формирования цензурированных данных и позволяет единообразно представлять их через цензурирующие множества.
2. Получено выражение квазиэмпирического распределения, которое для цензурированных данных выполняет роль обычного эмпирического распределения, обобщает, и, при определенных условиях, наследует его основные свойства, такие как состоятельность и асимптотическая нормальность.
3. Доказан аналог теории - / Гливенко-Кантелли о равномерной сходимости квазиэмпирических распределений.
4. Получено выражение дисперсии квазиэмпирического распределения и найдена ее несмещенная оценка в общем случае цензурирования.
5. Показано, что в рамках исследуемой модели эксперимента построение сглаженных (ядерных) распределений и плотностей проще и естественней.
6. Установлено, что широкий класс функционалов от квазиэмпирического распределения с ростом объема выборки неограниченно сближаются с соответствующими "теоретическими" значениями.
7. Получены необходимые и достаточные условия того, что оценка распределения является обобщенной оценкой максимального правдоподобия. Показано, что квазиэмпирическое распределение удовлетворяет этим условиям.
0. Разработан итерационный алгоритм построения оценки максимального правдоподобия, определены условия его сходимости и единственности решения.
9. Предложен класс аддитивных оценок функции распределения по цензурированным данным, обобщающий класс оценок максимального правдоподобия. Показано, что при
определенных условиях оценки этого класса асимптотически эквивалентны.
10. На основе принципа подстановки квазиэмпирического распределения обобщен метод минимального расстояния для оценивания неизвестных параметров распределения по ценэурированным данным различной структуры и доказана его состоятельность.
11. Разработана методика построения непараметрических доверительных границ гамма-процентного ресурса и вероятности безотказной работы на основе метода Монте-Карло и проведено соответствующее моделирование.
12. Разработан алгоритм приближенного построения критериев согласия по цензурированным выборкам и оценивания его мощности при простой альтернативе на основе бутстреп-метода. Исследованы свойства критериев согласия методом математического моделирования.
13. На осгове полученных результатов усовершенствованы известные методики статистического анализа монотонных процессов старения изделий машиностроения по цензурированным данным и методики планирования ускоренных испытаний, когда надежность изделий определяется рядом одновременно ненаблюдаемых случайных параметров.
14. Исследованные в работе модели и схемы случайного цензурирования хорошо описывают структуры данных, характерные для широкого круга практически важных задач теории надежности. К этим структурам относятся, в частности, данные об износах деталей, росте усталостных трещин и других монотонных параметров деградации изделий; данные возникающие при организации эксплуатационных наблюдений и ускоренных испытаний на надежность и пр.
15. Полученные результаты нашли широкое применение при изучении закономерностей изнашивания и I здежности деталей сельскохозяйственных тракторов, двигателей внутреннего сгорания, изделий электронной техники и др. В результате выполненных исследований решен ряд практических задач:
- обоснованы выбраковочные характеристики (предельные и допустимые иэносы) деталей сельскохозяйственных тракторов общего назначения класса 30 кН;
- оценены показатели надежности и выявлена номенклатура деталей лимитирующих ресурс трактора;
- для наиболее важных (с тонки зрения надежности) типовых элементов конструкции трактора разработаны и внедрены мероприятия по повышению из износостойкости.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Пули повышения степени использования ресурсов по износу деталей тракторов / С.П.Козырев, Л.М.Лельчук, В.Н. Баскаков и др. // Вестник машиностроения. - 1982, № 1. - С. 29-31.
2. A.c. 1023225 (СССР). Способ определения динамики износа дегалей машин / С.П. Козырев, Л.М. Лельчук, М.Е.Марон и др. // Б.И. - 1983, № 22.
3. Значения предельных износов в сопряжениях и деталях шасси тракторов ДТ-75/75М / В.П.Важдаев, Н.И.Селезнев, Л.М. Лельчук и др. - М.: ОНТИ НАТИ • 1983. - 17 с.
4. Лельчук А.Л., Баскаков В.Н., Молотников М.Д. Оценка динамики изнашивания деталей машин . // Механизация и электрификация сельского хозяйства. - 1985, № 3. - С. 52-54.
5. A.c. 1151733 (СССР). Механизм переключения зубчатых передач /В.Н.Баскаков, С.Б.Иваниди, С.П.Козырев и др. // Б.И. -1985, № 15.
6. Методические указания по оценке динамики изнашивания деталей машин в условиях специализированных ремонтных предприятий: Учебное пособие / В.Н.Баскаков, АЛ.Лельчук; под. ред. Н.Ф.Тельнова. - М.: МИИСП, 1985. - 42 с.
7. Определение прочности цилиндрических соединений деталей тракторов, восстанавливаемых анаэробными материалами (на примере корпуса трансмиссии трактора ДТ-75М) / В.Н.Баскаков, П.Б.Дейнега, А.М.Карапатницкий и др. // Труды ГОСНИТИ, 1985, Ne 73. - С. 3-12.
8. Баскаков В.Н., Комаров В.А., Округ А.И. Исследование закономерностей изнашивания элементов неподвижных цилиндрических соединений коробки передач тракторов ДТ-75/75М статистическими методами // Совершенствование тракторных конструкций: Тез докл. Всесоюзн. конф. - М., 1935, С. 194-195.
9. Баскаков В.Н. Непарамвтрическое оценивание функции распределения при двустороннем случайном цензурировании // Совершенствование методов контроля надежности машиностроительной продукции и их стандартизация: Тез. докл. Всесоюзн. конф. - Горький, 1985. - С. 202-203.
10. Методика испытаний деталей сложных машин на износостойкость в условиях эксплуатации / Л.МЛельчук, В.Н. Баскаков, А.Л.Лельчук и др. // Трение, износ и смазочные материалы: Тез. докл. Международн. конф. - Ташкент, 1985, Т. 5. -С. 76-77.
' ■ 11. Определение показателей надежности тракторной техники по результатам сокращенных (по продолжительности) испытаний: Временные методические указания / В.Н.Баскаков, В.П.Важдаев, А.Л.Лельчук и др. - М.: ОНТИ НАТИ, 1987. - 42 с.
12. Баскаков В.Н. О непараметрическом доверительном оценивании гамма-процентного ресурса по цензурированным данным // Надел ость и контроль качества. - 1988, № 7. - С. 26-31.
13. Баскаков В.Н. Оценивание показателей надежности по результатам цензурированных наблюдений // Исследование и оценка надежности тракторной техники: Труды НАТИ. - М.: ОИНТ НАТИ, 1988. - С. 40-48.
14. Баскаков В Н. Комплекс программ для оцен. 1 надежности изделий машиностроения //ИЛ. - М.: МГЦ НТИ. - 1988. - 88-274.
15. РД 23.3-87. Отраслевая методика ускоренных испытаний коленчатых валов тракторных и комбайновых двигателей на сопротивление усталости / Н.С.Антонов, С.Г.Фрейдин, В.Н.Баскаков и др. - Владимир: НИКТИД, 1988. - 28 с.
16. РД 10.16.0002-012-87. Оценка надежности восстанавливаемых деталей по постепенным отказам / Л.МЛепьчук, В.Н. Баскаков, А Л Лельчук и др. - М.: ГОСНИТИ, 1988. - 28 с.
17. Карапатницкий А.М., Дейнега П.Б., Баскаков В.Н. Исследование несущей способности анаэробных клеев в цилиндрических соединениях // Тракторы и сельхозмашины. - 1989, № 2. - С. 27-30.
18. Баскаков В.Н. Непараметрическая оценка максимального правдоподобия по цензурированным данным // Эксплуатация и надежность технических систем и комплектующих изделий. -Севастополь: ЧВВМУ им. П.С.Нахимова, 1990. - С. 34-38.
19. Баскаков В Н. Непарамотрические методы оценивания по цешурировинным данным // Моделирование и контроль качества в задачах обеспечения надежности радиоэлектронных устройств: Тез. докл. Международн. семинара. - Шауляй, 1992. - С. 37
20. Баскаков В.Н. Об одном аналоге эмпирического распределения для многомерных ценэурированных данных // Статистические методы оценивания и проверки гипотез. - Пермь: ПГУ, 1993. - С. 41-51.
21. Баскаков В.Н. Некоторые принципы построения оценок по цензурированным данным // Актуальные проблемы фундаментальных наук. - М.: МГТУ им.Н.Э.Баумана, 1994, Т.1, №2, - С. 7-9.
Подлисино к печли 22.С8.95 \. Зака* IIb _. Пбьем 2 0 пл. Тира« 100 bkj. Типе! рлфия МГТУ им. H-O-Bü/p^ana.
-
Похожие работы
- Разработка алгоритмического обеспечения и исследование обобщенных моделей пропорциональных интенсивностей
- Исследование методами компьютерного моделирования свойств оценок и статистик критериев согласия по группированным и цензурированным выборкам
- Статистическая обработка экспериментальных данных с учетом различных типов симметрии распределения
- Исследование специальных моделей кривых дожития в условиях неполных данных
- Системный анализ надежности нефтяных промысловых трубопроводов по малым выборкам
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность