автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Разработка и исследование критериев проверки гипотез случайности, независимости и однородности

кандидата физико-математических наук
Чепурко, Валерий Анатольевич
город
Обнинск
год
1998
специальность ВАК РФ
05.13.16
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование критериев проверки гипотез случайности, независимости и однородности»

Текст работы Чепурко, Валерий Анатольевич, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)



¿✓V ? V - " , ./ /7 «У

¿/■<¥... /9

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

ОБНИНСКИЙ ИНСТИТУТ АТОМНОЙ ЭНЕРГЕТИКИ

На правах рукописи.

, . УДК 519.24:621.039.58

Чепурко Валерий Анатольевич

Разработка и исследование критериев

проверки гипотез случайности, независимости и однородности.

Специальность 05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель: доктор технических наук,

профессор Л.В.Антонов.

Обнинск 1998

СОДЕРЖАНИЕ. ВВЕДЕНИЕ. 3

ч. ■ ." ■'■'■•■■'.

ГЛАВА 1. ПРОВЕРКА ОДНОРОДНОСТИ. 10

1.1 Постановка задачи............................................... 10

1.2 Обзор и анализ методов проверки однородности выборок........ 10

1.3 Распределение критерия подобия в предположении нормальности исходных распределений.......................... 17

1.4 Аппроксимация распределения...............---------------;...20

1.5 Построение критерия......................................................21

1.6 Распределение критерия подобия в предположении о гамма-законе исходных распределений.................................. 25

1.7 Критерий подобия, как инвариантный, локально наиболее мощный..................................................'......... 27

ГЛАВА 2. ПРОВЕРКА НЕЗАВИСИМОСТИ. 34

2.1 Постановка задачи исследования............, л . .................34

2.2 Критерий Гёфдинга. Нормировка........... .. .. .................35

2.3 Проекция статистики И в семейство линейных

ранговых статистик..............................................40

2.4 < Зависимость известных статистик от е- расстояния.............53

ГЛАВА 3. ПРОВЕРКА СЛУЧАЙНОСТИ. 60

3.1 Постановка задачи. Критерии Кендалла, Спнрмена........ 60

3.2 Критерий смешанных произведений Мп. Основные свойства. .. .64 . 3.2.1 Критерий Мп как РИМ против альтернатив

гиперболического убывания..................................... 66 1

3.3 Распределение статистики Мп................................... 69

3.3.1 Некоторые неравенства и зависимости........................... 70

3.3.2 Аппроксимация распределения................................... 72

3.4 Интегральный критерий..................... ................... . 81

3.4.1 Формулировка интегрального критерия.........................83

3.4.2 Свойства компонент интегральной статистики................... 85

3.4.3 Статистика ПК..................................................92

3.4.4 Числовые характеристики Ш? и её связь

со статистикой Спирмена К..................................... 94

2 2

3.4.5 Статистики (»S^) , (ST{ ~П ................................. ......97

3.5 Нормировка интегрального критерия, его распределение при Нп.100

3.G Критерий локального тренда.................................... 107

3.6.1 Скорость сходимости модуля статистики Сппрмена. . ..........113

ЗАКЛЮЧЕНИЕ. 117

ПРИЛОЖЕНИЕ. 118

ЛИТЕРАТУРА.

140

ГЛАВА 1. ВВЕДЕНИЕ.

Общая характеристика работы.

Актуальность темы. Новые экономически« условия диктуют не-

обходимость изыскивать резервы более эффективной организации функционирования действующих АЭС. В этих условиях * I »од-..исследователями встает ряд задач, решение которых позволит по но^ыу подойти, к проблеме эксплуатации систем, блоков и АЭС в целом. Основные из них:

• обоснование возможности продления ресурса отдельных систем или блоков АЭС. Планируемый срок эксплуатации блоков АЭС определен в 30 лет. Ресурс отдельных видов оборудования и систем еще более ограничен. При достижении критического срока необходимо проводить комплексное обследование систем. Центральное место в этом обследовании занимает анализ надежности элементов и систем с целью выявления остаточного ресурса; ,

• проведение вероятностного анализа безопасности АЭС (ВАБ). При этом одновременное использование априорной информации, информации от объектов аналогов значительно улучшает качественные характеристики оценок. В этом случае перед исследователем встаёт задача проверки гипотезы об однородности информации.

Теория проверки гипотез представляет собой развитую ветвь математической статистики. Критерии проверки гипотез находят широкое применение в научных исследованиях, связанных »:; обработкой и исследованием статистической информации, в экономических и социологических исследованиях, в теории надежности и т.д..

Для решения задач проверки гипотез используются, критерии согласия, определяющиеся заданием критической области в выборочном пространстве. Качество критерия характеризуется вероятностью отвергнуть истинную гипотезу. Чем меньше эта вероятность, тем лучше критерий. С другой стороны, критерий характеризуется вероятностями принять ложную гипотезу (эта вероятность зависит, естественно, от того, каким является истинное распределение статистики). Эти вероятности также желательно сделать как можно меньшими. Оптимальным критерием является такой,

у которого при заданном уровне значимости достигается максимальное значение функции мощности. Если задача сводится к проверке простых гипотез против простых альтернатив, то критерий обладающий оптимальными свойствами строится на основании фундаментальной леммы Неймана-Пирсона. Если же усложнить гипотезу или альтернативу, то построение оптимального критерия являющегося равномерно наиболее мощным или локально наиболее мощным является в основном нетривиальной, а иногда неразрешаемой задачей. Доказана, к примеру, неразрешимость проблемы Беренса- Фишера о сравнении средних значений в двух нормальных выборках с неизвестной дисперсией. Эта задача решается только приближенными методами. Например, с помощью критерия, статистика которого выражается в терминах достаточных статистик, а критические значения являются интерполяционными полиномами от неизвестного отношения дисперсий, которое является в данной задаче мешающим параметром.

Значительную часть в теории проверки гипотез занимают ранговые критерии, то есть критерии, основанные на рангах - порядковых номерах наблюдений в вариационном ряде. Ранговые критерии образуют подсемейство семейства критериев, основанных на перестановках. Ра,сцвет теории ранговых критериев вызван без сомнения их успехом как в практике, так и в теории. Ранговые процедуры осуществляются просто и быстро, они могут быть использованы тогда, когда известив, " м-со результаты упорядочения наблюдений. Однако область применен])* этих процедур имеет естественные границы. Ранговые процедуры подходят только для простых планов эксперимента с достаточно большими группами одинаково распределенных наблюдений при нулевой гипотезе. Кроме того построение доверительных интервалов, основанных на ранговых критериях, довольно трудоёмко. Другое возражение против ранговых критериев состоит в том, что их эффективность ниже, чем эффективность наилучших параметрических критериев. Это, однако, не столь серьёзно, так как потеря эффективности обычно невелика. Первоначальной целью введения ранговых критериев было создание критериев с точным уровнем значимости для гипотез в непараметрической постановке. Впоследствии репутация ранговых критериев сильно возросла благодаря установлению их высокой асимптотической эффективности во многих важных задачах. При малых, объемах выборок многие ранговые критерии значительно теряют в эффективности из-за плохой заполняемости интервала распределения. А поскольку зачастую приходит-

ся работать именно с малыми выборками необходимо иметь более мощные критерии, построенные на статистиках, заполняющих интервал распределения как можно плотнее.

Разработка и внедрение новых методов опрел »лени я .количественных показателей надежности оборудования ЯЭУ с уче,то => цдцифики их эксплуатации, базирующихся на теории проверки статист гчжих гипотез, позволяет определить степень работоспособности ЯЭУ й' ее подсистем, принимать при необходимости меры к повышению работоспособности, к снижению экономических затрат, связанных с вынужденными простоями ЯЭУ, с обслуживанием реакторных установок, обоснованно подходить к назначению ресурса блоков. Диссертационная работа связана с планами научно- исследовательских работ, проводимых Обнинским институтом атомной энергетики по теме "Разработка и исследование методических вопросов анализа надежности и безопасности функционирования действующих атомных станций" N 01930004724.

Цель работы. Исследование и обоснование критерия подобия, как критерия проверки гипотезы однородности текущей и априорной информации. Разработка оптимальных критериев в задачах проверки "гипотезы случайности" против альтернатив наличия монотонного тренда, использующихся также при проверке независимости в условиях ограниченной информации. Исследование и разработка критериев, состоятельных против альтернатив тренда сложного вида.

Научная новизна работы. Основные резул ьтаты диссертации яв-

ляются новыми и состоят в следующем:

• Проведено теоретическое исследование парамет рического критерия подобия проверки однородности статистической информации. Доказаны оптимальные свойства этого критерия при предположении о гамма-распределении случайных величин.

• Впервые предложен новый ранговый критерий проверки гипотезы случайности" и независимости статистических данных, позволяющий по малой выборке (наиболее часто встречающаяся на практике ситуация) делать более значимые выводы, по сравнению с известными критериями. Проведено исследование его распределения при нулевой "гипотезе случайности", позволяющее построить границы критической области.

в Впервые разработана ранговая статистика, обобщающая статистику

Снирмена и чувствительная к сложному тренду, находящемуся .внутри временного ряда. Таким образом критерий использующий эту статистику можно применять на практике в едуна Л- .^,щда случайные величины (к примеру параметр потока отказов) .(-¿пинают возрастать с ненулевого момента времени (момента начала этапа выработки ресур-сн);'

Практическая значимость работы.

• Построено табличное обеспечение для локально- наиболее -мощного критерия проверки гипотезы об однородности и для критерия проверки "гипотезы случайности".

в Разработаны необходимые методики и программы, позволяющие определять критические значения для любых объёмов информации и уровней значимости.

« Па основании вновь предложенного критерия проверки гипотезы случайности проводилась проверка гипотезы выработки своего ресурса элементами оборудования Вилибинской АЭС.

» С помощью вновь предложенного критерия выполнен анализ процесса. .достижения предельного состояния элементами системы управления защитой энергоблоков ВВЭР- -110 и ВВЭР 1UUU но информации, представленной Международной хозяйственной организацией " Интер-атомэнерго".

Основные результаты, выносимые па защиту:

• Аппроксимация распределения статистики отношения средних арифметических двух нормально распределённых совокупностей и критических границ для критерия, построенного на этой статистике;

• Доказательство инвариантности и локальной оптимальности критерия подобия в случае гамма- распределения двух совокупностей с одинаковыми параметрами формы.

• . Центрирование статистики типа Гефдипга. Те орема о проекции ста-

тистики Гефдинга в семейство линейных ранговых статистик.

• Определение основных числовых характеристик статистики смешанных произведений, таких, как математическое ожидание, минимум, максимум. Аппроксимация распределения при выполнении нулевой

" гипотезы случайности". Доказательство оптимальности в случае экспоненциального распределения исходной совокупности с линейно возрастающей интенсивностью.

• Теорема об эквивалентности условий и ЛИ условиям выполнения альтернативы возрастания и альтернативы убывания. Теорема о центрированной интегральной статистике. Доказательство нормальности распределения при нулевой гипотезе.

• Определение основных числовых характеристик статистики типа Сии-рмена, чувствительной к тренду сложного вида.

Личный вклад автора в работу. Конкретное личное участие ав-

тора заключается в проведённых теоретических исследованиях, направленных на разработку и исследование статистических критериев теории проверки гипотез случайности, независимости и однородности широко используемых при анализе показателей надежности ЯЭУ.

Автором исследован параметрический критерий проверки однородности выборок, полученных на разных этапах наблюдений за функционированием объектов. Доказаны оптимальные свойства этого критерия при условии гамма- распределения исходных наблюдений (инвариантность, локально наибольшая мощность). Получены формулы для вероятности ошибки второго рода, оценки Бахадура границ критической области в случае нормального и гамма- распределения.

В работе проведены новые исследования известных критериев проверки "гипотезы случайности" таких как Кендалла, Спирмена, критерия смешанных произведений рангов. Предложен новый непараметрический ранговый критерий проверки гипотезы случайности и независимости. Получено его распределение при выполнении нулевой гипотезы. Проведено исследование мощности при малой выборке. Выведен ряд свойств компонентов интегральной статистики, позволяющих упростить использование критерия.

Автором предложен новый непараметрический критерий проверки гипотезы случайности против альтернативы сложного тренда с ненулевым

временем начала. Получено его распределение при выполнении нулевой гипотезы.

Апробация работы.

• на семинаре кафедры АСУ МИИТ по теории надежности,

• на международном молодежном симпозиуме "Ядерная энергетика в третьем тысячелетии" ИАТЭ 1996г.

Публикации.

По теме диссертации опубликовано 6 статей и 3 научно- технических отчёта.

Структура и объем работы.

Диссертация состоит из введения, трех глав, заключения, приложения и списка литературы. Работа изложена на 144 страницах, в том числе основного текста - 139 страниц, библиографический список из 64 наименований на 5 страницах.

В приложении приведены графики функций мощности, функций распределения исследуемых статистик, таблицы критических значений для локально оптимального критерия однородности и для интегрального критерия случайности, результаты расчёта ресурса элементов СУЗ АЭС.

Основные результаты работы отражены в следующих

публикациях:

. 1. Антонов A.B., Чепурко В.А. Исследование свойств параметрического критерия проверки однородности выборок. //Сборник научных трудов № 10 кафедры АСУ.- Обнинск: ИАТЭ, 1995, 43с.

2. Антонов A.B., Чепурко В.А. Критерий подобия как инвариантный, локально наиболее мощный. //Сборник научных трудов № 11 кафедры АСУ,- Обнинск: ИАТЭ, 1996.

3. Чепурко В.А. О некоторых свойствах автокорреляционных критериев. //Сборник научных трудов № 10 кафедры АСУ.- Обнинск: ИАТЭ, L995, 51с.

4. Чепурко В.А. Ранговые критерии при проверке гипотезы о наличии тренда. //Международный молодежный симпозиум. Тезисы док ладов.-Обнинск: ИАТЭ, 1996, 107с.

5. Анализ статистической информации об эксплуатации реакторов ВВО.Р-440, ВВЭР-1000. Годовой отчёт "Интератомэнерго"/ Антонов A.B., Ва-сяшиж A.B., Чепурко В.А. и др.- Москва:Интератомгшерго" .-19%. •

6. Анализ показателей надёжности и ресурсных характерис тик подсистем СУЗ Билибинской АЭС с выдачей рекомендаций о возможности продления ресурса СУЗ: Отчёт по НИР (заключительньш)/Аытонов A.B., Буртаев Ю.Ф., Чепурко В. А. и др.- Обнинск: НАТО, -1995.

7. Анализ показателей надёжности и ресурсных характеристик подсистем СУЗ реактора РБМК-1000 первого блока. Курской АЭС.Разработка схем надёжности каналов СУЗ и математического аппарата для определения показателей надёжности и ресурсных характеристик: .Отчёт ио НИР / Антонов A.B., Чепурко В. А. и др.- Москва: ВНИИ АЭС, -1998.

8. Чепурко В.А. О предельном распределении некоторых рантовых < та тистик. //Сборник научных трудов № 12 кафедры АСУ - Обнинск: ИАТЭ, 1998, (в печати).

9. Антонов A.B., Морозова О.В., Чепурко В.А. Критерии проверки гипотезы случайности в задачах надёжности//Известия. вузов. Ядерная энергетика.- Обнинск: ИАТЭ, 1998, (в печати).

И в заключение автор выражает глубокую благодарность своему научному руководителю профессору Александру Владимировичу Антонову за постановку интересных задач и большую помощь в работе, а также профессору Юрию Фёдоровичу Буртаеву за полезные обсуждения результатов.

ГЛАВА 1. ПРОВЕРКА ОДНОРОДНОСТИ.

1.1 Постановка задачи.

Для проведения достоверных расчетов надежности объектов ЯЭУ необходимо использовать по возможности всю информацию о надежности объектов - аналогов (при этом удостоверившись с некоторой вероятностью ошибки в этом).

В процессе эксплуатации оценка показателей надежности производится по статистическим данным об отказах элементов и узлов систем. Исходная информация при этом очень часто представляет собой малые выборки. В связи с этим иногда приходится обьединять информацию об эксплуатационной надежности объектов у различных потребителей с целью получить более точные и достоверные оценки. Но объединять информацию можно лишь убедившись,