автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Исследование распределений характеристик технических систем при помощи критерия Колмогорова

кандидата технических наук
Саввушкина, Наталья Евгеньевна
город
Томск
год
1992
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование распределений характеристик технических систем при помощи критерия Колмогорова»

Автореферат диссертации по теме "Исследование распределений характеристик технических систем при помощи критерия Колмогорова"

6 9 0

министерство науки, высшей школы и технической политики

российской федерации томский государственный университет им. в. Е куйбышева

исследование распределений характеристик технических ~ : систем при помощи критерия колмогорова

-. (05.13..16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях)

Авторефграт диссертации на соискание ученой степени кандидата технических наук

На правах, рукописи УДК 519. 2

саввушкина

Наталья Евгеньевна

Томск -

Работа выполнена в Научно-техническом комплексе "Аспект".

Научный руководитель: доктор технических наук;

. - профессор Е.Л.ДАШЛЕНЫ) Официальные оппоненты: доктор физико-математических наук,

профессор В.А.ТОПЧИЙ кандидат технических наук . доцент И.А.КОЮТАЕВ

Ведущая организация: Московский государственный технический университет им.Н.Э.Баумана.-

Защита диссертации состоится "„ _1992 года

в {О часов на заседании Специализированного Совета Д 063.53.03 при" Томском - государственном университете по адресу: 634050, гЛоыск, пр.Ленина, 36.

С диссертацией можно ознакомиться в Научной библиотеке Томского государственного университета.

Автореферат разослан

1992 года.

Ученый секретарь

Б.Е.Тривоженко

. rtut^.j t

-«<л| Зведение.

■ r^ic-ji , j .

Работа посвящена актуальной проблеме, а именно выбору распределений технических характеристик, проверке согласия выборочных данных с распределениями известного типа при исследовании надежности сложных систем.

Известно, что для тех случаев, когда нужно проверить согласие выборочных данных, полученных в результате наблюдений с распределением, параметры которого считаются известными, существует множество критериев согласия - критерии хи-квадрат, Колмогорова, омега-квадрат, Купера, Ватсона, Андерсона-Дар-линга и другие. В пакетах прикладных программ по статистике наиболее часто реализованы два из них - хи-квадрат и Колмогорова

На практике этот случай встречается довольно редко. Чаще приходится проверять, что выборка взята из распределения, тип которого известен заранее, а параметры распределения оцениваются по-этой же самой выборке. В этом случае в пакетах прикладных программ для проверки согласия используется критерий хи-квадрат. В некоторых пакетах прикладных программ используют критерий Колмогорова, не замечая разницы между случаем проверки согласия с полностью известным распределением и распределением, параметры которого оценивается по имеющейся выборке ( например, в пакете STATGRAPHICS для IBM PC ). Это и определяет актуальность задачи проверки согласия в случае сложных гипотез при помощи критерия Колмогорова Актуальным является и нахождение распределений статистик Колмогорова в случае проверки согласия с распределениями известных типов,

а также разработка программа для ЭВМ. Программа использует эти результаты с целью анализа надежности сложных .систем и решения других задач, где необходимо проверять согласие с распределением известного типа или выбирать распределение, наилучшим образом аппроксимирующее имеющиеся статистические данные.

Цель и задачи работы.

Делыо настоящей работы является решение задачи проверки согласия с распределением известного типа и выбора распределений для характеристик технических систем, показателей их надежности.

Цель определила основные задачи исследования: построение асимптотических распределений статистик Колмогорова-Смирнова

я

( где д - вектор оценок неизвестных параметров, полученных методом максимального правдоподобия ) в случае проверки согласия с'распределениями разных типов при различных комбинациях известных и неизвестных параметров; создание алгоритмов и методики программной реализации проверки согласия при помощи критериев Колмогорова-Смирнова; разработку соответствующего программного обеспечения и его апробацию.

Научная новизна работы-заключается в следующем:

1. Построены асимптотические распределения статистик Колмогорова-Смирнова в случае проверки согласия со следующими семействами распределений: логистическим, Вейбулла, экстремальных значений, Коши и семейством гамма-распределений для различных комбинаций известных и неизвестных параметров ( неизвестные параметры оцениваются методом максимального правдоподобия ). Построены асимптотические распределения статистик Колмогорова-Смирнова в случае проверки согласия с нормальным распределением с известной дисперсией и неизвестным математическим ожиданием, в качестве оценки которого используется медиана выборки.

2. Разработаны.принципы построения и реализации алгоритмов и программ проверки согласия при помощи критерия Колмогорова в случае сложных гипотез и выбора наиболее подходящего распределения для аппроксимации выборочных данных.

Приведен пример выбора семейства статистических распределений для решения задач, возникающих при оценивании надежности сложных технических систем с использованием методики, позволяющей распространить асимптотические распределения для статистик У/7 17}Я)ц, на случай выборок объемом Л* >-20 для Семейств распределений Вгйбулла и экспоненциального в случае сложной гипотезы.

Практическая ценность.

Практическая ценность диссертации.определяется возможностью использования полученных результатов, доведенных до программного продукта IBM PC, при решении задач исследования надежности слюнных технических систем, получения более достоверных' оценок показателей надежности слокных систем для внесения их з ТУ или ТЗ.

Апробация работы.

Основные результаты диссертационной работы докладывались на семинаре "Прикладные задачи теории надежности" в ЫГТУ им. Н. 3. Баумана, 1983 год, Всесоюзной научно-технической шкоде-семинаре "Математическое моделирование в прикладных задачах", Одесса, 1990 год.

Публикации и внедрения.

Материалы диссертации опубликозаны в пяти научных работах. Внедрение результатов осуществлялось в Научно-техническом комплексе "Аспект" ! г. Калининград-), в конструкторском бюро ПО "Полет" ( г. Омск ).

Объем и структура диссертации.

Диссертация изложена на "Л?, листах машинописного текста. Работа состоит из введен,¡я, трех глав, еыбодов, заключения,

списка литературы и приложения. Список цитируемой литературы включает 40 наименований.

Содержание работы.

Во введении показана актуальность темы исследования, сформулированы цель и задачи работы. Приведена структура работы, которая следует из цели и задач работы. Также приведен краткий обзор результатов, полученных в ходе исследования.

В первой главе диссертации поставлены задачи исследования, представлен обзор результатов, касающихся вопроса нахождения процентных точек статистик Колмогорова-Смирнова в случае сложных гипотез, критически рассмотрено состояние дел в программной реализации проверки согласия.

Блок-схема решения задач согласия приведена на рисунке 1.

В п. 1.1 показано, что разработчики сложных технических систем при анализе их надежности на различных этапах разработки и проектирования используют математический аппарат обработки статистических.данных, в котором предполагаются известными и типы распределения- исследуемых характеристик и параметры этих распределений. Однако в большинстве случаев параметры распределений оцениваются по имеющейся выборке. Поэтому при подборе распределений, проверке согласия, оценке рисков заказчика и поставщика и других показателей сложных технических систем имеются значительные статистические погрешности, что говорит о важности принятия правильного решения при оценке соответствия заданным требованиям по надежности.

— п —

Рис.1. Блок-схема решения задач согласия и выбора наилучшего распределения для аппроксимации данных.

Для проверке согласия в случае неизвестных параметров на практике используется критерий хи-квадрат. ЕЮ статистика в этом случае будет иметь распределение хи-квадрат, а число степеней свободы по сравнению со случаем полностью известных параметров уменьшится на число параметров, оцениваемых по выборке С если использовать соответствующие оценки ).

Статистика Колмогорова {п имеет по сравнению со статистикой критерия хи-квадрат то преимущество, что она позволяет строить доверительные интервалы для функции распределения ■ лишь при условии,- что последняя непрерывна Критерий Колмо-• горова позволяет избежать- произвола в выборе разбиения для критерия хи-квадрат.

Исходя из этого, задача выбора наилучшего распределения

• и задача проверки согласия выборочных-данных с теоретическим -распределением решается при помощи критерия согласия Колмо-

-'горова. •

Е1.2 посвящен вопросу о том, каким образом обстоят дела с распределением статистик Колмогорова-Смирнова в случае прос-_ • тых и сложных гипотез. Описаны все имевшиеся таблицы процентных точек для статистик Колмогорова-Смирнова в случае про вертки согласия' с различными распределениями. Они получены моделированием для выборок различных объемов. Дня оценивания

• неизвестных параметров в основном-использовались оценки, полученные методом максимального правдоподобия. Отмечено, что таблицы, рассчитанные разными авторами, часто имеют расхождения в области малых вероятностей.

Обзор работ позволяет сделать следующие выводьс

1. Не все типы распределений рассмотрены -( и не все возмож- ' ные комбинации известных и неизвестных параметров ).

2. Процентные точки для Ул существуют в виде таблиц. Это очень неудобно при программной реализации проверки согласия в случае, сложных гипотез при помощи критериев Кол-могорова-Смирвова. Возникают сложности при выборе наилучшего распределения для аппроксимации имеющихся данных с использованием этого критерия.

Далее в обзоре приведены методы получения предельных распределений статистик Колмогорова-Смирнова аналитическим путем. Показано, что для решения поставленных задач •целесооб-- разно использовать асимптотические выражения вида

й«, Цпт, = их *

где , (С .: - коэффициенты. • Методика нахождения неизвестных коэффициентов и & изложена во второй главе.

К 1.3 посвящен программному аспекту-решения задач проверки согласия и выбора наилучшего распределения.. Здесь критически рассмотрено состояние дел в программной реализации проверки согласия. < ' 4

Вторая глава диссертации посвящена построению асимптотических распределений статистик Колмогорова-Смирнова в случае сложных гипотез для различных семейств распределений. В п. 2.1 рассмотрено одномерное распределение, имеющее плотность , где в- (&!,...,неизвестный^Ъ - мерный

параметр. Изложена методика построения асимптотических распределений статистик Колмогорова-Смирнова в случае сложных гипотез, когда неизвестные параметры оцениваются методом максимального правдоподобия. Методика основана на результатах, полученным К1Е Тюриным. В п. 2.2 построены асимптотические распределения для масштабно-сдвиговых семейств расп-

- ределений: логистического и Коши при разных комбинациях известных и неизвестных параметров ( в случае, когда неизвестные параметры оцениваются методом максимального правдоподобия ). В п. 2.3-построены асимптотические распределения статистик ' ' в случае проверки согласия с распределением экстре-

мальных' значений и распределением -Вэйбулла при разных комбинациях известных и неизвестных параметров С в случае, когда неизвестные параметры оцениваются методом максимального правдоподобия ). В п. 2.4 построены асимптотические распреде-: ления . в случае проверки- согласия с распреде-

лениями из семейства гамма-распределений. В п. 2.5 проведено методическое решение вопроса построения асимптотических • распределений в случае проверки согласия с се-

мейством бета-распределений. В п. 2.6 приведена методика псст-■ роения асимптотических распределений статистик ' в случае сложных гипотез, когда неизвестные параметры в выражениях для ПГЮ^ заменяются оценками из класса проектирующее оценок. С использованием этой методики построено асимптотическое распределение статистик ТпЪ^ в случае проверки согласия, с нормальным распределением где б**' - извест-

но, а у1/ оценивается медианой выборки. Использование оценок

. - 10 -

максимального правдоподобия и предыдущей методики в гтом случае невозможно, так как нарушены условия ее применимости.

Во второй главе получены следующие результаты: асимптотические распределения в случае проверки согласия -с распределениями из масштабно-сдвиговых семейств не зависят от оценок неизвестных параметров. .Они определяется семейством • распределений с которым проверяется согласие и тем, какие из параметров известны априори, а какие оцениваются по имеющейся выборке. Распределения статистик для логистического распределении с плотностью

' &[{ + е*/> Цг-а-уЩ

где Л/ - параметр сдвига, ^ - параметр масштаба имеют следующий вид: _ '

- в случае двух неизвестных параметров

- параметр Ь- известен, й* - неизвестный параметр

- параметр А- известен, ^ - неизвестный параметр

. 3} =

В случае проверки согласия с распределениями из семейства -распределений Коши, плотность которого определяется форму-

- И -

лой

г

ЩЦ&ТГ}

С где (¡и- параметр сдвига, —параметр масштаба ) получены следующие асимптотические распределения статистик

ЯГЯг:

- в случае двух неизвестных параметров

- параметр - известен, А - неизвестный параметр

- параметр £ - известен, Я- - неизвестный параметр

В случае проверки согласия с распределением Вейбулла с плотностью £

( $ - параметр масштаба, С - параметр формы ) асимптотическое распределение статистик не зависит от оценок неизвестных параметров.

Этот факт объясняется тем, что при соответствующем преобразовании его плотность распределения переходит в плотность

распределения экстремальных значений, которое является масштабно-сдвиговым.

В случае проверки согласия с распределением Вейбулла получены следующие асимптотические распределения статистик Колмогорова-Смирнова:

- в случае двух неизвестных параметров

- параметр масштаба известен, параметр формы неизвестен

■ Распределение статистик в случае проверки

согласия с распределением экстремальных значений'совпадают с распределениями (ТГЙ/р ' в случае проверки согласия с распределением Вейбулла ( в случаях, переходящих друг в друга посредством однозначных.преобразований ).

В случае распределений, плотность которых зависит от параметра формы, коэффициенты ^ и /С в выражениях для -асимптотических распределений статистик

зависят от значений оценки этого параметра'( или этих параметров, -если их несколько ), полученных из исходной выборки по методу максимального правдоподобия: Построен метод расчета коэффициентов разложения для семейств гамма-распределений и бета-распределений. Проведены расчеты значений этих коэффициентов в случае, если оценка параметра формы % & С 1,3 ) в семействе гамма-распределений. Значения этих коэффициентов приведены в табл.1.

Таблица 1.

Значения коэффициентов и А/ для расчета вероятнос-

тей при проверке согласия с семейством

гамма-распределений.

е, 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 &0 7.37 5.97 5.22 4.77 4.48 4.32 4.21 4.15 4.13 4,13 4 1.23 1.10 0.98 0.91 0.85 0.81 0.79 0.76 0.74 0.72

Асимптотические результаты сопоставлены с результатами, полученными моделированием в случаях проверки согласия с семействами распределений Вэйбудла, логистическим и гамма ( с известным параметром формы ).

. Построено асимптотическое распределение статистик Колмогорова-Смирнова в случае проверки согласия с нормальным * распределением, у которого ■ известна дисперсия, а "математическое ожидание оценивается по выборке. Как известно, этот случай является вырожденным (т.е. - Ь - О ), если в качестве оценки неизвестного параметра использовать выборочное среднее, являющееся в этом случае оценкой максималь-

- 14 -

ного правдоподобия. Получены следующие результаты:

В третьей главе описаны принципы построения и само прог- ' раммное обеспечение, необходимое для решения задач, поставленных в п. 1.1. Оно построено на базе результатов, подученных во второй главе, приведен пример выбора наиболее подходящего семейства распределений для времени безотказной работы подсистемы системы управления ( приемо-передаточного устройства ) на основе выборочных данных.

В п. 3.1 приведен алгоритм решения задачи выбора наиболее подходящего распределения из -данного класса распределений, используемых при нахождении надежности сложных технических систем; подтверждения заданных требований. Для этого здесь -сведены все известные результаты, касающиеся асимптотических 1 распределений статистик вслучае сложных

гипотез и определены пути использования соотношений между "распределениями при проверке согласия с распределениями из-• вестных типов. Алгоритм построен на основании блок-схемы,

представленной.на рисунке 1.

• ' ' '

В п. 3.2 описана программа КОШ, реализующая проверку согласия по критерию. Колмогорова для следующих семейств распределений .

- нормальное

- экспоненциальное

- Вейбулла

- двойное экспоненциальное

- логистическое

- Коти

при любых комбинациях известных и неизвестных параметров. Эта те программа позволяет выбирать распределения из любого подмножества перечисленных классов распределений наиболее хорошо соответствующе исходным данным. Каадое из рассматриваемых распределений монет иметь любую комбинацию известных и неизвестных параметров.

Программа написана на языке ТигЬоЬазю и предназначена 'для персональных ЭЕМ ( типа 1ВМ РС ). Она составлена в диалоговом ретжэ.1 Программа КОШ дополнена диалоговой программой ИЗДет, проводяней преобразования переменных.

Е 3.3 посвягззн решению некоторых технических задач с применением прогрг;.с.а КОШ Здесь приведена методика решения "задач выбора теоретического распределеш-и з технических за-•■ дачах и решена задача выбора типа" распределения для в ре ж ни безотказной работы подсистемы системы управления. Шбор производился на бесе згапои-пщпзльного семейства распределе-' ний и семейства распределений Вэйбулла ( более сло7гаого семейства, включающего в себя экспоненциальное как частный случай ).т Экспоненциальный закон распределения широко используется для анализа времени безотказной работы систем управления. Безотказность системы управления ( или ее подсистем ) при использовании экспоненциального закона не зависит от имеющейся к данному моменту наработки системы, что-не всегда соответствует действительному положению дел. При соответствующем выборе

- 16 -

параметров распределения Вейбулла гораздо более пшрокий круг выборок может быть аппроксимирован распределениями из этого семейства.

Закон безотказности на основе распределения Вейбулла в' достаточной степени близко подходит для описания безотказности электромеханических, приемо-передающих устройств. Рассмотрены две выборки объемом Л, = - 50

наблюдений. Они представляют собой время безотказной работы ППУ в номинальном режиме, полученных в ходе ресурсных испытаний. Статистические ряды приведены ниже:

0.708 0.974 '1. 277 1.111 0.585

0. 704. 1.307 1.417 . 0.731 0.555

0. 901 0.525 0.803 0.639 0.696

1.249 1.078 0.939 1.147 0.787

1.043 0. 961 0. 711 0.697 0.784

0. 902 0.816 1.287 0.660 • 0.834

0. 099 0.852 0.410 0.848 1.450

0. 862 1.064 1.418 1.259 0.931

0. 682' 0. 952 ' 0. 709 1. 268 0. 975

0. 846 0.517 0. 844 0.523 1.216

3.217 1.258 0.492 0.132 0. 409

0.963 1.702 . 0.390 2.060 0.934

0.876 5.757 1.685 1.028 0.222

0.040 0.733 1.381 1.938 0.412

4.008 0.663 0.210 0.099 2.383

0. 470 1.293 0.460 " 0.443 • 0.624

- 17 -

0.884 1.904 1. 824 ' 0.698 2.164

0. 279 1.273 0. 571 2. 568 1.900

0.670 0.530 1. 213 0. 295 0. 740

0. 668 0. 243 1. 948 0. 382 0. 348

Еьйор производился при П0М02Л программ КОШ Для уточнения полученных вероятностей соответствия найдены зависимости коэффициентов асимптотических распределений статистик Колмогорова-Смирнова и 77 и

от объема выборки !'■' в случае проверки согласия с ' экспоно ¡шкальным семейством распределения и семейство.! ■распределений Еейоудла. А именно, для расчета вероятности при твьйерках П р £0 мо~ско использовать асимптотическое • распределение статистик Кол}.эгороза-С!.ярнотза, сксрозктирован-кое слздув'длм сбрггта.::

*,9} = С Ь ; ?/&)- ( б

где для 5!сспонены;алького семейства распределен;^

= К } ^--■ л- {.-%,+1),

для семейства распределений Вейбулла ( с неизвестными пара-¡.йтрзмги Форш и масштаба ):

, К - л- ( "-1) -

Для получения оценок максимального правдоподобия пеизвестпых

параметров распределения Вейбулла составлена программа РАЯАМ. Оценки находятся итерационным методом Ньюггона-Рафсона.

Показано, что 1-ая выборка описывается распределением Вейбулла ( с двумя неизвестными параметрами ), а 2-ая выборка описывается экспоненциальным распределением. Акцентируется разница в нижних доверительных границах, получаемых в правильных и неправильных предположениях. Результаты расчетов представлены в табл. 2. Таким образом, проводя аналогичные исследования, возможно получить более достоверные оценки показателей надежности сложных систем для внесения их в ТУ или ТЗ.

Таблица 2. —

Результаты анализа выборочных данных.

Распределение Вейбулла • Экспоненциальное

( 2 неизвестных параметра) распределение

Вероятность Нижняя довер. ■ Вероятность Нижняя довер согласия граница согласия граница

Выборка 1 0.638 0.521 " О

Выборка 2 0.520 0.122 ,1

0.111 0.105

Основные результаты работы.

В диссертационной работе построены асимптотические распределения статистик Колмогорова-Смирнова в случае проверки согласия с распределениями разных типов, неизвестные параметры которых оцениваются по имеющейся'выборке методом максимального правдоподобия. С использованием этих асимптотических распределений разработана программа КОШ проверки согласия выборочных данных с распределениями известного типа и выбора распределения, наилучшим образом аппроксимирующего имеющиеся данные. Это позволило решить важную и актуальную задачу выбора распределений для параметров технических систем и показателей их надежности.

На основе обобщения полученных в работе результатов можно сформулировать следующие основные выводы:

1. Показано, что задачи проверки согласия с распределениями известного типа и полбора наилучдаго распределения в случае сложных гипотез являются актуальными и возникают при анализе надежности технических систем. Указан путь решения этих задач 'да базе критерия согласия Колмогорова

2. Показано, что наиболее подходящими для программной реализации является следующий вид распределения статистик Колмогорова-Смирнова:

Построены распределения этих статистик в случае сложных гипотез при разных комбинациях известных и неизвестных

-,20 -

параметров для следующих семейств распределений: логистическое, Вейбулла ( без параметра сдвига ), экстремальных значений, Кэши, гамма и нормального с известной дисперсией и неизвестным математическим ожиданием.

3. Разработан алгоритм решения задачи проверки согласия и выбора наилучшего распределения из распределений следующих типов: нормальное, экспоненциальное, логистическое, Ноши, Вейбулла и экстремальных значений. На основе алгоритма разработана диалоговая процедура в программе КОЬМ. Показано, что правильный выбор семейства распределений при помощи программы КОШ позволяет получить более достоверные оценки показателей • надежности сложных технических систем для внесения их в ТУ или ТЗ.

Список работ, опубликованных по теме диссертации:

1. Саввушкина Е Е.' Критерий Колмогорова-Смирнова для распределений Вейбулла с неизвестными параметра»,м. Горький: Тезисы докладов научно-технической конференции "Испытание.контроль и техническая диагностика в процессах разработки и постановки изделий на производстве", 1981, с. 140-143.

2. Саввушкина К Е., Тюрин ЕХ Н. Критерий согласия для распределения Вейбулла-Гнедёнко. - Известия АН СССР, серия Техническая кибернетика, 1984, N3, с. 109-112.

3. Саввушкина ЕЕ. Логистическая модель роста в надежности. -Надежность и,контроль качества, 1989, N 11, с. 13-16.

4. Кулинская Е. В., Саввушкина Е Е. О некоторых ошибках в реализации и применении непараметрических методов в пакетах STATGRAPHICS для IBM PC. - Заводская лаборатория, 1990, N 5, с. 96-99. .

• 5. Саввушкина Н.Е. Критерий согласия Колмогорова-Смирнова для логистического и гамма-распределений. - Сборник трудов ВНИИСИ, 1990, N 8, с. 50-56.