автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Расширение прикладных возможностей некоторых классических методов математической статистики

кандидата технических наук
Лемешко, Станислав Борисович
город
Новосибирск
год
2007
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Расширение прикладных возможностей некоторых классических методов математической статистики»

Автореферат диссертации по теме "Расширение прикладных возможностей некоторых классических методов математической статистики"

На правах рукописи

Лемешко Станислав Борисович

РАСШИРЕНИЕ ПРИКЛАДНЫХ ВОЗМОЖНОСТЕЙ НЕКОТОРЫХ КЛАССИЧЕСКИХ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Специальность 05 13 17 - Теоретические основы информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Новосибирск - 2007

003062638

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Новосибирский государственный технический университет»

Научный руководитель Заслуженный деятель науки и техники РФ,

доктор технических наук, профессор Денисов Владимир Иванович

Официальные оппоненты доктор технических наук, профессор

Котюков Владислав Игоревич

кандидат технических наук, доцент Никитина Надежда Шагабановна

Ведущая организация

Сибирская государственная геодезическая академия, г Новосибирск

Защита состоится 16 мая 2007 г в 1400 часов на заседании диссертационного совета Д 212 173 06 при Новосибирском государственном техническом университете (630092, Новосибирск-92, пр Карла Маркса, 20)

С диссертацией можно ознакомиться в библиотеке Новосибирского государственного технического университета

Автореферат разослан " /Л " апреля 2007 г

Ученый секретарь

диссертационного совета

Чубич В М

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования Корректное применение на практике множества классических методов математической статистики обусловлено выполнением конкретных предпосылок или условий, которые в реальных условиях оказываются недостижимыми или не могут быть проверены В условиях конкретной ситуации даже при кажущихся незначительными нарушениях предпосылок свойства оценок или распределения статистик применяемых критериев могут существенно отличаться от "стандартных" В других случаях наоборот, даже значитечьные отклонения реальных условий от классических предположений не приводят к значимым изменениям свойств или распределений статистик

Как правило, исследование свойств оценок или статистик, нахождение закона распределения статистики конкретного критерия аналитическими методами оказывается чрезвычайно сложным Особенно, если учесть множество реальных ситуаций, для которых это следовало бы сделать Поэтому при исследовании вероятностных (статистических) закономерностей все чаще используют методы статистического моделирования

Данная диссертационная работа является логическим продолжением исследований (Постовалов С Н , Чимитова Е В , Помадин С С ), проводимых на кафедре прикладной математики НГТУ и направленных на расширение прикладных возможностей кчассических методов математической статистики за счет изучения свойств классических критериев при нарушении стандартных предположений, лежащих в обосновании метода или критерия Развиваемая методика компьютерного моделирования и анализа статистических закономерностей позволяет получать полезные результаты, расширяющие аппарат математической статистики Применение получаемых результатов обеспечивает корректность статистических выводов в тех ситуациях, когда использование классических процедур и методов неправомерно Методика дополняет аналитические методы, обеспечивая нахождение приближенного решения в тех случаях, когда этого не удается сделать аналитическими методами

Диссертационная работа нацелена на решение ряда задач, интерес к которым не снижается в связи с их практической направленностью и частым использованием соответствующих методов или критериев в приложениях

Принадлежность наблюдаемых данных нормальному закону является необходимой предпосылкой корректного применения большинства классических методов математической статистики, используемых в задачах обработки измерений, стандартизации и контроля качества Поэтому проверка на отклонение от нормального закона является частой процедурой в ходе проведения измерений, контроля и испытаний

Отечественный стандарт ГОСТ Р ИСО 5479-2002, представляющий собой аутентичный текст международного стандарта ISO 5479-97, отражает далеко не полную картину, связанную с критериями проверки отклонения выборок наблюдаемых случайных величин от нормального закона Различные подходы к решению данной задачи связано с множеством имен (Shapiro S S, Wilk М В,

Shapiro S S, Wilk MB , Hartley H О , Bowmann К О , Shenton L R , Baringhaus L , Epps T W , Pulley L В , Doornik J A , Hansen H , Золотухина JIB,, Looney S W , Gulledge T R , Martinez J , Iglewicz В , Prescott P и др )

С необходимостью решения задач проверки гипотез о принадлежности двух выборок случайных величин одной и той же генеральной совокупности (проверки однородности) постоянно сталкиваются при анализе случайных ошибок средств измерений, при статистическом управлении качеством процессов Критерии проверки однородности связаны в первую очередь с именами Смирнова Н В , Lehmann Е L , Rosenblatt М В данной диссертационной работе не затрагиваются критерии проверки однородности средних и критерии однородности дисперсий, хотя и исследуется устойчивость критерия проверки независимости Аббе, близкого по свойствам к критериям проверки однородности средних

При решении задач статистического анализа и, в частности, при построении моделей законов распределения и вычислении оценок параметров этих моделей проблема наличия в выборке аномальных измерений имеет чрезвычайно важное значение Присутствие единственного аномального наблюдения может приводить к оценкам, которые совершенно не согласуются с выборочными данными В случае принадлежности наблюдений нормальному закону применяемые критерии чаще всего опираются на работы Grubbs F Е и предшествующие им работы Смирнова Н В

Не окончательно решенной проблемой является проверка адекватности моделей законов распределений с применением критериев согласия Практика их применения изобилует примерами неэффективного (почти всегда) или некорректного (очень часто) применения Это касается как критериев типа %2, так и непараметрических критериев согласия В частности, предельные распределения статистик непараметрических критериев согласия типа Колмогорова, типа Крамера-Мизеса-Смирнова или Андерсона-Дарлинга при проверке сложных гипотез зависят от истинного закона, соответствующего проверяемой гипотезе, числа и типа оцениваемых параметров этого закона, от выбранного метода оценивания параметров, иногда, от значения параметра

В исследование критериев типа %2 внесли значительный вклад Чибисов Д М , Гванцеладзе Л Г , Боровков А А , Никулин М С , Rao К С , Robson D S , Мирвалиев М , Воинов В Г , Greenwood Р Е , Drost F С , Лемешко Б Ю , Чими-това ЕВ и др Исследование непараметрических критериев согласия при проверке сложных гипотез связано с именами Кас М , Kiefer J , Wolfowitz J , Pearson E S , Hartley H О , Stephens M A , Мартынова Г В , Тюрина Ю Н , Саввуш-киной Н Е , Лемешко Б Ю , Постовалова С Н и др

Вопросы мощности критериев согласия исследовались в работах Чиби-сова Д М , Боровкова А А , Никулина М С , Воинова В Г , Лемешко Б Ю , Постовалова С Н, Чимитовой Е В и др Однако в большинстве случаев вопрос о преимуществе в мощности того или иного критерия относительно конкретных альтернатив остается без четкого ответа, так как определение мощности критерия упирается в необходимость знания распределения статистики критерия при

соответствующей конкурирующей гипотезе А нахождение этого распределения аналитическими методами, как правило, связано с серьезными трудностями и удается крайне редко

Цель и задачи исследований. Основной целью диссертационной работы является дальнейшее расширение на основе компьютерного моделирования прикладных возможностей классических методов математической статистики, уточнение знаний о свойствах ряда статистических критериев, широко используемых в различных прикладных областях

В соответствии с поставленной целью решались следующие задачи

- исследование распределений статистик и сравнительный анализ совокупности критериев, применяемых при проверке отклонения распределения вероятностей от нормального закона,

- исследование распределений и мощности критериев проверки однородности двух выборок Смирнова и Лемана-Розенблатта,

- исследование распределений статистик критериев типа Граббса и расширение их возможностей при отбраковке аномальных измерений,

- исследование распределений статистики критерия независимости Аббе при нарушении предположений о принадлежности наблюдений нормальному закону, исследование мощности критерия,

- уточнение моделей распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга при проверке сложных гипотез относительно некоторых законов наблюдаемых величин,

- исследование распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлин-га при проверке сложных гипотез относительно семейств бета-распределений, построение моделей распределений статистик и таблиц процентных точек,

2

- сравнительный анализ мощности критериев типа X и непараметрических критериев согласия Кочмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга

Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, статистического моделирования, математического программирования Научная новизна диссертационной работы заключается

- в результатах сравнительного анализа критериев проверки отклонения распределения от нормального закона и в выявлении недостатков критериев Шапиро-Уилка и Эппса-Палли, которые ранее никем не отмечались,

- в результатах исследования мощности критериев однородности Смирнова и Лемана-Розенблатта, в предложенной поправке к статистике критерия Смирнова, обеспечивающей близость распределения статистики к предельному,

- в построенных таблицах процентных точек, расширяющих возможности критериев типа Граббса при отбраковке аномальных измерений,

- в подтверждении устойчивости критерия независимости Аббе к нарушению предположений о принадлежности наблюдений нормальному закону, в результатах исследования мощности критерия,

— в моделях распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга при проверке сложных гипотез относительно некоторых законов наблюдаемы» величин,

— в результатах исследования, моделях и таблицах процентных точек распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений,

- в результатах сравнительного анализа мощности критериев согласия Основные положения, выносимые на защиту. На защиту выносятся

1 Результаты исследований распределений статистик, мощности и сравнительного анализа критериев проверки отклонения эмпирического распределения от нормального закона

2 Результаты исследований распределений статистик и мощности критериев однородности Смирнова и Лемана-Розенблатга, рекомендации по применению критериев однородности

3 Результаты расширения возможностей критериев типа Граббса для проверки различных видов гипотез (об аномальности различного числа эпементов в выборке)

4 Результаты исследования устойчивости критерия независимости Аббе к нарушению предположений о принадлежности наблюдений нормальному закону, результаты исследования мощности критерия

5 Уточненные модели распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлин-га при проверке сложных гипотез относительно некоторых законов наблюдаемых величин

6 Результаты исследования, модели и таблицы процентных точек распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений

7 Результаты сравнительного анализа мощности критериев типа %2 и непараметрических критериев согласия Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга

Обоснованность и достоверность научных положений, выводов и рекомендаций обеспечивается

- корректным применением математического аппарата и методов статистического моделирования для исследования свойств и распределений статистик критериев,

- совпадением результатов статистического моделирования с известными теоретическими результатами

Личный творческий вклад автора заключается в проведении исследований, обосновывающих основные положения, выносимые на защиту, в разработке программного обеспечения

Практическая ценность и реализация результатов.

Результаты сравнительного анализа критериев проверки отклонения от нормального закона, включающего указания недостатков и преимуществ отдельных критериев, расширяют рекомендации для практического применения критериев, приводимые в ГОСТ Р ИСО 5479-2002

Результаты исследования критерия однородности Смирнова, предложенная поправка к статистике критерия расширяют возможности применения критерия в приложениях

Результаты исследования устойчивости критерия независимости Аббе расширяют сферу его корректного применения в приложениях

Результаты исследования статистик критериев типа Граббса позволяют проверять на аномальность одновременно несколько элементов в выборке, расширяя прикладные возможности критерия

Результаты исследования непараметрических критериев согласия при проверке сложных гипотез, результаты исследования мощности непараметри-

2

ческих критериев и критериев типа % дополняют и уточняют рекомендации по стандартизации Р 50 I 037-2002 и Р 50 1 033-2001

Результаты исследований и средства моделирования включены в программную систему "Интервальная статистика" ISW и используются в научных исследованиях и учебном процессе

Апробация работы Результаты работы докладывались на региональной конференции студентов, аспирантов и молодых ученых "Наука Технологии Инновации", Новосибирск, 2003 и 2005 гг, Всероссийской научно-технической конференции "Информатика и проблемы телекоммуникаций", Новосибирск, 2004, 2005 и 2006 гт, VII и VIII международных конференциях "Актуальные проблемы электронного приборостроения", Новосибирск, 2004 и 2006 гг, Всероссийской научно-технической конференции "Информационные системы и технологии", Нижний Новгород, 2004 и 2006 гг , VIII Korea-Russia International Symposium on Science and Technology, Tomsk, 2004 г, VII International Conference "Computer Data Analysis and Modeling Robustness and Computer Intensive Methods", Minsk, 2004 г, Международном научно-техническом семинаре "Математическая, статистическая и компьютерная поддержка качества измерений", Санкт-Петербург, 2006 г

Диссертационные исследования явились составной частью работ, проводимых в рамках проектов "Математическое и алгоритмическое обеспечение задач статистического анализа данных и исследования статистических закономерностей при нарушении классических предположений", грант Министерства образования Российской Федерации № Т02-3 3-3356, 2003-2004 гг , "Развитие компьютерных технологий моделирования и исследования фундаментальных закономерностей математической статистики", раздел 3 3 программы "Развитие научного потенциала высшей школы" Министерства образования и науки РФ, код проекта 15378, 2005 г, "Развитие компьютерных технологий исследования статистических закономерностей" (контракт № 2005-РИ-19 0/002/091, 2005 г) и "Применение компьютерных технологий исследования статистических законо-

мерностей в задачах оценивания и различения близких гипотез о виде и свойствах распределений случайных величин" (контракт № 2006-РИ-19 0/001/119, 2006 г ), ФЦНТП "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы по разделу "Проведение научных исследований молодыми учеными", "Расширение прикладных возможностей классических методов математической статистики", грант Российского фонда фундаментальных исследований № 06-01-00059

Публикации По теме диссертации опубликовано 12 печатных работ, в том числе 5 в рецензируемых журналах из списка ВАК, 7 в трудах и материалах конференций В конце реферата приведен список основных публикаций Структура работы Основная часть диссертации изложена на 158 страницах и состоит из введения, 5 глав основного содержания, включая 34 таблицы и 84 рисунка, заключения, списка литературы из 121 наименования и приложений

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

1. Исследование и сравнительный анализ критериев проверки отклонения распределения от нормального закона

В данном разделе проведен сравнительный анализ и исследованы распределения статистик критериев проверки отклонения от нормального закона, представленные в ГОСТ Р ИСО 5479-2002, а также статистик ряда критериев, не вошедших в него

Исследована мощность рассмотренных критериев и проведено сравнение с мощностью критериев согласия при проверке сложных гипотез Отмечено, что такие критерии как Шапиро-Уилка и Эппса-Палли при малых объемах выборок, как правило, оказываются мощнее критериев согласия типа Колмогорова, со2 Крамера-Мизеса-Смирнова, Q2 Андерсона-Дарлинга или критерии типа х2, когда последние используются для проверки отклонения от нормального закона

Использование критериев согласия для проверки отклонений от нормального закона при малых объемах выборок п является бесперспективным вследствие их очень низкой мощности по отношению к близким альтернативам Совсем другое дело, при больших п При малых п предпочтение необходимо отдать специальным критериям проверки отклонений от нормальности

Критерий Эппса-Палли при близких альтернативах по мощности не уступает критерию Шапиро-Уилка

Впервые отмечено, что критерии Шапиро-Уилка, Эппса-Палли и некоторые другие при малых объемах выборок оказываются смещенными по отношению к некоторым альтернативам, более плосковершинным по сравнению с нормальным законом (со значением эксцесса меньшим 3), то есть неспособны отличить такие законы от нормального

Например, на рис 1 1 приведены полученные условные распределения Gn(S\Hl) статистики Шапиро-Уилка при справедливости гипотез Н0, //,, H2, #з при объеме выборок п-10 В качестве гипотезы Н0 рассмотрен

нормальный закон распределения с параметром масштаба равным 1 и параметром сдвига равным О В качестве близких конкурирующих гипотез рассмотрены законы с такими же значениями параметров сдвига и масштаба Н] - выборка соответствует семейству распределений

л Г /I г

:exPÍ

О О

26,Г(1/02) 1 ч V,

с параметром формы 02 = 4, Н2 - этому же семейству с 92 = 1 (распределение Лапласа), Нъ — логистическому распределению с плотностью

-ехр<-

п(х-в0) I /'

1 + ехр'

е,-/з

ег/з 1 [ о, /з ^

Как показано на рисунке, в области принятия решения распределения С)0(5|//0) и <1?10 ) пересекаются Это означает, что критерий Шапиро-Уилка признает распределение (11) с параметром формы Э2 = 4 более 'нормальным' чем нормальный закон

0 70 0.75 0 80 0.85 0 90 0 95 1.00

Рис 1 1 Условные распределения Сп(Б\Н:) статистики Шапиро-Уилка при справедливости гипотез Н0, Ht, Н2, Нъ при объеме выборок я=10

Показано, что модифицированный критерий Шапиро-Уилка, предназначенный для проверки отклонения от нормального закона по совокупности малых выборок и рекомендованный стандартом, нецелесообразно использовать из-за очень плохой сходимости распределения статистики к предельному и, как следствие, повышенной вероятности ошибок первого рода

Показано, что критерием, по крайней мере, не уступающим по мощности при близких альтернативах критериям Шапиро-Уилка и Эппса-Палли, у кото-

poro отсутствует отмеченный в данной работе недостаток, свойственный последним, является модификация D'Agostmo1 критерия со статистикой z2, которую целесообразно рекомендовать для применения Статистика критерия учитывает отклонения от симметричности и от эксцесса нормального закона Достоинством критерия со статистикой z2 является возможность использования в качестве распределения статистики стандартного нормального закона

Относительно большинства рассмотренных критериев однозначно можно утверждать, что они весьма чувствительны к наличию аномальных наблюдений в связи с использованием оценок вторых, третьих и четвертых центральных моментов, не являющихся робастными Это означает, что отклонение проверяемой гипотезы о нормальности может быть связано с наличием в рассматриваемой выборке аномальных наблюдений

Основные результаты раздела опубликованы в [2]

2. Исследование распределений статистик и мощности критериев однородности

В данном разделе исследованы особенности сходимости распределений статистик к предельным и мощность критериев проверки однородности Смирнова и Лемана-Розенблатта, предложена поправка к статистике критерия Смирнова, обеспечивающая лучшую сходимость распределения статистики к предельному

Статистика критерия Смирнова имеет вид

Dt„= max

т " 1 SrSm

D„„= max

m " 1 SrSm

--F¿Xr)

m

■ max

l£j<n

GJYS)-

5-1

m

■ max

~-Gm(Ys)

Dmn=max(D+m¡ri,D:j,

Sr =

-A.

(2 1)

Чт + п

где тип- объемы сравниваемых выборок, Рп (Хг) и (7^(7,) - соответствующие эмпирические функции распределения, а статистика критерия Лемана-Розенблатта -

Т = -

J_

mn{m + ri)

4mn — \

6(m + ti)

(2 2)

' Doornik J A , Hansen H An Omnibus Test for Univariate and Multivariate Normality 1994 Discussion Paper J> W4 & 91, Nuffield College, Oxford

о№о)

1,00

о оо

0.00 0,20 0 40 ОБО 0 80 1 00 1 20 1,40 1 60 1.80 2 00

Рис 2 1 Распределения статистики (2 1) при справедливости Я0 в зависимости

В случае критерия Смирнова из-за ступенчатого характера распределения статистики (2 1) (см рис 2 1) (особенно при т=п) использование предельного распределения Колмогорова К(я) связано с очень приблизительным знанием действительного уровня значимости (вероятности ошибки 1-го рода) и соответствующего критического значения

При построении процедур проверки однородности по критерию Смирнова для большей гладкости распределения статистики рекомендуется выбирать тФп так, чтобы они представляли собой взаимно простые числа, а их наименьшее общее кратное к было максимальным и равным тп В этом случае особенно заметен недостаток статистики (2 1), связанный с тем, что ее эмпирическое распределение очень медленно сходится (слева1) к К{$)

В работе предложено модифицировать статистику критерия к виду

что обеспечивает быструю сходимость ее распределения к предельному Применение распределения К{я) в качестве предельного распределения статистики (2 3) корректно при относительно малых тип (см рис 2 2)

Так как распределение статистики Лемана-Розенблатта очень быстро сходится к распределению а\(Т), то использование его в качестве распределения статистики критерия Лемана-Розенблатта корректно и при малых тип

Мощность критериев Смирнова и Лемана-Розенблатта сравнивалась на различных парах конкурирующих гипотез Показано, что, как правило, мощность критерия Лемана-Розенблатта заметно выше мощности критерия Смирнова Однако относительно очень близких альтернатив несколько выше оказы-

отти/1

(2 3)

вается мощность критерия Смирнова В качестве примера в таблице 2 1 представлены значения мощности критериев в случае, когда гипотезе Нй соответствуют обе выборки со стандартным нормальным законом, а при гипотезе Я, - одна принадлежит стандартному нормальному, а другая нормальному со сдвигом или логистическому закону

о№0)

ом

ООО 0 20 0 40 ОБО 0,00 1,00 1 20 1,40 1 ВО 1,80 2 00 Рис 2 2 Распределения статистики (2 1) и (2 3) при справедливости Н0,

т = 61 и п = 53

Таблица 2 1 Мощность критериев однородности в зависимости от объемов вы-

Уровень значимости а п=20 п=50 п=100 п=300 п=500 п=1000 п=2000

Значения мощности критерия Смирнова относитечьно N(0 1,1)

0,1 0,0937 0,1480 0,1766 0,2775 0,3806 0,6171 0,8688

0,05 0,0410 0,0569 0,0944 0,1883 0,2682 0,4899 0,7762

Значения мощности критерия Смирнова относитечьно логистического закона

0,1 0,0836 0,1209 0,1308 0,1568 1 0,1976 0,3191 0,5639

0,05 0,0341 0,0455_| 0,0673 0,0891 1 0,1 ¡58 | 0,1879 0,3754

Значения мощности критерия Лемана-Розенблатта относительно N(0 1,1)

0,1 0,1241 0,1382 | 0,1727 0,3125 0,4369 0,6874 0,9114

0,05 0,0615 0,0770 1 0,0999 0,2078 0,3211 0,5703 0,8469

Значения мощности критерия Лемана-Розенблатта относительно логистического закона

0,1 0,1087 0,1069 0,1135 0,1422 0,1826 1_ 0,2978 0,5463

0,05 0,0511 0,0549 0,0581 0,0668 0,0910 0,1450 0,3390

При обработке результатов измерений, в задачах статистического управления качеством обычно имеют дело с выборками ограниченного или, чаще, малого объема Следует отчетливо понимать, что критерии однородности

вследствие низкой мощности при малых объемах выборок не способны различать близкие альтернативы Поэтому проверяемая гипотеза об однородности выборок, даже в случае ее несправедливости, чаще не будет отклоняться Сдвиг на 0 1а или увеличение масштабного параметра (рассеяния) на 10% при малых объемах выборок критерии однородности вернее всего "не заметят", но большие отклонения в законах, соответствующих выборкам, будут отмечаться Например, для того чтобы в случае применения критерия Лемана-Ро-зенблатта вероятности ошибок 1-го а и 2-го рода (3 не превышали 0 1 при наличии сдвига 0 1а (альтернатива Нх нормальный закон с параметрами сдвига 60 = 0 1 и масштаба в) =1) объемы выборок должны быть порядка 2000 А при сдвиге 0 5сг (альтернатива Нг - нормальный закон с параметрами 6П = 0 5 и 0, =1) вероятности ошибок не превысят величин 0 1 при объемах выборок не более 100

Основные результаты раздела опубликованы в [4]

3 Расширение области применения критериев типа Граббса, используемых при отбраковке аномальных измерений

Критерии Граббса ориентированы на проверку гипотез о принадлежности к аномальным измерениям одного или одновременно двух минимальных или максимальных значений в выборке, принадлежащей нормальному закону Именно для этих случаев Граббсом построены таблицы процентных точек распределений статистик

Статистики критерия логично формируются для проверки принадлежности к аномальным различного числа минимальных и максимальных значений в анализируемой выборке Проблема лишь в нахождении распределений статистик для заданных объемов выборок или в построении таблиц процентных точек В частности для проверки на аномальность одновременно одного минимального и одного максимального значения статистика критерия будет иметь вид

<?,,„= (3 1)

¿о

где =

В данном разделе область применения критериев типа Граббса расширена за счет реализации возможности а) проверки на наличие одновременно одного минимального и одного максимального значений в выборке, б) проверки на выброс одновременно трех минимальных либо три максимальных значений в выборке Для чего построены соответствующие таблицы процентных точек

Разработано программное обеспечение, позволяющее исследовать распределения статистик типа Граббса для проверки на выброс любого количества минимальных и максимальных значений в выборке, и возможность построения процентных точек для соответствующих критериев

Реализована возможность построения модели распределения и вычисления процентных точек для любой рассмотренной статистики критерия типа Граббса при любом законе наблюдаемых случайных величин

Например, на рис 3 1 демонстрируются распределения статистики (3 1) в случае принадлежности выборок семейству распределений с плотностью (11) при различных значениях параметра 02 Приведенная картина демонстрирует существенную зависимость распределений статистик критерия типа Граббса от истинного закона распределения наблюдаемой случайной величины

Рис 3 1 Изменение распределений статистик (3 1) критерия Граббса в случае различных законов семейства распределений (11) при п = 20

Построенные таблицы процентных точек позволяют корректно отбраковывать грубые ошибки измерений (выбросы) в случае выполнения предположения о нормальности наблюдаемого закона Если предположения о нормальности нарушаются, использовать указанные таблицы процентных точек нельзя В то же время, реализованное программное обеспечение позволяет построить требуемые процентные точки в случае любой применяемой в приложениях модели закона случайных величин

Основные результаты раздела опубликованы в [3]

4 Исследование распределений и мощности критерия независимости Аббе при нарушении предположения нормальности

Критерий Аббе предназначен для проверки гипотез вида Н0 Е\Х, ] = Е[Х2 ] = = Е\Хп ], то есть для проверки того, что все наблюдаемые величины Хи Х2, , Хп в выборке объема п имеют одинаковые математические ожидания Конкурирующая гипотеза (альтернатива) заключается в справедливости ]-> 0 для всех или некоторых значений

/ = 1,2, ,п — 1 Критерий часто используют для проверки независимости последовательности измерений, для проверки отсутствия тренда (систематического изменения)

Статистика критерия Аббе в современной форме представтает собой отношение

=

л 2

1 (п-1

(4 1)

где X = —"У* X,

Предполагается,

что А'., , Xп — взаимно независимые, нормально распределенные случайные величины с одинаковыми, но неизвестными дисперсиями Если верна некоторая альтернатива, то знаменатель статистики больше числителя и поэтому значения статистики будут, как правило, меньше тех, которые наблюдаются, когда справедлива основная гипотеза о равенстве средних

Условное распределение статистики (4 1) \Н0) при справедливости

Н0 зависит от объема выборки п, симметрично относительно 1 и определено на интервале 1 + соз(л/п) В литературных источниках отмечается, что с ростом объемов выборок распределение статистики хорошо приближается нормальным законом с параметром сдвига 1 и со стандартным отклонением при

объемах и >20, равным [(и —2)/(«2 — 1)]" , а при п > 60 - с

{(»-2)/[(н-1Хп + 2)Г

Одной из основных предпосылок применения критерия Аббе является предположение о принадлежности X,, , Xп нормальному закону Ранее отмечалось, что при справедливости Н0 числовые характеристики и распределения статистики (4 1) устойчивы к нарушению предположения о нормальности Х1, , Xп, если наблюдения принадлежат различным симметричным законам

На основании исследований, проведенных в данном разделе, можно констатировать, что применение критерия Аббе будет корректным и в тех случаях, когда мы имеем дело с законом, существенно отличающимся от нормального На рис 4 1 показано, как меняется распределение статистики (4 1) в зависимости от наблюдаемого закона На нем приведены распределения статистики в случае принадлежности X,, ,Хп законам показательному, нормальному и распределениям семейства (11) при различных значениях параметра б2

Исследования показали, что распредечение статистики (4 1) практически не отличается от распределения этой статистик в случае принадлежности наблюдений нормальному закону, даже когда наблюдаемый закон очень далек от нормального Однако закон не должен иметь "тяжелых" хвостов и быть симметричен Закон может быть двухмодальным, описываться симметричной сме-

сью законоЕ Умеренная асимметричность наблюдаемого закона также практически не сказывается на распределении статистики критерия

ФА\Н0)

0 40 0.50 0.60 0.70 0.80 0,40 1.00 1.10 1.20 1.30 1.40 1.50 1 60

Рис 4 1 Распределения статистики критерия Аббе в зависимости от параметра формы распределения семейства (11) при п = 25

В разделе мощность критерия Аббе исследована относительно различных альтернатив В таблице 4 1, например, приведены оценки мощности критерия относительно альтернатив с трендом вида

Г, = а I + о 31п(2яг) +Х, Рассмотрены альтернативы Яи, Нп, Я13, Ни, //15, задаваемые параметром а=0,25, 0,5, 1, 1,5, 2, соответственно

Полученные в разделе оценки мощности критерия позволяют судить о его способности обнаруживать наличие линейного и нелинейного тренда

Таблица 4 1 Значения мощности критерия Аббе относительно альтернатив с трендом У, = а I + а Б1п(271/) +Х,

п а Ни Н\г Я13 Я,4

50 0,025 0,0302 0,0644 0,3236 0,7592 0,9720

0,05 0,0630 0,1186 0,4472 0,8510 0,9890

0,1 0,1238 0,2152 0,5796 0,9194 0,9962

100 0,025 0,0376 0,0950 0,5548 0,9618 0,9992

0,05 0,0708 0,1618 0,6856 0,9800 0,9996

0,1 0,1332 0,2662 0,7902 0,9894 1

Исследования показали, что в качестве распределения статистики критерия при п > 20 можно применять нормальную аппроксимацию

[(« — 2)/(и2 — l)] 2, которая предпочтительней {(w-2)'[(n-lX« + 2)]}"2 и при больших п

Основные результаты данного раздела опубликованы в [6]

5 Построение моделей для распределений статистик непараметрических критериев согласия при проверки некоторых сложных гипотез

В данном разделе исследуются распределения статистик и мощность непараметрических критериев согласия при проверке сложных гипотез

Статистика критерия Колмогорова с поправкой Болыиева имеет вид

6nD„ +1

Sk = -7^=-, (5 1)

6 jn

где

D„ =max(D*,D~), D+n = raaxi--F(x„Q)\, D~n=maxW.B)-—), Ы<п [n J liiiu [ n J

n - объем выборки, x,,x2, ,xn - упорядоченные по возрастанию выборочные

значения При справедливости простой проверяемой гипотезы Н0 статистика

Sk в пределе подчиняется закону распределения Колмогорова K(s)

Статистика критерия со2 Крамера-Мизеса-Смирнова (KMC) имеет вид

<«>

При справедливости простой гипотезы статистика в пределе подчиняется закону с функцией распределения fll(i)

Статистика критерия Q2 Андерсона-Дарлинга (АД) определяется выражением

5П = пП2„ = - 2Z ln + [1- 1п(!" F(-x■ >0»} 3>

и при справедливости простой гипотезы в пределе подчиняется закону с функцией распределения a2(s)

При проверке сложных гипотез вида HQ F(x) 9 е©], когда

оценка 0 скалярного или векторного параметра распределения F(x,6) вычисляется по той же самой выборке, непараметрические критерии согласия теряют свойство "свободы от распреде тения" В этом случае на условный закон распределения статистики критерия G(S\H0) влияет ряд факторов вид наблюдаемого закона F(x,Q), соответствующего истинной гипотезе Н0, тип оцениваемого параметра и количество оцениваемых параметров, ь некоторых ситуациях конкретное значение параметра (например, для семейств гамма- и бета-распределений), используемый метод оценивания параметров

В разделе 5 3 построены таблицы процентных точек и модели распределений статистик для непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия (ОМП), уточняющие соответствующие результаты рекомендаций по стандартизации Р 50 1 037-2002 Построенные модели распределений статистик приведены в таблице 5 1 Таблицы процентных точек и модели распределений статистик строились по смоделированным выборкам статистик объемом Лг = 106 При этом выборки псевдослучайных величин, принадлежащих F(x,0), генерировались объемом п = 103

В этом случае распределения <7(5^Дц) статистики Колмогорова наилучшим образом приближаются семейством гамма-распределений с функцией плотности

2 0®°Г(0О)

а распределения статистик Крамера-Мизеса-Смирнова и Андерсона-Дарлинга хорошо - семейством распределений Джонсона с плотностью

щв0,еив2,в}) =-----е'0-2

е0-е, in

J3

02+(

х v02

l_2L 9,

(*-е3)(02+03

В разделе 5 4 исследованы распределения статистик G(Sj//0) непараметрических критериев согласия при проверке гипотез относительно семейств бета-распределений 1-го и П-го рода в случае применения для оценивания параметров этих законов метода максимального правдоподобия Бета-распределение 1-го рода имеет функцию плотности

( \е<Н/ Л0'"1

где В(0о,0,) = Г(0о)Г(0,)/Г(0о+0,) - бета-функция, параметры формы 0О,0, е (0,оо), масштабный параметр 02 е(0,со), хе [О,02] Функция плотности бета-распределения П-го рода описывается выражением

где х е [0, <ю) Частным случаем бета-распределения Н-го рода является F-распределение Фишера

Полученные таблицы процентных точек и моделей (более 1500 моделей) распределений статистик для непараметрических критериев согласия при проверке сложных гипотез относительно бета-распределений 1-го и Н-го рода при использовании оценок максимального правдоподобия (ОМП) в зависимости от значений параметров формы представлены в приложении к диссертации

Таблица 5 1 Модели предельных законов распределения статистик непараметрических критериев при использовании ОМП

Закон распределения Оценивание параметра масштаба Оценивание параметра сдвига Оценивание двух параметров

Экспоненциальный и Релея у(5 1092,0 0861,0 2950) - -

« о Полунормальный у(4 5462, 0 1001,0 3100) - -

о и о Максвелла у (5 4566, 0 0794, 0 2870) - -

? с; О Лапласа у(3 39S0, 0 1426, 0 3405) 7(6 2887,0 0718,0 2650) у(6 2949, 0 0624, 0 2613)

iai 'S Нормальный и логнормальный у(3 5609,0 1401,0 3375) y(7 5304, 0 0580, 0 2400) у(6 4721,0 0580,0 2620)

CL, и Коши у (3 0987,0 1463, 0 3350) y(5 9860, 0 0780, 0 2528) у(5 3642, 0 0654, 0 2600)

s Логистический у(3 4954,0 1411,0 3325) у (7 6325,0 0531,0 2368) у (7 5402,0 0451,0 2422)

Экстремальных значений и Вейбулла у(3 6805,0 1355, 0 3350) " 7(5 2194, 00848, 02920) 2) у( 6 6012, 0 0563, 2598)

Экспоненциальный и Релея Sb(3 3738,1 2145, 1 0792, 0 0110) - -

Полунормальный Sb(3 5270, 1 1515, 1 5527,0 0121) - -

Максвелла Sb(3 3531, 1 2201,0 9786,00118) - -

Лапласа Sb(3 2262, 0 9416, 2 7029, 0 0150) Sb(2 9669, 1 2534, 0 6936, 0 0100) ЭЬ(3 7683, 1 2865, 0 83 3 6, 0 0113)

a. К Нормальный и логнормальный Sb(3 1529, 0 9448, 2 5477, 0 0160) Sb(3 2433, 1 3147, 0 6826, 0 0095) 5Ь(4 3950, 1 4428, 0 9150, 0 0090)

о, Ы Коши Sb(3 1895,0 9134,2 6900,0 0130) Sb((2 3588, 1 0732, 0 5950, 0 0129) 5Ь(3 4364, 1 0678, 1 0000,0 0110)

Логистический Sb(3 2637, 0 9581, 2 7046, 0 0138) Sb(4 0026, 1 2853, 1 0000, 0 0122) вЬ(3 2137, 1 3612,0 3600,0 0105)

Экстремальных значений и Вейбулла Sb(3 3431, 0 9817, 2 7533,0 0148) " Sb(3 4978, 1 2236, 1 1632,0 011) 2) 5Ь(3 3854, 1 4453, 0 4986, 0 0070)

Экспоненциальш ш и Релея Sb(3 8386, 1 3429, 7 5000, 0 0900) - -

Полунормальный Sb(4 2019, 1 2918, 11 5000, 0 1000) - -

Максвелла Sb(3 9591, 1 3296,7 8000,0 1010) - -

« Лапласа Sb(4 3260, 1 0982, 27 0000, 0 1100) Sb(3 1506, 1 3352, 4 9573, 0 0960) 5Ь(3,8071, 1,3531, 5,18093,0,1000)

О н Нормальный и логнормальный Sb(4 3271, 1 0895, 28 0000, 0 1200) Sb(3 3085, 1 4043, 4 2537, 0 0800) ЭЬ(3 5601, 1 4846, 3 0987, 0 0800)

& Коши Sb(3 7830, 1 0678, 18 0000, 0 1100) Sb(3 4814, 1 2375, 7 8100, 0 1000) 5Ь(3 2902, 1 1290, 5 8367 , 0 0990)

Логистический Sb(3 5159, 1 0544, 14 7484, 0 1167) Sb(5 1316, 1 5681, 10 000,0 0651) 5Ь(3 4091, 1 4337, 2 4482, 0 0950)

Экстремальных значений и Вейбулла Sb(3 5122, 1 0640, 14 4957, 0 1250)" Sb(4 7988, 1 4023, 13 000, 0 085) 2> вЬ(3 4830, 1 5138, 3 0000, 0 0700)

Распределения статистик (5 1), (5 2) и (5 3) в данном случае, как

правило, хорошо аппроксимируются одним из семейств распределений гамма-распределениями, распределениями ЗЪ-Джонсона, распределениями £/-Джон-сона с плотностью

5/(е0,е„е2,е3)= 9' чехР|~4

' 3 .¡2п(х-д3) 1 I бета-распределениями Ш-го рода с плотностью

Г(*-е4)

де» I й

5///(0о,е1,е2)е3)е4) =

2 J

(*-е4)

е,

Зв(в0,е,)

1 + (е2-1)

(*-е4) е,

где параметры формы 0О,0,,02 е (0, со), масштабный параметр 03е(О,оо), хе[04,04 +03]

В случае проверки гипотез о согласии с 5^(00,0,)-распределениями для статистик(5 1)-(5 3) имеем те же распределения С (5\Н0), что и для .6,(00,0,)-распределений Полученные модели могут использоваться при проверке гипотез относительно бета-распределений Ш-го при оценивании двух его параметров формы

В разделе 5 5 [8] на конкретных парах близких конкурирующих гипотез проведен сравнительный анализ мощности непараметрических критериев и критериев типа %2 Для случая проверки простых гипотез критерии можно упорядочить по мощности следующим образом %2 Пирсона (АОГ) >- Андер-сона-Дарлинга >- Крамера-Мизеса-Смирнова ^Колмогорова

Такая шкала справедлива при использовании в критерии у? Пирсона асимптотически оптимального группирования (АОГ), при котором минимизируются потери в информации Фишера

При проверке сложных гипотез градация по мощности оказывается существенно иной Андерсона-Дарлинга >- Крамера-Мизеса-Смирнова >- типа %2 Никулина2 (АОГ) >- %2 Пирсона (АОГ) >~ Колмогорова

Основные результаты данного раздела опубликованы в [7,8] Заключение

В соответствии с целями исследований получены следующие результаты 1 Исследованы распределения статистик критериев проверки на симметричность, на эксцесс, критериев Шапиро-Уилка и Эппса-Палли в зависимости от объемов выборок Исследованы распределения статистик указанных кри-

Никулин М С О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и ее применение - 1973 -Т XVIII -№3 -С 675-676

териев в зависимости от наблюдаемых законов Исследована мощность данных критериев и проведено сравнение с мощностью критериев согласия при проверке сложных гипотез Впервые показано, что критерии Шапиро-Уичка и Эппса-Палли при малых объемах выборок оказываются смещенными относительно некоторых конкурирующих гипотез

2 Методами статистического моделирования исследована сходимость распределений статистик критериев Смирнова и Лемана-Розенблатта к предельным Даны рекомендации по выбору объемов выборок, обеспечивающих большую гладкость распределения статистики Смирнова Предложена модификация статистики Смирнова, улучшающая сходимость распределения статистики критерия к предельному распределению Колмогорова Проведен сравнительный анализ мощности критериев однородности Смирнова и Лемана-Розенблатта

3 Методами статистического моделирования исследованы распределения статистик критериев типа Граббса в зависимости от вида закона, которому принадлежат наблюдения Расширена область применения критериев типа Граббса и реализована возможность а) проверки на наличие одновременно одного минимального и одного максимального аномального значения, б) проверки на выброс одновременно трех минимальных либо трех максимальных значений в выборке Построены таблицы соответствующих процентных точек Разработано программное обеспечение, позволяющее исследовать распределения статистик типа Граббса для проверки на выброс любого количества минимальных и максимальных значений в выборке, и возможность построения процентных точек для соответствующих критериев

4 Исследованы распределения статистики критерия независимости Аббе в зависимости от закона распределения наблюдений Показано, что применение критерия Аббе остается корректным и в тех случаях, когда мы имеем дело с законом, существенно отличающимся от нормального Полученные оценки мощности критерия позволяют судить о его способности обнаруживать наличие линейного и нелинейного тренда

5 Уточнены таблицы процентных точек и модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно ряда законов распределения в случае использовании метода максимального правдоподобия Эти результаты уточняют модели, включенные в рекомендации по стандартизации Р 50 1 037-2002

6 Проведены исследования распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений 1-го и 11-го рода Получены таблицы процентных точек и построены модели распределений статистик для множества конкретных значений 2-х параметров формы бета-распределении

7 Проведен сравнительный анализ мощности непараметрических критериев и критериев типа %2, позволяющий проранжировать критерии по предпочтительности применения

8 Разработанные программные средства моделирования и исследования статистических закономерностей, связанные с рассмотренными в диссертационной работе критериями, построенные модели распределений статистик встроены в развиваемую на кафедре прикладной математики НГТУ программную систему "Интервальная статистика" ISW Результаты исследований и разработанное программное обеспечение используются при проведении лабораторных работ по курсу "Компьютерные технологии анализа данных и исследования статистических закономерностей" для студентов, обучающихся по направлению подготовки 010500 - прикладная математика и информатика

Список основных публикаций

1 Лемешко, С Б Исследование критериев проверки гипотез, используемых в задачах управления качеством / Лемешко, Б Ю , Лемешко, С Б, Миркин, Е П // Материалы VII международной конференции "Актуальные проблемы электронного приборостроения" АПЭП-2004 Новосибирск, 2004 - Т 6 - С 269-272

2 Лемешко, С Б Сравнительный анализ критериев проверки отклонения распределения от нормального закона / Лемешко, Б Ю , Лемешко, СБ// Метрология 2005 №2 - С 3-24

3 Лемешко, С Б Расширение области применения критериев типа Граббса, используемых при отбраковке аномальных измерений / Лемешко, Б Ю , Лемешко, С Б//Измерительная техника 2005 -№6 - С 13-19

4 Лемешко, СБ О сходимости распределений статистик и мощности критериев однородности Смирнова и Лемана-Розенблатта / Лемешко, Б Ю , Лемешко, СБ// Измерительная техника 2005 № 12 - С 9-14

5 Лемешко, Б Ю , Лемешко, С Б , Постовалов, С Н О мощности критериев согласия при близких альтернативах // Материалы Российской НТК "Информатика и проблемы телекоммуникаций", Новосибирск 2006 - Т 1 -С 175-179

6 Лемешко, С Б Критерий независимости Аббе при нарушении предположений нормальности / Лемешко, СБ// Измерительная техника 2006 № 10 - С 9-14

7 Лемешко, С Б Распределения статистик критериев согласия типа хи-квадрат при малых выборках / Лемешко, СБ// Материалы VII международной конференции "Актуальные проблемы электронного приборостроения" АПЭП-2006 Новосибирск, 2006 -Т 6 - С 78-82

8 Лемешко, Б Ю , Лемешко, С Б , Постовалов, С Н Мощность критериев согласия при близких альтернативах // Измерительная техника 2007 № 2 -С 22-27

Подписано в печать 10 04 07 г Формат 60x84x1/16 Бумага офсетная Тираж 100 экз Печ л 1 5 Заказ № 633

Отпечатано в типографии

Новосибирского государственного технического университета

630092, г Новосибирск, пр К Маркса, 20

Оглавление автор диссертации — кандидата технических наук Лемешко, Станислав Борисович

ВВЕДЕНИЕ.

1. ИССЛЕДОВАНИЕ И СРАВНИТЕЛЬНЫЙ АНАЛИЗ КРИТЕРИЕВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ОТ НОРМАЛЬНОГО ЗАКОНА.

1.1. Введение.

1.2. Критерий проверки на симметричность.

1.3. Критерий проверки на эксцесс.

1.4. Критерий Шапиро-Уилка.

1.5. Критерий Эппса-Палли.

1.6. Модифицированный критерий Шапиро-Уилка.

1.7. Совместный критерий проверки на симметричность и нулевой коэффициент эксцесса.

1.8. Модификация D'Agostino критерия проверки на симметричность.

1.9. Модификация D'Agostino критерия проверки на симметричность и значение эксцесса.

1.10. Совместный критерия проверки на симметричность и нулевой коэффициент эксцесса D'Agostino.

1.11. Выводы.

2. ИССЛЕДОВАНИЕ РАСПРЕДЕЛЕНИЙ СТАТИСТИК И МОЩНОСТИ КРИТЕРИЕВ ОДНОРОДНОСТИ.

2.1. Введение.

2.2. Критерий Смирнова.

2.3. Критерий однородности Лемана-Розенблатга.

2.4. Выводы.

3. РАСШИРЕНИЕ ОБЛАСТИ ПРИМЕНЕНИЯ КРИТЕРИЕВ ГРАББСА, ИСПОЛЬЗУЕМЫХ ПРИ ОТБРАКОВКЕ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ.

3.1. Введение.

3.2. Критерии отбраковки аномальных измерений при нормальном законе распределения.

3.2.1. Критерий Граббса проверки на один выброс.

3.2.2. Проверка на два выброса.

3.2.3. Проверка на три выброса.

3.2.4. Одновременная проверка на выброс наименьшего и наибольшего значения

3.3. Выводы.

4. ИССЛЕДОВАНИЕ РАСПРЕДЕЛЕНИЙ И МОЩНОСТИ КРИТЕРИЯ АББЕ ПРИ НАРУШЕНИИ ПРЕДПОЛОЖЕНИЙ НОРМАЛЬНОСТИ.

4.1. Введение.

4.2. Степень близости распределений статистики Аббе к нормальному.

4.3. О степени зависимости распределений статистики Аббе от наблюдаемого закона.

4.4. Исследование мощности критерия Аббе.

4.5. Выводы.

5. ПОСТРОЕНИЕ МОДЕЛЕЙ ДЛЯ РАСПРЕДЕЛЕНИЙ СТАТИСТИК НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СОГЛАСИЯ ПРИ ПРОВЕРКЕ НЕКОТОРЫХ СЛОЖНЫХ ГИПОТЕЗ.

5.1 Введение.

5.2 Исследуемые критерии.

5.3. Уточнение моделей распределений статистик непараметрических критериев согласия при проверки сложных гипотез.

5.4. Исследование распределений статистик непараметрических критериев согласия при проверке гипотез относительно бета-распределений.

5.5. Сравнительный анализ мощности критериев согласия при близких альтернативах.

5.5.1 Рассматриваемые альтернативы.

5.5.2 Мощность критериев в случае пары альтернатив "нормальныйлогистический".

5.5.3. Мощности критериев в случае пары альтернатив "Вейбулла - гамма-распределение"

5.6. Выводы.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Лемешко, Станислав Борисович

Актуальность темы исследования. Корректное применение на практике множества классических методов математической статистики обусловлено выполнением конкретных предпосылок или условий, которые в реальных условиях оказываются недостижимыми или не могут быть проверены. В условиях конкретной ситуации даже при кажущихся незначительными нарушениях предпосылок свойства оценок или распределения статистик применяемых критериев могут существенно отличаться от "стандартных". В других случаях наоборот, даже значительные отклонения реальных условий от классических предположений не приводят к значимым изменениям свойств или распределений статистик.

Как правило, исследование свойств оценок или статистик, нахождение закона распределения статистики конкретного критерия аналитическими методами оказывается чрезвычайно сложным. Особенно, если учесть множество реальных ситуаций, для которых это следовало бы сделать. Поэтому при исследовании вероятностных (статистических) закономерностей все чаще используют методы статистического моделирования.

Данная диссертационная работа является логическим продолжением исследований (Постовалов С.Н., Чимитова Е.В., Помадин С.С.), проводимых на кафедре прикладной математики НГТУ и направленных на расширение прикладных возможностей классических методов математической статистики за счет изучения свойств классических критериев при нарушении стандартных предположений, лежащих в обосновании метода или критерия. Развиваемая методика компьютерного моделирования и анализа статистических закономерностей позволяет получать полезные результаты, расширяющие аппарат математической статистики. Применение получаемых результатов обеспечивает корректность статистических выводов в тех ситуациях, когда использование классических процедур и методов неправомерно. Методика дополняет аналитические методы, обеспечивая нахождение приближенного решения в тех случаях, когда этого не удается сделать аналитическими методами.

Данная диссертационная работа нацелена на решение ряда задач, интерес к которым не снижается в свете их практической направленности и частого использования соответствующих методов или критериев в приложениях.

Принадлежность наблюдаемых данных нормальному закону является необходимой предпосылкой для корректного применения большинства классических методов математической статистики, используемых в задачах обработки измерений, стандартизации и контроля качества. Поэтому проверка на отклонение от нормального закона является частой процедурой в ходе проведения измерений, контроля и испытаний.

Отечественный стандарт ГОСТ Р ИСО 5479-2002 "Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения" [55], введенный в действие в 2002 г., представляет собой аутентичный текст международного стандарта ISO 5479-97. В стандарте рассматривается графический метод проверки на нормальность с использованием вероятностной бумаги, критерии проверки на симметричность и на значение эксцесса, статистики которых представляют собой функции от оценок моментов закона распределения, критерии Шапиро-Уилка, основанные на регрессионном анализе порядковых статистик, критерий Эппса-Палли, статистика которого измеряет некоторое расстояние между выборочной характеристической функцией и характеристической функцией нормального закона.

С необходимостью решения задач проверки гипотез о принадлежности двух выборок случайных величин одной и той же генеральной совокупности (проверки однородности) постоянно сталкиваются при анализе случайных ошибок средств измерений, при управлении качеством процессов статистическими методами. Такая задача естественно возникает при проверке средств измерений, когда пытаются убедиться в том, что закон распределения случайных ошибок измерений не претерпел существенных изменений по истечении некоторого интервала времени. С проблемами решения таких задач нередко разбираются в различных приложениях. При обработке экспериментального материала очень часто ее приходится решать технологам, медикам, биологам. В данной диссертационной работе не затрагиваются критерии проверки однородности средних и критерии однородности дисперсий, хотя и исследуется устойчивость критерия проверки независимости Аббе, близкого по свойствам к критериям проверки однородности средних.

При решении задач статистического анализа и, в частности, при построении моделей законов распределения и вычислении оценок параметров этих моделей проблема наличия в выборке аномальных измерений имеет чрезвычайно важное значение. Присутствие единственного аномального наблюдения может приводить к оценкам, которые совершенно не согласуются с выборочными данными. Поэтому статистическим критериям, предназначенным для выделения аномальных результатов измерений (выбросов), оказывают серьезное внимание в практической деятельности. Если не исключить выбросы из анализируемых данных, то традиционно применяемые классические методы статистического анализа, как правило, не являющиеся робастными, чаще всего приводят к некорректным выводам.

Не окончательно решенной проблемой является проверка адекватности моделей законов распределений с применением критериев согласия. Практика их применения изобилует примерами неэффективного (почти всегда) или л некорректного (очень часто) применения. Это касается как критериев типа % , так и непараметрических критериев согласия. В частности, предельные распределения статистик непараметрических критериев согласия типа Колмогорова, типа Крамера-Мизеса-Смирнова или Андерсона-Дарлинга при проверке сложных гипотез зависят от истинного закона, соответствующего проверяемой гипотезе, числа и типа оцениваемых параметров этого закона, от выбранного метода оценивания параметров, иногда, от значения параметра. Последние факты практически неизвестны большинству даже подготовленных пользователей статистических методов. Особенно интересны для практики результаты исследований распределений статистик непараметрических критериев согласия при проверке сложных гипотез для тех законов, соответствующих проверяемой гипотезе, в случае которых распределения статистик зависят от конкретных значений параметров, в частности, для бета-распределения 1-го и 2-го рода. Интерес этот обусловлен тем, что частным случаем бета-распределения 2-го рода является Fv ^-распределение Фишера, широко встречающееся в задачах статистического анализа в качестве распределения статистик различных критериев.

Из множества статистических критериев, применение которых возможно для проверки некоторой гипотезы, следует выбирать тот, который для заданной вероятности ошибки 1-го рода (для заданного уровня значимости) гарантирует минимальную вероятность ошибки 2-го рода, то есть обладает максимальной мощностью. Однако в большинстве случаев вопрос этот остается без четкого ответа, так как определение мощности критерия упирается в необходимость знания распределения статистики критерия при соответствующей конкурирующей гипотезе. А нахождение этого распределения аналитическими методами, как правило, связано с серьезными трудностями и удается крайне редко.

Цель и задачи исследований. Основной целью диссертационной работы является дальнейшее расширение на основе компьютерного моделирования прикладных возможностей классических методов математической статистики, уточнение знаний о свойствах ряда статистических критериев, широко используемых в различных прикладных областях.

В соответствии с поставленной целью решались следующие задачи:

- исследование распределений статистик и сравнительный анализ совокупности критериев, применяемых при проверке отклонения распределения вероятностей от нормального закона;

-исследование распределений и мощности критериев проверки однородности двух выборок Смирнова и Лемана-Розенблатта;

- исследование распределений статистик критериев типа Граббса и расширение их возможностей при отбраковке аномальных измерений;

- исследование распределений статистики критерия независимости Аббе при нарушении предположений о принадлежности наблюдений нормальному закону, исследование мощности критерия;

-уточнение моделей распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга при проверке сложных гипотез относительно некоторых законов наблюдаемых величин;

- исследование распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлин-га при проверке сложных гипотез относительно семейств бета-распределений, построение моделей распределений статистик и таблиц процентных точек;

- сравнительный анализ мощности критериев типа и непараметрических критериев согласия Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга.

Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, статистического моделирования, математического программирования.

Научная новизна диссертационной работы заключается:

- в результатах сравнительного анализа критериев проверки отклонения распределения от нормального закона и в выявлении недостатков критериев Шапиро-Уилка и Эппса-Палли, которые ранее никем не отмечались;

- в результатах исследования мощности критериев однородности Смирнова и Лемана-Розенблатта, в предложенной поправке к статистике критерия Смирнова, обеспечивающей близость распределения статистики к предельному;

- в построенных таблицах процентных точек, расширяющих возможности критериев типаГраббса при отбраковке аномальных измерений;

- в подтверждении устойчивости критерия независимости Аббе к нарушению предположений о принадлежности наблюдений нормальному закону, в результатах исследования мощности критерия;

- в моделях распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга при проверке сложных гипотез относительно некоторых законов наблюдаемых величин;

-в результатах исследования, моделях и таблицах процентных точек распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений; - в результатах сравнительного анализа мощности критериев согласия.

Основные положения, выносимые на защиту. На защиту выносятся:

1. Результаты исследований распределений статистик, мощности и сравнительного анализа критериев проверки отклонения эмпирического распределения от нормального закона.

2. Результаты исследований распределений статистик и мощности критериев однородности Смирнова и Лемана-Розенблатта, рекомендации по применению критериев однородности.

3. Результаты расширения возможностей критериев типа Граббса для проверки различных видов гипотез (об аномальности различного числа элементов в выборке).

4. Результаты исследования устойчивости критерия независимости Аббе к нарушению предположений о принадлежности наблюдений нормальному закону, результаты исследования мощности критерия.

5. Уточненные модели распределений статистик непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлин-га при проверке сложных гипотез относительно некоторых законов наблюдаемых величин.

6. Результаты исследования, модели и таблицы процентных точек распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений.

7. Результаты сравнительного анализа мощности критериев типа %2 и непараметрических критериев согласия Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга.

Обоснованность и достоверность научных положений, выводов и рекомендаций обеспечивается:

- корректным применением математического аппарата и методов статистического моделирования для исследования свойств и распределений статистик критериев;

- совпадением результатов статистического моделирования с известными теоретическими результатами.

Личный творческий вклад автора заключается в проведении исследований, обосновывающих основные положения, выносимые на защиту: в разработке программного обеспечения, проведении статистического моделирования распределений статистик, вычислении мощности критериев относительно конкретных альтернатив, в построении моделей распределений статистик и вычислении таблиц процентных точек.

Практическая ценность и реализация результатов.

Результаты сравнительного анализа критериев проверки отклонения от нормального закона, включающего указания недостатков и преимуществ отдельных критериев, расширяют рекомендации для практического применения критериев, приводимые в ГОСТ Р ИСО 5479-2002 [55].

Результаты исследования критерия однородности Смирнова, предложенная поправка к статистике критерия расширяют возможности применения критерия в приложениях.

Результаты исследования устойчивости критерия независимости Аббе расширяют сферу его корректного применения в приложениях.

Результаты исследования статистик критериев типа Граббса позволяют проверять на аномальность одновременно несколько элементов в выборке, расширяя прикладные возможности критерия.

Результаты исследования непараметрических критериев согласия при проверке сложных гипотез, результаты исследования мощности непараметрических критериев и критериев типа %2 дополняют и уточняют рекомендации по стандартизации Р 50.1.037-2002 [106] и Р 50.1.033-2001 [105]. и

Результаты исследований и средства моделирования включены в программную систему "Интервальная статистика" ISW и используются в научных исследованиях и учебном процессе.

Апробация работы. Результаты работы докладывались на региональной конференции студентов, аспирантов и молодых ученых "Наука. Технологии. Инновации", Новосибирск, 2003 и 2005 гг.; Всероссийской научно-технической конференции "Информатика и проблемы телекоммуникаций", Новосибирск, 2004, 2005 и 2006 гг.; VII и VIII международных конференциях "Актуальные проблемы электронного приборостроения", Новосибирск, 2004 и 2006 гг.; Всероссийской научно-технической конференции "Информационные системы и технологии", Нижний Новгород, 2004 и 2006 гг.; VIII Korea-Russia International Symposium on Science and Technology, Tomsk, 2004 г., VII International Conference "Computer Data Analysis and Modeling: Robustness and Computer Intensive Methods", Minsk, 2004 г.; Международном научно-техническом семинаре "Математическая, статистическая и и компьютерная поддержка качества измерений", Санкт-Петербург, 2006 г.

Диссертационные исследования явились составной частью работ, проводимых в рамках проектов: "Математическое и алгоритмическое обеспечение задач статистического анализа данных и исследования статистических законно-мерностей при нарушении классических предположений", грант Министерства образования Российской Федерации № Т02-3.3-3356, 2003-2004 гг.; "Развитие компьютерных технологий моделирования и исследования фундаментальных закономерностей математической статистики", раздел 3.3 программы "Развитие научного потенциала высшей школы" Министерства образования и науки РФ, код проекта 15378, 2005 г.; "Развитие компьютерных технологий исследования статистических закономерностей" (контракт № 2005-РИ-19.0/002/091, 2005 г.) и "Применение компьютерных технологий исследования статистических закономерностей в задачах оценивания и различения близких гипотез о виде и свойствах распределений случайных величин" (контракт № 2006-РИ-19.0/001/119, 2006 г.), ФЦНТП "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы по разделу "Проведение научных исследований молодыми учеными"; "Расширение прикладных возможностей классических методов математической статистики", грант Российского фонда фундаментальных исследований № 06-01-00059.

Публикации. По теме диссертации опубликовано 12 печатных работ, в том числе 5 в рецензируемых журналах из списка ВАК, 7 в трудах и материалах конференций.

Структура работы. Основная часть диссертации изложена на 158 страницах и состоит из введения, 5 глав основного содержания, включая 34 таблицы и 84 рисунка, заключения, списка литературы из 121 наименования и приложений.

Заключение диссертация на тему "Расширение прикладных возможностей некоторых классических методов математической статистики"

5.6. Выводы

В данном разделе проведены исследования и уточнены модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно ряда законов распределения в случае использовании метода максимального правдоподобия. Эти результаты уточняют модели, включенные в [106].

Проведены исследования распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений. Полученные таблицы процентных точек и построенные модели распределений статистик для множества конкретных значений 2-х параметров формы бета-распределений приведены в таблицах приложения.

На конкретных парах близких конкурирующих гипотез проведен сравнительный анализ мощности непараметрических критериев и критериев типа %2. Для случая проверки простых гипотез можно упорядочить критерии по мощности следующим образом: А

Такая шкала справедлива при использовании в критерии % Пирсона АОГ, при котором минимизируются потери в информации Фишера. При очень близких гипотезах может быть:

Колмогорова >- ©2 Мизеса.

При проверке сложных гипотез градация по мощности оказывается существенно иной:

С12 Андерсона-Дарлинга >- ю2 Мизеса >- Yn (АОГ) >- X2 Пирсона (АОГ) >- Колмогорова. При очень близких гипотезах может быть:

Q2 Андерсона-Дарлинга >- Yn (АОГ) >- ©2 Мизеса >- X2 Пирсона (АОГ) >- Колмогорова.

Указанные выводы носят интегрированный характер. Такое упорядочение не является жёстким. Как видно из таблиц с приведенными значениями мощности, иногда критерий имеет преимущества по мощности при одних значениях а и объемах выборок п и уступает при других значениях а и п. л

Надо иметь в ввиду, что мощность критериев типа % (Пирсона и Никулина) зависит не только от гипотез Н0, Нх и объема выборок п, но при заданных Н0 и Нх - от способа группирования и числа интервалов.

Число интервалов, при котором мощность критериев для пары альтернатив Н0 и Нх максимальна, зависит от этих гипотез и от способа группирования. Увеличение числа интервалов не всегда приводит к росту мощности критериев типа %2 [111].

При близких гипотезах #0 и Я1 выбор АОГ при использовании критерия

X Пирсона дает положительный эффект как при простых, так и при сложных гипотезах. Однако это не означает, что использование АОГ всегда гарантирует максимальную мощность данного критерия. При конкретных и не очень близких гипотезах оптимальным может оказаться некоторый другой способ группирования, который может быть найден в результате максимизации мощности критерия.

Вывод о безоговорочно положительном эффекте применения АОГ нельзя распространять на критерий Никулина: при одной и той же паре гипотез Н0 и Нх при одном числе интервалов к критерий оказывается более мощным при АОГ, при другом к - более мощным при РВГ. Зависимость мощности от способа группирования оказывается более сложной и требует исследования. Основные результаты раздела опубликованы в [74, 94].

ЗАКЛЮЧЕНИЕ

В соответствии с целями исследований получены следующие результаты.

1. Исследованы распределения статистик критериев проверки на симметричность, на эксцесс, критериев Шапиро-Уилка и Эппса-Палли в зависимости от объемов выборок. Исследованы распределения статистик указанных критериев в зависимости от наблюдаемых законов. Исследована мощность данных критериев и проведено сравнение с мощностью критериев согласия при проверке сложных гипотез. Впервые показано, что критерии Шапиро-Уилка и Эппса-Палли при малых объемах выборок оказываются смещенными относительно некоторых конкурирующих гипотез.

2. Методами статистического моделирования исследована сходимость распределений статистик критериев Смирнова и Лемана-Розенблатта к предельным. Даны рекомендации по выбору объемов выборок, обеспечивающих большую гладкость распределения статистики Смирнова. Предложена модификация статистики Смирнова, улучшающая сходимость распределения статистики критерия к предельному распределению Колмогорова. Проведен сравнительный анализ мощности критериев однородности Смирнова и Лемана-Розенблатта.

3. Методами статистического моделирования исследованы распределения статистик критериев типа Граббса в зависимости от вида закона, которому принадлежат наблюдения. Расширена область применения критериев типа Граббса и реализована возможность: а) проверки на наличие одновременно одного минимального и одного максимального аномального значения; б) проверки на выброс одновременно трех минимальных либо три максимальных значений в выборке. Построены таблицы соответствующих процентных точек. Разработано программное обеспечение, позволяющее исследовать распределения статистик типа Граббса для проверки на выброс любого количества минимальных и максимальных значений в выборке, и возможность построения процентных точек для соответствующих критериев.

4. Исследованы распределения статистики критерия независимости Аббе в зависимости от закона распределения наблюдений. Показано, что применение критерия Аббе остается корректным и в тех случаях, когда мы имеем дело с законом, существенно отличающимся от нормального. Полученные оценки мощности критерия позволяют судить о его способности обнаруживать наличие линейного и нелинейного тренда.Уточнены таблицы процентных точек и модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно ряда законов распределения в случае использовании метода максимального правдоподобия. Эти результаты уточняют модели, включенные в рекомендации по стандартизации Р 50.1.037-2002.

5. Проведены исследования распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно семейств бета-распределений 1-го и И-го рода. Получены таблицы процентных точек и построены модели распределений статистик для множества конкретных значений 2-х параметров формы бета-распределений.

6. Проведен сравнительный анализ мощности непараметрических критериев и критериев типа %2, позволяющий проранжировать критерии по предпочтительности применения.

7. Разработанные программные средства моделирования и исследования статистических закономерностей, связанные с рассмотренными в диссертационной работе критериями, построенные модели распределений статистик встроены в развиваемую на кафедре прикладной математики программную систему "Интервальная статистика" ISW. Результаты исследований и разработанное программное обеспечение используются при проведении лабораторных работ по курсу "Компьютерные технологии анализа данных и исследования статистических закономерностей" для студентов, обучающихся по направлению подготовки 010500 - прикладная математика и информатика [73].

Библиография Лемешко, Станислав Борисович, диссертация по теме Теоретические основы информатики

1. Aguirre, N., Nikulin, M. Chi-squared goodness-of-fit test for the family of logistic distributions // Kybemetika. 1994. - V. 30. - № 3. - P. 214-222.

2. Anscombe, F.J., Glynn, W.J. Distribution of the Kurtosis Statistic (32 f°r Normal

3. Samples // Biometrika, 1983. Vol. 70, No.l. P. 227-234.

4. Arizono, I., Ohta, H. A Test for Normality Based on Kulback-Leibler Information // The American Statistician, 1989. Vol.43, No. 1. P. 20-22.

5. Baringhaus, L., Danschke, R., Henze N. Recent and classical tests for normality -A comparative study. Comm. Statistic. B, 18(1), 1989. P. 363-379.

6. Baringhaus, L., Henze, N. A consistent test for multivatiate normality based on the emperical characteristic function // Metrika. 35, 1988. P. 339-348.

7. Birch, M.W. A new proof of the Pearson-Fisher theorem // Ann. Math. Statist. -1964. V. 35.-P. 817.

8. Bowmann, K.O., Shenton, L.R. 'Omnibus' test contours for departures from normality based on fiX b2ll Biometrika, 62,1975. P. 243-250.

9. Chandra, M., Singpurwalla, N.D., Stephens, M.A. Statistics for Test of Fit for the Extrem-Value and Weibull Distribution // J. Am. Statist. Assoc. 1981. V.76. -P. 375.2

10. Chernoff, H., Lehmann, E.L. The use of maximum likelihood estimates in % test for goodness of fit// Ann. Math. Stat., 1954. V. 25. - P. 579-586.

11. D'Agostino, R.B. Transformation to normality of the null distribution of gi // Biometrika, 57, 1970. P. 679-681.

12. D'Agostino, R.B., Belanger, A., D'Agostino, R.B., JR. A Suggestion for using Powerful and Informative Tests of Normality // The American Statistician, 1990. Vol.44, No. 4.-P. 316-321.

13. D'Agostino, R.B., Tietjen, G.L. Simulation probability points of b2 for small samples // Biometrika, 58,1971. P. 669-672.

14. Doornik, J. A., Hansen, H. An Omnibus Test for Univariate and Multivariate Normality. 1994. Discussion Paper № W4 & 91, Nuffield College, Oxford. (http://www.nuff.ox.ac.uk/users/Doornik/papers/normal2.pdf)

15. Dyer, A.R. Comparison of Tests for Normality with a Cautionary Note // Biometrika, 1974. Vol. 61, No.l. P. 185-189.

16. Epps, T.W., Pulley, L.B. A test for normality based on the empirical characteristic function // Biometrika. 70,1983. P. 723-726.

17. Frank E. Grubbs, Glenn Beck. Extension of sample sizes and percentage points for significance tests of outlying observations // Technometrics, 1972. Vol. 14. -No. 4.-P. 847-854.

18. Frank E. Grubbs. Procedures for Detecting Outlying Observations in Samples // Technometrics, 1969. Vol. 11. - No. 1. - P. 1 -21

19. Frank E. Grubbs. Sample Criteria for Testing Outlying observations // Ann. Math. Statist, 1950.-Vol. 21.-No. l.-P. 27-58.

20. Greenwood, P.E., Nikulin M.S. A Guide to Chi-Squared Testing. John Wiley & Sons, Inc. 1996.-280 p.

21. Kac, M., Kiefer, J., Wolfowitz J. On tests of normality and other tests of goodness of fit based on distance methods // Ann. Math. Stat. 1955. V.26. - P. 189-211.

22. Kinnison, R. Correlation Coefficient Goodness-of-Fit Test for the Extreme-Value Distribution // The American Statistician, 1989. Vol.43, No. 2. P. 98-100.

23. Kolmogoroff, A.N. Sulla determinazione empirica di una legge di distribuzione // G. 1st. Ital. attuar. 1933. Vol. 4. - № 1. - P. 83-91.

24. Lehmann, E.L. Consistency and unbiasedness of certain nonparametric tests / Ann.Math. Statist.- 1951. V.22.№ l.-P. 165-179.

25. Lemeshko, B.Yu., Lemeshko, S.B., Pomadin, S.S., Mirkin, E.P. Investigation Of The Stability Of Statistical Hypotheses Testing Procedures Used In Quality

26. Management Problems // Proceedings of the Seventh International Conference "Computer Data Analysis and Modeling: Robustness and Computer Intensive Methods", September 6-10,2004, Minsk. Vol. 1. P. 90-93.

27. Lin, C.C., Mudholkar, G.S. A Simple Test for Normality Against Asymmetric Alternatives // Biometrika, 1980. Vol. 67, No.2. P. 455-461.

28. Looney, S. W., Gulledge, T.R. Probability Plotting Positions and goodness of Fit for the Normal Distribution // The Statistician, 1985, Vol. 34, No. 3. P. 297-303.

29. Looney, S.W., Gulledge, T.R. Use of the Correlation Coefficient with Normal Probability Plots // The American Statistician, 1985. Vol.39, No. 1. P. 75-79.

30. Mage, D.T. An Objective Graphical Method for Testing Normal Distributional Assumptions Using Probability Plots // The American Statistician, 1982. Vol.36, No. 2.-P. 116-120.

31. Martinez, J., Iglewicz, B. A Test for Departure from Normality Based on a Biweight Estimator of Scale // Biometrika, 1981. Vol. 68, No.l. P. 331-333.

32. Neumann, J. von. Distribution of the ratio of the mean square successive difference to the variance // AMS, 1941,12. p. 367-395.

33. Pearson, E.S., Hartley, H.O. Biometrika tables for Statisticians. Vol. 1, edn. 3, Cambridge University Press, 1966. P. 207-208.

34. Pearson, E.S., Hartley, H.O. Biometrika tables for Statisticians. Vol. 2, Cambridge University Press, 1976. P. 221.

35. Pearson, E.S., D'Agostino, R.B., Bowmann K.O. Test for departure from normality: Comparison of powers // Biometrika, 64,1977. P. 231-246.

36. Prescott, P. Comparison of test for Normality Using Stylized Senstivity Surfaces // Biometrika, 1976. Vol. 63, No.2. P. 285-289.

37. Prescott, P. On a Test for Normality Based on Sample Entropy // Journal of the Royal Statistical Society, Series B, 1976. Vol. 38, No. 3. P. 254-256.

38. Rosenblatt, M. Limit theorems associated with variants of the von Mises statistic //Ann. Math. Statist. 1952. V.23.-P. 617-623.

39. Saniga, E.M., Miles, J.A. Power of Some Standard Goodness-of-Fit Test Of Normality Against Asymmetric Stable Alternatives // Journal of The American Statistical Association, 1979. Vol. 74, No. 368. P. 861-865.

40. Shapiro, S.S, Wilk, M.B., Chem, C.J. J. Amer. Stat Ass., 1968. December. P. 13431372.

41. Shapiro, S.S., Francia, R.S. An approximate analysis of variance test fo normality // J. Amer. Statist. Assoc., 337,1972. P. 215-216.

42. Shapiro, S.S., Wilk, M.B. An analysis of variance test for normality (complete samples) //Biometrika, 52,1965. P. 591-611.

43. Spiegelhalter, D.J. An Omnibus Test for Normality fo Small Samples // Biometrika, 1980. Vol. 67, No.2. P. 493-496.

44. Stephens, M.A. EDF statistics for goodness of fit and some comparisons // J. Am. Statist. Assoc. 1974. V.69. - P. 730-737.

45. Stephens, M.A. Use of Kolmogorov-Smirnov, Cramer von Mises and related statistics - vithout extensive table // J. R. Stat. Soc. - 1970. - B. 32. - P. 115-122.

46. Van der Vaart A.W. Asymptotic Statistics. Cambridge University Press. 1998. -443 p.

47. Айвазян, C.A., Мхитарян, B.C. Прикладная статистика и основы эконометрики. Учебник для ВУЗОВ М.: ЮНИТИ, 1998. - 1022 С.

48. Болыпев, JI.H. Асимптотические пирсоновские преобразования // Теория вероятностей и ее применения. 1963. Т. 8. - № 2. - С. 129-155.

49. Болыпев, JI.H. Теория вероятностей и математическая статистика / Избранные труды. Под ред. Ю.В. Прохорова. 6- М.: Наука, 1987. 286 С.

50. Большее, JI.H., Смирнов, Н.В. Таблицы математической статистики. М.: Наука, 1983.-416 С.

51. Боровков, А.А. К задаче о двух выборках // Изв. АН СССР, серия матем.,1962. Т. 26. С.605-624.

52. Воинов, В.Г. Об оптимальных свойствах критерия Рао-Робсон-Никулина // Заводская лаборатория. Диагностика материалов. 2006. 1.12. - № 3. - С. 65-70.

53. ГОСТ 11.002-73. Прикладная статистика. Правила оценки анормальности результатов наблюдений. М.: Изд-во стандартов. 1982. 26 С.

54. ГОСТ Р ИСО 5479-2002. Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения. М.: Изд-во стандартов. 2002. - 30 С.

55. ГОСТ Р ИСО 5725-2-2002. Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. М.: Изд-во стандартов. 51 С.

56. Денисов, В.И., Лемешко, Б.Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. -Новосибирск, 1979.-С. 5-14.

57. Денисов, В.И., Лемешко, Б.Ю., Цой, Е.Б. Оптимальное группирование, оценка параметров и планирование регрессионных экспериментов: В 2-х ч. / Новосиб. гос. техн. ун-т. Новосибирск, 1993. - 346 С.

58. Золотухина, Л.В., Винник, ЕВ. Эмпирическое исследование мощности критерия Саркади и его модификация // Заводская лаборатория. 1985. Т. 51. - №1. - С. 5155.

59. Королюк, B.C. Асимптотический анализ распределений максимальных уклонений в схеме Бернулли // Теория вероятностей и ее применения. 1959. -Т.4.-С. 369-397.

60. Крамер, Г. Математические методы статистики. М.: Мир, 1975. - 648 с.

61. Лемешко, Б.Ю. Асимптотически оптимальное группирование наблюдений -это обеспечение максимальной мощности критериев // Надежность и контроль качества. 1997. № 8. - С. 3-14.

62. Лемешко, Б.Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия // Заводская лаборатория. 1998. Т. 64. - №1. - С. 56-64.

63. Лемешко, Б.Ю. Постовалов С.Н. Прикладные аспекты использования критериев согласия в случае проверки сложных гипотез // Надежность и контроль качества. 1997. - № 11. - С. 3-17.

64. Лемешко, Б.Ю. Робастные методы оценивания и отбраковка аномальных измерений // Заводская лаборатория. 1997. - Т.63. - № 5. - С. 43-49.

65. Лемешко, Б.Ю., Лемешко С.Б. О распределениях статистик и мощности критериев однородности двух выборок // Материалы Российской НТК "Информатика и проблемы телекоммуникаций", Новосибирск. 2005. Т.1. -С. 109-112.

66. Лемешко, Б.Ю., Лемешко, С.Б. О сходимости распределений статистик и мощности критериев однородности Смирнова и Лемана-Розенблатта // Измерительная техника. 2005. № 12. С. 9-14.

67. Лемешко, Б.Ю., Лемешко, С.Б. Расширение области применения критериев типа Граббса, используемых при отбраковке аномальных измерений // Измерительная техника. 2005. № 6. - С. 13-19.

68. Лемешко, Б.Ю., Лемешко, С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. № 2. -С. 3-24.

69. Лемешко, Б.Ю., Лемешко, С.Б., Постовалов, С.Н. Мощность критериев согласия при близких альтернативах // Измерительная техника. 2007. № 2. -С. 22-27.

70. Лемешко, Б.Ю., Лемешко, С.Б., Постовалов, С.Н. О мощности критериев согласия при близких альтернативах // Материалы Российской НТК "Информатика и проблемы телекоммуникаций", Новосибирск. 2006. Т.1. -С. 175-179.

71. Лемешко, Б.Ю., Лемешко, С.Б., Постовалов, С.Н. Сравнительный анализ мощности критериев согласия // Тезисы докладов международной научно-технической конференции "Информационные системы и технологии" (ИСТ-2006), Нижний Новгород. 2006. С. 145-148.

72. Лемешко, Б.Ю., Маклаков, А.А. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями экспоненциального семейства//Автометрия. 2004. №3. С. 3-20.

73. Лемешко, Б.Ю., Миркин, Е.П. Критерии Бартлетта и Кокрена в измерительных задачах при вероятностных законах, отличающихся от нормального // Измерительная техника. 2004. № 10. С. 10-16.

74. Лемешко, Б.Ю., Помадин, С.С. Проверка гипотез о математических ожиданиях и дисперсиях в задачах метрологии и контроля качества при вероятностных законах, отличающихся от нормального // Метрология. 2004. № 3.-С. 3-15.

75. Лемешко, Б.Ю., Постовалов, С.Н. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями Джонсона // Доклады СО АН ВШ. 2002. № 1(5). - С. 65-74.

76. Лемешко, Б.Ю., Постовалов, С.Н. О зависимости предельных распределений2статистик % Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. Т. 64. - № 5. - С. 56-63.

77. Лемешко, Б.Ю., Постовалов, С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. 2001. Т.67. -№7.-С. 62-71.

78. Лемешко, Б.Ю., Постовалов, С.Н. О распределениях статистик непараметрических критериев согласия при оценивании по выборкам параметров наблюдаемых законов // Заводская лаборатория. 1998. Т. 64. - № 3. - С. 6172.

79. Лемешко, Б.Ю., Постовалов, С.Н. Прикладные аспекты использования критериев согласия в случае проверки сложных гипотез // Надежность и контроль качества. -1997. № 11. - С. 3-17.

80. Лемешко, Б.Ю., Постовалов, С.Н. Применение непараметрических критериев согласия при проверке сложных гипотез // Автометрия. 2001. № 2. - С. 88-102.

81. Лемешко, Б.Ю., Постовалов, С.Н., Чимитова, Е.В. О распределениях стати2стики и мощности критерия типа % Никулина //Заводская лаборатория. Диагностика материалов. 2001. Т.67. - №3. - С. 52-58.

82. Лемешко, Б.Ю., Чимитова, Е.В. О выборе числа интервалов в критериях согласия типа %2 // Заводская лаборатория. Диагностика материалов. 2003. -Т. 69.-№1.-С. 61-67.

83. Лемешко, Б.Ю., Чимитова, Е.В. Об ошибках и неверных действиях, совер2шаемых при использовании критериев согласия типа % II Измерительная техника. 2002. № 6. - С. 5-11.

84. Лемешко, Б.Ю., Чимитова, Е.В. Оптимальные Z-оценки параметров сдвига и масштаба распределений по выборочным квантилям // Заводская лаборатория. Диагностика материалов. 2004. Т.70. - № 1. - С. 54-66.

85. Лемешко, Б.Ю., Чимитова, Е.В. Построение оптимальных ^-оценок параметров сдвига и масштаба распределений по выборочным квантилям // Сибирский журнал индустриальной математики. 2001. Т.4. - № 2. - С. 166183.

86. Лемешко, С.Б. Исследование критерия Аббе в случае нарушений предположений о нормальности // Материалы докладов всероссийской НК молодых ученых "Наука. Технологии. Инновации" НТИ-2005, 2005. - 4.1. -С. 56-57.

87. Лемешко, С.Б. Критерий независимости Аббе при нарушении предположений нормальности // Измерительная техника. 2006. № 10. С. 9-14.

88. Лемешко, С.Б. Распределения статистик критериев согласия типа хи-квадрат при малых выборках // Материалы VII международной конференции "Актуальные проблемы электронного приборостроения" АПЭП-2006. Новосибирск, 2006. Т. 6. - С. 78-82.

89. Лемешко, С.Б., Лемешко, Б.Ю. Исследование распределений статистик критериев, используемых для проверки отклонений от нормальности // Материалы докладов всероссийской НК молодых ученых "Наука. Технологии. Инновации" НТИ-2003,2003. - 4.1. - С. 42-43.

90. Мартынов, Г.В. Критерии омега-квадрат. М.: Наука, 1978. - 80 с.

91. Микешина, Н.Г. Выявление и исключение аномальных значений // Заводская лаборатория. 1966. -Т. 22. № 3. - С. 310-318.

92. Мирвалиев, М., Никулин М.С. Критерии согласия типа хи-квадрат // Заводская лаборатория. 1992. Т. 58. - № 3. - С. 52-58.

93. Никулин, М.С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и ее применение. 1973. Т. XVIII. -№ 3. - С. 583-591.

94. Никулин, М.С. О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и ее применение. 1973. - Т. XVIII. - № 3. - С.675-676.

95. Новицкий, П.В., Зограф, И.А. Оценка погрешностей результатов измерений. JL: Энергоатомизд., 1991. - 303 С.

96. Орлов, А.И. Неустойчивость параметрических методов отбраковки резко выделяющихся наблюдений // Заводская лаборатория. 1992. Т. 58. - № 7. -С. 40-42.

97. Орлов, А.И. О проверке однородности двух независимых выборок // Заводская лаборатория. 2003. - Т.69. №.1. - С. 55-60.

98. Орлов, А.И. Часто ли распределение результатов наблюдений является нормальным // Заводская лаборатория. 1991. Т. 57. - №7. - С. 64-66.

99. Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. М.: Изд-во стандартов. 2002. - 87 С.

100. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть И. Непараметрические критерии. М.: Изд-во стандартов. 2002. - 64 С.

101. Саввушкина, Н.Е. Критерий Колмогорова-Смирнова для логистического и гамма-распределения // Сб. тр. ВНИИ систем, исслед. 1990, № 8. - С. 5056.

102. Смирнов, Н.В. Вероятности больших значений непараметрических односторонних критериев согласия // Труды Матем. ин-та АН СССР. 1961. -Т.64.-С. 185-210.

103. Смирнов, Н.В. Оценка максимального члена в ряду наблюдений // Доклады АН СССР, 1941. Т. 33. - № 5. - С. 346-349.

104. Смирнов, Н.В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках // Бюллетень МГУ, серия А.1939.-Т.2. №2.-С. 3-14.

105. СТ СЭВ 545-77. Прикладная статистика. Правила оценки анормальности результатов наблюдений. М.: Изд-во стандартов. 1978. 26 С.

106. Струнов, В.И. О применении критерия Аббе для анализа независимости рядов измерений, характеризующихся отличными от нормального законами распределения // Измерительная техника 2006 №8 - 13-18 С.

107. Тюрин, Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. д-ра физ.-мат. наук. -М., 1985.-33 С.-(МГУ).

108. Тюрин, Ю.Н. О предельном распределении статистик Колмогорова-Смирнова для сложной гипотезы // Изв. АН СССР. Сер. Матем. 1984. Т.48. - № 6.-С. 1314-1343.

109. Тюрин, Ю.Н., Саввушкина, Н.Е. Критерии согласия для распределения Вейбулла-Гнеденко. // Изв. АН СССР. Сер. Техн. Кибернетика. 1984. № 3. -С. 109-112.

110. Хьюбер, П. Робастность в статистике. М.: Мир, 1984. - 303 С.

111. И 7. Чибисов, Д.М. Исследования мощности некоторых непараметрических критериев // Теория вероятностей и ее применения. 1962. Т. 7. - № 3. - С. 355-356.

112. Чибисов, Д.М. К исследованию асимптотической мощности критериев согласия // Теория вероятностей и ее применения. 1965. Т. 10. - № 3. - С. 460-478.

113. Чибисов, Д.М. Некоторые критерии типа хи-квадрат для непрерывных распределений // Теория вероятностей и ее применения. 1971. Т. XVI. -№ 1. - С. 3-20.

114. Чибисов, Д.М. Об асимптотической мощности и эффективности критерия со* // ДАН СССР, 1961.138,2. С. 322-325.

115. Чибисов, Д.М. Об асимптотической мощности критериев согласия при близких альтернативах // Теория вероятностей и ее применения. 1964. Т. 9. -№3.-С. 561-566.