автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Методы вероятностно-статистического анализа данныхв задачах судостроения

доктора физико-математических наук
Золотухина, Лидия Анатольевна
город
Санкт-Петербург
год
2000
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Методы вероятностно-статистического анализа данныхв задачах судостроения»

Автореферат диссертации по теме "Методы вероятностно-статистического анализа данныхв задачах судостроения"

На правах рукописи

ЗОЛОТУХИНА Лидия Анатольевна р р 5 0 Д

2 5 мй 2ЛЯ

Методы вероятностно-статистического анализа данных в задачах судостроения

Специальность 05.13.16 —

Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук

Санкт-Петербург 2000

Работа выполнена в Санкт-Петербургском государственном морском техническом университете.

Официальные оппоненты: доктор физико-математических наук,

профессор С. М. Ермаков, доктор физико-математических наук Б. П. Харламов,

доктор технических наук, профессор Н. О. Вильчевский

Ведущая организация: Центральный научно-исследовательский

институт имени академика А.Н.Крылова

Защита состоится « ' » ШУИЛ 2000 года в часов на заседании диссертационного совета Д 063.38.18 в Санкт-Петербургском государственном техническом университете по адресу: 190251, г. Санкт-Петербург, ул. Политехническая, 29. СПбГТУ, корп. у ,ауд.

С диссертацией можно ознакомиться в фундаментальной библиотеке университета.

Автореферат разослан <к'у»

2000 г.

Ученый секретарь диссертационного совет

доктор биологических наук, профессор А. В. Зинковский

Общая характеристика работы

Актуальность темы. Вероятностно-статистические методы в настоящее время широко используются при решении различных задач судостроения.

Так, при проектировании судов важную роль играет технико-экономический анализ проектных решений. Необходимость обеспечения оптимальных решений требует совершенствования методов технико-экономических обоснований. Увеличение точности такого обоснования должно привести к более корректному выбору технических и эксплуатационных характеристик судна.

Основным математическим аппаратом для нахождения оптимальных решений на ранних стадиях проектирования является имитационное моделирование, позволяющее сочетать использование статистической информации по эксплуатации серии судов с функциональными зависимостями элементов судна и характеристиками процесса его технического использования и ремонта.

Для того, чтобы получить модель, наиболее приближенную к натуре, необходимо иметь данные по эксплуатации судов, которые в силу ограниченного количества судов в серии нередко представляют собой выборки малого объема. Возникает задача извлечения из малой выборки максимальной информации.

Определение затрат и полезного эффекта при проектировании осуществляется с использованием аппроксимационных моделей, устанавливающих взаимосвязи между элементами судов и величиной затрат на их создание и эксплуатацию. Подобные модели строятся с применением регрессионного анализа, который существенно повышает точность предсказания предстоящих затрат. Особенностями применяемых регрессионных моделей являются: случайность зависимых переменных, неизвестность законов распределений переменных и (или) их явная ненормальность. Это потребовало разработки специальных методов регрессионного анализа. Внедрение в практику модульных принципов проектирования значительно повышает эффективность и качество судостроения и уменьшает эксплуатационные расходы. Предложенное автором использование для этой цели методов многомерной статистики — сокращения размерности и кластерного анализа — дало новые постановки задач модульного судостроения и их обоснованные решения.

Волнение морской поверхности оказывает существенное влияние на деятельность морского транспорта, гидротехнических сооружений, морских портов и т.д. Поэтому нужны надежные данные об ожидаемом состоянии поверхности океанов и морей. Освоение

природных ресурсов шельфовых зон океанов и морей, изучение взаимодействий океана и атмосферы делают исследование морского волнения также необходимым и важным.

Использование наиболее полных стохастических моделей, проведение теоретических обоснований областей их применимости способствует повышению адекватности моделей реальной действительности, достоверности и надежности получаемых результатов. В то же время ряд актуальных проблемных вопросов оставался до настоящего времени недостаточно разработанным, и является объектом исследований в настоящей работе. К таким вопросам относятся: представление взволнованной поверхности "в наиболее общем виде, при котором возможна его гауссовская аппроксимация или аппроксимация рядом Эджворта; расширение класса общих условий возникновения распределений Релея и Максвелла, которыми описывается распределение высот волн и радиусов орбитального движения частиц при волнении моря; определение областей изменения коэффициентов асимметрии и эксцесса, при которых используемые в практике судостроения усеченные и неусеченные ряды Грама-Шарлье и Эджворта неотрицательны; разработка эффективного способа моделирования морского волнения как трехмерного случайного поля.

Статистические характеристики ветра и волн, используемые для оценки ходкости судов, получают в результате обработки экспериментальных данных, при этом имеют место, как правило, выборки большого объема. Выбор метода обработки и анализа таких выборок оказывает существенное влияние на достоверность конечных результатов. При этом на практике следует учитывать не только эффективность, но и устойчивость получаемых оценок, а также трудоемкость их вычисления, что потребовало проведения специальных теоретических исследований.

К важному направлению в области судового оборудования следует отнести проблему надежности судовых устройств и их диагностики.

Разработка методов диагностики технических устройств и принятия на их основе решений о состоянии судового оборудования представляет собой сложную задачу, имеющую много различных постановок. Эта задача решена автором настоящей работы в одной из возможных нестандартных постановок, когда ка>кдый из двух диагностических сигналов наблюдается отдельно.

Совершенствование методов статистического и вероятностного анализа данных, а также разработка новых, более эффективных методов, обеспечивает как повышение качества проектных ре-

шений по созданию судна, так и повышение качества его эксплуатации.

Широкому внедрению методов статистического анализа в задачи судостроения немало способствовали статистические программные пакеты. Анализ существующих пакетов программ статистической обработки одномерных выборок показал, что они не предназначены для выборок малого объема. Но и для выборок большого объема они часто не могут быть использованы для решения многих задач судостроения из-за выявленных принципиальных недостатков.

Устранение недостатков существующих пакетов программ привело к необходимости проведения специальных теоретических и практических исследований и созданию на их основе новых пакетов программ автоматизированной обработки данных.

Таким образом, анализ совокупности научно-технических проблем в области судостроения показал, что большинство из них связано с постановкой и решением ряда нетривиальных математических задач. Необходимо было разработать и исследовать вероятностно-статистические методы, в наибольшей степени учитывающие специфику практического применения.

Совокупность нерешенных проблем потребовала разработки и исследования новой методологии решения практических задач в области статистического анализа выборок любого объема (от малого до большого), а также .вероятностного и регрессионного анализа данных в нетрадиционных постановках.

Работа подводит итог исследованиям автора по созданию и развитию нового научного направления в области применения вероятностно-статистических методов в задачах судостроения и выполнена на основе работ в соответствии с планами НИР ЛКИ: 1-9А-970 № ГР 01840048109, П-1-Х-729 № ГР 79036373, П-8-5-Х-894 № ГР 01820084552, А-1012 № ГР 01830053623, А-161 № ГР 0880017387, А-222 № ГР 087009417.

Целью работы является развитие нового перспективного направления в области применения вероятностно-статистических методов в судостроении, заключающееся в разработке и исследовании специальной методологии для решения комплекса задач по статистическому анализу данных и исследованию вероятностных моделей.

Научная новизна работы заключается в решении новых, ранее не исследованных проблем:

— выполнены теоретические исследования по сравнению оценок, найденных традиционными методами, по их асимптотическим дисперсиям для основных типов распределений, используемых

в практике судостроения и выработаны рекомендации по их использованию на практике;

— усовершенствован математический аппарат для разработки алгоритмов оценок, в частности, доказаны существование и единственность решений систем уравнений правдоподобия, найдены оптимальные уровни вероятности квантильных оценок, минимизирующие асимптотическую дисперсию оценок;

— проведено сравнение оценок параметров распределений по их эффективности и устойчивости, при этом в качестве меры устойчивости выбрана нетрадиционная для математической статистики мера: вариационная производная от асимптотической дисперсии;

— показано, что известные модификации методов оценок — такие, как корректный метод моментов и метод одношаговых оценок (ОШ-сценки) — практически не имеют преимуществ перед традиционными методами;

— для критерия х для ряда важных распределений выявлены минимальные объемы выборок, обеспечивающие возможность использования значений критических точек и поправок к этим значениям при любых объемах выборок;

— разработан алгоритм построения обобщенной гистограммы, близкой к оптимальной, для этой цели исследована взаимосвязь оптимальной ширины окна обобщенной гистограммы с выборочной дисперсией;

— проведена систематизация методов получения эффективных и линейных эффективных оценок параметров распределений;

— разработан новый метод получения наилучших оценок параметров трехпараметрических семейств распределений, основанный на обобщенном методе наименьших квадратов и методе «складного ножа». Апробация и исследование метода проведены на примере распределений экстремальных значений. Показано его преимущество по сравнению с другими методами при малых объемах выборок;

— построены доверительные интервалы наименьшей длины для параметров распределений: нормального, двухпараметрическо-го показательного, равномерного, трехпараметрического распределения Вейбулла, гамма-распределения, рассчитаны таблицы критических точек и предложены аппроксимации их значений;

— найдено удобное для анализа общее выражение распределения статистики Диксона для отбраковки резко выделяющихся наблюдений для семейств распределений с параметрами сдвига и масштаба и приведен явный вид этого распределения для законов:

двухпараметрического показательного, равномерного и двойного показательного (логвейбулловского);

— проведен обзор, анализ и эмпирическое сравнение специальных критериев согласия, разработаны и исследованы новые критерии для гамма-распределения и распределения Вейбулла, а также модифицированный критерий Манн для распределения Вейбулла и модифицированный критерий Саркади для нормального закона распределения;

— разработана и исследована новая концепция различения гипотез о типе распределения на основе уклонения Кульбака-Лейбнера и показано ее преимущество перед используемыми для этой цели коэффициентами асимметрии и эксцесса;

— разработан и исследован новый, более эффективный, чем известные, метод проверки гипотезы нормальности по совокупности многих малых выборок на основе предложенного модифицированного критерия Саркади;

— на основе проведенных исследований разработана методология статистической обработки выборок любого объема и созданы пакеты программ, апробирована их работа как с использованием методов статистического моделирования, так и на натурной статистике;

— разработан и исследован новый, основанный на методе максимального правдоподобия, робастный метод оценивания параметров линейной регрессии при наличии ошибок в зависимых и независимых переменных, подчиненных двухпараметрическому обобщенному распределению показательно-степенного типа. При отсутствии ошибок в независимых переменных частными случаями метода являются метод наименьших квадратов и метод наименьших модулей. Определены достоинства предложенного метода;

— найдено асимптотическое распределение числа совпадений двумерной выборки в случае, когда компоненты вектора наблюдаются отдельно. Вместо традиционно используемой линии регрессии введена новая характеристика стохастической связи, более естественная в этой ситуации — линия равных квантилей компонент;

— введена и исследована новая мера устойчивости оценок линейной регрессии на основе вариационной производной от асимптотической ковариационной матрицы М-оценок и предложены методы получения оценок с наименьшими потерями в эффективности и устойчивости;

— даны новые постановки и решения задач модульного судостроения на основе применения методов многомерной статистики: сокращение размерности и кластерного анализа;

— предложен новый метод моделирования трехмерного морского волнения, основанный на неканонических представлениях случайных полей и учитывающий дисперсионное соотношение между частотой волны и волновым числом;

— проведены теоретические исследования вероятностных задач, полезных при изучении морского волнения и проектировании судов: даны доказательства асимптотической нормальности сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами; дана новая характеризация законов Релея и Максвелла; определены условия неотрицательности усеченных рядов Грама-Шарлье и Эджворта и унимодальности усеченного ряда Грама-Шарлье; для методов нахождения итогового распределения при случайных параметрах исходного, базирующихся на принципе максимума энтропии, определен тот метод, который обеспечивает согласованность распределений параметров при функциональных преобразованиях;

— на основе разработанного в диссертации инструментария решен ряд практических задач из области проектирования и эксплуатации судов различных типов, их энергетических установок и морских инженерных сооружений.

Обоснованность и достоверность научных положений, выводов и рекомендаций, сформулированных в диссертации, базируется на использовании наиболее полных математических моделей изучаемых явлений, применении строгих математических доказательств и методов имитационного моделирования на ЭВМ.

Практическая ценность работы заключается в том, что полученные в ней результаты позволяют более эффективно решать задачи вероятностного и статистического анализа данных, в первую очередь из практики судостроения. Полученные аналитические решения, разработанные и усовершенствованные методы, алгоритмы, профаммы и практические разработки исследований могут быть использованы также широким кругом специалистов в решении практических задач из других областей техники. Созданные на основе проведенных исследований статистические пакеты программ апробированы на практике и позволяют оптимально использовать натурную статистику, повысить точность принимаемых технических решений.

Реализация работы. Представленные теоретические результаты и программные пакеты были использованы при проведении научно-исследовательских работ в Межведомственном инженерном центре математического моделирования в судостроении (СПб ГМТУ), Учебно-исследовательском центре автоматиэированно-

го проектирования судов и их энергетических установок (СПб ГМТУ), в ЦНИИТС, ЦНИИ «Румб».

Теоретические положения работы применены в учебном процессе в курсах математической статистики, эконометрики, теории массового обслуживания и включены в учебные пособия [12], [13], [23], [29].

Основные научные положения, выносимые на защиту.

1. Совокупность исследований и методологических разработок в области выборок большого и малого объёмов, позволяющих производить эффективный статистический анализ данных для широкого класса распределений с полным набором параметров сдвига, масштаба и формы.

Основу этих разработок и исследований составляют

а) в области выборок большого объёма:

— систематизация и сравнение оценок параметров распределений, полученных традиционными методами, по их асимптотическим дисперсиям;

— доказательства существования и единственности оценок максимального правдоподобия;

— определение оптимальных уровней квантилей, при которых достигается минимум асимптотической дисперсии квантильных оценок.

б) в области выборок малого объёма:

— разработка инженерного метода расчёта близкой к оптимальной обобщённой гистограммы, основанного на взаимосвязи оптимальной ширины окна гистограммы и выборочной дисперсии;

— систематизация методов получения эффективных и линейных эффективных оценок параметров распределений;

— разработка нового метода получения наилучших оценок параметров трёхпараметрических семейств распределений;

— построение доверительных интервалов наименьшей длины для параметров распределений, наиболее часто используемых на практике, с расчётом таблиц коэффициентов;

— анализ и эмпирическое сравнение специальных критериев согласия;

— разработка и исследование новых и модифицированных критериев согласия для распределений Вейбулла, гамма и нормального;

— разработка метода отбраковки резко выделяющихся наблюдений для широкого класса распределений, отличающихся от нормального распределения с нахождением удобного для анализа общего выражения распределения статистики критерия.

2. Создание на основе полученных результатов сервисных пакетов статистических программ ZACON, UGRAND, ZACMAL, MALIC анализа данных, апробированных на решении практических задач из области судостроения.

3. Совокупность исследований в области развития вероятностных методов и методов многомерной статистики применительно к практике судостроения. Основные результаты в этом направлении заключаются в следующем:

— доказательство асимптотической нормальности сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами;

— новые параметризации законов распределения Релея и Максвелла;

— определение областей изменений коэффициентов асимметрии и эксцесса, обеспечивающих неотрицательность и унимодальность усеченных рядов Грама-Шарлье и Эджворта.

— для методов нахождения итогового распределения при случайных параметрах исходного, которые базируются на принципах максимума энтропии, определение метода, обеспечивающего согласованность распределений параметров при функциональных преобразованиях;

— разработка нового метода имитационного моделирования трехмерного морского волнения, основанного на неканоническом представлении случайных полей и учитывающего дисперсионное соотношение между частотой волны и волновым числом;

— разработка нового робасгного метода оценивания параметров линейной регрессии в схеме конфлюэнтного анализа;

— нахождение для задач диагностики в нетрадиционной постановке асимптотического распределения числа совпадений верно репродуцированных пар при натуральном совмещении наблюдаемых компонент двумерного случайного вектора, когда компоненты наблюдаются отдельно;

— введение и исследование новой меры устойчивости оценок линейной регрессии, основанной на вариационной производной от асимптотической ковариационной матрицы М-оценок, и выработка рекомендаций по выбору оценок с учетом их эффективности и устойчивости;

— новые постановки и решения с использованием разработанного инструментария практических задач судостроения по проектированию и эксплуатации судов, их энергетических установок и морских инженерных сооружений.

Апробация работы. Результаты работы докладывались на научных конференциях профессорско-преподавательского состава СПб ГМТУ, научных семинарах ПОМИ РАН, использовались в курсе лекций, прочитанных в Китайском кораблестроительном научно-исследовательском центре (CSSRC, Wuxi, China, 1997), были представлены на следующих научных конференциях: 2-й Вильнюсской конференции по теории вероятностей и математической статистики, 1977; Всесоюзной научно-технической конференции «Проблемы модульного судостроения (Модуль-82)», Ленинград, 1982; 14-th session SMSSH-85, Varna, 1985; Всесоюзной конференции "Актуальные проблемы вычислительной и прикладной математики", Новосибирск, 1987; Всесоюзной научно-технической конференции "Физико-математическое моделирование при решении проблем гидроаэромеханики и динамики судов и средств освоения мирового океана», XXXIV Крыловские чтения, Ленинград, 1989; Всесоюзной научно-исследовательской конференции "Повышение эффективности экспериментальных исследований гидромеханики судна для решения проблемных задач в судостроении", Калининград, 1990; Всесоюзной научно-исследовательской конференции "Методы прогнозирования и способы повышения мореходных качеств судов и средств освоения океана", XXXV Крыловские чтения, Ленинград, 1991; International Conference Asymptotic in Mechanics (AiM), S.-Petersburg , 1994; 13-th International Conference on Port and Ocean Engineering under Arctic Conditions (POAC'95), Murmansk, 1995; Международной конференции "Современные проблемы прикладной и вычислительной математики" (АМСА-95), Новосибирск, 1995; 2-й международной конференции "Освоение шельфа арктических морей России" (RAO-95), СПб, 1995; 3-й Международной конференции по разработке и коммерческому применению технологий в полярных районах (POLARTECH-96), СПб, 1996; 6-й Международной конференции женщин-математиков, Чебоксары 1998; 3-й Сибирский конгресс по прикладной и индустриальной математике (ИНПРИМ-98), Новосибирск, 1998; 3-я Международная конференция и выставка по морским интеллектуальным технологиям (MORINTECH-99), Санкт-Петербург, 1999.

Публикации. По материалам диссертации опубликовано 67 научных работ в изданиях АН СССР, периодических научно-технических отечественных и иностранных журналах, межвузовских сборниках, трудах международных и всесоюзных конференций и шести учебных пособиях, из них 22 печатные работы опубликованы без соавторов.

Структура н объем работы. Диссертация состоит из введения, шести разделов, заключения и списка литературы. Она содержит 396 страниц, в том числе 55 таблиц, 25 рисунков и библиографию из 421 наименования.

Содержание работы

Во Введении обосновывается актуальность темы диссертации, сформулирована цель работы, приведено краткое содержание выполненных исследований и основные научные положения, выносимые на защиту.

В разделе 1 дан анализ вопросов применения вероятностно-статистических методов в задачах судостроения и выявлены задачи и проблемы, решение которых направлено на значительное повышение эффективности использования методов увеличения точности и надежности получаемых результатов. На основе проведенного анализа сформулирована постановка задач исследований.

В 1.1 приведены обоснования необходимости применения вероятностно-статистических методов при проектировании и эксплуатации судов и судового оборудования, при проведении технико-экономических оценок надежности судовых механизмов и оборудования, в задачах диагностики технических устройств. Повышение эффективности управления процессом проектирования и эксплуатации судов невозможно проводить только на основе опыта и интуиции проектанта, необходимо использовать знание общих закономерностей развития сложных технических систем, а также широко использовать методы имитационного моделирования функционирования систем в процессе их эксплуатации. В ЛКИ под руководством профессора В. И. Николаева создана базовая модель внешнего проектирования судна и его энергетической установки (СЭУ), которая воспроизводит на ЭВМ реальный процесс эксплуатации судна и СЭУ на протяжении всего срока службы. Модель характеризуется совокупностью большого числа параметров и взаимосвязей между ними. В разработке этой модели принимала непосредственное участие и автор настоящей работы; в частности, ею разработан блок статистического анализа данных. Для того, чтобы получить модель, наиболее адекватную натуре, обрабатывались данные по эксплуатации судов одной серии за несколько лет плавания. Таким образом, задача эффективной переработки имеющейся информации, учета ее стохастичности, как объективного фактора, возникла из потребностей практики. Возникла также актуальная задача установления адекватности моделей внешнего проектирования и возможности рас-

пространения результатов статистического анализа на всю генеральную совокупность, из которой извлечена выборка. Эта задача в математической статистике традиционно решается с помощью процедур проверки статистических гипотез и оценки параметров распределений. Отметим, что формальное использование традиционных методов статистической обработки данных могло привести к ошибочным заключениям. Это объясняется несколькими причинами. Во-первых, с ростом сложности и стоимости современных судов уменьшается возможность проведения большого числа наблюдений, поэтому приходится оперировать с малыми выборками (число судов данного типа обычно порядка 10). Во-вторых, часто нет однородности условий опытов, так как данные по эксплуатационным параметрам сгруппированы по годам, а их числовые характеристики изменяются от года к году. В-третьих, в ряде статистических данных имеются выбросы, которые могут существенно исказить получаемые результаты. В-четвертых, выравнивание статистических рядов с использованием распределения в стандартном виде с неполным набором параметров не дает удовлетворительного решения.

Поскольку исходные данные вводились в модель в виде случайных величин, выходные (итоговые) технико-экономические показатели, от которых зависит экономическая эффективность судов, получаются также в виде случайных величин. Предложение о целесообразности перехода к вероятностной оценке экономической эффективности судов впервые было высказано академиком РАН В. М. Пашиным еще в 70-х гг. и получило широкое развитие в практике судостроения. Определение затрат в процессе технико-экономических исследований осуществляется с использованием регрессионных моделей, причем сами факторы являются случайными величинами. Поэтому в диссертации рассматриваются задачи оценки параметров регрессии в схеме конфлюэнтного анализа. При этом строятся оценки, обладающие достаточной эффективностью и устойчивостью.

Разработка методов и алгоритмов обработки результатов измерений диагностических сигналов и на их основе принятие решений о состоянии судового оборудования представляет собой важную и сложную задачу. Одна из возможных постановок задачи диагностики по косвенным признакам и ее решение рассмотрены в диссертации.

В 1.2 на основе проведенной статистической обработки данных по эксплуатационным характеристикам судов для моделей внешнего проектирования СЭУ установлено, что их распределения можно описать сравнительно небольшим числом теоретических за-

конов: нормальным, распределениями Эджворта или Грама-Шарлье, трехпараметрическим логнормальным, четырехпараметрическим бета-распределением.

1.3 посвящен рассмотрению стохастических моделей, применяемых для описания морского волнения. Для того, чтобы в процессе проектирования судна обеспечить надлежащие мореходные качества, необходимо уметь производить оценку внешних сил, действующих на него. Остойчивость, качка корабля, ходкость, прочность и т. д. существенно зависят от состояния морской поверхности. Сложность физических процессов образования и распространения волн, многообразие факторов, от которых они зависят, создают серьезные трудности в изучении морского волнения. Важный шаг на пути теоретического описания взволнованной поверхности был сделан в 50-х годах нашего столетия после того, как к изучению волнения подошли с позиций теории случайных функций. Первые работы, посвященные исследованию нерегулярного волнения методами теории случайных функций появились одновременно в СССР (A.A. Свешников, А.И. Вознесенский) и на Западе (М. Сен-Дени, У. Пирсон, М. Лонге-Хиггинс).

В спектральном представлении волновая поверхность U(x,y,t)

имеет вид суммы гармоник со случайными амплитудами и фазами £,, при условии их независимости в совокупности:

п

и (x,y,t) = 2°, cos (кхх + куу + «,(+£,) (1)

¡=1

и представляет собой гауссово случайное поле.

В более общей модели, предложенной Лонге-Хиггинсом, u(x,y,t) = uw(x,y,t)+u{-2)(x,y,t)+... , где yW _ случайное поле вида (1), иW - поле, содержащее произведения переменных (1), и т. д. Каждое из и(*) представляет собой к -мерную сумму случайных величин вида u(ij,i2, ..., i'i), причем величины независимы, если не имеют общих индексов. Возникает вопрос об исследовании асимптотического распределения при п->°°. В диссертации рассмотрена эта задача и доказано, что при общих условиях зависимости u(iu...,ik), при надлежащей нормировке распределение и^ асимптотически нормально. Подобные же результаты, как показано в диссертации, справедливы и для векторных случайных полей. Эти результаты обосновывают широкое использование гауссовского распределения и ряда Эджворта при моделировании морского волнения. Кроме того, в 1.3 рассмотрены

другие законы распределения, применяемые при описании основных параметров морского волнения.

В 1.4 приведены обоснования необходимости применения в судостроительной практике распределений экстремальных значений: при расчетах устойчивости движения судна с учетом влияния ветра и волнения; при расчетах значений предельных значений нагрузки и прочностных характеристик материалов; при проектировании инженерных сооружений на шельфе замерзающих морей.

В 1.5 показано, что применение многих из рассматриваемых распределений может быть обосновано с помощью энтропийного подхода или его варианта, при котором параметры закона распределения сами случайны и находятся из условия максимизации энтропии. В последнем случае описываются два подварианта: первый — когда максимизируется энтропия случайного параметра, второй — когда максимизируется энтропия апостериорного распределения.

В 1.6 основные типы распределений, используемые в практике судостроения, систематизированы и дополнены таблицей, в которой приведены их числовые характеристики, причем распределения в соответствии с потребностями судостроительной практики даны в самом общем виде с полным набором параметров.

В 1.7 отмечены особенности, выявленные при практической обработке статистического материала по эксплуатации судов и потребовавшие разработки специальных методов обработки. Это прежде всего малый объем выборок: число судов данного типа обычно порядка ~ 10. Другая особенность — большая изменчивость параметров: данные по эксплуатационным параметрам сгруппированы по годам и их числовые характеристики изменяются от года к году. Немаловажной особенностью является наличие в выборках резко выделяющихся наблюдений.

В 1.8 на основе анализа существующих пакетов программ статистической обработки данных выявлены их принципиальные недостатки, затрудняющие, а часто вовсе исключающие возможность корректного проведения исследований.

В 1.9 дана постановка задач исследований, проведенных в

работе.

Раздел 2 посвящен исследованию методов статистического анализа выборок большого объема. В нем рассмотрены типы распределений с полным набором параметров сдвига с , масштаба а и формы ь.

В 2.1 получены формулы и проведена представленная в виде таблиц систематизация способов вычисления оценок параметров основных типов рассматриваемых распределений традиционными

методами: моментов, максимального правдоподобия и квантилей, а также приведены алгоритмы вычисления оценок на ЭВМ. Установлено, что такие модификации метода моментов и метода максимального правдоподобия, как корректный метод моментов и одно-шаговые оценки (ОШ-оценки), не имеют преимуществ перед традиционными методами и могут быть исключены из дальнейшего рассмотрения. На примерах показано, что решение оценочных уравнений для нахождения оценок по корректному методу моментов ничуть не легче решения систем уравнений максимального правдоподобия. ОШ-оценки представляют собой результат первой итерации при решении системы уравнений правдоподобия по методу Ньютона, при котором требуется обращение информационной матрицы. Но при больших значениях параметра формы ь для трехпараметрических семейств распределений гамма и Вейбулла, как показано в работе, информационная матрица близка к вырожденной, и определение ОШ-оценок в этом случае становится проблематичным.

2.2 — 2.10 посвящены исследованию асимптотических свойств оценок, найденных методами моментов, максимального правдоподобия и квантилей, исследованию численных реализаций этих методов, а также их сравнительному анализу для основных типов распределений. По результатам проведенного анализа выработаны рекомендации по практическому использованию методов, которые учитывают как эффективность оценок, так и трудоемкость вычислений.

Ввиду важности для судостроительной практики распределения Вейбулла, ему уделено особое внимание.

В 2.2 изучены свойства оценок параметров стандартного двухпараметрического распределения Вейбулла.

Для оценок максимального правдоподобия доказана единственность решения системы уравнений правдоподобия и приведен алгоритм решения системы методом Ньютона. Для оценок по методу моментов выведены аналитические выражения для асимптотических дисперсий оценок, а эффективность этих оценок представлена в виде зависимости от параметра Ъ . Кроме того, используя разложение гамма- и пси-функций, найдены асимптотические дисперсии при Ь «о . Проведенные расчеты показали, что оценки параметра ь достаточно эффективны только в узком диапазоне изменения параметра Ь (2<Ь<5), оценки же параметра а достаточно эффективны при Ь > 2. При машинной реализации метода моментов приходится либо решать трансцендентные уравнения, либо иметь в оперативной памяти машины громоздкие таблицы. Таким образом, с

точки зрения объема вычислительной работы преимущество метода моментов перед методом максимального правдоподобия несущественны. Для оценок по методу квантилей, найдены асимптотические дисперсии оценок параметров и оптимальные уровни вероятностей, полученные из условия минимизации дисперсии оценок. Поскольку минимизация дисперсии оценки одного параметра приводит к увеличению дисперсии оценки другого параметра, предлагается использовать уровни вероятностей, при которых эффективность оценок одинакова. При этом их эффективность оказалась больше 0,62. Процедура вычисления квантильных оценок достаточно проста, и их рекомендуется использовать на практике. Если же нужны более эффективные оценки, предлагается использовать оценки по методу максимального правдоподобия, приняв квантильные оценки в качестве первого приближения.

В 2.3 изучены свойства оценок параметров двухпараметри-ческого распределения Релея, являющегося частным случаем трех-параметрического распределения Вейбулла при значении параметра формы 6=2. Особенность распределения Релея, как частного случая Вейбулла, состоит в том, что значение ь = 2 является граничным между регулярным и нерегулярным случаями и требует специального исследования. Доказано существование и единственность решения системы уравнений правдоподобия, исследованы асимптотические свойства оценок максимального правдоподобия для этого распределения. Хотя условия регулярности для него нарушаются, поскольку элемент информационной матрицы равен бесконечности, тем не менее в разделе показано, что оценка параметра сдвига с

асимптотически нормальна с дисперсиеи Ос--(т.е. дисперсия

шп п

с убывает быстрее, чем в регулярном случае), а асимптотическая

а2

дисперсия оценки параметра а: £>а---. Найдены асимптотиче-

4/1

ские дисперсии моментных и квантильных оценок. Кроме того, для квантильных оценок определены оптимальные уровни вероятностей, при которых квантильные оценки наиболее эффективны. Из проведенного сравнительного анализа оценок следует, что эффективность моментных и квантильных оценок параметра сдвига с стремится к нулю при /!-»«>, и следовательно, оценки максимального правдоподобия для этого распределения предпочтительнее.

В 2.4 изучены свойства оценок параметров двухпараметри-ческого показательного распределения. Найдены асимптотические

дисперсии оценок, полученных методами моментов, максимального правдоподобия и квантилей. При этом оказалось, что асимптотическая эффективность моментных оценок: efß~ 0,5; effc-* о, а оптимальных квантильных оценок: ejß~ 0.64, efff- 1. Поскольку оценки максимального правдоподобия вычисляются достаточно просто, целесообразно остановить свой выбор именно на них.

В 2.5 рассматриваются оценки параметров трехпараметри-ческого распределения Вейбулла. Проанализированы способы нахождения оценок методами' моментов, максимального правдоподобия, квантилей с целью выработки рациональных алгоритмов их численной реализации. Отмечено, что нахождение оценок по методу моментов требует обращения гамма-функции, и метод теряет свое основное преимущество — простоту вычислений. Вопросы численного решения уравнений правдоподобия рассматривали многие авторы: Cohen A.C., Whittan В., Harter H.L., Moors А.Н., Johnson R. А., Haskell J. H„ Rockette H„ Antle С., Klimko L. A., Smith R. L„ Wingo D.R. В работе Смита (Smith R. L.) для ¿»l была установлена асимптотическая (при и->оо) единственность локального максимума в окрестности истинных значений параметров и указано, что вопрос о единственности решения системы уравнений правдоподобия очень труден, на него не был получен ответ. Тем не менее, в разделе дано аналитическое доказательство единственности решения системы уравнений правдоподобия. Что касается оценок по методу квантилей, то отмечено, что стандартный способ нахождения оценок связан со значительными трудностями в силу нелинейности системы уравнений для их нахоздения. В разделе предложен более простой способ нахождения квантильных оценок, в котором используются характерная точка распределения Вейбулла, соответствующая

уровню вероятностей 1—р = е-1, и минимальный член вариационного ряда в качестве оценки параметра сдвига с. В диссертации предложена также другая оценка параметра с: ?=x(1)-(x(2)-jr№)=2x(i)-i(2) — аналогичная по смыслу оценке Робсона и

Уилтока при определении границы усечения справа, и показано, что асимптотически в общем случае нельзя отдать предпочтение ни одной из них, ибо при ь > у оценка ? имеет меньшее смещение, но

большую дисперсию, чем оценка , а при ь < у — наоборот. Проведен анализ асимптотических свойств оценок, полученных ме-

тодами максимального правдоподобия, моментов и квантилей, и выведены явные выражения для асимптотических ковариационных матриц оценок. При этом асимптотические эффективности момент-ных и квантильных оценок оказались почти одинаковыми, и при Ь->оо равными 0,535. Расчеты коэффициентов корреляций свидетельствуют о сильной коррелируемости оценок. При коэффициенты корреляции стремятся к ±1. Поскольку нахождение момент-ных оценок связано с большими вычислительными затратами, представляется целесообразным рекомендовать использовать на практике оценки по методу квантилей. Если же нужны более эффективные оценки, целесообразно использовать оценки по методу максимального правдоподобия.

По схеме, изложенной в 2.2—2.4, проведены исследования свойств оценок, полученных различными методами для других распределений: в 2.6 — для двухпараметрического распределения Лапласа, в 2.7—2.8 — для двухпараметрических распределений минимальных и максимальных значений типа I, в 2.9 — для трехпарамет-рического гамма-распределения, в 2.10 —для трехпараметрическо-го логнормального. Выяснено, что асимптотические свойства оценок максимального правдоподобия трехпараметрического гамма-распределения близки к свойствам этих же оценок для трехпараметрического распределения Вейбулла. Оценки по методу моментов для гамма-распределения вычисляются в явном виде, в отличие от квантильных оценок, которые ввиду сложности выражений для их вычисления вообще не рассматриваются. Эффективность же мо-ментных оценок слишком мала, и их следует использовать только как первое приближение при решении системы уравнений максимального правдоподобия. Для трехпараметрического логнормального распределения найдены ковариационные матрицы оценок по методам моментов, максимального правдоподобия и квантилей. Определены оптимальные уровни вероятностей квантильных оценок. Численные расчеты показали, что эффективность моментных оценок значительно ниже квантильных, эффективность которых, в свою очередь, также мала. Поэтому на практике предлагается использовать в качестве оценок параметров логнормального закона — оценки максимального правдоподобия.

2.11 посвящен исследованию вариационно-устойчивых оценок. В реальных ситуациях нередко плотность распределения неизвестна, и относительно ее делаются некоторые предположения. Практика показывает, что даже небольшие отклонения от исходных предпосылок о вероятностной модели могут привести к существен-

ному ухудшению свойств используемых статистических процедур. Однако любой математический результат, предназначенный для практического использования, должен обладать свойством устойчивости по отношению к небольшим отклонениям от исходных предположений. В работе в качестве меры устойчивости выбрана предложенная А. М. Шурыгиным вариационная производная от асимптотической дисперсии М-оценок, определяемых из уравнений ~£у/(х;,в ) = о , где ц/ — определяющая функция М-оценки. Путем решения вариационной задачи А.М. Шурыгиным была найдена оценка максимальной устойчивости и определено, по аналогии с понятием эффективности оценки, понятие устойчивости оценки, как отношение дисперсии оценки максимальной устойчивости к дисперсии рассматриваемой оценки. Таким образом, вместо одной характеристики качества оценки было предложено использовать две: эффективность и устойчивость. Кроме того, введены радикальные оценки, когда эти показатели равны, и компромиссные оценки, когда минимизируется взвешенная сумма квадратов показателей эффективности и устойчивости. В диссертации для основных типов рассматриваемых распределений проведено сравнение оценок параметра сдвига четырьмя методами и показано, что оценки максимального правдоподобия имеют малую устойчивость, и наоборот — устойчивые оценки имеют малую эффективность. Радикальные и компромиссные оценки имеют достаточно высокие показатели и эффективности, и устойчивости.

В 2.12 рассмотрены проблемы, возникающие при использовании критериев согласия: х2, о? \л Колмогорова. Для критерия х1 показано, что использование критических точек распределения при недостаточно больших объемах выборок возможно лишь при внесении к ним поправок. Приведены также исследования по выбору значений оптимального числа интервалов разбиения выборки в зависимости от типа распределения. Для критериев а? и Колмогорова приведены таблицы критических точек в случае сложных гипотез для следующих распределений: нормального, логнормального, показательного, Вейбулла и логвейбулловского.

В 2.13 дано краткое описание сервисных пакетов программ исЯАЫО и гАСОЫ для обработки выборок большого объема, в основу которых положены алгоритмы, составленные на основе методов, разработанных в разделе 2.

Основное содержание раздела 3 — построение методологии комплексной обработки выборок конечного объема, включая" малый. Несмотря на значительное количество публикаций по различным

аспектам анализа малых выборок, до сих пор не существовало работы, имеющей практическую направленность и освещающей весь комплекс задач: построение оценки плотности распределения; оценка параметров распределения; доверительное оценивание; отбраковка резко выделяющихся наблюдений; проверка статистических гипотез; проверка типа закона распределения по совокупности многих малых выборок.

Не было также специального пакета программ по статистической обработке таких выборок. Необходимость исследования специальных методов обработки выборок малого и среднего объемов связана с тем, что традиционные методы здесь часто дают неудовлетворительные результаты.

В 3.1 дан краткий обзор методов оценки неизвестной плотности распределения с помощью обобщенной гистограммы (оценки Парзена—Розенблатта или оценки ядерного типа)

пЬ-

/=1

X -х(

Л

где К(у) — ядро, а Л — коэффициент раз-

мытости. Исследована связь коэффициента размытости Л со сред-неквадратическим отклонением гипотетического распределения, что позволило разработать практический алгоритм численного расчета обобщенной гистограммы, а также построить доверительную полосу для неизвестной плотности распределения.

В 3.2 для основных типов рассматриваемых распределений получены формулы вычисления наилучших несмещенных оценок. Эти оценки основаны на достаточных статистиках и содержат всю информацию выборки. Приведена их систематизация, представленная в виде таблицы. Приводятся формулы построения наилучших линейных несмещенных оценок.

В 3.3 предложен новый метод получения оценок параметров трехпараметрических семейств распределений. Метод состоит в нахождении при фиксированном параметре ь оценок параметров с и а по обобщенному методу наименьших квадратов, то есть исходя из условия минимизации квадратичной формы д=(х-А 0)гу~' (х-ле),

МуцА

ГДе Хт =(г(1)„..,х(п))©7' =(с,а)1Л =

1

Му (2)

у = (и(г).У(ж))). У О) =

1 Му („) Х(П - с

При этом для нахождения коэффициентов л/у(/) и соv (>(,•), ^у)) используется аппроксимация Дэйвида и Джонсона. Оценка параметра б находится путем минимизации остаточной суммы квадратов при найденных при предыдущем шаге значениях матрицы v . При малых объемах выборок оценки параметра ь оказываются смещенными. Для ликвидации смещения предлагается использовать метод «складного ножа», предложенный Кенуем. Апробация и сравнительный анализ проведены на примере распределения Вейбулла. Проведенный сравнительный анализ выявил превосходство рассмотренного метода в сравнении с традиционными особенно при объемах выборок я < 15.

3.4 посвящен построению доверительных интервалов наименьшей длины для параметров распределений: нормального, двухпараметрического показательного, равномерного, гамма- и Вейбулла. Следует различать интервалы наименьшей длины от «наиболее селективных», называемых также в некоторых источниках кратчайшими. В первом случае мы имеем дело с длиной доверительных интервалов, тогда как во втором случае минимизируется частота, с которой накрываются альтернативные значения параметра. Задача отыскания интервала наименьшей длины сводится к на-хояедению минимума определенной функции при соответствующих ограничениях и решается с использованием множителей Лагранжа. Решения представлены в виде таблиц критических точек, приведенных в [26] и [30]. Для малых объемов выборок в диссертации приведена линейная аппроксимация верхних и нижних границ доверительных интервалов. Погрешность аппроксимации при этом не превышает Ю'г.

В 3.5 рассматриваются критерии отбраковки резко выделяющихся наблюдений. Обычно используемые при обработке наблюдений методы отбраковки грубых ошибок существенным образом опираются на предположения нормальности генеральной совокупности. Вместе с тем в практике часто встречается ситуация, когда о законе распределения генеральной совокупности нет достоверных сведений, или когда этот закон отличен от нормального. В первом случае более обоснованно применение непараметрических критериев. В таблицах Р. Шторм и других в качестве такого непараметрического критерия предлагается использовать критерий Диксона, основанный на статистике г = —. Другой непараметрический

*<ю-*<|)

критерий предложен И. В. Оньковым. Он основан на статистике

(х — ЗГ)

IV -и аппроксимации распределения этой статистики бе-

(п-))з2

та-распределением с параметрами, зависящими от коэффициента выборочного эксцесса. Поскольку при малых объемах выборок коэффициент эксцесса оценивается с большой погрешностью, применение предложенного критерия на практике некорректно, что и было подтверждено численным экспериментом. В диссертации найдено удобное для анализа общее выражение распределения статистики Диксона в выборках из семейств распределений, зависящих от параметров сдвига и масштаба, причем для законов двухпараметриче-ского показательного, равномерного, двойного показательного эти распределения найдены в явном виде. Проведенные исследования показали, что использование общепринятых таблиц критических точек критерия Диксона для распределений, отличных от нормального, как это рекомендуется в некоторых руководствах по математической статистике, недопустимо. Полученные в работе распределения статистики Диксона дают возможность производить обоснованную отбраковку для перечисленных законов, а также для закона Вейбулла, функционально связанного с двойным показательным.

3.6 начинается с обзора и анализа работ по специальным критериям согласия для нормального закона. Сравнительный эмпирический анализ различных критериев, проведенный с помощью метода статистического моделирования, дал основания рекомендовать для практики как наиболее эффективные против широкого спектра альтернатив IV -критерий Хана и Шапиро и а -критерий Гири. Заметим при этом, что критерий Гири значительно проще, и для его вычисления не требуется громоздких таблиц. В отечественной литературе в качестве специального критерия для проверки нормальности рекомендуется также критерий Саркади. В диссертационной работе предложена его модификация и проведено эмпирическое исследование мощности стандартного критерия Саркади и модифицированного. Исследования показали, что модифицированный критерий Саркади является вторым по мощности после (У -критерия, а стандартный критерий Саркади имеет столь же малую мощность, как и непараметрические критерии. Предложена и исследована новая мера различия между распределениями /¡(х) и /0(х), основанная на минимуме информационного уклонения Кульбака-Лейбнера / = /(/,:/(,). Показано преимущество этой меры перед обычно используемыми для этой цели коэффициентами асимметрии и эксцесса. Проведены обзор, анализ и эмпирическое сравнение специаль-

ных критериев согласия для распределений равномерного и показательного. Предложен критерий для гамма-распределения, поскольку для него специальных критериев в литературе обнаружить не удалось. Рассмотрены также специальные критерии согласия для двух-параметрического распределения Вейбулла. Предложена модификация наиболее мощного критерия Манн, позволяющая расширить возможности использования критерия для любых объемов выборок. Поскольку применение большинства известных критериев согласия достаточно сложно, предлагаются два новых критерия, более простых в вычислительном отношении. Это критерии

N2

Т =■

1 V

У,--ЬУк пк=1

1 "

— У

( \

1 " Ук -~ЪУ]

пм

И Г, =2122!^, где У, =1пх/. УШ — выбо-

рочная медиана. Достаточно высокая мощность предложенных критериев, особенно критерия Тх, и простота их вычисления дают основания рекомендовать их для практического использования.

В 3.7 дан краткий обзор основных критериев проверки гипотезы нормальности по совокупности многих малых выборок. Предложен новый критерий, основанный на модифицированном критерии Саркади, имеющий определенные преимущества перед используемыми на практике известными критериями, в частности, перед критерием Смирнова, поскольку при вычислении предложенного критерия используются все наблюдения. Исследование эффективности модифицированного критерия Саркади проводилось методом Монте-Карло. При этом под эффективностью критерия понималось число выборок Ыкриа заданного объема п, которое для каждого альтернативного распределения обеспечивало определение отличия от нормального с заданной надежностью 1-/3 при заданном уровне значимости а. Полученные оценки ы1сри„ для двенадцати альтернативных распределений оказались относительно невелики, в частности, для равномерной альтернативной гипотезы Мкрит лишь незначительно превышает величину, полученную Хахубией для наиболее мощного критерия. Исследование с помощью метода наименьших квадратов показало, что зависимость Ккрыт можно представить в ви-

\Г -'.И г -0,757

де - ¿эи п -1 Построенную зависимость очень удобно использовать для оценки критического числа малых выборок, при

котором определяется отличие альтернативного распределения от нормального с надежностью 1-0 при заданном уровне значимости а. Проведенные исследования позволили рекомендовать предложенный критерий для практического применения.

В 3.8 дано описание пакетов программ МАИС, предназначенного для статистической обработки одной выборки, и гАСМА!., предназначенного для статистической обработки нескольких выборок. В основу алгоритмов программных модулей положены исследования, проведенные в разделе 3. Для отладки и доработки этих программ, а также программ обработки выборок большого объема, был проведен обширный статистический эксперимент. Генерировались выборки из различных законов распределений и различных объемов — от малых п = 4—25, до больших п- 1000. Параметры законов также варьировались в широком диапазоне. В разделе приведены результаты некоторых экспериментов. Описаны также результаты использования вышеуказанных программ для решения ряда практических задач из области судостроения.

Раздел 4 посвящен статистическим исследованиям зависимостей между переменными (факторами) с учетом особенностей задач из практики судостроения. Статистические исследования связей между исследуемыми факторами характеризуются большим разнообразием постановок задач и различной степенью разработанности математического аппарата. В наибольшей степени теоретически разработана модель линейной регрессии при наличии ошибок только в зависимых переменных. Но в эту схему не укладываются многие практические задачи, в частности, из области судостроения.

В 4.1 рассматривается схема конфлюэнтного анализа, в которой в отличие от регрессионного анализа разделение на независимые и зависимые переменные не является необходимым. Переменные ... хк связаны линейной зависимостью х 7 р + а = 0 ,

/3 т Р = £ = 1, где .....хк), РТ = .....А).

Параметры а и р1 неизвестны, и их нужно оценить по наблюдениям у,=х,+£, (/=1,2.....Здесь У,7 = (V,,.....п,)т —наблюдения, £,т = (Ец,..., ) — ошибки измерений, независимые одинаково распределенные случайные векторы с математическим ожиданием равным нулю, а £ц - компоненты векторов е, —также независимые между собой случайные величины с симметричной плотностью рас-

b ~ь

—°°<х <°° . рас-

пределения вида =

сматриваемое семейство распределений включает в себя, в частности, распределение Лапласа при ь = i, нормальное при 6 = 2, равномерное при Необходимо на основе имеющихся наблюдений V,(t =1,...,«) оценить неизвестные параметры си и Д. Оценки неизвестных параметров находятся методом максимального правдоподобия. В случае b = 2 задача сводится к минимизации квадратичной формы при ограничениях в форме неравенств. В общем случае предлагается воспользоваться методом вариационно-взвешенных квадра-тических приближений, полагая на нулевой итерации Ь-l. При неизвестном параметре b предлагается воспользоваться его оценкой, найденной путем приравнивания выборочного и теоретического коэффициентов эксцесса рассматриваемого семейства распределений. Проверка работы предлагаемою метода и разработанных на его основе алгоритмов проводилась методом статистических испытаний при известном параметре Ь . Результаты имитационного моделирования показали работоспособность метода и робастность получаемых оценок. Большим преимуществом предлагаемого метода перед известными является его применимость для довольно широкого класса распределений ошибок измерений. Заметим, что в случае отсутствия ошибок в независимых переменных метод наименьших квадратов и метод наименьших модулей являются частными случаями предложенного метода.

В 4.2 рассмотрена нетрадиционная задача диагностики: имеется п объектов, каждый из обладает двумя случайным характеристиками X и У, наблюдаемыми отдельно. Прежде всего ставится задача такого сопоставления наблюдений над х и У , чтобы наилучшим образом репродуцировать пары. В случае независимости х \л у — это классическая задача о совпадениях. Задача обобщения классической модели на случай зависимых величин х и Y с плотностью f(x,y) рассматривалась в работах Де Гроота, Хоэ-ла, (De Groot М.Н., Goel Р.К.) и других авторов. В этих работах было установлено, что процедура сопоставления элементов вариационных рядов обеих выборок (натуральное совмещение) максимизирует функцию правдоподобия. В диссертации найдены выражения в квадратурах для математического ожидания числа верно репродуцированных пар N при натуральном совмещении. Найдено явное

выражение для математического ожидания в случае выборки объема п = з из нормального распределения. Уместно заметить, что в работе Де Гроота и Хоэла указывается, что это возможно только при п = 2, а при больших значениях п требуются численные расчеты на ЭВМ. Комбинаторные исследования, проведенные в настоящей работе, позволили найти выражение и для начальных моментов любого порядка. Кроме того, используя представления в виде контурных интегралов биномиальных коэффициентов, меняя порядок суммирования и интегрирования под знаком интеграла, получен ряд, суммируя который и используя теорию вычетов, были найдены также интегральные выражения для любых моментов. Методом перевала при /?—была найдена асимптотика начальных моментов. Наконец, методом моментов доказано, что предельное распределение числа совпадений является пуассоновским с параметром

, Г /(.X, V * (л- )) , ,, .

А - I ——--ск . где /2О) — маргинальная плотность распре-

а /2 (У * (* ))

деления второй компоненты, у*(х)=Р'2~'(^(х)), ^(х), Г2(х) —маргинальные функции распределения х и у соответственно. Поскольку распределение числа совпадений при оптимальном сопоставлении зависит от функции у*(х), естественно было в данной постановке предложить использовать эту функцию в качестве оптимального предиктора У по х . Отмечено, что в случае выборки из нормальной генеральной совокупности у*(х) совпадает с прямой регрессии. В 4.3 введена и исследована новая мера устойчивости оценок линейной регрессии на основе вариационной производной от асиглптотической ковариационной матрицы М-оценок, которые нахо-

п

дятся из условия минимизации суммы X р (у,-х,в), где р —

¡=1

функция контраста, * — вектор-строка, в — неизвестные параметры. Для дифференцируемых функций р задача сводится к реп

шению системы нелинейных уравнений -х,0)ху =0, ] = \,...,р,

1=1

где Ф (х) = е '(х). Функция ¡/(х) —определяющая функция М-оценок. При выполнении условий регулярности М-оценки асимптотически нормальны с ковариационной матрицей

л-(/,у) = а2 К> 4/2 (хгху] ■ где х — матрица значений базисных [л/у/'р

функции ^(х) через величину ш(/ ,ц/ ) =

<5/

мини-

функций в точках плана. Поэтому вариационная производная ковариационной матрицы зависит от плотности и определяющей

<5 |~ М у 2

[м V 'Г

мум которой по 4 определяет оценку с максимальной устойчивостью. Эта оценка найдена в диссертации с использованием вариационных принципов. Эти же принципы были применены при нахождении оценок, имеющих наибольшую устойчивость при фиксированной эффективности, для нахождения компромиссных оценок, когда минимизируется взвешенная сумма квадратов показателей эффективности и устойчивости, а также для нахождения радикальных оценок, когда эти показатели равны. Методы разработаны для применения как при детерминированных, так и случайных аргументах линейной регрессии, а также для одновременного оценивания параметров линейной регрессии и параметра масштаба.

В 4.4 для целей модульного судостроения разработаны методика и алгоритмы автоматизированной классификации судов или их составляющих: надстроек, судовых помещений и т.д. , основанные на методе главных компонент и модифицированном методе кластерного анализа, при котором элементы, попавшие в один класс, различаются не более чем на заданную константу Л по каждой координате. При использовании такой процедуры классы не пересекаются. Предложенные алгоритмы реализованы в виде специальной программы автоматизированной классификации, примеры использования которой приведены в этом же разделе.

Раздел 5 посвящен теоретическим исследованиям ряда вероятностных задач, полезных при изучении морского волнения и при проектировании судов.

В 5.1 сформулирована и доказана центральная предельная теорема для случайного поля и (О с дискретным параметром

( = (/!,...,гш)еТт , если для случайного поля выполнены следующие условия: 1) Ш(>) = 0; 2) интегралы, представляющие £>м(0, сходятся равномерно по ••.,/„,; 3) для любого ¡е г„т число элементов множества У„ (/) имеет порядок о(па) равномерно по /, где о<а < I», а (/„(о — множество тех значений ^е Т,'", для которых «С*) зависит от и((). При доказательстве использовался метод моментов. Теорема обобщает ряд полученных ранее результатов автора, в частности, теорему об асимптотической нормальности сумм

значений случайных полей, зависимых в V полосах, причем каждая полоса характеризуется своим наклоном и конечной шириной. Полученные результаты обосновывают широкое применение гауссовских моделей при имитационном моделировании волновой поверхности, а также хорошо согласуются с многочисленными экспериментальными данными. Эти же результаты являются основанием для использования нормального закона в задачах интерпретации сейсмических данных при исследовании суммарных многократно отраженных волн от слоистых сред. Последняя задача, безусловно, важна в настоящее время в связи с необходимостью поиска полезных ископаемых на шельфе морей и океанов. При изучении океанических процессов важную роль играют методы анализа векторных случайных полей, к которым можно отнести: уклоны волновой поверхности, температуру и соленость воды в различных слоях и др. В связи с этим результаты обобщаются на случай векторных случайных полей.

В 5.2 предложена новая характеризация распределений Ре-лея и Максвелла, находящих, как известно, широкое применение при описании морского волнения.

В 5.3 обосновываются условия корректной аппроксимации эмпирических данных усеченными рядами Грама-Шарлье и Эджвор-та. Разложения плотности распределения в ряды Грама-Шарлье и Эджворта используются во многих областях техники, в том числе в судостроении, при этом часто заранее известно, что случайная величина, плотность которой раскладывается в ряд, является ограниченной и задается в интервале (-к,к). В этом случае естественно пользоваться при аппроксимации плотности усеченными рядами Грама-Шарлье и Эджворта. Хорошо известно, что при таких аппроксимациях возникают отрицательные значения плотности на «хвостах» распределений. В разделе аналитически найдены области изменения значений коэффициентов асимметрии и эксцесса, при которых усеченные ряды Грама-Шарлье и Эджворта неотрицательны на всем интервале (-к,к). Кроме того, найдены еще и области унимодальности усеченного ряда Грама-Шгрлье. При получаются области неотрицательности и унимодальности для неусеченных рядов Грама-Шарлье и Эджворта.

5.4 посвящен исследованию свойств согласованности распределений случайных параметров при функциональных преобразованиях. Рассматривается случай, когда плотность распределения /(х,а) случайной величины х зависит от параметра се, и а -случайная величина с неизвестной плотностью распределения

р{а), но у которой известны к моментов. Существуют два варианта энтропийного подхода к определению плотности распределения случайной величины а. В. И. Мудров и В. Л. Кушко предлагают находить р(а) из условия максимума энтропии апостериорного распределения случайной величины, а В. Н. Вапник — из условия максимума энтропии р{а). В прикладных задачах часто случается, что один из экспериментаторов выбирает в качестве параметра a, a другой - параметр ß, являющийся функцией от а. Так как решается одна и та же физическая задача, естественно считать, что распределения а и ß согласованны, и плотность распределения ß вычисляются по формуле преобразования случайных величин. Возникает естественный вопрос: обладает ли такой согласованностью распределения полученные при двух вариантах энтропийного подхода? Показано, что при первом подходе плотность распределения, р(а) обладает согласованностью в указанном выше смысле, а при втором подходе не обладает. Поэтому первый подход более целесообразен для практического применения.

В 5.5 предлагается метод моделирования трехмерного морского волнения, основанный на использовании неканонических представлений. Этот метод дает возможность учесть дисперсионное соотношение, связывающее временную и координатную частоты, и позволяет моделировать нерегулярное волнение с заданным спектром в наиболее общей форме.

Раздел 6 посвящен решению ряда практических задач из области судостроения с использованием разработанного в предыдущих разделах инструментария. Рассмотрены следующие задачи:

— прогнозирование экстремальных ледовых нагрузок на элементы движительно-рулевых комплексов судов ледового плавания и гидротехнические сооружения по данных выборок малого объема, позволившее существенно уточнить результаты, полученные традиционным методом (6.1);

— обработка и анализ данных эксплуатации ролкеров, используемых при проектировании их энергетических установок по параметрам ремонтопригодности, в результате чего был выявлен ряд характерных закономерностей их технического обслуживания и ремонтов (6.2);

— моделирование состояния взволнованной поверхности моря на протяжении некоторого отрезка времени, использованное при проектировании глубоководного необитаемого аппарата, с апробацией предложенной методики описания волнения в виде случай-

ного поля, заданного неканоническими разложениями (6.3);

— технико-экономический анализ с учетом неопределенности исходных данных, применяемый при проектировании энергетических установок судов (6.4);

— расчеты нелинейной бортовой качки судна на нерегулярном волнении методами моментных соотношений и имитационного моделирования, а также обоснование условий использования распределения Эджворта при этих расчетах (6.5).

В Заключении сформулированы основные результаты работы.

— Установлены теоретические законы распределения эксплуатационных характеристик при внешнем проектировании судов и их энергетических установок и показано, что описать эмпирические распределения с помощью стандартных законов с неполным числом параметров можно далеко не всегда. В общем случае необходимо использовать законы распределения с полным набором параметров.

— Показано, что применение многих из рассматриваемых в работе распределений может быть обосновано с помощью энтропийного подхода или его модификации, при которой параметры закона распределения сами случайны и находятся из условия минимизации энтропии. В последнем случае их двух известных вариантов определен вариант, обеспечивающий согласованность распределений параметров при функциональных преобразованиях.

В области усовершенствования используемых теоретических моделей в работе получены следующие результаты.

— Методом моментов доказана асимптотическая нормальность сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами. Результаты могут быть использованы для описания вероятностных свойств волновой поверхности, а также в практических задачах из других областей техники, например, в задачах сейсморазведки.

— Для усеченных и неусеченных рядов Грама-Шарлье и Эджворта определены области изменения значений коэффициентов асимметрии эксцесса, в которых обеспечивается их неотрицательность, а для ряда Грама-Шарлье также и унимодальность.

— Найдены новые характеризации распределений Релея и Максвелла, находящих широкое применение в различных областях судостроения.

— Предложен новый метод имитационного моделирования трехмерного морского волнения, основанный на неканонических представлениях однородного по координатам и стационарного по времени случайного поля, дающий возможность учесть дисперсион-

ное соотношение, связывающее временную и координатную частоты. Метод удобен для практического применения и позволяет моделировать волнение в наиболее общем виде.

На основе системного анализа разработана методология, приемы и алгоритмы решения задач по статистической обработке выборок любых объемов (от малого до большого), а также теоретическая основа и макроструктура сервисных пакетов программ.

При этом для выборок большого объема:

— получены аналитические выражения для асимптотических дисперсий рассматриваемых распределений с полным набором параметров, определенных методами моментов, максимального правдоподобия, квантилей, проведено сравнение оценок и выработаны рекомендации по их обоснованному использованию, учитывающие как эффективность оценок, так и трудоемкость вычислений;

— для оценок максимального правдоподобия доказаны существование и единственность решения системы уравнений правдоподобия;

— для оценок по методу квантилей определены оптимальные уровни вероятностей, при которых достигается минимум асимптотической дисперсии оценок;

'— проведено сравнение оценок параметров распределения с двух точек зрения — по эффективности и по устойчивости. При этом в качестве меры устойчивости взята нетрадиционная для математической статистики мера: производная от асимптотической дисперсии.

Для выборок конечного, в том числе малого, объема:

— разработан и исследован новый метод получения наилучших оценок параметров трехпараметрических семейств распределений, основанный на обобщенном методе наименьших квадратов и методе «складного ножа» и показано, что этот метод имеет преимущества перед известными, традиционно используемыми методами;

— исследована взаимосвязь оптимальной ширины окна обобщенной гистограммы с выборочной дисперсией. С учетом этого для практического применения разработан алгоритм численного расчета обобщенной гистограммы;

— получены аналитические выражения, определяющие доверительные интервалы наименьшей длины для параметров распределений, составлены таблицы для границ интервалов и приведены их удобные аппроксимации;

— показано, что известный непараметрический критерий отбраковки резко выделяющихся наблюдений, основанный на оценке

коэффициента эксцесса, малоэффективен. Найдено удобное для анализа общее выражение распределения статистики Диксона для семейств распределений, зависящих от параметров сдвига и масштаба, что позволяет обоснованно производить отбраковку для широкого класса распределений. При этом показана ошибочность использования критерия Диксона в качестве непараметрического, как это рекомендуется некоторыми авторами;

— проведен обзор и эмпирический анализ специальных критериев согласия для основных типов распределений с целью выработки рекомендаций по их практическому использованию;

— для ряда распределений предложены и исследованы модификации известных критериев, а также новые специальные критерии согласия, более простые в использовании и не уступающие по мощности известным критериям;

— предложена новая концепция различения основной и альтернативной гипотез, основанная на информационном уклонении Кульбака-Лейбнера, и показано ее преимущество по сравнению с традиционно используемыми для этой цели коэффициентами асимметрии и эксцесса;

— предложен новый метод проверки гипотезы нормальности по совокупности многих малых выборок на основе модифицированного критерия Саркади, имеющий преимущество перед другими используемыми на практике критериями.

В области регрессионного анализа:

— разработан, исследован и апробирован путем статистического моделирования новый общий метод робастного оценивания параметров линейной регрессии в схеме конфлюэнтного анализа;

— решена задача теоретического исследования по оценке зависимости между компонентами двумерного вектора в нетрадиционной постановке, именно в случае, когда компоненты вектора наблюдаются отдельно и независимо друг от друга;

— разработаны и исследованы методы оценки параметров регрессии, основанные на новой мере устойчивости М-оценок — вариационной производной от асимптотической ковариационной матрицы оценок. Проведены исследования по нахождению компромиссных и радикальных оценок. Методы разработаны для применения как при детерминированных, так и при случайных аргументах линейной регрессии.

Даны новые постановки и решения с помощью разработанного инструментария практических задач судостроения:

— по эксплуатации и проектированию, в том числе основанному на модульном принципе, судов различного назначения с уче-

том воздействия нерегулярного волнения и качки;

— по проектированию судовых энергетических установок с учетом неопределенности исходных данных;

— по проектированию морских инженерных сооружений с учетом воздействия экстремальных нагрузок.

Подводя итог, отметим, что в работе рассмотрен комплекс вопросов по системному анализу данных для выборок любых объемов, основной целью которого является обеспечение наиболее эффективной обработки имеющейся информации. При этом разработка методологии анализа велась преимущественно на единой оптимизационной основе. В математическом отношении это выразилось в использовании вариационных принципов и методов в различных разделах диссертации, таких, как: выбор распределений с использованием принципа максимума энтропии, нахождение вариационно устойчивых оценок параметров распределений и линейной регрессии, нахождение оптимальных уровней вероятностей квантильных оценок, нахождение оценок по обобщенному методу наименьших квадратов и максимально правдоподобных оценок параметров линейной регрессии при наличии ошибок в независимых переменных, построение доверительных интервалов в наименьшей длины и т. д. Содержание диссертации связано с нетривиальными теоретическими задачами, постановки и решение которых затрагивают целый ряд фундаментальных областей математики. Поэтому большинство полученных результатов, в силу своей общности, применимы не только в практике судостроения, но и в других областях техники, а также имеют самостоятельной научное значение (например, доказательства теорем: о единственности решения системы уравнений правдоподобия трехпараметрического распределения Вейбулла; об асимптотической пуассоновости числа совпадений вариационных рядов независимых наблюдений двумерного вектора, когда компоненты вектора наблюдаются отдельно; об асимптотической нормальности сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами, и др.). Разработанные методы, алгоритмы и пакеты программ апробированы на практике и могут быть использованы широким кругом специалистов. Совокупность сформулированных и обоснованных в диссертации научных положений, разработанных методов и алгоритмов развивает перспективное направление по применению вероятностно-статистического анализа данных к задачам из области судостроения, а также из других областей техники, а ряд результатов имеют самостоятельную научную ценность.

Основные публикации по теме диссертации

1. Золотухина Л.А., Латышев К. П., Чугуева В. Н. Стохастическая модель слоистой среды и вероятностные свойства отражённых волн. // Успехи матем. наук. — 1966. - Т. XXI, № 3. С. 224-226.

2. Золотухина Л.А., Латышев К. П., Чугуева В. Н. Статистические модели слоистой среды и вероятностные свойства отражённых волн, распространяющихся в этих средах. // Труды Математического института им. В. А. Стеклова. — 1968. — Т. 95. — С. 42-97.

3. Золотухина Л.А. Вероятностные характеристики и асимптотические распределения суммарных однократно отражённых волн в стохастической модели слоистой среды в приложении к сейсмической разведке. II Труды Математического института им. В. А. Стеклова АН СССР, - 1968.- Т. 95,- С. 21-41.

4. Золотухина Л.А., Латышев К. П., Чугуева В. Н. Сходимость к нормальному распределению одного частного вида суммы зависимых случайных векторов. II Математические заметки, АН СССР. — 1969.

- Т. 5, № 6. - С. 692-695.

5. Золотухина Л.А., Чугуева В.Н. Центральная предельная теорема для одного класса случайных полей //Математические заметки, АН СССР. - 1973. - Т. 14, № 4. - С. 549-558.

6. Золотухина Л.А., Чугуева В. Н. Достаточные условия асимптотической нормальности сумм значений дискретных случайных полей, зависимых в полосах. // Математические заметки АН СССР. — 1978.

- Т. 23, № 5. - С. 725-732.

7. Золотухина Л.А., Латышев К. П. Асимптотический анализ среднего числа совпадений вариационных рядов двумерной выборки // Записки научн. семинаров ЛОМИ АН СССР. — Т. 79: Исследования по статистической теории оценивания. — Вып. II. — Л.: Наука, 1978. — С. 4-11.

8. Золотухина Л.А., Васильев А.Л. Разбиение судов на однородные классы для целей модульного судостроения (Постановка задачи). // Труды ЛКИ: Методы прикладной математики в судостроении. Оптимизация и стандартизация характеристик судов и их конструкций. — 1978,- С. 18-22.

9. Золотухина Л.А. Слабая сходимость к нормальному закону средних векторных случайных полей. // Труды ЛКИ: Методы прикл. матем. в судостроении. Оптимизация и стандартизация характеристик судов и их конструкций.—1978.—С.44-47.

10. Золотухина Л.А. Центральная предельная теорема для дискретных случайных полей. // Известия АН Уз.ССР. Серия физ.-мат. наук,— 1978. - № 3,- С. 15-19.

11. Золотухина Л.А. О характеризации законов Релея и Максвелла. II Труды ЛКИ: Методы прикладной и вычисл. математики в судостроении.- 1979,- С. 84-88.

12. Золотухина Л.А. Статистические методы в задачах судостроения. Учебное пособие. Часть 2. - Л.: ЛКИ, 1980. - 123 с.

13. Золотухина Л.А. Статистические методы в задачах судостроения. Учебное пособие. Часть 3. - Л.: ЛКИ, 1981. — 127 с.

14. Золотухина Л.А., Балицкая Е.О., Буяк А. Н. Специальные критерии согласия дли малых выборок. // Труды ЛКИ: Прикладная и вычислительная математика в судостроении. — 1981. — С. 14-21.

15. Золотухина Л.А. Выражение для среднего числа совпадений элементов вариационных рядов в двумерной нормальной совокупности при объеме выборки 3. I/ Труды ЛКИ: Прикладная математика и САПР в судостроении,—1982. — С. 33-37.

16. Золотухина Л.А., Балицкая Е.О. Особенности статистической обработки параметров эксплуатации судов и их энергетических установок для моделей внешнего проектирования СЭУ. // Труды ЛКИ: Автоматизация проектирования судовых энергетических установок. — 1982. - С. 77-86.

17. Золотухина Л.А., Балицкая Е.О. Система программ для определения типа закона для распределения по выборке малого объема. II Труды ЛКИ: Автоматизация проектирования судовых энергетических установок. - 1982.— С. 97-104.

18. Золотухина Л.А., Латышев К.П. Интегральное представление дисперсии числа правильно угаданных пар в задаче о совпадении двумерной выборке. II Зап. науч. семинаров ЛОМИ.— Исследования по математической статистике.— Вып. VI. — Л.: Наука, 1984. — С. 4-10.

19. Золотухина Л.А., Балицкая Е.О. Описание системы программ статистической обработки малого числа наблюдений. II Труды ЛКИ: Автоматизация проектирования СЭУ. — 1985. — С. 73-79.

20. Золотухина Л.А., Винник Е.В. Эмпирическое исследование мощности критерия Саркади и его модификации. // Заводск. лаборатория, 1985.—Т.51, №1.—С.51-55.

21. Золотухина Л.А., Винник Е.В. Применение модифицированного критерия Саркади для проверки гипотезы нормальности малых выборок. II Заводская лаборатория.—1987,—Т.53, вып. 7,—С. 51-54.

22. Золотухина Л.А., Балицкая Е.О., Николаев В.И. Система программ автоматизированной обработки одномерных рядов наблюдений. // Судостроительная промышленность. Системы автоматизации проектирования, производства и управления: Науч.-техн. сборник. — Вып. 9,- 1988,- С. 70-77.

23. Золотухина Л.А. Теория массового обслуживания в приложении к задачам судостроения. Учебное пособие. — Л.: ЛКИ, 1988. — 106 с.

24. Золотухина Л.А., Балицкая Е.О. Асимптотическая эффективность моментных и квантильных оценок параметров распределения Вей-булла Н Заводская лаборатория. — 1988,— Т. 54, №3. —С. 92-95.

25. Золотухина Л.А., Балицкая Е.О. Асимптотические свойства оценок параметров распределения Вейбулла. II Записки научных семинаров ЛОМИ АН СССР. — Т. 166: Исследования по мат. статистике. — Вып. VIII. - Л.: Наука, 1988. - С. 9-16.

26. Золотухина Л.А., Балицкая Е.О. Доверительные интервалы наименьшей длины параметра масштаба показательного закона. II Труды ЛКИ: Математические методы и средства автоматизированных систем в судостроении.—1988.— С. 49-53.

27. Золотухина Л.А., Балицкая Е.О. Об одном критерии согласия для двухпараметрического распределения Вейбулла. // Труды ЛКИ: Математические методы и средства автоматизированных систем в судостроении, 1988. — С. 83-88.

28. Золотухина Л.А., Балицкая Е.О. Модифицированный S-критерий для распределения Вейбулла. // Труды ЛКИ: Прикладная математика и вычислительная техника в судостроении. — 1989. — С. 25-30.

29. Золотухина Л.А., Балицкая Е.О. Оценки параметров распределения Релея. II Заводская лаборатория. — 1992. — Т. 58, № 5. — С. 54-57.

30. Золотухина Л.А., Балицкая Е.О. Статистические методы имитационного моделирования в судостроении. Учебное пособие. — Л: ЛКИ, 1993. - 205 с.

31. Золотухина Л.А., Андрюшин A.B., Алексеев Ю.Н. К вопросу о прогнозировании экстремальных нагрузок на инженерные сооружения по малым выборкам. II The 13th International Conference on Port and Ocean Engineering under Arctic Conditions (POAC'95).—Murmansk, 1995.

32. Золотухина Л.А. Исследование свойства согласованности распределений, минимизирующих энтропию, при функциональных преоб-

разованиях. II Труды 6-й Международной конференции женщин-математиков, 1998 г., Чебоксары—С. 74.

33. Золотухина J1.A. Моделирование трехмерного морского волнения методом неканонических представлений. II Третий сибирский конгресс по прикладной и индустриальной математике (ИНПРИМ-98). Тезисы докладов. Часть II. — Новосибирск: Издательство Института математики СО РАН, 1998. — С. 60.

34. Золотухина Л.А., Федякина И.А. Вариационная оптимизация устойчивости оценок в регрессионном анализе. II Третья Международная конференция и выставка по морским интеллектуальным технологиям (MORINTECH-99). Тезисы докладов. - СПб: Изд-во СПб ГМТУ, 1999.- С. 120.

35. Золотухина Л.А. Асимптотическое распределение числа совпадений двумерной выборки при натуральном совмещении. // Известия вузов. Математика, 2000, № 5. — С. 1-8.

36. Zolotukhina L.A. Peculiarities of statistical Analysis of small Samples in Shipbuilding Applications. — 14-th session SMSSH-85, Varna, 1985. — V. 2. - P. 63.

37. Zolotukhina L.A., Balitskaya E.O. On the representation of a density by on Edgeworth series. II Biometrika. — 1988. — V. 75, № 1. — P. 185187.