автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Оптимальное планирование эксперимента в задачах структурной и параметрической идентификации моделей многофакторных систем

доктора технических наук
Попов, Александр Александрович
город
Новосибирск
год
1997
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Оптимальное планирование эксперимента в задачах структурной и параметрической идентификации моделей многофакторных систем»

Автореферат диссертации по теме "Оптимальное планирование эксперимента в задачах структурной и параметрической идентификации моделей многофакторных систем"

'у На правах рукописи

N

ПОПОВ Александр Александрович

Оптимальное планирование эксперимента в задачах структурной и параметрической идентификации моделей многофакторных систем

Специальность 05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (в области технических наук)

Автореферат диссертации на соискание ученой степени доктора технических наук

Новосибирск - 1997

Работа выполнит в Новосибирском государственном техническом университете

Официальные оппоненты:

доктор технических наук, профессор А.М Кориков

доктор технических наук, профессор В.И. Кононов

доктор технических наук, профессор 1>.Я Рябко

Ведущая организация: Томский политехнический университет

Защита состоится лА-14-уМ 1997 года в а часов на заседании

диссертационного совета Д063.34.03 при Новосибирском государственном техническом университете (630092, Новосибирск-92, пр. К. Маркса, 20).

С диссертацией можно ознакомиться в читальном зале библиотеки НГТУ.

Автореферат разослан С^лЛ^рЛ 1997 г.

Ученый секретарь /

диссертационного /У

к.т.н, доц. Г.Г1. Чикильдин ■

совета

Общая характеристика работы

Актуальность. Под идентификацией в широком смысле слова будем понимать определение модели объекта на основании использования пмборки за-шумленных экспериментальных данных ограниченного объема. Методы теории оптимального планирования эксперимента (ТОПЭ) призваны повышать эффективность решения этой задачи.

Экспансия методов ТОПЭ, как и любой другой относительно молодой научной дисциплины, проходит по известной схеме: от относительно простых объектов, задач к объектам более сложной природы. Например, от рассмотрения моделей линейных по входящим в них параметрам к моделям нелинейным по параметрам, от моделей статики к моделям динамики, от одномерных моделей к многомерным и т.п.

Линейные- регрессионные модели. Методы ТОПЭ для данного класса моделей развивались преимущественно по схеме, когда априори задавалась модель объекта и необходимо было спланировать эксперимент по наиболее точному оцениванию параметров модели. При этом молчаливо предполагалось, что модель адекватна. Недостатком планов, синтезированных под конкретную модель, является их тенденция использовать не всю область факторного пространства, в котором можно проводить эксперимент, а концентрировать наблюдения только в нескольких "характерных" точках. Часто это приводит к тому, что по полученному плану можно оценить только одну модель. Однако если структура модели в точности не известна, то на этапе обработки данных нам придется решать задачу структурной идентификации, где оцениваться должны различные модели из некоторого множества. Таким образом, желательно иметь такой план эксперимента, чтобы он позволял оценивать модели из заданного класса. В условиях структурной неопределенности планирование эксперимента, на наш взгляд, следует направлять в том числе н на решение задачи по уточнению структуры модели.

В классическом регрессионном анализе есгь некоторые возможности по управлению структурой модели: это прежде всего механизм проверки гипотез о значимости параметров модели. Однако, на наш взгляд, механизм проверки гипотез о значимости параметров не отвечает задаче подтверждения ваяидности модели. Сейчас все большее число специалистов склоняются к мысли, что ва-лидность рабочей модели необходимо проверять на дополнительной выборке. Активными сторонниками такого подхода являются ученые, работающие в научной школе, созданной А.Г. Ивахненко (Сарычев, Степашко, Юрачковский и др.). Развиваемую теорию идентификации моделей они называют теорией самоорганизации моделей. В дальнейшем мы вместо "теория самоорганизации моделей" будем использовать близкие по смыслу понятия "задача структурной идентификации" или " задача структурной оптимизации" моделей.

Критерии выбора (селекции) моделей, использующие дополнительные экзаменационные выборки, получили название внешних критериев. При использовании методов структурной оптимизации на основе внешних критериев есть возможность получать валидные модели оптимальной сложности. Характерно, что при увеличении уровня шума структуры оптимальных моделей смещаются в сторону более простых моделей.

Методы структурной оптимизации исследованы и развиты в основном для моделей с количественными факторами и для случая пассивного эксперимента. Возможно, что привлечение методов ТОПЭ на всех этапах решения задачи структурной оптимизации позволило бы получать более точные решения, и, наоборот, учет структурной неопределенности на этапе планирования эксперимента позволил бы получать более эффективные планы в целях их дальнейшего использования.

Линейные модели с качественными факторами. Традиционно модели данного типа связывают с задачами дисперсионного анализа по Шеффе. На этапе анализа таких моделей, как правило, привлекается аппарат обобщенных обратных матриц, а на этапе синтеза планов эксперимента - комбинаторные алгоритмы (Rao, Searle, Денисов, Маркова, Малютои, Лисенков, Полетаева, Пономарев и др.). Их применение на практике требует квалифицированного сопровождения со стороны математика-статистика. Большой эффект могло бы дать решение проблемы упрощения соответствующих процедур анализа и планирования эксперимента. В принципиальном плане при анализе таких моделей вместо процедур проверки гипотез о иезначимости факторов (уровней факторов) можно было бы решать задачу структурной оптимизации. Эго особенно важно при построении моделей со смешанными факторами, поскольку эти модели могут быть использованы в том числе и в целях управления или прогнозирования. Если говорить о планировании эксперимента, то для практики важно иметь возможность строить планы и виде ошиыачьнии выборки необходимого объема из полного факторного эксперимента (ПФЭ).

Многомерные модели. Переход от одномерного представления отклика системы к многомерному сопряжен со многими трудностями. Усложняется понятие структуры модели, методы оценивания параметров, проверка адекватности многомерной модели. Если многомерные модели генерируются в соответствии с методологией моделирования по принципу "черного ящика", то для выбора их структуры также можно решать соответствующую оптимизационную задачу. Опыта решения этой задачи в многомерном случае практически нет.

Нелинейные модели. Структурная неопределенность, характерная для линейных по параметрам моделей, здесь трансформируется в параметрическую неопределенность. В этом смысле эти два класса моделей эквивалентны друг другу. Стратегии и алгоритмы планирования эксперимента для нелинейных по параметрам моделей должны учитывать имеющуюся параметрическую неопределенность (Федоров, Григорьев, Денисов, Ермаков, Мелас, Круг, Кабанов, Фомин и др.).

Модели динамических систем. Структурная и параметрическая идентификация моделей динамических систем имеет ряд своих особенностей, связанных с большой сложностью моделируемых объектов. В последние годы при решении задач идентификации моделей псе больше внимания уделяется проблемам оптимального планирования эксперимента (Круг, Фатуев, Глазов, Саванов, Круглое, Денисов, Горский, Рапср, Талалай, Федоров, Успенский и др.). Однако опыта алгоритмических и программных разработок в этой области еще не достаточно. Объясняется это и относительно новой областью применения ТОГ1Э и большим разнообразием управляемых ресурсов эксперимента, а также спецификой н сложностью постановок задач. Сказанное относится и к моделям стохастических динамических систем. Пионерские работы в области ТОПЭ для этого класса моделей выполнены зарубежными учеными (Goodwin, Gupta, Kalaba, Mehra, Payne, Zarrop и др.). Алгоритмические конструкции, доведенные до программной реализации для этого класса задач, отсутствуют. Неясным также остается вопрос - в какой степени на задаче синтеза оптимального плана сказывается учет стохасгичности моделируемого объекта.

Решение вопросов активной идентификации моделей объектов невозможно без привлечения соответствующего программного обеспечения (ПО). Разработка такого ПО - важнейшая проблема. Поэтому все проводимые исследования в части использования методов ТОПЭ в задачах структурной и параметрической идентификации должны быть связаны с отбором и разработкой соответствующих эффективных алгоритмов, пригодных для программной реализации.

Итак, данная диссертационная работа посвящена развитию существующей теории структурной идентификации моделей с использованием внешних критериев селекции, посредством привнесения в нее идей .и методов ТОПЭ, распространением ее па объекты с качественными факторами и факторами смешанной природы, развитию теории оптимального планирования эксперимента в части учета структурной неопределенности модели исследуемого объекта и разработки вычислительных схем синтеза оптимальных планов эксперимента для моделей динамических систем, что позволит решать задачи моделирования объектов различной природы в реалистической постановке.

Целыо исследования является: рассмотрение задачи структурной оптимизации моделей объектов с количественными, качественными и смешанными факторами, с одномерным и многомерным откликом совместно с задачами оптимального планирования эксперимента; разработка эффективных базовых алгоритмов синтеза дискретных оптимальных планов эксперимента для линейных и нелинейных по параметрам многофакторных моделей в условиях структурной или параметрической их неопределенности; разработка алгоритмов оптимального планирования экспериментов для моделей детерминированных и стохастических динамических систем в различных постановках; разработка программного обеспечения решения задач оптимального планирования эксперимента, структурной и параметрической идентификации.

Научная новизна:

1. Задача структурной оптимизации регрессионных моделей с использованием внешних критериев селекции рассмотрена совместно с задачами оптимального планирования эксперимента.

2. Методы структурной оптимизации распространены на объекты с многомерным выходом, объекты с качественными действующими факторами и с факторами смешанной природы, при этом рассмотрена идентифицируемость используемых линейных моделей. Аналитически найден базис функций, допускающих оценку, для линейных моделей, моделей с двухуровневыми взаимодействиями при произвольном числе качественных факторов и их уровней варьирования, а также для линейных моделей с факторами смешанной природы.

3. Разработан эффективный подход к решению задачи построения оптимальных планов эксперимента для моделей дисперсионного, ковариационного анализа и общих моделей с переключениями.

4. Для решения задач синтеза оптимальных планов эксперимента развиты концепции дискретизации области планирования и последовательного достраивания. В рамках данных концепций разработаны эффективные алгоритмы.

5. Для моделей динамических систем в виде обыкновенных дифференциальных уравнений разработаны вычислительные схемы планирования моментов наблюдений, входных сигналов, модели наблюдения. Для моделей динамических стохастических систем рассмотрены способы вычисления информационной матрицы Фишера, свойства задачи синтеза оптимального плана входного сигнала. Предложены упрощенные схемы вычисления в задаче планирования входного сигнала аналога информационной матрицы.

6. Для решения задачи параметрической идентификации моделей в пространстве состояний предложено использовать комбинированный алгоритм на базе МНК с регуляризацией. Регуляризация достигается выбором оптимального параметра сглаживающего сплайна при минимизации скалярного функционала от вектора ошибок предсказания.

Тсоретпческаи значимость. Теоретическая значимость проведенных исследований состоит в том, что показано положительное влияние методов ТОПЭ на решение задачи структурной оптимизации линейных моделей, предложено использовать для конструирования внешних критериев селекции моделей повторные выборки, разработана последовательная композиционная процедура поиска адекватных моделей с привлечением методов планирования экспериментов, отвечающая реалистической концепции моделирования. Предложен подход по определению базиса идентифицируемых параметрических функций и механизм решения экстремальных задач для построения оптимальных планов эксперимента для линейных моделей с качественными и смешанными факторами. Проблему анализа линейных моделей с качественными факторами предложено решать средствами структурной оптимизации. Получены выражения для вычисления элементов информационной матрицы Фишера при планировании входного сигнала для стохастических моделей динамических систем.

Практическая ценность и реализация результатов. Разработанные алгоритмы активной структурной идентификации линейных по параметрам моделей позволяют с единых методологических и алгоритмических позиций решать задачи моделирования объектов с факторами различной природы в реалистической постановке. Они положены в основу развиваемой концепции объективного анализа данных и могут быть использованы при разработке соответствующего программного обеспечения. Разработанный подход планирования эксперимента позволяет просто и эффективно решать задачу синтеза планов эксперимента дня линейных по параметрам моделей с качественными и смешанными факторами. Развиваемая концепция дискретизации области планирования в сочетании с методом последовательного достраивания имеет неоспоримые преимущества в практических задачах синтеза планов эксперимента, поскольку позволяет учитывать любые технологические ограничения, факторы различной природы, гибко наращивать объем плана, строить бипланы. Предложенный подход по сплайн представлению входных сигналов позволяет эффективно решать задачи синтеза оптимальных входных сигналов для широкого класса моделей (модели временных рядов, разностные и дифференциальные уравнения в пространстве переменных состояния). Рассмотренные свойства задачи синтеза оптимальных планов входного сигнала для стохастических моделей динамических систем позволяют резко упростить ее решение. Это открывает новые практические возможности для конструирования соответствующих алгоритмов и программных систем. С использованием предложенного алгоритма параметрической идентификации моделей динамических систем открывается принципиальная возможность ставить и решать задачу структурной оптимизации моделей данного класса. Разработанное программное обеспечение позволяет эффективно решать практические задачи активной структурной и параметрической идентификации моделей статических и динамических систем. При помощи предлагаемых алгоритмов, методик и программ ренины задачи в области активной идентификации авиационных силовых установок, при исследовании параметрической идентификации моделей химической кинетики, термической обработки твердых теплив, моделирования испытаний электроизоляционных материалов. Программное обеспечение внедрено на ряде предприятий, таких как ЛИИ (г. Жуковский). ЦАГИ (г. Жуковский), НЗХК (г. Новосибирск).

Апробация работы. Результаты исследований в период с 1980 по 1997 гг. докладывались и обсуждались на 2-х Международных, 15-ти Всесоюзных и 3-х Республиканских конференциях и симпозиумах.

Публикации. ГТо результатам работ в период с 1980 по 1997 гг. опубликовано 60 печатных работ, в том числе одна Монография.

Структура работы. Диссертация состоит из введения, восьми глав, заключения, списка литературы из 327 названий и 3-х приложений. Работа изложена на 424 страницах, включающих 71 таблицу н 68 рисунка.

Основное содержание работы

Глава 1. Методы активной структурной идентификации линейных регрессионных моделей

Первая глава посвящена рассмотрению проблемы структурной идентификации линейных регрессионных моделей на основе использования критериев селекции, вычисленных по дополнительной выборке данных. Названная проблема рассматривается совместно с задачей оптимального планирования эксперимента.

В и.1.1 рассмотрены известные критерии оптимальности планов эксперимента и критерии селекции моделей. Среди традиционно используемых критериев оптимальности планов эксперимента отметим критерии D-, А-, Е-, MV-, W-, Q-, С- оптимальности Критерии селекции моделей применяются в задаче структурной идентификации

/ -=/)/•£ min J(f), (I)

./ еХ2/

где О. j - априорное множество просматриваемых моделей-кандидатов; J -критерий селекции модели / из этого множества. Критериев селекции моделей предложено достаточно много. Основное внимание в работе уделено использованию внешних критериев селекции моделей, в частности, таких, как: критерии

I, "1

\Уи ~ %цОА , где запись А (В / А) означает "ошибка" на В модели, коэффициенты, которой получены на А (предполагается, что вся выборка IV разбита иа части А и В), критерий симметричной регулярности d^ — Л' ( ВI /1) +- zl2 ( А I В), стабильности

S2 = Ar(lV / А) + Л2(ИЧ В) = -XW0A§ иесмещенпо-

1 II - - ¡¡2

сти по коэффициентам >1( ~ — - 0 ц | , непротиворечивости

псм2 = - Хн,0ц | , критерии вариативности

л л -Г " л '

V =(XfyOA -Xtу&ц') (Хц,вц' -Хц'в1}) и критерий "скользящего контроля (прогноза)" Л}:к - (jv,- -у, (*',#(,) ))2 , где -оценка параметров по выборке IV с исключенным /- м наблюдением. В работе предлагается внешний критерий селекции, получивший название субидеального критерия стабильности, основанный на использовании выборки из повторных наблюдений. В нем в качестве оценки неизвестного истинного вектора наблюдений используется вектор выборочных средних. Исследуются свойства предлагаемого критерия по поведению его математического ожидания. При использовании данного критерия отпадает необходимость проводить разбиение выборки на обучаю-

шую и проверочные части. Проведенные о работе вычислительные эксперименты подтвердили работоспособность предлагаемого внешнего критерия.

В П. 1.2 подробно рассматривается проблема структурной идентификации моделей с использованием методой активного эксперимента. Перечислим проблемы, возникающие при решении задачи структурной оптимизации: слишком быстрый сдвиг влево минимума внешнего критерия при возрастании дисперсии шума, т.е. Низкая его помехоустойчивость; возможность появления "ложных" минимумов из-за "ущербности" реализованного плана эксперимента; проблема разбиения выборки на части.

В работе предлагаются пути решения перечисленных проблем привлечением методов оптимального планирования эксперимента. При решении задачи > планирования эксперимента используются, как правило, два концепта: постулируемая модель и выбранный критерия оптимальности. Проблему выбора базовой модели при построении плана эксперимента в условиях структурной неопределенности можно решить с позиции теории векторной оптимизации, рассматривая задачу компромиссного планирования по функционалу в виде свертки от функционалов от информационных матриц всех частных моделей. Предполагается, что Исследователь априори задает множество из т регрессоров, вйуГрИ которого находится некоторое подмножество регрессоров, соответствующее истинной структуре модели. Однако данный подход не конструктивен из-за большого объема вычислений. В целях упрощения задачи можно в обобщенном функционале учитывать не все возможные модели, а только некоторые наиболее характерные или даже только одну полную модель, состоящую из Ж регрессоров. Вычислительные эксперименты показали, что оптимальные планы, построенные с учетом в обобщенном функционале всех моделей, и планы, построенные с учетом только одной полной модели, оказались близки друг к другу. 0 пользу выбора полной модели при решении задачи планирования Эксперимента говорят также следующие факты. Введем в рассмотрение расширенную матрицу плана Хггде

/(л:) - т х 1 вектор регрессоров полной модели; /), ( = 1, п - веса точек плана. Для частной 1-й модели матрицу плана Х(/) можно определить как Х(0 = ХБи), где квадратная диагональная матрица 5(/) содержит на диагонали Нули и единицы, определяя таким образом структуру частной модели с оценками Параметров = Х+ («')у = (Л5(|))+ у.

Утверждение 1.2.1. Матрица плана X для полной модели есть усредненная с точностью до постоянного множителя всех 2т -1 матриц клана Х(1) 2т-1 .

частных моделей, т.е. X = £*(/)/2 ■

/=1

Второй факт следует из рассмотрения задачи векторной оптимизации:

= А /у тах{/„ 5=1,...,т), /, = ^ (А/Д0), з = 1, , т, (2)

где >,п ~ последовательность вложенных друг в друга информа-

ционных матриц плана 4 Для моделей сложности 5. Учитывая, что по теореме отделения Штурма /| > /2 .. > >... > 1т можно заключить, что для получения одного из Парето - оптимальных решений задачи (2) необходимо ее решить с полной моделью: ^ = А /¿'шах/,,.,

Вторым важным моментом является выбор критерия оптимальности. В работе устанавливается определенная связь между некоторыми критериями оптимальности планов эксперимента и критериями селекции моделей. Рассмотрим вначале критерий скользящего прогноза

у2к-хТв)Т а (у -хг9), (3)

где С - диагональная матрица. [С]^ = (1 -/(х,)'1 (Л'/Л')~'/(-*())~2. ' ~ 1п-Вводя // - (/ -X1 (А'У А'У'Л), выпишем его математическое ожидание:

ЕСV]к) = {у + е)т ИаИу + е) = у т 1ЮНу + д-2/гС1,7. (4) Исследование (Сарычев А.П., 1990) поведения ¿'(V«) в зависимости от тех или иных ошибок спецификации Л" показало, что в случае, когда X включает истинный набор регрессорав с избытком, первое слагаемое в (4) равно нулю, а второе слагаемое ведет себя как функция штрафа за переусложнение модели. Чем больше значение 1г (71'2; тем быстрее сдвигается минимум V« в сторону простых моделей при увеличении дисперсии шума а2 . В диссертации рассмотрена возможность уменьшить //'О'"2 выбором плана -эксперимента, другими словами, улучшить помехоустойчивость критерия

Утверждение 1.2.2. Минимум /г б"2 достигается на О - оптимальном плане и равен о-2 ц2 / (/; - 5).

К аналогичным выводам приходим, если анализировать не математическое ожидание критерия У2„, а его оценку (3). Зафиксируем остаточную сумму

квадратов 52(0) = (>> -Хт0)т(у -Хг0) = р .

Утверждение 1,2.3. При ограниченной остаточной сумме квадратов максимальное значение тт V2* достигается на О -оптимальном плане.

$2(01=р

Следуя утверждению 1.2.3, можно ожидать, что критерий V2* на О-оптимальном плане не будет иметь ложных минимумов.

При рассмотрении критерия непротиворечивости показано, что он тесным образом связан с критерием Е - оптимальности планов эксперимента. Выбирая

Е - оптимальный план, мы уменьшаем вероятность того, что минимум критерия

2 2 f7CM будет достигаться не за счет малого значения (ff, а за счет малого минимального собственного числа Amjn(M(Ç)), другими словами, уменьшается ве-

2

роятность появления ложных минимумов критерия щ-м . Как показано в работе, критерии п}:м и V2 связаны с процедурами проверки гипотез, и для того, чтобы не получить F - критерия с малой мощностью, нужно выбирать Е ~ оптимальный план эксперимента.

В проведенном в работе вычислительном эксперименте получены следующие результаты. На D- оптимальном плане по критерию скользящего прогноза задача структурной идентификации решалась правильно до уровня помехи в 50% от мощности полезного сигнала, а, например, на А- оптимальном плане - до уровня помехи 25%, на случайном плане - до уровня 20%. Задача идентификации считалась правильно решенной, если в полученной модели оптимальной сложности не было потеряно ни одного истинного регрессора.

В п. 1.3 рассмотрено решение проблемы разбиения выборки данных на обучающую и проверочную. При этом исследовалось поведение критерия регулярности. Математическое ожидание критерия регулярности зависит от того как разбита выборка. В силу этого неизбежно встает задача управления разбиением выборки. Задача эта ставилась и раньше (Юрачковский Ю.П., Грошков А.П., 1980), однако каких либо общих результатов по ее решению пока нет.

В общем случае разбиения X на X л и X в второе слагаемое в выражении для математического ожидания критерия Д(В) равно

J0(s,a) = a2(nB + U(XTAXA TlXrBXB)). (5)

Исследована возможность минимизации Ja путем выбора того или иного варианта разбиения X на XА , Хв при условии, что пв (число точек в В) зафиксировано.

Утверждение 1.3.1. Если на X существует D - оптимальный план такой,что =... = />* =МпА, р*= 0, j = nA +1 ,...,п, тодлянего

irM~\^*)XßXg < trM~l(Ç)X'i}XB, где £ - не П - оптимальный план.

Результат говорит о том, что осуществляя D- оптимальное разбиение выборки, когда ХА составят точки D- оптимального плана, можно ожидать, что

критерий регулярности zf(fl) будет при этом обладать повышенной помехоустойчивостью. Это связано с тем, что в выборку В отойдут точки, в которые обеспечивается хороший пропюз по моделям, построенным на выборке А. В работе также обсуждена возможность использования Q- оптимального разбиения выборки. Кроме того показывается также, что к D- оптимальному (или Е-

оптимальному) разбиению выборки приходим и при рассмотрении критерия непротиворечивости.

В проведенном вычислительном эксперименте подучены следующие результаты: критерий регулярности на В для О - оптимального разбиения правильно специфицирует модель до уровня шума V = 50%. Для не Р- оптимального разбиения это оказалось возможным лишь до уровня щупа у = 10%.

В п. 1.4 рассмотрена проблема получения адекватных регрессионных моделей объектов. Для того, чтобы модель оптимальной сложности имела практическую ценность, необходимо потребовать, чтобы она была адекватной- Адекватность модели, следуя реалистической концепции (Айвазян СЛ., 1У85), будем проверять, исследуя точность прогноза на контрольной выборке.

В работе вводится нормированный критерий регулярности

%(В) = {уй-Хп0А?и„а +Х1){Х\ХлухХ1ну\ун-ХвдА) и показывается, что для истинной модели Е(Л2 (В)) = Пцсг2 ■ Оценка дисперсии - Л2 (В)/Пц используется при проверке гипотезы об адекватности.

Для решения задачи поиска адекватной модели оптимальной сложности предлагается следующая процедура.

Выдвигается гипотеза, что адекватная модель /** принадлежит

= |/\ 1, 0\ еЛ"'1 против альтернативного предположения, что

возможно /** е П/п. = {// (хЩ + /[(х)в2 ), 0, е К'"1 , 02 е К"'1 . Строится композиционный план е\2 = Л'^тахЧ^А^/^.^ц)], м(/12>¿"12) ~~

информационная матрица плана для полной модели /12 +/гУ = ¿¡2 = (£1>е2)< а план е\ является

оптимальным для модели Д. Таким образом, план ¿'2 в композиционном плане £¡2 есть оптимальная добавка к плану £1 для возможности оценивать пол* *

ную модель /|2. План £| составит выборку А, а план ¿'2 - выборку В. Далее на множестве моделей Пу, решается задача (1). Полученная оптимальная модель проверяется на адекватность. Если модель признается неадекватной, то процесс усложнения модели продолжается до получения адекватной модели. В Предложенной схеме экзаменационная часть выборки связана в основном с альтернативной гипотезой, т.е. точки выборки В характерны для более сложной модели. Таким образом, модели, соответствующие основной гипотезе, проверяются не просто на новых точках, а на точках плана, характерных для более сложной модели.

В работе, в развитие предложенной схемы построения адекватных моделей, предлагается широкий класс многоуровневых ортогональных планов вто-

poto и третьего порядков. Показывается оптимальность планов с точки зрения мощности проверки гипотез о степени полиномов.

В 11.1.5 ставится и исследуется задача структурной оптимизации регрессионных моделей при группированных данных. В условиях, когда индивидуальные значения отклика не наблюдаются, оценки параметров модели будут смещенными и, строго говоря, не будут состоятельными. Поэтому, на наш взгляд, основной акцент при моделировании в условиях группированных дан-пых следует сделать на структурную оптимизацию моделей.

Проведенный в работе вычислительный эксперимент показал, что при увеличении ширины интервала группирования сложность оптимальной модели имеет тенденцию к снижению. Результаты работы алгоритмов селекции значительно были лучше, если в качестве выборки выбирался D- оптимальный биплан. При свободе выбора интервалов группирования или назначения условного среднего наблюдений, попавших в заданный интервал, возможно организовать некоторую задачу по оптимизации группирования. В этих целях рассмотрено поведение критериев селекции при изменении ширины интервала группирования при фиксированном уровне шума. В проведенном вычислительном эксперименте прослеживается зависимость критериев селекции от выбранного интервала группирования. Отмечен эффект повышения помехоустойчивости критериев селекции при определенных интервалах группирования. Делается вывод о возможности решать задачу оптимального группирования при выборе модели оптимальной сложности.

В п. 1.6 рассматриваются алгоритмы решения задачи структурной оптимизации (1), вопросы повышения селективных свойств алгоритмов и задача определения истинной (физической) структуры в условиях шума. В качестве базовых выбраны эффективный комбинаторный алгоритм и многорядный алгоритм. Для повышения селективных свойств алгоритмов предлагаются схемы планирования дискриминирующих экспериментов, в которых критерии дискриминации вычисляются на основе ошибок прогноза. Для определения истинной модели в условиях шума предлагается подход с использованием имитационной модели поведения критериев селекции в зависимости от состава регрессоров.

Глава 2. Методы активной структурной идентификации линейных моделей с разнотипными переменными

Распространение методов структурной оптимизации на базе внешних критериев на класс моделей с качественными и разнотипными переменными Позволяет создать универсальную систему алгоритмов для решения задач идентификации линейных по параметрам моделей. Однако известно, что модели с качественными переменными, активно используемые в задачах дисперсионного и ковариационного ан'ализов, относятся к классу моделей неполного ранга или неидентифицируемых. Это приводит к необходимости в общем случае использовать аппарат псевдообратных или обобщенных, обратных матриц и делает невозможным применение эффективных алгоритмов структурной оптимизации.

Проблему можно решить, если отказаться от использования обобщенных обратных матриц, сводя исходную модель к модели полного ранга. Данный прием редукции исходной модели к модели полного ранга в разное время использовался различными авторами (Асатурян В.И.,1975, 1978; Бекарева Н.Д., 1981; БеаНе Б.Я., 1971). Однако при этом редукции подвергалась непосредственно расширенная матрица плана. Таким образом, модель и план становились тесно связанными друг с другом, что препятствовало получить решение универсального свойства.

На наш взгляд, принципиальным моментом является понимание того факта, что дефект ранга в модели может иметь двойную природу. Назовем дефект ранга внутреншщ, если он является следствием способа кодировки качественных факторов, и епешшш, если он является следствием ущербности реализованного плаца эксперимента. Необходимо тем или иным способом ликвидировать внутренний дефект ранга.

В п. 2.1, 2.2 рассмотрены вопросы идентифицируемости линейных моделей с качественными и разнотипными факторами.

Запишем дисперсионную модель для случая к факторов в виде

где ц - среднее, а,, Р}У ¡~ эффекты уровней соответственно первого,

второго и т.д. факторов, подлежащие оцениванию.

Пусть для модели (6) реализован некоторый план эксперимента с матрицей наблюдения А-. Предположим также, что данный план не вносит дополнительно в модель внешний дефект ранга. Столбцы матрицы X будем обозначать так же, как неизвестные параметры с подчеркиванием снизу: ц, ииI,

- \.....УI- имея в виду, что это N - мерные векторы, состоящие

из 0 и 1, а ц - вектор из 1, - всего р векторов. В модели (6) несмещенно будут оцениваться только г = р- к - г§(А*г) линейно независимых функций, допускающих оценку (ФДО), образующих базис ФДО.

Утверждение 2.1.2. В линейной модели (6) с линейно зависимыми столбцами ■■■■•У I базис ФДО составляют функции

М =М+сс1 + /}, + --- + У,, са = са-а1, /=1...../-1,

_ — (7)

Редуцирование модели (6) к модели полного ранга можно проводить через факторизацию матрицы X =Х1А> где Х\ - матрица полного строчного ранга

у= Хв+Е= Х{Ав + е = ххв+б. (8)

В (8) матрица А определяется базисом ФДО.

Запишем линейную модель с взаимодействиями

Уц..л=Р + я, + Р ¡+...+у ¡1 (ар\ к ■+(«/)(/+(Ру+ е,} ,,

(9)

i-\,...,^J=],...,J,...,l = \,...,L, I = SЬJ = S2,...,L = йк.

Утверждение 2.1.3. Для модели с взаимодействиями (9) базис ФДО с учетом внутреннего дефекта ранга составляют следующие ФДО:

р = р + а, + р г + с + {аР)и+~- + (ау)[1 + (Ру)м,

Т1 = Гг71 + {с1у),г{ау)п + ---+(ру)м-{ру)л,1 = \,...,1-\, {ар) ч = (а/3) у + {ар) ц - {ар),, - (ар) у,/ = 1,...,/ — I, у = 1,...,./-1,

(ру) ^(ру) ,,+(Рг)лГ(Ру) 11Г(ру)л,з = =

Для порядковых качественных переменных, отражающих отношения линейного порядка, меняется и способ кодирования матрицы плана X и базис ФДО. Приведем здесь базис ФДО для модели с взаимодействиями.

Утверждение 2.2.2. Для модели (9) с порядковыми факторами с взаимодействиями базис ФДО составляют следующие параметрические функции:

V = /' + «!+ Л + —+ + + +

т = а, + (аР)11+--- + (ау)1,, Ы2,...,/, (11)

Г/ = Г/ + («Г)1/ +--- + (Рг)и> 1 = 1,-Л,

{ФЬ, = (<Ф)0, (ау)1,=(ау),1,..., (ру)}1 = (ру) ц, 1 = 2,...,/,7 = 2,...,Л / = 2,...,1.

Многие схожие проблемы идентифицируемости параметров имеют место в моделях так называемого ковариационного анализа. В работе рассмотрены различные виды непрерывно-дискретных моделей и аналитически определен базис ФДО для них (утверждения 2.2.4,2.2.5 диссертационной работы).

В п. 2.3. рассмотрены вопросы оценивания параметров в редуцированной модели и интерпретации получаемых оценок. Оценивание параметров в модели (8) можно осуществлять по обычному методу наименьших квадратов. При этом,

по сути, обеспечивается выполнение ограничений 0Г+, — 0, ( = 1 ,...,р-г на параметры в исходной модели. Известно, что введение тех или иных ограничений на параметры в модель (6) может изменить структуру функций, допускающих оценку. Рассмотрим в этой связи к каким результатам приводит введение в модель (6) ограничений вида

«.7 = 0, /¡¡,=0....,ГЛ=а (12)

Утверждение 2..11. В модели (6) с ограничениями р1 0 =0, где Р7 ~(0г, 1Р-г)> базис ФДО составляют 0, = 0„ / = 1, ,Р

К аналогичному результату приводит использование в качестве идентифицирующих ограничений балансового вида, а именно

Та, = 0, = 0 , =0. (13)

Обозначим оценки параметров при ограничениях (12) как а,,/^,...,;5/, а оценки, полученные при ограничениях (13), как а¡.

Утверждение 2.3.2 Для линейной модели (6) между оценками, полученными при ограничениях (12), и оценками, полученными при ограничениях (13), справедливы следующие соотношения:

¡1 = £ + со, ■+й)J+...+c^)l, а, =а, -со], /=1,/-1, а, =-й>/, ....... ,?1 - У1. - со]., / = 1,1-1. У]. =~со/ ,

где«, = рзу и,....Юь^^у,)!!,.

1 = 1 7 = 1 Ы\

Аналогичные соотношения можно установить и для моделей с взаимодействиями. В работе приводится пример их построения.

Несмотря на то, что наложение ограничений (12) или ограничений (13) позволяет несмещенно оценивать любую параметрическую функцию, только оценки параметрических функции, допускающих оценку в модели без ограничений, будут совпадать. Таким образом, в общем случае, вводя то или иное идентифицирующее ограничение, можно говорить только об условно оцениваемой параметрической функции, которая ранее в модели без ограничений была неоцениваема. Если действовать формально, вводя в модель ограничения типа (13), можно оказаться в ситуации, когда все параметрические функции будут оцениваемы, но при этом фактически могут не инт ерпретироваться как соответствующие главные эффекты уровней факторов или их взаимодействий. Для несбалансированных планов полезным может оказаться вычисление и интерпретация оценок, полученных с учетом ограничений

Лг,а, =0, 2>Д. =о,...,Хлп =0. (15)

Для их вычисления можно воспользоваться соотношениями (14) с заменой

/-1 / J-t - .1 /.-I L

a>¡ =(1';а,}/£>;, oJj =(£ vfî^i 2>,„.., m, =CLPiTi)'T.P¡ '=1 /=i j=\ ■ /=1

(предполагается, что не все г, > 0, > 0, p¡ > 0 равны нулю). Однако в общем случае строгие и обоснованные выводы можно сделать лишь о тех параметрических функциях, которые оценивались в модели без ограничений. Базис этих ФДО устанавливается в диссертационной работе (см. выше). Это относится и к моделям с взаимодействиями. Важно также, что в редуцированной модели оценки этих параметрических функций (сравнений) получаются автоматически при оценивании соответствующих параметров. ,

В п. 2.4 рассмотрена задача синтеза планов эксперимента для моделей с качественными и разнотипными переменными. В качестве планов эксперимента для моделей типа (6) традиционно рассматривались различного рода комбинаторные конфигурации, например, такие как латинские кубы, гиперкубы, параллелепипеды и т.д. В то же время планам дисперсионного анализа, построенным с помощью комбинаторных методов, присущи определенные недостатки. Во-первых, не для любого числа наблюдений существует тот или иной тип плана, во-вторых, такой план жестко сбалансирован и выпадение хотя бы одного эксперимента нарушает его оптимальность.

Поставим задачу планирования эксперимента следующим образом. Необходимо в некотором смысле оптимальным образом выбрать п точек из N возможных, представляющих в общем случае ПФЭ. Значительную трудность при решении поставленной задачи планирования эксперимента вызывает тот факт, что исходная модель (6) является моделью неполного ранга. Разработанная теория оптимального сингулярного планирования здесь мало эффективна, поскольку рассчитана на общий случай M île имеет в своем арсенале соответствующих алгоритмов синтеза планов. Ключом решения проблемы является использование редуцированной модели полного ранга (8).

Редуцированная модель (8) выписывается относительно базиса ФДО. Если в качестве плана эксперимента для редуцированной модели рассматривается ПФЭ, то для него базис ФДО в точности совпадает с соответствующим базисом ФДО, полученным в утверждениях 2.1.2, 2.1.3, 2.2.1, 2.2.2, поскольку он не вносит в модель внешний дефект ранга. В отличие от ПФЭ произвольный План может увеличить дефект ранга модели. Возникает вопрос: существуют ли планы в виде выборки из ПФЭ, не привносящие в модель внешний дефект ранга и оставляя тем самым неизменным вид базиса ФДО? Ответ на это вопрос дает следующее утверждение.

Утверждение 2.4.1. Существует насыщенный план с числом наблюдений 11 = rgX, составленный из точек ПФЭ, для которого базис ФДО совпадает с базисом ФДО для ПФЭ.

В работе, опираясь на утверждение 2.4.1, ставится и решается с позиций общей теории оптимального планирования эксперимента задача синтеза планов

эксперимента для моделей с качественными и разнотипными переменными. В задаче синтеза оптимальных планов предлагается использовать критерий й-оптимальности, поскольку он инвариантен к невырожденному линейному преобразованию исходной системы функций (Федоров В В., 1971). Это обеспечивает выбор плана, оптимального не только для заданной системы базисных ФДО, по и для любой другой системы линейно независимых ФДО.

Для моделей дисперсионного анализа эффективным способом построения планов является ранжирование всех точек ПФЭ по порядку их включения в оптимальный план. Для проведения такого ранжирования можно воспользоваться алгоритмом последовательного достраивания планов (рассмотрен в главе 4).

Планирование эксперимента для моделей с двухуровневыми взаимодействиями имеет свои особенности, связанные с тем, что размерность базиса ФДО быстро растет с увеличением как числа факторов, так и их уровней варьирования. Гибко управлять необходимым объемом плана позволяет предложенная схема композиционно-последовательного планирования эксперимента для линейных моделей с взаимодействиями. Схема такого планирования предусматривает наращивание плана при введении в модель псе новых двухфакторных взаимодействий. Добавочные точки эксперимента могут выбираться по последовательной схеме й- оптимального планирования. В работе приводятся примеры синтеза оптимальных планов дисперсионного и ковариационного эксперимента.

В п. 2.5 диссертации на модельном примере рассматривается решение задачи структурной оптимизации модели с качественными факторами. При структурной оптимизации модели определение значимых сравнений и факторов производится автоматически, путем включения их в резулыирующую модель оптимальной сложности. Проведенные вычислительные эксперименты подтвердили работоспособность данного подхода, а также его большую помехоустойчивость в сравнении с обычными процедурами проверки гипотез.

Глава 3. Структурная оптимизации многомерных регрессионных моделей и многомерных моделей с разнотипным!! переменными

Третья глава посвящена исследованию задачи структурной оптимизации многомерных регрессионных моделей и многомерных моделей с разнотипными переменными. Имеются в виду модели объектов с многомерным откликом.

В п. 3.1 анализируется типология многомерных моделей. Выделены, в частности, такие типы, как "традиционная многомерная модель" и "модель псевдонезависимых регрессий". В первом случае для всех откликов формируется одна и та же модельная структура, а во втором - для каждого отклика формируется своя структура. Данные типы многомерных моделей различаются также и способами оценивания неизвестных параметров, входящих в модель.

В п. 3.2 рассмотрены критерии селекции многооткликовых моделей. Основное внимание уделено проблеме конструирования внешних критериев в многомерном случае. Введены в рассмотрение матричные аналоги известных

одномерных внешних критериев. Конкретный внешний критерия селекции многомерной модели в работе предлагается получать применением той или иной свертки для матричного аналога, в качестве которых могут выступать определитель, след, максимальное собственное число, и т.п. Различные виды сверток можно рассматривать как различные принципы нахождения Парето-оитимальиых решений в задачах векторной оптимизации.

Дополнительные возможности по формированию критериев селекции появляются для объектов с моделью наблюдения неполного строчного ранга, т.е. когда помимо неременных состояния наблюдаются еще и некоторые их линейные комбинации. Пусть изучаемый процесс описывается некоторой многомерной моделью вида 1]{х,в) = {^(х,0),...,т]р(х,в))Г . Необходимо найти оптимальную структуру ?;* (х,0)7 по результатам наблюдения

Ун = Нгф,9)+ е„ « = . (16)

где гцН2 £ /', Н\ - полного столбцового ранга, г%Н\ - р; уи - ц- мерный вектор наблюдений за процессом в точке хи. Будем использовать первую часть наблюдений = Н\ п(х,в) + с1и непосредственно для решения задачи оценивания параметров. Таким образом, И[ представляет собой обучающую часть модели наблюдения. Оставшуюся часть наблюдений, связанную с Н^ , можно будет использовать для выбора оптимальной структуры многомерной модели г) (х,0). В качестве критерия оптимальности можно использовать в этом случае так называемый критерий баланса

В7 = Е-ВД), ЗД7) = 0ъ-Н[ц/(у1и-Н^и), и = (17)

«=1

где ?;„ - оценки вектора переменных состояния, полученные по тестируемой модели без участия второй части наблюдений.

При решении задачи структурной оптимизации многомерных моделей непременным условием является проверка полученных моделей на адекватность. Проверку адекватности многомерных моделей, на наш взгляд, необходимо проводить в контексте взаимосвязности наблюдаемых откликов. В работе предлагается подход к проверке адекватности многомерных моделей, основанный на использовании информации, извлекаемой из модели наблюдения неполного строчного ранга.

В п.3.3 проводится экспериментальное исследование работоспособности внешних критериев селекции многомерных регрессионных моделей.

По результатам вычислительных экспериментов можно сформулировать следующие выводы. Свертки от многомерных критериев непротиворечивости и вариативности оказались работоспособными только при малом шуме. Выводы

по этим критериям согласуются с результатами моделирования для однооткли-ковых моделей. Свертки от многомерных критериев регулярности, стабильности, скользящего контроля, обобщенного критерия скользящего контроля и критериев, не использующих экзаменационную выборку, оказались работоспособны в большей степени. Если анализировать тины применяемых сверток, то лучшие результаты показали свертки в виде определителя и следа.

Решение задачи структурной оптимизации для моделей типа "традиционная многомерная" давало устойчиво лучшие результаты в сравнении с моделями псевдонезависимой регрессии. Это объяснимо тем, что в первом случае неявно присутствует априорная информация о том, что структура оптимальной модели для всех откликов одна и та же.

Обнаружено также, что высокая корреляция между откликами привносит с собой регуляризирующий эффект. Проявляется это в увеличении помехоустойчивости. Данный эффект объясним тем, что в этом случае в рядах данных наблюдений присутствуют дополнительные статистические значимые связи, которые играют роль балансовых ограничений.

О п.3.4 проводится аналогичное экспериментальное исследование задачи структурной идентификации многомерных моделей с качественными факторами. Многомерная модель при этом выписывается относительно базиса ФДО. Проведенные вычислительные эксперименты подтвердили работоспособность метода структурной оптимизации для моделей данного класса.

Глава 4. Алгоритмы построения оптимальных планов эксперимент

Основное внимание в главе уделено разработке базовых алгоритмов синтеза дискретных оптимальных планов, которые находят применение на практике. В п.4.3 развивается концепция дискретизации области планирования при решении задачи синтеза планов эксперимента. В рамках данной концепции предложен эффективный комби-градиентный алгоритм замены точек.

Пусть область действия факторов представляет собой дискретное множество точек А', сагс1 (А ) = и, где сагсЦХ) - число элементов в множестве X .

Решается задача ец = АщтйхЧ'[ М(£ц )] с ограничениями =1, где _ р '='

Р,, I — \,п могут принимать только два значения 0 и I /Л', а вектор-градиент функционала М(еы)] = \Ш(х1 )дГ[ М(£ц )}1дМ{еи )||"=1. В алгоритме организуется оптимизация функционала качества при движении по направлению градиента с учетом дискретности весов точек плана. Вблизи экстремума или при выходе на гребень при выборе направления движения осуществляется перебор возможных направлений в некотором конусе допустимых направлений. Это устраняет возможность преждевременного останова алгоритма. Проводится сравнение алгоритма с известными другими алгоритмами, и исследуется скорость его сходимости. В рассмотренных задачах скорость сходимости

близка к квадратичной. Данный алгоритм возможно эффективно использовагь и тогда, когда исходная область планирования представляет собой произвольную непрерывную замкнутую или составную область. D этом случае она предварительно аппроксимируется некоторой сеткой. Проведенное исследование "сеточной" сходимости алгоритма подтвердило его эффективность. В работе предлагается также модификация алгоритма для построения минимаксных и байесовских планов эксперимента для линейных и нелинейных по параметрам моделей.

В 11.4.4 рассмотрена концепция последовательного достраивания планов эксперимента. Предлагается схема, по которой план эксперимента строится последовательным добавлением точек, начиная с выбора первой точки. Для синтеза плана с заданным числом наблюдений будем последовательно добавлять точки в план в соответствии с критерием D - оптимальности. Информационная матрица "неполного" плаца, т.е. при s < т, будет вырожденной. Применим регуляризацию по единичной матрице M(es) = + где у - некоторый малый положительный параметр регуляризации. Добавим к плану £s новое s+1 - е наблюдение. Тогда собственные значения матрицы 1) будут не меньше собственных значений матрицы M{ss). £stÄi (es)+S,p, , О < ¿¡j < \,Y,'i"=\Si - 1, ' = \,ni, где p— собственное значение матрицы однократного наблюдения М(хы) яля добавленной точки jcj+i, равное P= /T(a'v+i),/ (.Хл+i) Величина |A/(£-s+1)j будет зависеть от распределения добавок между собственными числами Я,- (¿-s), чго в конечном счете определяется взаимными свойствами матриц iM(ss) и M(xs+i) Максимальное увеличение определителя достигается при

x> + i = ArgMaxf r(x) М-1 (£,)f{х). (18)

Последовательная схема начинается с поиска первой точки для включения в план. В эгом случае М = / ' 1 ■ Для того чтобы на т - м шаге мы получили невырожденную информационную матрицу М(е,„) необходимо на каждом шаге обеспечивать возрастание ранга матрицы Ai (¿-j). Для этого необходимо потребовать, чтобы для включаемой на s - м шаге точки je j выполнялось fixj) Й ß(M(£-s.i)), где R(M(¿¡¡.i)) - пространство образов, порождаемое столбцами M(ss-1)- Существование последовательности планов £i,E2,- -,£s,- -,£m, приводящей к невырожденному плану ет > вытекает в этом случае из самого факта существования невырожденного насыщенного плана.

В работе рассмотрены конструкции последовательной процедуры для построения У-, Е-, А- оптимальных планов.

Дополнительные возможности, предоставляемые последовательной схемой, появляются, когда область планирования X представляет собой дискретное множество из N точек. В этом случае, если Провести последовательное планирование по рассмотренной выше процедуре с ¿ = 1 до то получим

упорядоченную по информативности совокупность точек. По сути, это готовый каталог оптимальных планов для любого п в диапазоне т<п<Ы.

В работе рассмотрена эффективность процедуры последовательного достраивания в сравнении с случайными планами и планами, полученными применением прямых методов поиска. Последовательные планы в достаточной степени близки к оптимальным И значительно лучше случайных.

В качестве одной из задач, Где возможно применение последовательной процедуры достраивания рассмотрена задача построения бипланов. Задачу разбиения выборки возможно решать на этапе планирования эксперимента.

Введем понятие биплана. Бшианом назовем совокупность

= {¿у,'\ ¿'I,21}, где планы, составленные каждый из п точек об-

ласти Хи различающиеся между собой составом включенных в план точек. Эффективным способом построения бипланов является использование двух параллельных конкурирующих последовательных процессов по типу (18). Эксперименты по построению бипланов показали эффективность предлагаемого алгоритма их синтеза.

В работе последовательную процедуру предложено также использовать при построении оптимальных планов с учетом стоимости смсн уровней факторов. Пусть затраты на проведение эксперимента определяются не только числом опытов, но и порядком их проведения во времени. В частности, затраты могут определяться стоимостью перехода в экспериментах с одного уровня какого-либо фактора на другой (например, полетный эксперимент на разных высотах). Введем в рассмотрение функцию стоимости = 1^5=1^(^,-1.*/). гДе = функции стоимо-

сти перехода от точки плана к 1-й точке плана по ] -й координате точек факторного пространства. В качестве х0 берется некоторая точка, определяющая начальное положение системы, относительно которой и ведется подсчет затрат. Точка х0 в план не включена. Очередная точка на включение в план 5+1 -м шаге определяется из условия

*1+1 = Аг8ты(1-а)ГГ{х)М-\£Жх)-<хТ.%1ЛМ^)- (19)

гь?

Задачу целесообразно решать несколько раз при различных значениях коэффициента предпочтения а, выбирая затем подходящий план эксперимента.

В работе также предлагается модификация процедуры последовательного достраивания планов в случае коррелированных наблюдений.

Глава 5. Оптимальное планирование эксперимента при идентификации моделей динамических систем в виде обыкновенных дифференциальных уравнений

В п.5.1 вводится в рассмотрение модель состояния детерминированной динамической системы вида

с1г}/с/1 = 8(т!,1,и,0) (20)

с начальными условиями (задача Коши) т/(0) = 1)0(1°, и0, в), где ?; -/»-мерный вектор переменных состояния; 0 - ш-мерный вектор параметров; I- переменная времени; а - /-мерный вектор входных сигналов системы. Модель наблюдения определяется выражением

у = Н1 т] + V, (21)

где у - <7*7 - вектор измеряемых линейных комбинаций переменных состояния; Н1 - (ц х р)-матрица наблюдений; у - (¡х! вектор случайных ошибок,

= 0; Е( у( I,), I I)) = Л( С ¡)3 ,у , где - матрица ковариаций измеряемых откликов порядка г/.

В качестве оценки информационной матрицы будет выступать

.«(¿Л',%) = £р, рф„,х ,) Н Ц-хНтРтфя,х ,), (22)

где Г (0ц ,л) = дг/ (х,0)/д0 | , а через х обозначен совокупный

вектор действующих и управляемых факторов.

В 5.2 рассматриваются различные постановки планирования эксперимента для моделей данного класса. В зависимости от уровня априорной информации можно выбрать ту или иную стратегию проведения эксперимента из числа: последовательниц планирование, локально оптимальное планирование, минимаксное планирование, байесовское планирование. Необходимо отметить важность иметь планы, дающие малую коррелированпость оценок параметров. Результаты использования в этих целях различных критериев оптимальности приведены в ирил. 1 диссертации. Хорошие результаты дает использование критериев формы (Е-, А- критерии оптимальности) и критерия IV- оптимальности (предложен в работе Погорелова А.Г. и Янчевскон Т.Н., 1979).

В п. 5.3 рассмотрены алгоритмические и вычислительные аспекты синтеза оптимальных планов эксперимента в различных постановках. При конструировании алгоритмов синтеза оптимальных планов основное внимание уделено алгоритмам на базе градиентных методов.

Планирование моментов наблюдения. В задаче плакирования моментов измерений некто]) входных переменных вырождается в скаляр и включает только переменную времени / еП(, Для вычисления элементов матрицы Якоби необходимо решить совместно уравнения состояния и уравнения чувствителыю-

сти с соответствующими начальными условиями. В работе выписываются выражения для вектор-градиентов функционала (с[Л/ (е)] по координатам и весам точек плана, которые используются при конструировании алгоритмов построения локально-оптимальных планов. На основе- нх также легко выписываются выражения для направления наискорейшего спуска для задач минимаксного или байесовского планирования. Ввиду того, что область планирования в рассматриваемой задаче неограничена {(¿0), в работе предлагается процедура последовательного уточнения правой границы интервала наблюдений.

Планирование оптимальных входных сигналов. Для данной задачи анализируются возможности подхода, связанного с параметризацией функции входного сигнала. Отмечаются его недостатки и развивается подход, связанный с сплапн-представлением входного сигнала.

Рассмотрим его на примере одномерного сигнала. На интервале наблюдения ( е[0, Г] зададимся системой узлов 0 < г | < г 2 <...< г; < 7", а в них значениями сигнала и(г,) и проведем сплайн аппроксимацию значений «(г,), I = 1,..,/ по всему интервалу наблюдения Г е[0,7]. Тем самым мы получаем непрерывное описание процессов и(() на всем интервале I е[0,Г]. В этом случае при построении оптимальных планов по входному воздействию в качестве факторов-переменных будут выступать ординаты «(г,) искомой функции и(1) в заданных точках г¡, г = 1,..,/. Точность аппроксимаций искомого непрерывного сигнала можно регулировать в широких пределах, меняя число узлов I, что снимает проблему поиска подходящей системы базисных функций. При использовании сплайн-аппроксимации значительно проще учитывать количественные и качественные ограничения на входной сигнал, выбором соответствующих интервалов изменения факторов-ординат и{г (), /' = 1,..,/.

Алгоритмы синтеза входных сигналов. Как правило, когда на объекте имеется возможность проводить эксперименты с выбором входных воздействий, то фактор времени считается самым дешевым ресурсом. По этой причине в реальных исследованиях можно ограничиться одноточечным планом одного запуска системы. Для синтеза подобных планов в работе предлагается использовать алгоритм полного перебора на дискретном множестве допустимых ординат и{г ¡), / = 1,..,/, что позволяет получать глобальный экстремум для функционала качества плана. Ограниченность его использования определяется размерностью пространства поиска до /<15. Это означает, что синтезируемый оптимальный сигнал па интервале наблюдения [0,71 будет иметь не более / "изломов". Для некоторых задач такая степень приближения (детализации) мо' жег оказаться недостаточной. Для построения планов входных сигналов большой длительности или детализации в работе предлагается использовать алгоритм последовательного достраивания. Пусть весь интернат наблюдения [0, Г] содержит Аг моментов наблюдений П, = ,72,■ ■ >'л'}. а управляющий сигнал

и, eQ,r Будем рассматривать смешанную задачу выбора моментов наблюдений и значений управляющего сигнала в эта моменты времени. Совокупный

Г

вектор переменных х = (t, i/(í)) . Будем считать, что часть координат вектора х определена заранее, а именно задано упорядоченное множество Q, с элементами t],t2' - 'tN ■ Предположим, что уже выбраны первые s точек с координатами (/|,«(/])), ('2."('2)) >•••» ('j.'^íj)), причем m<qxs,ra.e т - число параметров в системе; q —число наблюдаемых откликов. Организуем выбор значения i'Cj+i) в соответствии с последовательной процедурой

и(/)еЛи,<=/1+1 дМ{е) (23)

х HR'l(ti+])HT Fr(íi+lMt)M

Последовательную процедуру можно улучшить в том смысле, что на первом этапе этого алгоритма для некоторого j оптимальные значения

u{í\)....."(',) отыскиваются методом полного перебора, а затем вычисления

переключаются на последовательчую схему (23). В работе предлагается также модификация алгоритма, когда на очередном шаге производится выбор не одной, а нескольких последовательно расположенных точек наблюдений со своими значениями амплитуд входного сигнала. Данная модификация алгоритма названа блочно-последовательным алгоритмом (БП алгоритмом).

Оптимальное планирование модели наблюдения. Рассмотрим случай, когда предварительный анализ моделей наблюдений безотносительно к плану эксперимента позволяет выбрать среди них наиболее информативные. Пусть

г

имеются две модели наблюдения с соответствующими матрицами , Rt и //J , R2 размерами q¡ х д <■/, х q[, q2x ру q2 х ch 11 рангами rg Н\= rg НТ2 = р, q{ > р,чJ ^ р. Будем считать, что первая модель наблюдения более информативна, чем вторая, если выполняется условие (í/f1// ¡ R~¡ а2 < (Чг1Н 2 ^ / У/2 ) ' Показано, что выполнение данного условия влечет за собой выполнение i¡^Mx{e,0)> q2x М2{е,в). Полученный результат дает возможность реализовать двухступенчатую процедуру выбора оптимальной пары: модели наблюдения и плана. Если обозначить все множество допустимых моделей наблюдения через Ои , то оптимальную модель наблюдения

* у * т Г ~ 1 -1 7* 1

/У можно найти из условия Н - Arg ( max 1// I q HR H ). После

НТеОн 1 J

того, как оптимальная модель наблюдения выбрана, при необходимости решают задачу построения оптимального плана эксперимента. Приводится пример выбора оптимальной модели наблюдения в задаче параметрической идентификации кинетической модели.

В работе рассмотрены также алгоритмические аспекты синтеза оптимальных планов в различных смешанных схемах, например, планирования начальных условий и моментов наблюдений и др.

В п. 5.4 рассматривается проблема оценивания неизвестных параметров, входящих в модель динамических систем. Трудности решения задачи по оцениванию параметров связаны с необходимостью многократного интегрирования системы дифференциальных уравнений и чувствительностью итерационных методов к заданию начальной точки. В алгоритмах линейного регрессионного анализа эти трудности, как правило, отсутствуют. В работе рассмотрен случай, когда неизвестные параметры модели входят в правые части дифференциальных уравнений (20) линейно. В основу излагаемого метода положена известная идея численного дифференцирования экспериментальных данных с целью получения новых откликов, которые вместе с правыми частями дифференциальных уравнений в форме Коши образуют систему линейных регрессионных уравнений (20). Для снижения уровня ошибки при вычислении производных в работе предлагается использовать процедуру фильтрации данных сглаживающим сплайном. В рассматриваемом алгоритме используются только первые производные S'(() сплайна S(t). Задача численного нахождения производных относится к числу некорректных, в силу чего характеризуется неоднозначностью решения. Эгу неоднозначность предлагается направить на повышение точности вычисления оценок параметров в. Будем называть это регуляризацией решения В методе это реализовано следующим образом. В качестве управляемого параметра при построении сглаживающего сплайна взят так называемый коридор фильтрации 8\ фильтрованные и наблюдаемые значения процесса находятся в диапазоне [S(f/)~ tj(tj) | ^ S. В алгоритме априори, исходя из предполагаемого уровня шумов, задается некоторый интервал [cimln, ] и на

нем выбирается оптимальное значение ё , в качестве критерия выбора которого может использоваться, например, сумма квадратов отклонений

б" = А ig min X 0' (<i)~y (f„ 0S)fR~X (У ('/)->' С „ Ös)). (24) а /=1

В качестве оценок 0S при заданном параметре 5 сглаживающего сплайна в (24) используются оценки параметров 9, вычисляемые по МНК в системе линейных регрессионных уравнений (20) с откликами в виде производных tjg. В задаче (24) принципиальным моментом является выбор предсказателя для у Поскольку исходная модель системы задана в виде (20), (21), то и

предсказатель для у {t ¡, 0g) необходимо строить по этой же схеме

di}/dt = g(i,,t,u,es), у= HTfj. (25).

Дополнительная регуляризация решений в алгоритме обеспечивается использованием риОж-оцаюк. Необходимость их применения объясняется тем,

что в моделях типа (20) случай сильной мультиколлинеарности используемых переменных встречается довольно часто.

П программной реализации данный алгоритм дополнен возможностью обращения к поисковой процедуре для уточнения решения. Обеспечив применением данного алгоритма эффективное решение задачи параметрического оценивания, можно ставить и решать задачу структурной оптимизации моделей данного класса.

Глава 6. Оптимальное планирование эксперимента в задачах структурной и параметрической идентификации стохастических динамических систем

В работе автор ограничился обсуждением некоторых типов моделей во временной области. О числе моделей временных рядов рассмотрены модели типа AR, ARX, ARMA, ARMAX. В числе моделей, заданных в пространстве состояний, рассмотрены модели в виде стохастических разностных уравнений и стохастических обыкновенных дифференциальных уравнений. В качестве модели наблюдения для них выбрана дискретная во времени модель.

Целью проводимых экспериментов для моделей в пространстве состояний ставится задача параметрической идентификации, а для моделей временных рядов - задача структурной идентификации. Для получения выражений для информационной матрицы Фишера исходные модели записываются в форме предсказателей. Для моделей временных рядов это известные уравнения одно-шаговых предсказателей, а для моделей в пространстве состояний - стационарный предсказатель на основе обновленной последовательности.

В п. 6.2 обсуждены вопросы вычисления информационной матрицы Фишера для моделей, заданных в пространстве состояний. Рассмотрены два подхода к вычислению информационной матрицы Фишера. Первый основывается на использовании нормированной обновленной последовательности. Он был развит в работах Мехра (Mchra R.K., 1974) и уточнён ( Абденов А.Ж., Попов A.A., 1981). Второй подход основывается на использовании ненормированной обновленной последовательности. Он позволяет несколько упростить выражения для вычисления элементов информационной матрицы.

Запишем модель состояния и наблюдения в форме фильтра Калмана с ненормированной обновленной последовательностью

где

x(t +1) = Ах(1) + Biii) + Kv(t), № = Нтх( О + КО, y(t) = y(t)~HTx(0,

К= АРН{НТPH+R)'\ £ = (НТPH + R), P{t + 1)= AP(t)AT + Ц)ГТ -APHZ~\aPH)

То

г

(26)

(27)

Утверждение 6.2.2. Информационная матрица Фишера для параметров в модели (26)-(28) определяется элементами

'J Щ2 Щ â0j

â6j Щ

Для вычисления элементов (29) в работе построена рекуррентная процедура, основанная на использовании расширенного вектора состояния

. . , . . âx(t) âx(t).r

ХМ (0 ~ (х(0 - "' -) , соответствующих матриц усиления, фор-

Щ двт

мул фильтра Калмана и функций чувствительности. Аналогичные соотношения устанавливаются для вычисления информационной матрицы Фишера для линейных управляемых непрерывно-дискретных систем, заданных в форме стационарного предсказателя.

В п.6.3 рассмотрены свойства задачи синтеза оптимальных планов входного сигнала для моделей стохастических систем. Известно (Mehra, 1974), что информационную матрицу плапа входного сигнала можно представить в виде двух слагаемых

М(е) = Й{ё)+Ъ', (30)

где M (в) - часть, зависящая от функции входного сигнала, а V- часть, не зависящая от него. В работе отмечается, что при фиксированной схеме измерений {fi,f2,. ...fjv } матрица V будет одной и той же для любого плана входного сигнала. Поэтому из неравенства K{(ei)> М(е2) следует выполнение М(С[) > М{с2). Таким образом, в задаче планирования входного сигнала вместо М{е) можно использовать М{е), что значительно проще

= (31)

1=1 Щ dtIj

ЗГ(< +1) = Л F(f) + ÖK(0, ДО) = х0, . • (32)

(зз)

ов дО дО сО дв

В отличие от уравнений предсказателей для функции чувствительности дх(1 + 1) / д9 для детерминированных моделей в (33) вместо исходной матрицы

7*

передачи А используется "ослабленная" в виде А — КН .

Если интенсивность R(t) Шума измерения очень мала по сравнению с ■ элементами ковариационной матрицы Р(<), что определяется неравенством R(l)<< Р(1), то К(!) а Л P(t)P~\t) = А (здесь для простоты принято, что

т// = /у,) и уравнение чувствительности принимает вид

39 Ж 30 дО '

т.е. можно заключить, что функция *(/) как бы не зависит от параметров в и уравнение чувствительности <ЯГ(/ + 1)/<30 (34) будет зависеть только от динамики x(l +1). При обратном предположении /?(/)» P(t) Получим

£(/)« AP(t)R~* (/), т.е. К(() будет малым. В пределе при К=0 уравнения чувствительности (33) будут совпадать с уравнениями чувствительности для детерминированных моделей. Вводя обозначение КН1 = АК, где К = PHS'lH Т, перепишем (33)

Выбор конкретного значения К можно осуществлять между 1 р и Ор,

руководствуясь, например, соображениями априорной информации об интенсивности возмущений в системе wft) и шума измерения v(t). Можно также в качестве К использовать Кс = P(tc)HE~xHT, где Р(1С) - установившееся решение уравнения Риккати.

В работе проведены вычислительные эксперименты по анализу чувствительности оптимального плана входного сигнала к варьированию коэффициента усиления фильтра Калмана. В рассмотренных.задачах эта чувствительность оказалась небольшой.

В работе проведено сравнение алгоритмов синтеза оптимальных планов входных сигналов. Показана эффективность БП алгоритма синтеза планов входных сигналов. Проанализирована эффективность применения оптимальных планов входных сигналов в сравнении с псевдослучайными двоичными сигналами. Эффективность оптимальных планов в рассмотренных задачах состави-лаяла 30-40% временного ресурса при достижений одинаковой точности оценивания параметров модели.

В п. 6.4 рассматривается задача структурной идентификации моделей временных рядов и задача параметрической идентификации моделей, заданных в пространстве состояний.

При решении задачи структурной идентификации для оценивания параметров моделей временных рядов использовались известные многоэтапные схемы. В качестве внешних критериев предлагается применять критерий скользящего прогноза и критерий регулярности на В. В проведенном вычислительном эксперименте графики зависимостей этих критериев от сложности оптимальной модели имели ярко выраженный минимум, приходящийся на модель, по которой моделировался временной ряд.

Сходимость алгоритмов параметрической идентификации моделей, заданных в пространстве состояний, во многом зависит от устойчивой работы

фильтра Калмана. Точность работы фильтра Калмана зависит от неизвестных параметров модели. В условиях незнания параметров A, Q, R степень доверия к измерительной информации должна быть выше. Этим автор обосновывает возможность использования для оценивания параметров модели линейного метода наименьших квадратов с регуляризацией. В вычислительных экспериментах проведено исследование данного алгоритма па моделях дифференциальных уравнений первого порядка. Варьировались постановки задачи перемещением источника возмущений из канала измерения в саму систему, изменением интенсивности вносимой помехи. При этом опробовалось использование различных предсказателей в контуре регуляризации (с фильтрацией по Калмаиу и без фильтрации). По точности предсказания выхода получены сопоставимые результаты. В то же время эффективность использования предсказателя по Калмаиу напрямую зависит от правильной спецификации параметров фильтра. В предложенном алгоритме это обеспечивается подключением на этапе вычисления начального приближения линейного оценивания по методу наименьших квадрате с регуляризацией.

Глава 7. Програлшное обеспечение задач оптимального планирования эксперимента, структурной и параметрической идентификации

В начале главы дается короткий обзор существующих разработок в области программного обеспечения прикладной статистики.

В п. 7.1 описываются программные системы ОПЭК-2, ОДА, ESTIMATE решения задач оптимального планирования эксперимента, структурной и параметрической идентификации, разработанные для платформы ЕС ЭВМ в период 1980-1989 гг. За цикл работ по созданию пакетов прикладных программ планирования и анализа экспериментов автор в 1986 г. Постановлением от 11.12.86 № 1091-Н награжден бронзовой медалью ВДНХ СССР (Удостоверение № 65554).

В п.7.2 рассмотрены некоторые концептуальные подходы к построению статистического программного обеспечения (СПО) для персональных ЭВМ.

Решение конкретной прикладной проблемы, как правило, носит итерационный характер. Всю совокупность информации, возникающую в одном цикле решения, назовем ЗАДАЧЕЙ. В теории форм представления знаний широкое распространение получило представления знаний в виде фреймов (Минский М., 1979). Поскольку по определению фрейм - структура данных, предназначенная для представления некоторой стандартной ситуации, то исходное множество френмов-ЗАДАЧ будет определяться различными вариантами постановок задач-ситуаций данной предметной области. Процесс решения задачи распадается .на три фазы: подготовка, выполнение, анализ. Таким образом, фрейм-ЗАДАЧА на более низком уровне представляется уже сетью как минимум из грех подфреймов. Другое значение термина фрейм - рамка. Фрейм (рамка) может объединять совокупность слотов. В процессе решения задачи каждый слот

должен получить свое значение. Часть слотов используется для спецификации задачи и заполняется пользователем, а часть - есть продукт этапа выполнения.

Придание слотам фрейма конкретных значений в процессе подготовки задачи к решению - важнейшая часть работы пользователя. Перспективным направлением решения этой задачи можно считать использование Мастеров (или Проводников) По мног их сложных программных системах они широко используются. Мы будем их называть Мини-экспертами. Особенностью работы Мини-экспертов является предлагаемая ими последовательность шагов по уточнению спецификации решаемой задачи. Концепция Мини-экспертов положена в основу организации пользовательского интерфейса в разработанных программных системах. В работе предлагается ряд принципов, на которых может быть построена внутренняя идеология Мини-эксперта как программной системы (ПС).

С учетом предложенных принципов автором разработан ряд программных систем для платформы PC. Для их функционирования требуется 32-разрядная графическая операционная система Windows 95 или Windows NT и дисковое пространство до 1 Мб для каждой программной системы.

Программная система ОДА предназначена для решения задачи поиска модели оптимальной сложности ч классе линейных по параметрам моделей с разнотипными факторами.

Программные системы REGRFLAN, DISFPLAN, COVAPLAN предназначены для решения задач построения оптимальных планов эксперимента соответственно для линейных по параметрам регрессионных моделей, для моделей с качественными факторами, для моделей, имеющих в своем составе количественные.и качественные факторы.

Программная система NELIPLAN предназначена для решения задач построения оптимальных планов эксперимента для нелинейных по параметрам регрессионных моделей.

Программная система AUMA предназначена для решения задачи поиска модели оптимальной сложности при анализе временных рядов. Класс рассматриваемых моделей включает модели типа AR, А11Х, ARMA, ARMAX.

Программная система ARMAPLAN предназначена для решения задачи оптимального планирования входного сигнала для моделей временных рядов типа ARX.

Программная система 1NPUTPLAN предназначена для решения задачи синтеза оптимальных входных сигналов для моделей динамических систем, заданных в пространстве состояний. В качестве моделей могут быть выбраны системы разностных или дифференциальных уравнений.

Программная система EST IMATE предназначена для решения задач параметрическом идентификации моделей динамических систем в форме обыкновенных дифференциальных уравнений.

Данные ПС могут иметь самостоятельное значение, являясь эффективным инструментом решения задач прикладного статистического анализа или полигоном для отработки технологических цепочек решения задач проблемного ха-

рактера, или, наконец, как демонстрация возможностей подходов к задачам подбора зависимостей и планирования эксперимента, развиваемых в данной работе. Одновременно такие ПС могут быть элементами нижнего уровня некоторой общей экспертной системы (ЭС).

Глава 8. Методы активной структурной и параметрической идентификации в прикладных исследованиях

В п. 8.1 рассмотрено решение нескольких задач структурной и параметрической идентификации моделей авиационных силовых установок. Практика применения методов ТОПЭ при Исследовании авиационных двигателей выдвигает ряд проблем, характерных для этапа летных испытаний. Среди них высокая стоимость летного эксперимента, невозможность строго выполнять повторные опыты, сложность области экспериментирования, наличие неуправляемых факторов и т.д. Все это делает актуальными разработку и совершенствование методик проведения летного эксперимента, методик подбора моделей для установившихся (модели статики) и переходных (модели динамики) режимов.

К числу типичных задач относится задача построения дроссельных характеристик. В работе с участием специалистов ЛИИ получены структуры моделей, аппроксимирующие дроссельные характеристики двигателей, работоспособные в широком диапазоне действующих факторов. При моделировании САУ ГТД необходимо в том числе решить задачу построения модели ГТД на переходных режимах. С использованием программной системы ESTIMATE были решены несколько задач по идентификации моделей многороторных авиационных двигателей в переходном режиме. В приводимой в диссертационной работе задаче обшее число неизвестных параметров, входящих в модель, было равно 27. Для вычисления оценок параметров использовался разработанный линейный МНК с регуляризацией. Длй задачи параметрической идентификаций модели двухроторного двигателя в переходном режиме решена задача Синтеза оптимального плана входного сигнала. Эффективность применения полученногЬ плана может заключаться в экономии 30-40% полетного времени.

В п. 8.2 рассмотрены задачи синтеза оптимальных планов при'параметрической идентификации моделей химической кинетики, заданных в виде систем обыкновенных дифференциальных уравнений. Данные работы проводились под руководством д-ра техн. наук, проф. В.Г. Горского и выполнялись совместно с В.М. Стасышииым. Решены следующие задачи: проведено, оптимальное планирование моментов измерений для класса параллельных, последовательно-параллельных и последовательных реакций, осуществлено сравнение эффективности различных типов реакторов и проведено оптимальное планирование ■ скорости нагрева при изучении Неизотермической кинетики одностадийной реакции.

В п. 8.3 рассмотрена задача параметрической идентификации процесса пиролиза твердого топлива. Получены модели двухстадийной реакции пиролиза

угля различных марок. Процесс пиролиза описывался системой из двух нелинейных дифференциальных уравнении первого порядка.

Н п. 8 4 рассмотрена задача моделирования испытаний электроизоляционных материалов систем электрической изоляции в поле гамма излучения. Решена задача выбора месторасположения и числа датчиков, а также программа опроса датчиков во времени. Для этой цели привлекался разработанный пакет программ оптимального планирования экспериментов ОПЭК-2.

Основные результаты работы

Полученные в диссертационной работе результаты состоят в следующем:

1 Задача структурной идентификации регрессионных моделей с использованием внешних критериев селекции рассмотрена совместно с задачами оптимального планирования эксперимента. Проанализирована связь известных критериев оптимальности планов эксперимента и внешних критериев селекции моделей. Показана возможность и целесообразность использования D - и Е -огшшальных планов. Задача разбиения пассивной выборки на обучающую и проверочную части решена с позиций теории оптимального планирования эксперимента. При априорном планировании предлагается строить н использовать так называемые бипланы. Предложена последовательная композиционная процедура построения моделей, адекватность которых подтверждается на проверочной выборке. Предложен широкий класс ортогональных планов второго и третьего порядков и показаны оптимальные свойства этих планов с позиции проверки гипотез о степени полиномов. Поставлена н исследована задача структурной оптимизации в условиях группированных данных. Для повышения селективных свойств алгоритмов структурной оптимизации предложено вводить в них последовательные схемы планирования дискриминирующих экспериментов с использованием критериев скользящего прогноза и регулярности.

2. Методы структурной оптимизации распространены на объекты с качественными действующими факторами и с факторами смешанной природы. Для тIX целей рассмотрена идентифицируемость моделей дисперсионного и ковариационного анализа. Введены понятия внутреннего и внешнего дефектов ранга линейных моделей с качественными факторами. Аналитически найден базис ФДО для линейных моделей и моделей с двухуровневыми взаимодействиями для произвольного числа факторов, измеренных в номинальной или порядковый шкале, а также для моделей со смешанными факторами (модели с переключениями). Проведенные исследования легли в основу разработанной методики конструирования моделей с разнотипными переменными.

3. Разработан эффективный подход к решению задачи построения оптимальных планов эксперимента для моделей дисперсионного, ковариационного анализа и общих моделей с переключениями. Имеется возможность строить планы эксперимента, свободные от внешнего дефекта ранга, для заданного чис-

ла наблюдении в виде выборки из ЛФЭ, используя штатные алгоритмы синтеза оптимальных планов для регрессионных моделей.

4. Методы структурной оптимизации распространены на объекты с многомерным выходом. При этом в качестве критериев селекции предложено использовать различные свертки от матричных аналогов внешних критериев, а также в случае модели наблюдения неполного строчного ранга критерии балансового типа. В многочисленных вычислительных экспериментах показана работоспособность подхода в том числе и в сравнении с процедурами проверки многомерных гипотез.

5. Для задач построения дискретных планов в качестве базовых предложено использовать две концепции: концепцию дискретизации области планирования и концепцию последовательного достраивания. В рамках предложенных концепций разработан эффективный комби-градиентный алгоритм замены точек и алгоритм последовательного достраивания Планов. Предложенные алгоритмы используются для синтеза дискретных оптимальных планов для регрессионных, дисперсионных, ковариационных моделей, а алгоритм последовательного достраивания адаптирован в том числе и для построения планов входных сигналов, построения бипланов; он также встроен в алгоритмы структурной оптимизации для решения задачи разбиения выборки на части.

6. Для задач параметрической идентификации моделей динамических систем рассмотрены алгоритмические и вычислительные аспекты планирования моментов наблюдений, входных сигналов, модели наблюдения, начальных условий и смешанных схем. В алгоритмах синтеза оптимальных входных сигналов предложено в качестве универсального подхода использовать сгшайн-представление функции входного сигнала. На базе этого подхода разработаны эффективные алгоритмы синтеза входных сигналов одного запуска системы.

7. Для задач оценивания параметров, входящих линейно в правые части систем обыкновенных дифференциальных уравнений в форме Коши, предложено использовать усиленный вариант известного алгоритма дифференциальной аппроксимации. Оценивание параметров в алгоритме производится по МНК с регуляризацией. Регуляризация осуществляется подбором оптимального сглаживающего сплайна, используемого для сглаживания траекторий процессов, и оптимальных ридж-оценок параметров вместо МНК-оценок. Предложенный алгоритм позволяет решать задачи оценивания вектора параметров большой размерности, не требует знания начального приближения, его можно отнести к классу конечно-шаговых - все это делает возможным решение задачи структу рной оптимизации моделей данного типа.

8. Рассмотрены способы вычисления информационной матрицы Фишера для моделей стохастических динамических систем, свойства задачи синтеза оптимального плана входного сигнала. Разработана рекуррентная схема вычислений элементов информационной матрицы плана входного сигнала, а также предложены упрощенные схемы вычисления аналога информационной матрицы Исследовано влияние параметров фильтра Качмана на вид и характеристи-

ки оптимального плана входного сигнала, а также исследована эффективность оптимальных планов входных сигналов в сравнении с псевдослучайным двоичным сигналом при увеличении числа наблюдений, и эффективность алгоритмов синтеза планов входного сигнала.

9. Разработано программное обеспечение, позволяющее эффективно решать практические задачи активной структурной и параметрической идентификации моделей статических и динамических систем. Последние версии разработанного программного обеспечения функционируют на платформе PC под управлением ОС WINDOWS-95, WINDOWS NT.

При помощи разработанных алгоритмов, методик и программ решены практические задачи в области активной идентификации авиационных силовых установок, при исследовании параметрической идентификации моделей химической кинетики, термической обработки твердых топлив, моделирования испытаний электроизоляционных материалов.

Основные работы, опубликованные по теме диссертации

1. Попой А.А Об алгоритмах в пакете программ оптимального планирования экспериментов // Тез. докл. VI Всесоюз. коиф. по планированию и автоматизации экспериментальных и науч. исслед. - М: МЭИ. -Ч. I., 1980. - С. 60.

2. Абденов А Ж., Попов А.А Планирование D - оптимальных входных воздействий при идентификации линейных систем / Новосиб. электротехн. институт. -Новосибирск, 1981 .-12с,- Деп. в ВИНИТИ, № 771-82.

3. Денисов В И.,' Попов A.A. Об условиях оптимальности н алгоритмах а сингулярном планировании// Применение ЭВМ в оптимальном планировании и проектировании. - Новосибирск, ИЭТИ.1981. - С. 32-38.

4. Попов A.A. Оптимальное сингулярное планирование эксперимента в регрессионных задачах//' Применение ЭВМ в оптимальном планировании и проектировании - Новосибирск, НЭ'ТИ, 1981. - С. 65-71.

5. Абденов А.Ж., Попов A.A. Планирование оптимальных входных воздействий при идентификации линейных стохастических систем // Тез. докл. Всесоюз. конф. "Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов". - М., 1982. - 4.1. - С. 196-197.

6. Горский В.Г., Полов A.A., Стасышин В.М. Планирование многооткликового эксперимента при исследовании случайных полей частного вида (на примере задач химической кинетики) // Тез. докл. Всесоюз. конф. "Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов".-М„ 1982. - 4.1. - С. 194-195.

7. Пипов А А., Стасышин В.М. Построение оптимальных планов измерений при оценивании параметров в моделях в форме систем дифференциальных уравнений // Применение ЭВМ в оптимальном планировании и проектировании. - Новосибирск, 11ЭТИ, 1982,- С. 47-59.

8. Попов A.A., Стасышин D.M., Горский В.Г. Вычислительные аспекты построения оптимальных планов эксперимента для моделей динамики в форме обыкновенных дифференциальных уравнений // Применение ЭВМ в оптимальном планировании и проектировании. - Новосибирск, НЭТИ, 1982. - С. 15-22.

9. Попов А.А., Стасышин В.М., Горский В.Г., Смирягина Т.Г. Стехиометрические линейные связи в моделях химической кинетики и задача планирования эксперимента для оценивания кинетических параметров // Планирование и автоматизация эксперимента в научных исследованиях,- М.:ВИНИТИ, 1982. - С. 102— 116.

Ю.Попов A.A., Сгасышин В.М., Смирягина Т.Г., Горский В.Г. Оптимальные планы изучения кинетики обратимых реакций// Тез. докл. IV Всесогоз. школы-семинара "Применение математических методов для описания и изучения физико-химических равновесий". - Иркутск, 1982. - С. 11-12.

1 ГАбдепов А.Ж., Попов A.A. Планирование D - оптимальных входных сигналов для непрерывно-дискретных систем при некоррелированных и взаимно-коррелнрованиых шумах объекта и измерителя // Алгоритмическое и программное обеспечение задач оптимального планирования и проектирования. -Новосибирск, НЭТИ. - 1983. - С. 7-13.

12.Активная идентификация дроссельных характеристик авиационных донга гелей/ В.И. Денисов, A.A. Попов, В.М. Сгасышин, Э.Г. Акопян, A.C. Козлов, В.И. Мельник // Тез. докл. Всесоюз. науч.-техн. конф. "Методы и средства машинной диагностики газотурбинных двигателей и их элементов". - Ч.1.-Харьков, 1983. - С.10-11.

13.Горский В.Г., Попов A.A., Смирягина Т.Г. Оценивание параметров и проверка гипотез в многооткликовых регрессионных моделях неполного ранга// Заводская лаборатория. - 1983. - №7- С. 49-52.

14.Горский В.Г., Попов a.A., Стасышин В.М. Оптимальное планирование закона изменения температуры в термокинетическом эксперименте // Тез. докл. VII Всесоюз конф. по планированию и автоматизации эксперимента В науч. исслед.

- М.: МЭИ, 1983. -Ч.1.- С. 59-61.

15.Горский В.Г., Попов A.A., Стасышин В.М, Построение и исследование оптимальных планов эксперимента в задачах химической кинетики//Тез. докл. VII Всесоюз. конф. по планированию и автоматизации эксперимента в науч. исслед.

- М.: МЭИ, 1983. -4.1.-С. 57-58.

16.Попов A.A. Лннейный метод наименьших квадратов с регуляризацией вычисления оценок параметров в моделях динамических систем, заданных дифференциальными уравнениями I Новосиб. электротехн. ин-т., 1983 -Деп. в ВИНИТИ, №5962-83.

17.Попов A.A., Пнпскин В.И. , Ракитпн М.Н. Идентификация динамических характеристик ГТД Н Тез. докл. Всесоюз. науч.-техн. конф. "Методы и средства машинной диагностики газотурбинных двигателей и их элементов". - Харьков, 1983. - Ч 1.-С. 80-81.

18 Горский В Г., Попов A.A., Стасышин В.М. Применение методов оптимального планирования эксперимента в неизотермической кинетике // Тез. докл. I Всесо-юз. симпозиума по макроскопической кинетике и химической газодинамике. -Алма-Ата, 1984.-Т. 1,ч.1.-С. 117-118.

19.Попов A.A., Абдснов А.Ж. Субоптимальный алгоритм оценивания параметров в моделях стационарных динамических систем на основе линейного метода наименьших квадратов с регуляризацией / Новосиб. электротехн. ин-т - Новосибирск, 1984. - 10 с. - Деп. в ВИНИТИ, №4261-84.

20 Попов A.A. Планирование эксперимента в задачах построения регрессионных моделей оптимальной сложности/Нопосиб. электротехн. ин-т. - Новосибирск, 1985. - 17 с - Деп. в ВИНИТИ, 19.06.85, № 4341 - 85.

21.Попов A.A. Субоптимальный алгоритм идентификации параметров динамических систем при конструировании фильтров (Салмана // Тез. докл. 4 Всесоюз. симпоэ. "Методы теории идентификации в задачах измерительной техники и метрологии" - ! 1овосибирск, 1985. - С. 65-66.

22.Бекарева Н.Д, Денисов В.И., Попов A.A. Оптимальное планирование дисперсионного и ковариационного экспериментов // Заводская лаборатория. 1986. -№ 5. - С. 60-63.

23.Денисов И.И , Попов A.A. Пакет программ оптимального планирования эксперимента. - М.: Финансы и статистика, 1986. - 159 с.

24.Попов A.A. Методы планирования эксперимента в задачах построения моделей оптимальной сложности // Тез. докл. 8 Всесоюз. конф. "Планирование и автома-тнз. эксперимент;) в науч. исслед.". - JI. - 1986. - С.18.

25.Попов A.A., Абденоа А.Ж. О комплексе программ для оценивания параметров линейных динамических систем // Математическое обеспечение исследований стохастических и детерминированных моделей. - Новосибирск, НЭТИ, 1986. -С. 102-107.

26.1 ¡опов А А., Стасышин В.М. Использование программ динамической структуры при разработке адаптивных алгоритмов в ОС ЕС/Программирование. -1986 - №1 - С. 29-31.

27.Попов A.A. Алгоритмическое и программное обеспечение задач активной идентификации объектов а условиях структурной неопределенности // Тез. докл. 3 Всесоюз. конф. "Перспективы и опыт внедрения статистических методов » АСУ ТП" - Тула. - 1987. - С.72-73.

28.Попов A.A. Методы планирования эксперимента в задачах синтеза моделей оптимальной сложности // Машинные методы планирования эксперимента и сии имитации многофакгорных систем / Новосиб. электротехн. ин-т. -Новосибирск, 1987. - С. 54-58.

29.Попов A.A. Алгоритмическое и программное обеспечение задач оптимального плакирования и анализа эксперимента // Тез. докл. Всесоюз. конф. "Моделирование систем информатики". - Новосибирск. -- 1988. - С. 89-90.

.»О.Пипов A.A. Дисперсионный анализ моделей с качественными факторами как задача структурного моделирования//Машшшые методы оптимизации, моделирования и планирования эксперимента. - Новосибирск, НЭТИ, 1988. - С. 130-133.

31 .Попов A.A. Использование повторных выборок в критериях селекции моделей// Планирование эксперимента, идентификация, анализ и оптимизация многофакторных систем. - Новосибирск, НЭТИ, 1990. - С. 82-8S.

32.Попов A.A. Планирование эксперимента в задачах разбиения выборки в МГУА // Сб. науч. тр. НГТУ. - Новосибирск, 1995. - Вып. 2. - С. 35-40.

33.Попов A.A. Последовательные схемы построения оптимальных планов экспе-римента//Сб. науч. тр. НГТУ. - Новосибирск, 1995. - Вып. 1. - С. 39-44.

34.Лисицин Д.В., Попов A.A. Исследование критериев селекции многомерных моделей при наличии разнотипных факторов // Тр. 3 Междунар. науч.-техн. конф. "Актуальные проблемы электронного приборостроения" АПЭГ1 -96. -Новосибирск, 1996 - Т. б, ч. 1. - С. 54-58.

ЗЗ.Лиеицин Д.В., Попов A.A. Исследование критериев селекции многооткликовых регрессионных моделей //Сб. науч. тр. НГТУ. - Новосибирск, 1996. - Вып. 2. -С. 19-28.

Зб.Лисицин Д.В., Попов A.A. Исследование работоспособности критериев выбора многомерных моделей// Междунар. науч.-техн. конф. "Информатика и проблемы телекоммуникаций", Новосибирск, 25-26 апр., 1997. : Материалы конф. -Новосибирск, 1997. - С. 103-105.

37Лисицин Д.В., Попов A.A. Конструирование критериев селекции многомерных регрессионных моделей // Сб. науч. тр. НГТУ. - Новосибирск, 1996. - Вып. 1. -С. 13-20.

38.Лисицин Д.В., Попов A.A. Структурная оптимизация многомерных регрессионных моделей//Второй СибирскшЧ конгресс по прикладной и индустриальной математике. Тез. докл. - Новосибирск, 1996. - С. 179.

39.Попов A.A. Композиционный подход построения адекватных регрессионных моделей в схемах активного эксперимента //Сб. науч. тр. НГТУ. - Новосибирск, 1996.-Вып. 2.-С. 29-38.

40.Попов A.A. Конструирование дискретных и непрерывно-дискретных моделей регрессионного типа //Сб. науч. тр. НГТУ. - Новосибирск, 1996. - Вып. 1. - С. 21-30.

41.Попов A.A. Планирование эксперимента в задачах структурного моделирования с использованием критерия скользящего прогноза // Заводская лаборатория. - 1996.-№10. - С. 42-44.

42.Попов A.A. Планирование эксперимента при построении моделей дискретных и непрерывно-дискретных систем // Тр. 3 Междунар. науч.-техн. конф. "Актуальные проблемы электронного приборостроения" АПЭП -96. - Новосибирск, 1996. - Т. 6, ч. 1. - С. 61-65.