автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях)

доктора физико-математических наук
Жданов, Александр Иванович
город
Санкт-Петербург
год
1994
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях)»

Автореферат диссертации по теме "Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях)"

Санкт-Петербургский государственный технический университет

На прзвах рукописи

ВДАНОВ Александр Иванович

НЕКОРРЕКТНЫЕ ЗАДАЧИ РЕГРЕССИОННОГО АНАЛИЗА И ИДЕНТИФИКАЦИИ ДШЙМИЧЕСКИХ МОДЕЛЕЙ ПО ЭКСПЕРИ'ШП'АЛЬНЬСЛ ДАННЫМ (с применениями в модико-биологических исследованиях)

Сшцигльность -05.13.16 (применение вычислительной техники, математического моделирования и математических методов в научных исследованиях)

Автореферат диссертации но соискание ученой степени доктора физико-математических наук

Санкт-Петербург - 1991 г.

Работа выполнена в Самарском политехническом институте им. К Е Куйбышева.

Официальные оппоненты - доктор технических наук, профессор Р. Ш. Липирр, доктор физико-математических наук, профессор В, А. Морозов, доктор физико-математических наук, профессор а а ДЬшш.

Ведущая организация: Институт проблем управления (автоматики и телемеханики) АН СССР (Москва).

" а.

г. Ж'*

Защита состоится . 1992 г. в' Аасов на

васедании специализированного совета Д 063. 38.18 в Санкт-Петербургском государственном техническом университете (195201, СашрЛетербург, Политехническая ул. , 29, ауд. Лу, корп.

С диссертацией можно ознакомиться в фундаментальной библиотеке университета.

ан »

Автореферат разослан

Ученый секретарь специализированного совета, кандидат физико-математических наук^,

0. И. Репин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Методы регрессионного анализа в настоящее время с успехом применяются при анализе экспериментальных данных в различных областях науки и техники: биологии, экологии, экономике, физике, химии, автоматизации и др. Регрессионный анализ по праву мо;кет быть назван основным методом современной математической статистики. Идея регрессионного анализа зиждется на мысли о том, что все доступные нам ресурсы важно использовать полно и эффективно,особенно если речь идет о накоплении и переработке информации.

Исторически одной из первых областей применения регрессионного анализа является биология. Ь настоящее время методы современного регрессионного анализа продолжают находить самое широкое применение в различных биологических, а также медико-биологических исследованиях. Среди многочисленных применений в биологических исследованиях особое место занимает применение методов регрессионного анализа к исследованию динамических характеристик (в частности процессов роста) в биологических системах. Для этих целей широко используются параметрические регрессионные модели временных рядов, описываемые в форме линейных разностных уравнений, или так называемые функции тренда в виде полиномиальных зависимостей. Специфика возникающих при этом вадач регрессионного анализа состоит в следующем. Во-первых, для этих задач харатаерно наличие свойства мулътиколлинеарности, которое ведет к проблеме плохой обусловленности и является одним из основных препятствий эффективного применения аппарата регрессионного анализа. Плохая обусловленность при решении задач идентификации параметрических моделей временных рядов такте часто возникает из-за неточного гкбора порядка мод°лн. Во-вторых, применение дина'.л-ч"ских регрессионных моделей в форме линейных разностных уравнений для описания процессов роста приводит к необходимости учета погрепиостей я независимых переменных.

Перечисленные задачи относятся к классу некорректных задач рг.гр'-ссиоичого ана/црч для которых характерно, что малнм случпйшл« вогшулрттм в исходных данных будут соответствовать очень гч>лмгг*» "р<71Н"ктд|>*чгич>;скив пго'Яю! в оценках нпрчмет-

1

ров моделей, т. е. эти задачи являются неустойчивыми. В настоящее время имеется огромное число подходов, алгоритмов и программ, позволяющих в этих нелегких условиях более или ме-• нее рационально организовать процесс определения оценок параметров регрессионных моделей.

Несмотря на отдельные результаты, полученные в рассматриваемой области, проблёма ими далеко не исчерпывается. Остается нерешенным целый ряд существенных вопросов, связанных с развитием теории стохастической регуляризации некорректных задач регрессионного анализа, в том числе задач идентификации нестационарных параметрических моделей временных рядов в биологических и других исследованиях. Следует отметить, что некорректные задачи регрессионного анализа представляют собой частный случай задач решения приближенных стохастических систем линейных алгебраических уравнений (СЛАУ). В свою очередь задача отыскания эффективных способов решения СЛАУ в ее раз- • личных постановках является по видимому, в историческом плане одной из древнейших проблем в математике. Наличие неизбежных погрешностей (неточностей) в задании коэффициентов как в правой так и в левой (матричном операторе) ее частях, порожденных либо неточностью 'самих исходных данных в той содержательной задаче, математической моделью которой является рассматриваемая система уравнений, либо конечной точностью представления чисел в ЭВМ, либо и тем и другим вместе, приводит к неопределенности искомого решения.

Как было указано А.Е Тихоновым, при-построении решения СЛАУ принципиальным фактором является наличие погрешности задания правой . части и матрицы. Классические алгоритмы решения СЛАУ, основанные на концепции абсолютной точности при наличии погрешностей, не могут быть положены в основу универсальных вычислительных программ для ЭВМ в силу неустойчивости к погрешностям. В последующих работах А. К Тихонова, В. К Иванова, К А. Морозова, В. Я. Арсенина, А. Е Гончарского, А. Г. Яголы, Ы.М. Лаврентьева, ЕЕ Воеводина, Ы. А. Красносельского, Р. Ш. ■ Липцера, Е. Л. Жуковского, а также зарубежных ученых Дж. Голуба, Р. Хенсона, Ч. Лэусона, Дж. Форсайта и др. были созданы «' Эффективные универсальные алгоритмы решения СЛАУ с учетом погрешностей задания возмущенных матрицы А и вектора Г систе-

2 V ' • ;

мы при детерминированных возмущениях.

Значительно менее разработанными являются методы решения некорректных СЛАУ при случайных возмущениях к числу которых как раз и относятся некорректные задачи регрессионного анализа, возникакяцие в задачах моделирования процессов роста в биологических и других исследовниях, а также в задачах параметрической идентификации дискретных динамических систем, описываемых линейными разностными уравнениями. Вероятно впервые на эти задачи было обращено внимание именно при решении плохо обусловленных задач линейного регрессионного анализа, которые в принципе сводятся к решению некорректных СЛАУ с неточно заданной правой частью. Для решения этого класса задач был создан метод ридж-регрессии. Несомненные заслуги в развитие этого метода принадлежат А. Херлу и Р. Кеннарду. Однако метод ридж-регрессии обладает серьезными недостатками и не решает полностью проблему. Еще сложнее обстоит дело с некорректными СЛАУ при случайных возмущениях как в правой части, так и матрице системы. Определенный вклад в решение этой проблемы принадлежит Е. А Жуковскому, В. а Федорову, & И. Мэлекко, А. а Кряневу и II М. Исламову. О важности проблемы регуляризации при решении задач идентификации параметров объектов управления отмечалось также в работах а 3. Цыпкина и Б. Т. Поляка.

Сформулированные задачи составляют научную проблему, имеющую важное теоретическое и прикладное значение. Решение этой проблемы будет способствовать существенному расширению класса эффективно решаемых задач математического моделирования с применением ЭВМ на основе экспериментальных данных сложных систем в биологических, медико-биологических, экологических, технических и др. приложениях.

Тема диссертационной работы совпадает с планом госбюджетных и хоздоговорных научно-исследовательских работ, выполняемых Самарским политехническим институтом им. Е а Куйбышева в рамках комплексных научно-технических проблем.

Цель работы заключается в разработке эффективных численно и статистически устойчивых методов решения некорректных задач регрессионного анализа и идентификации нестационарных параметрических моделей временных рядов в биологических и других исследованиях, а также задачах параметрической иденти-

3

фикации сложных дискретных стохастических динамических систем, описываемых линейными разностными уравнениями. Для достижения поставленной цели в работе решались следующее задачи:

- построение теории, методов и алгоритмов, стохастической регуляризации СЛАУ возникающих в некорректных задачах регрессионного анализа в которых бы существовала органически неразрывная связь между статистической устойчивостью оценок решений и численной устойчивостью алгоритмов их реализующих;

-•получение методов стохастической регуляризации С.ЧАУ в которых бы асимптотически оптимальные статистические свойства сочетались с определенными оптимальными статистическими свойствами на конечной выборке, что является очень важным фактором при решении многих практических задач в биологических исследованиях;

- изучение оптимальной статистической формы принципа невязки при решении некорректных стохасических СЛАУ, возникающих в плохо обусловленных и вырожденных задачах регрессионного анализа;

- разработка эффективных численных алгоритмов нахождения регуляризованных оценок решений некорректных стохастических СЛАУ и их реализация на современных ЭЬМ;

- исследование эффективности представленных в диссертации методов, алгоритмов и программ с помощью тестового ста» тистического моделирования на ЭВМ и на примерах решения реальных задач математического моделирования нестационарных временных рядов в медико-биологических исследованиях.

Общие методы исследования. Разработанные в диссертации методы опираются на результаты современной теории регуляризации, развитой А. Н. Тихоновым, теории статистического оценивания параметров, вычислительной линейной алгебры, теории мартингалов, анализа временных рядов и современной теории идентификации параметров дискретных динамических систем по экспериментальным данным. Полученные алгоритмы вычисления регуля-ризовишых оценок параметров некорректных задач регрессионного анализа исрледованы методом статистического моделирования на ЭВМ.

Научная новизна работы заключается в следующем.

1. На основе обобщения предшествующих исследований выяв-

лены основные причини некорректности в задачах регрессионного и конфлюентного анализов, а также задачах идентификации нестационарных моделей временных рядов в биологических исследованиях и идентификации параметров динамических систем, описываемы}; линейными разностными уравнениями.

2. Сделан обзор современного состояния проблемы решения некорректных стохастических СЛАУ в задачах регрессионного анализа по неточным данным.

3. Дана классификация методов решения некорректных стохастических СЛАУ по уровню априорной информации о неизвестном решении и случайных возмущениях в элементах матрицы и векторе правой части.

4. Дано обобщение определения А. К ' Тихонова приближенной детерминированной СЛАУ на стохастические системы.

5. Обоснована и исследована статистическая форма обобщенного принципа невязки и дана ее связь с регуляризованным методом ортогональных проекций.

6. Получены условия существования и однозначной разрешимости задачи вычисления регуляризованных оценок решений некорректных СЛАУ с применением статистической формы обобщенного принципа невязки.

7. Исследовано влияние априорной информации о возмущениях в исходных данных системы на статистические свойства регуляризованных оценок решений и получены оптимальные в среднек-вадратическом смысле регуляризоЕанные оценки решений с несмещенным квадратом длины, что гарантирует их статистическую устойчивость при решении некорректных стохастических СЛАУ на конечной выборке.

8. Доказана сильная состоятельность нерегуляризованных и регуляризованных оценок решений метода ортогональных проекций для возмущений в элементах матрицы и правой части СЛАУ представляющих случайные процессы типа мартингал-разностей.

9. Исследованы ватой? для практичекого применения вопросы нахождения оценок решений с несмещенным квадратом длины в случае когда отсутствует априорная информация о дисперсиях погмуг^пий в элементах матрицы и вектора правой части.

1(1. Исследованы рекуррентные алгоритмы нахождения минн-ютьны\ собственных значении информационных матриц и на их

5

основе получены итеративные методы регуляризации некорректных стохастических СЛАУ.

11. Разработаны и исследованы численно устойчивые алгоритмы нахождения псевдорешений некорректных стохастических СЛАУ с неточно заданными матрицей и вектором правой части.

12. Получены общие условия сильной состоятельности оценок метода ортогональных проекций в задачах идентификации параметров стохастических динамических систем, описываемых линейными разностными уравнениями.

13. Показано, что задачи параметрической идентификации большого класса динамических систем с дискретным временем, описываемых линейными разностными уравнениями, сводятся к задачам решения некорректных стохастических СЛАУ с неточно заданными матричным оператором и вектором правой части; на основании предложенных в работе методов стохастической регуляризации СЛАУ получены регуляризованные оценки параметров стохастических динамических систем.

14. Для математического моделирования процессов роста в медико-биологических исследованиях предложено использовать дискретные передаточные функции с помощью которых удается существенно расширить класс моделируемых процессов.

Практическая ценность и реализация результатов работы. Разработанный цикл методов, методик, алгоритмов и программ позволяет существенно расширить класс эффективно решаемых прикладных вадач математического'моделирования нестационарных временных рядов в биологических, медико-биологических и других исследованиях на основе экспериментальной информации. Основной практический выход диссертационной работы заключается в разработке единой методики решения класса некорректных задач регрессионного анализа нй основе их сведения к задачам определения оценок решений приближенных СЛАУ с неточно заданными случайными данными, включающему предложенные в диссертации базовые алгоритмы стохастической регуляризации. Реализуемые в рамках предложенной методики вычислительные схемы решения приближенных стохастических СЛАУ содержат как универсальные, так и адаптированные к конкретным классам аадач идентификации нестационарных параметрических моделей временных рядов в биологических и медико-биологических исследованиях. 6

Предложенные в диссертации алгоритмы вычисления регуля-ризовамных оценок решений некорректных стохастических СЛАУ не требуют никакой недоступной на практике экспериментатору информации и поэтому могут широко использоваться при решении значительного круга проблем автоматизации научного измерительного эксперимента, связанных с необходимостью получения устойчивых решений многочисленных задач обработки, интерпре' тации и моделирования данных.

Практическая ценность результатов представленных в настоящей диссертации также объясняется тем бесспорным фактом, что важнейиим алгоритмом Енчислительной'математики, используемым в качестве блога решения большинства практических вычислительных задач, является алгоритм решения СЛАУ при построении решений которых принципиальным фактором является наличие случайных погрешностей задания исходных данных.

Методы, алгоритмы и программы, разработанные в диссертации, использованы:

- в задачах моделирования по экспериментальным данным процессов роста биологических популяций;

- при разработке пакета прикладных программ (ППП) для исследования динамики роста некоторых-видов заболеваний вызванных промышленными загрязнениями окружающей среды;

- при разработке ППП для прогнозирования среднесуточных концентраций вредных веществ в воздухе, вызванных промышленными загрязнениями.

Эффективность использования предложенных в диссертации методов, алгоритмов и программ для решения указанных задач подтверждена актами соответствующих орга шзаций.

Апробация работы. Основные результаты диссертации докладывались на 5-й Всесоюзной конференции по планированию и автоматизации эксперимента л научных исследованиях (Москва, 1976), 3-й Всесоюзной научной конференции "Применение вероятностно-статистических методов в буренки н.нефтедобыче" (Баку, 1981). В?есошной конференции "Теория адаптивных систем'и ее применения" (Ленинград, 1053), 5-м Гсесотоном совешлтш "Уп-равлет?.' миогосвзгиши системами" (Тбилиси, 1934), 1-й Роесо-гсной п.к и^-кокф-.ретши "Кпчгмягичискг..» юдаытродети« г машиностроении" (КуйГисч'В, 1РЭ0), 5-и ^енпнгр'у.ском екмпозруч? по

7

теории адаптивных и экспертных систем в управлении (Ленинград, 1991), обсуждались на семинаре "Современные проблемы численного анализа" ШВЦ МГУ (1933, 1989) и общемосковском семинаре по теории адаптивных систем в Институте проблем управления АН СССР (1989).

Автором опубликованы по теме диссертации 18 работ 11-18].

Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, списка литературы. Объем диссертации составляет 259 машинописных страниц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность рассмзхриваемой проблемы, сформулированы цель и задачи исследований. Приведено распределение материала по разделам, указаны основные положения выносимые на защиту, а также научная новизна, практическая ценность, апробация и реализация основных результатов диссертационной работы.

В первой главе дано определение некорректных задач регрессионного анализа и показана их связь с задачами нахождения оценок решений приближенных стохастических СЛАУ, т.е. в данной работе задачи линейного (относительно неизвестных параметров) регрессионного анализа будут рассматриваться как частный случай задач нахождения оценок решений приближенных стохастических СЛАУ с неточно (случайно) заданными вектором правой части и матрицей'системы.

Рассмотрим стандартную задачу линейной множественной регрессии в виде: '

Ли = I - дг,

где А - п х ш - .матрица эксперимента; и - вектор размерности т неизвестных параметров регрессионной модели; Г - вектор размерности п компонентами которого являются значения функции отклика регрессионной модели; Д1 - ненаблюдаемый вектор аддитивных случайных возмущений. Данную задачу нахождения оценок и вектора неизвестных параметров можно формально рассматривать как^частную задачу нахождения оценок нормальных решения^СЛАУ (А, £) с приближённо заданной случайной правое частью X (точная неизвестная правая часть имеет.вид: 1-1 -лГ),

где под нормальным решением понимается решение с минимальной нормой соответсвующей задачи о наименьших квадратах для точной СЛАУ (А, £).

Значительная часть встречающихся в практика решения задач регрессионного анализа приближенных стохастических СЛАУ (А, I) некорректны в том смысле, что бесконечно малым случайным приращениям в векторе правой части могут соответствовать сколь угодно большие погрешности в оценках и нормальных решения, т.е. сколь угодно большие значения М|]и - и„,||г, где - нормальное решение точной СЛАУ (А, 1). Некорректность данной задачи в основном бывает вызвана явлением сильной мультиколлинеарности столбцов матрицы А исходной СЛАУ соответствующей регрессионной задачи. Сильная

мультиноллинеарность столбцов матрицы А ведет к плохой обусловленности матрицы АТА и наиболее часто проявляется при использовании полиномиальных моделей или динамических авторегрессионных моделэй (моделей описываемых с помощью линейных разностных уравнений), которые в настоящее время широко используются для описания различных процессов роста (в том числе процессов роста биологических популяций и т.д.).

Существенно слояягее являются задачи регрессионного анализа в которых возникает необходимость учёта погрешностей как в значениях функции отклика, так и в значениях ее аргумента. Необходимость учета случайных погрешностей в независимых переменных в регрессионном анализе была отмочена давно - возникло понятие "кояфлюентный анализ". Было показано, что неучет случайных погрешностей даже в части исходных данных приводит к смещенным и несостоятельным оценкам, в общем случае задачи конфлюентного анализа являются обобщением задач регрессионного анализа. Как показано в главе 5, к задачам конфлюентного анализа сводится большое количество задач параметрической идентификации динамических моделей дискретных систем описываемых линейными разностными уравнениями, которые, как показано в главе б, широко используются при исследованиях процессов роста в би.гогических и других областях науки.

С формальной точки зрения задачи конфлюентного анализа, тагах? как и задачи регрессионного анализа, можно рассматривать

о

как частный случая задач нахождения оценок нормальных рошений СЛАУ (А, I), но в отличие от задач регрессионного анализа с приближенно случайно заданными не только вектором правой части I, но и матрицей А системы, где А=А+дА и эломенты матрицы ДА и вектора априори неизвестны. Некорректность задачи

нахождения оценок решений приближенной стохастической СЛАУ (АД) может быть уже вызвана не только плохой обусловленностью или вырожденностью точной матрицы, но и случайным характером возмущений ДА, так как матрица А может оказаться плохо обусловленной или вырожденной даже когда матрица А хорошо обусловленная.

Таким 1 образом, задачи коифлюентного анализа также относятся к классу некорректных задач регрессионного анализа и учитывая, что все эти задачи с формальной точзси зрения сводятся к нахождению оценок нормальных решений приближенных стохастических СЛАУ, которые в свою очередь являются некорректными, возникает необходимость в разработке методов стохастической регуляризации оценок решений некорректных стохастических СЛАУ.

В отой главе дан обзор современного состояния методов решения некорректных стохастических СЛАУ и на основании сделанных выводов из этого обзора сформулировапы основные проблемы возникающие при решении некорректных стохастических СЛАУ в задачах регрессионного и конфлюентного анализов.

. Во второй главе рассматривается задача решения некорректных стохастических СЛАУ с неточно заданной правой частью и частично (или полностью) неточно заданной матрицей коэффициентов, вытекаащая из постановки некорректных задач регрессионного анализа. В данной работе предполагается, что плотность распределения возмущений априори неизвестна, а известны лишь первые два момента распределения. Наиболее известные метода стохастической регуляризации гарантируют получение, лишь асимптотически оптимальных (в некотором смысле) ; оценок решения. Однако на практике регуляризация наиболее эффективна не в асимптотике, а при конечном число . уравнений. В практических задачах также точная система может . оказаться несовместной. Для детерминированнь'х возмущений эти задачи довольно хорошо исследованы, а • для случая

стохастических возмущений всегда явно или неявно предполагается совместность точной системы. Решению всех этих .задач и посвящена данная глава.

Рассматривается система линейных алгебраических уравнения

Аи=Г,

где А -пхщ - матрица; и, I - векторы размерностей шип соответственно. Элементы вектора правой части 1 и часть элементов матрицы А известны с ошибками, т.е. вместо точных Ад, даны их случайные реализации 1=Гт+дГ, А=(Л^>А%лА), где А^ -гь(и-з) - матриц?, Ат и ДА -п*з -матрицы. Если з=ш, то все элементы матрицы возмущены.

Предполагается, что элементы матрицы возмущений ДА и вектора возмущений ДГ являются случайными величинами и удовлетворяют условиям:

1) М<ДЬ.|Зе_1)=0 П.н.,

2) В(ДЬ.|з..1)=с11вв{^.....п.н.,

где дЬ. = (да1Р... ,Да1т, ДГ1)Т, - »-алгебра

31=о,{дЬ1.....ДЬ.) индуцированная случайными величинами

указанньми в скобках 1=1,...,п, и 30=в, т.н. - почта наверное и для всех 3=1,...т-з, 0 <с*.< <о для всех 3=т-з+1,... ,т и о* > о, т - знак транспонирования.

Затлечание 1. В дальнейшем в этой главе без потери общности предполагается, что <уг=гЛ=о-* > а для всех д=ш-з+1,...,га.

. - Предполагается, что точная система (Ат, является

детерминированной и может быть вообще говоря несовместной, т.о.

МА~И^ги - М -

Нормальное псевдорзшенке й определяется как

П=ш^±пГ ||и||, 1 е о

где П - множество псевдорошония системы (Ат, :ГТ).

Приближенная стохастическая система задается при помощи индивидуальной системы (А, Г), меры несовместности точной системы и дисперсии о1 характеризующей точность задания приблгстанной системы, а также свойств 1), 2). характеризующих

определенную статистическую регулярность возмущений.

Пусть имеется К экспериментальных (возмущенных) наблюдения каждой строки расширенной матрицы Вт=(\, -Хт), т.е. приближенные матрица А имеет размерность kn * ш и вектор f размерность kn.

Рассмотрим задачу вычисления состоятельных опенок нормальных псевдорешений G приближенных стохастических систем уравнений (в общем случае несовместных, т.е. *'л>0) при к—► <». В дальнейшем рассматривается сильная состоятельность, т.е. сходимость с вероятностью 1.

Оценки нормальных псевдорешений ü будут вычисляться из решения экстремальной задачи

inf J^u), (1)

u е R

где

uTDu + 1

D=diag{0.....0,1.....1), t^tf.O^Jlf,

А

"о........Тк;;Ч1 Г

N в х (тп- я » ; А в Я

единичная матрица размера з, 0оу(т_в)- нулевая матрице размера з * (ш-з).

Основное отличив экстремальной задачи, соответствующе! методу ортогональных проекция (МОП), состоит в том, чтс функция итШ не является строго положительно определенной I как следствие решение задачи (1) не» может быть сведено ] решению экстремальной задачи соответствующего отношения Релея Лемма 2.1. Верно соотношение

x.=lnf J(u)=

U е ИГ

1/kX t (BTB)"*D], если х (ВТВ, ) > О,

О, еслихт1п(в^) = О, где -I0), D.ediBgiO^^jO, 1,..., 1).

т- a iti

Олэдствие. Если а=ш, то D »I л и * . <ВТВ, ).

.........." • w+i • minл fj fj'

Решение экстремальной задачи (1) мошт быть неединственным и поэтому необходимо рассмотреть вопрос о единственности решения.

■':'?"п 2.2. Решение экстремальной задачи (1) имеет единственное решение тогда и только тогда, когда хж< и это решение равно

и J(uo)=x., где

1/кл г<а;а, ) di, если х . (а;а ) > о,

та* Ц р' f mvr*y fj Ц' 9

О, если хм1п(А'Аи> = 0.

Min fJ р

Теорема 2.1. Пусть последовательность векторов возмущений (аЬ.)™=1 расширенной матрицы (A, f) удовлетворяет условиям 1),

2). Тогда, если о*=с?=ог> 0 (j=m-s+1.....га) и априори

известна величина м . то оценки определяемые выражением

vtf^ - K*,D>*A¿Í0. (2)

где С)+ - псевдообрзтпая матрица Мура-Пенроуза, будут сильно состоятельными оцетсами нормальных псевдорешения 0, т.е.

Ч. « ' 5-

Несмотря на свойство состоятельности, оценки и^, определяемые выражением (2), являются неустойчивыми с вычислительной точки зрения при конечных (особенно малых) значениях к. Этот факт делает актуальной проблему регуляризации состоятельных оценок при конечных к.

Для решения этой задачи вместо экстремальной задачи (1) удобнее рассматривать задачу

inf F(u), (3)

„ ^

где

F (u)-

K"i¡'^l - gil' ||и||гИ

w= .................... , g=(í;.0.....D)T.

(кл.)1"2! I О ^Г-''

В тл-э' ! m-a ) X ь В

Лемма 2.3. Экстремальная задача (1) экьивэлентна экстремальной задаче (3).

В отличие от задачи (1), задача (3) точно сосл Е>отствует

МОП.

Вводам дополнительное ограниченно ||и|| < К в (1), означающее регуляризацию плохо обусловленной задачи, и рассмотрим двойственную задачу: при фиксированном значении функционала J(u>, равном , минимизировать К. Таким образом, регуляризованцые оценки решений определяются из решонил задачи: K=inf«un на ue U=tu: К-йнtfu-gn2-(1 + >.

Решение этой задачи определяется из решения уравнений

(to-I + «TW)u = WTg, (4)

- gf - ü'-lul2^*. <5)

В формулах <4), (5) априорная информация о и змиэется с помощью параметра и2. Из этих формул елодует их соответствие формулам, определяющим решение согласно [вгуляризованному методу наименьших квадратов А.Н. Тихонова.

Теорема 2.2. Если ;/<х„, то систома уравнения (4), (5) не имеет решений. Если то система уравнений (4), (5* имеет

единственное решение тогда и только тогда, когда х^, х^и оно совпадает с решением экстремальных задач (4), (5) без ограничений.

Представим параметр г в виде

í-=-x#+a, а <е (О,®). * (6)

Подставляя г из <6) в <4), <5) получаем

«TWUa - (kX.-<*)UaJTg, ОО,

«>(а >-К_* I Wue-e|*-^* «l + lll^l*) -о.

Теорема 2.3. Если x#<p*<k"' 1?|г и IATí|>0, то для всех а £ <0,а>) функция р(а) непрерывна, является сторого монотонно возрастающей к уравнение р(а)=0 имеет единственное решение на интервала <0,ш).

Ззмеччнко. Если АтГ=0, то и=0.

Для применения быстро сходящихся алгоритмов отыскания корня уравнения р(а)=0, рассмотрим функцию $(/?)=к*>(1Л?).

Теорема 2.4. Если \.<р2<га:т(к~'|1||2, \л) и ЦАТ1])>0. то для всех р е (О,*) функция Цгч) непрерывна, является убывающей и выпуклой вниз.

Из теоремы 2.4 следуот, что для решения уравнения ф(гэ)=0, если ц1 (Х„Л,), применим метод касательных Ньютона:

где

*(Р)=ЦГ|:(КХ.-Ю -2-1 /Р) Ци^Цг,

(Р)=2 (к\„-!си2-1 а и^ и являются решениями уравнения Эйлера

Г(1 )1т+1т1

[ (1 /О .

Полученпое уравнение (5), вообще говоря, соответствует статистической ферме обобщенного принципа невязки. Выше были рассмотрены лишь вычислительные аспекты определения регуляризопанных оценок решения СЛАУ в предположении, что ¡л1 -свободный параметр.

В робота рассмотрены некоторые возможные способы выбора параметра цг из допустимой области, гарантирующие наличие определенных статистических свойств регуляризованкых оценок решений, определяемых из уравнения (4), (5).

Наиболее значительным вкладом в увеличение средней квадратическоя ошибки оценок решений приближенных стохастических СЛАУ, связанное с палением плохой обусловленности при вычислении состоятельных оценок и,, решения ИНК или У )П, является сильное увеличение сродного квадрата длины вектора оценок, т.е. плохая обусловленность приводит к тому, что М||ик|)г>>||й[|г. Поэтому, при плохой обусловленности задач V: ПС и МОП, в работе предлагается вычислять р^гуляризовопные одонян роданид которые бы несмещенный

!С<лдрат д'ичы штора, т.е. обладали свойством УН11^В*—И^Пг ГГГ" всех К (и.'и соответственно п).

Для получения регуляризованных оценок наименьших квадратов с несмещенным квадратом длины используется тот факт, что применение МНК приводит к "дефекту" (систематическому уменьшению) средней величины суммы квадратов невязок, т.е. регуляризованные оценки и определяются так, чтобы выполнялось условна

MS(u)=nA (7)

где

S(uH|ATu - i||\

Выполнение условия (7) можно обеспечить, если регуляризованные оценки решений будут определяться из совместного решения уравнений

К\иа + »4,=^. (8)

ИМо - (9)

при jjz=p^in+<5 и соответствующем выборе параметра где

р2. =ШГ S(u) на и е ж'.

mir. * '

Простейший способ выбора <5, гарантирующий выполнение условия (7), «^„^.(п-т.Г'р*^, где тж=гапК АТ.

В этом способе не требуется никакой дополнительной априорной информации о приближенной СЛАУ и выполняется следующая

Теорема 2.6. Пусть возмущения Af удовлетворяют условиям 1), 2), ^г=^1П+<50 и р^+^о-М* п.н.. Тогда регуляризованные

оценки и решений СЛАУ (Ат, f), определяемые уравнениями (8), (9) существуют, единственны и удовлетворяют условию

мцииЧйГ.

По аналогии с классом несмещенных оценок представляется разумным на классе оценок с несмещенным квадратом длины найти оптимальные в каком-либо смысла оценки. Для- этого рассматривается величина

Т)(б)=М(р^.п-Ь5-По2)2, (10)

которая характеризует устойчивость аппроксимирующих решений на классе приближенных стохастических систем эквивалентных по. точности в смысла дисперсии °г.

Из (10) получаем, что оптимальное значение

Теорема 2.7. Пусть возмущения удовлетворяют условиям 1), 2) и р^п+т„<у2<||Г||2 п.н. Тогда оптимальные

регуляризованнш оценки иор1 решений СЛАУ (Ат,1), определяемые уравнениями (8), (9) при <5=ш„о<2 существуют, единственны и удовлетворяют условиям:

1) МС8(иор1)-п»2]2 < М[3(и)-п<72]2,

2) М||иор1||2=||й||2,

3) Н[||иор1||2-||й||2]2 < М[|^||2-||^|2]2,

где и - соответствующие МНК-оценки.

Несомненный интерес с пра1стической точки зрения представляет случай, когда априори известна не сама дисперсия о2, а лишь какая-то еа оценка о2. Показано, что в этом случае (т.е. когда вместо с2 известна ее оценка с2) для того чтобы выполнялись условия теоремы 2.7, необходимо чтобы оценка о2 была статистически независима от 1 и выполнялись условия: М<уг= =о2, М(</-о2):£сЛ и р21п+т„с2<||Г||2 п.н.. В работе рассмотрены практические способы нахождения оценок а2, удовлетворяющих выше перечислонным условиям.

Аналогичные результаты получены для случая приближенных СЛАУ с неточно заданными не только вектором правой части, но и элементами матрицы системы. В этом с.дучае оптимальный выбор параметра м2 в уравнении обобщенной невязки (5) о2,

гдэ шо=гапк А. Тогда, если х<+шос2<к"1||1||2 п.н., то для регуляризовзнлых оценок решений й , определяемых уравнениями (4), (5), при ¿/=м2 можно получить результаты аналогичные результатам полученным в теореме 2.7. Однако эти результаты, в отличив от случая А=А носят лишь асимптотический характер.

Особенно важно отметить, что все алгоритмы рассмотренные в этой главе являются численно устойчивыми, а оценки решений, полученные с помощью этих алгоритмов обладают статистической устойчивостью.

Третья глава посвящена рассмотрению итеративных методов решения некорректных стохастических СЛАУ, т.е. методов позволяющих с поступлением очередного случайного наблюдения элементов матрицу и вектора правой части строить очередную оценку точного решения СЛАУ. В отличие от второй 'главы, гдэ

предаю чагалось, что элементы матрицы и вектора правой части точной СЛАУ являются детерминированными, здесь предполагается., что и точная и приближенная системы задаются в терминах условных математических ожиданий. Показано, что в этом случае решение стохастической СЛАУ определяется выражениям

и.=агеш1п «(1^- в1и)г/(1+ЦиЦг), (11)

где соответсвенно строки матрицы А, а Г - элвменты вектора

правой части Г, г=1, 2.....п.

Вместо (11), вектор неизвестных решения и. можно также определить как

где хя=(х*.....хГ>т * к""' и

х„=аг£?п1п хт(Мр(^)х/хтх, (12)

_.т+ 1 x € к ч<0>

а ^-(а, -?)Т.

Из (12) по существу следует, что задача решения приближённых стохастических СЛАУ, определенных в терминах условных математических ожиданий сводится к задаче нахождения оценок собственных векторов соответствующих минимальным собственным значениям ковариационной матрицы М»^*. При этом основное свойство, которому должны удовлетворять итеративные оцэнки решения, - свойство сильной состоятельности оцэнок.

В работе дается строгая формальная постановка задачи рекуррентного оценивания минимальных собственнных значений и соответствующих им собственных векторов ковариационных матриц «=Мр1*>* при условии бе К > О. Для рошения этой задачи используется метод стохастической аппроксимации, основанный на минимизации отношения Ролея

м(х)=(х,$х)/(х,х),

где х е к""1, (",') - скалярное произведение.

Таким образом, оцэнки х1 собственных векторов х, определяются с помощью стохастически градиентной процедуры

I (х,^) )

(X, .X,)

где (г, )'1"1 - детерминированная последовательность, удовлетворяющая стандартным условиям метода стохастической аппроксимации.

В работе показано, что если случайная последовательность удовлетворяет некоторым дополнительным условиям и начальные условия ихо11=<5>0, то оценки х(, доставляемые алгоритмом (13), удовлетворяют соотношению

Ит р(х1,о<1)=0 п.н.,

I—► ®

где р(х,о.) - расстояние от точки х до множества о,,

р(х,о.)=тГ_ их-х'«, (14)

*' еО

*

П# = 1х: ФХ=Хт пХ, <5 £ «ХИ < 1 < »), ]>5+<5~21К. г* и К

удовлетворяет неравенству < К < ю п.н..

Для доказательства (14) из-за многоэкстремальности минимизируемого функционала, а также коррелированности возмущений используется метод асимптотических

непрерывных детерминированных моделей и мэртингальный подход анализа сходимости стохастических рекуррентных процедур. Показано, что предлагаемый рекуррентный алгоритм вычисления минимальных собственных значений информационных матриц может эффективно использоваться дяя конструирования асимптотически оптимальных рекуррентных алгоритмов идентификации параметров динамических систем, предложенных Я.З. Цыпкиным в рамках информационной теории идентификации. Приводятся результаты численного моделирования на ЭВМ разработанных асимптотически оптимальных рекуррентных алгоритмов идентификации со скалярной матрицей усиления.

Четвертая глава посвящена рассмотрению численно устойчивых методов нахоящения псевдорешений некорректных приближенных стохастических СЛАУ.

Во-второй главе были получены сильно состоятельные оценки и^ псевдорешений а. точной СЛАУ, где

А* - псевдообратная (в смысле Мура-Пенроуза) матрица к матрица Ат, ип определяются, в соответствии с теоремой 2.1, выражением

и^ = (Ат А-х ж Б)+ Дт I. (15)

Здесь везде в дальнейшем без потери общности предполагается, что к=1.

Однако наличие члена в выражении (15) не позволяет применить для вычисления оценок ип эффективные численно устойчивые метода, основанные на сингулярном разложении и несвязанные с необходимостью предварительно формировать матрицу

П =АТА-ХБ.

п

К тому же отмечалось, что матрица пп из-за члена часто

оказывается очень плохо обусловленной. Кроме того, как известно, формирование матрицы может приводить к

антипэреполнению или переполнению, к появлению дополнительных ошибок вычислений, а также к возведению в квадрат числа обусловленности задачи по сравнению с методами которые не требуют формирования матрицу оп.

В данной главе эта задача решается на основе определенной модификации рекуррентного алгоритма Жуковского-Липцэра, предназначенного для вычисления псевдорешений СЛАУ, позволяющей производить исключения строк в расширенной матрицз исходной СЛАУ.

Показано, что оценку (15) псевдорешения и. можно представить в виде

если ввести комплексную матрицу

А

А =

и вектор 1.=(ГТ, 0.....0)т«жп<°, где а - мнимая единица,

3=У=1.

Запись выражения (15) в виде (16) позволяет

О

непосредствэшшо применить рекуррентный алгоритм Жуковского-Липцера не обращая внимания на то, что часть элементов матрицы А. являются комплексными числами.

Для применения этого алгоритма, обозначим: а1, 1;=1,

2,...,п - строки матрицы А и элементы матрицы Р^ как р^к(1;), а ее столбцы как г^СЬ), 1,к=1,2,... ,ш, т.е.

Р?=|Р?к<*>М>\<1;> ■••

Рассмотрим систвму рекуррентных уравнений (относительно вектора и матрицы Р^ е к"""") для решения. СЛАУ

(б%+АтА-х,Б)и=Ат1, б>0. (17)

Тогда, с учетом введенных выше обозначений, эта система уравнепий имеет вид

- «а»

о м

для 1=0,1,...,п-1 и

и"?*1=и? + )"?№)/(¿2Л.-р*к(1;)), (20)

р?.,=р? + (21)

для 1;=п, п+1, ... , п+э-1, где к=ш-з+1 + (г-п), и^(к) - элементы

вектора и^, т.е. (1).....и^га))т е кт.

Теорема 4.1. Решения рекуррентных уравнений (18)-(19) задаются формулами

и?=(б% + АХ)-^?1, (22)

Р?=(бг1т + А^Г'б1 (23)

для 1=1,2,...,п и

и?=<6% + ЛТА - х.С1.п)"'Ат?, (24)

+ АТА - х.С^^-'б1 (25)

для t=п+1, п+2, ... , п+з,

где С =diag{0.....0,1.....1,0.....0),

к=1,2,..

к а

е R1"1", Il=

А =А, Г =f.

Следствие.

U" =(6 Е + А А

V.Dr'A'f,

т.е. является решением СЛАУ (17).

Из этого факта непосредствешо следует, что если rank A=m и положить <5г=\ж>0, то рекуррентные уравнения

(18)-(21) позволяют получить системы, т.е.

точное нормальное решение

и=(АтА)~1АтЕ.

Экспериментальные исследования проведенные на ЭВМ показали, что данный метод позволяет; в ' случае пжя.о обусловленных систем получать решения задачи наименьших квадратов существенно точнее, чем решения полученные по методу Холесского, при проведении вычислений обоими методами на ЭВМ с одной и той же разрядностью.

Вычисления с помощью рекуррентных соотношений (18)-(21) можно использовать для нахождения псевдорешения (15), если

их проводить по следующей схеме. После вычисления и

и Г

«v f г

((п+з)-число строк матрицы Аж) продолжается подсчет и° и Pt с

помощью этих

t =f 2(п+а>*1 1 ' '

же

соотношений, пслользующиа строки

b =b ,.,

числа

s>=bo.....

f, ,

Теорема 4.2. Справедливы соотношения F6

u6

(r»+e)N n * ( n+e>N

Описанное вше "зацикливание" в рекурронтньос уравнениях (18)-(21) позволяет уменьшать как угодно величину бг и

<5 '5 rw4- 'v

приближать воктор u(n>e)>| и матрицу Pln..m к вектору A^f, и-

в, =а

I

и

матрица

при N —» а, так как

. lim (ö2E +Arl )~V=I -А+Л,.

m * * м ж ж

6 —* О

Экспериментальные исследования на ЭВМ показали, что такой прием уменьшения бг, позволяет проводить устойчивые вычисления, с помощью алгоритма (18)-(21), отвечающие как угодно малым значениям <5Z при N —♦ «>, причем это значение независит от машинного эпсилон.

В пятой главе рассматриваются регулярные метода решения задач параметрической идентификации дискретных конечномерных линейных стационарных динамических систем. В работе автор придерживается определения динамической системы просто как объекта состояшрго из некоторого семейства временных рядов. Ючнее говоря под динамической системой понимается тройка £={Т,Я,53), в которой TciR - множество моментов времени, W алфавит сигналов и «cWT - поведение системы.

Рассмотрены три класса моделей линейных динамических систем:

-(АЯ)-системы (авторегрессионные системы, описываемые стохастическими линейными разностными уравнениями);

- системы типа вход-выход;

- системы с пространством состояний.

Перечисленные классы моделей линейных динамических систем находят широкое применение в задачах моделирования медико-биологических, биологических'Г экологических и других систем.

Показано, что статистические проблемы идентификации этих классов динамических систем с дискретным временем, а также задачи регрессионного анализа с ошибками в независимых переменных в общем случае можно сформулировать как задачу оценивания вектора неизвестных параметров тж<еК™ по наблюдениям за скалярным процессом (yt)f=1 (У^к1) и векторным процэссом (z^™), описываемых уравнениями ■ ' ■>

' Уг^+'ч' t=1,2,..., (26)

где еь)т - ненаблюдаемый векторный белый шум.

В свою очередь последняя задача идентификации сводится к решению СЛАУ

А , (28)

Г« п' л '

где Ап-пхга -матрица, Ап=1х£.. .хп|т, 1п=(%х1.....т1хп)т и и -

неизвестный вектор параметров (и^к"1).

В зтой задаче элементы вектора правой части 1 и элементы матричного оператора Ап известны с ошибками, т.е. вместо точных 1 и Ап даны их возмущенные случайные реализации

Ап=Ап+дАп= .....гда строки да

(1=1,2,...п) матрицы лАп соответственно равны да^^, 1=1,2,....п, а к".

Отмеченная аналогия поставленной задачи идентификации с задачей решения СЛАУ (28) по приближённым случайным данным (Ап, I ), а также ' некоторой дополнительной априорной статистической информации о возмущениях лАп и позволяет,

как показано в работе, получить устойчивые численные алгоритмы вычисления оценок неизвестных параметров, используя результаты предыдущих глав.

Показано, что оценки МОП ип неизвестных параметров тж, определяемые выражением

и^агяпШ |1п - Апи||2/п(1+|и|г),

и е Кт

будут сильно состоятельными, если возмущения е[ и в1 в уравнениях (26), (27) удовлетворяют следующим условиям:

1) векторный случайный процэсс (е>1)^1 статистически независиг от процессов (е1)™=1 и (х1)®=1;

2) М(е1|31.1)=0 п.н. и □ < М(е^|31_1)=о-' < ш п.н.,

г=1, 2, ... ;

3) М<о1|Б1_11)=0 п.н. и М (ее* 15^) =£3186^.....«■*)=

=И>0 п.н., 1=1,2,...; где и о-алгебры, .....е^х,,... .х^} и 51=о-{в1,

.....V-

Теорема 5.1. Пусть процессы (у^®, и описываются

уравнениями (26), (27) и выполняются условия 1) - 3), а также предполагается, что матрица

Р„<-ЛХГ

невырожденная и что

м<гг р^1) <ш ' для некоторого q > ш. Тогда, если

4) 11л Рп'=0 п.н.;

г»-*С0

5) 0 < с пЕ < ? < спЕ , с > О п.н., Мс* < оо;

' 1 т п 2 т * 4 2 >

то 11т и =т п.н..

п *

П—>00

Результаты теоремы 5.1 позволяют установить сильную состоятельность оценок МОП для большого класса задач параметрической идентификации линейных дискретных динамических систем (моделей авторегрессии с аддитивными помехами измерений , состояний, дискретных линейных динамических систем типа вход-выход, описываемых линейными разностными уравнениями с аддитивными помехами по выходу и входу, задач идентификации параметров дискретных передаточных функций и т.д.).

Показано, что задачи вычисления'состоятельных оценок МОП перечисленных классов стохастических дискретных динамических систем относятся к классу некорректных задач регрессионного анализа и поэтому для их решения целесообразно использовать методы стохастической регуляризации развитые в предыдущих главах.

На основа рогуляризованных вариантов методов ортогональных проекций и наименьших квадратов в диссертации разработаны конкретные вычислительные схемы для решения следующих классов задач параметрическое идентификации дискретных динамических систем:

- моделоя авторэгрессии с аддитивными помехами измерений состояний процессов (рассматриваются как устойчивые так и неустойчивые процессы);

- задачи оценивания параметров процэссов описываемых линейными однородными разностными уравнениями с адиитивными помехами изкорений состояний; ;;

- задачи идентификации параметров динамических систем ти-*.

па вход-выход, описываемых линейными разностными уравнениями заданного порядка с помехами по выходу и входу;

- задачи идентификации параметров дискретных передаточных функций (рассмотрены устойчивые и неустойчивые системы).

Важным достоинством рассмотренных в диссертации методов идентификации является то, что дяя их применения используется лишь информация содержащаяся в экспериментальных данных и не требуется никакой дополнительной априорной информации о неизвестных параметрах.

Шестая глава посвящена прикладным результатам реализации теории, методов и программных средств регулярных методов решения некорректных задач регрессионного анализа и параметрической идентификации моделей по экспериментальным данным к задачам моделирования в биологических и медико-биологических исследованиях. Приведены разработки связанные с решением задач математического моделирования: процессов роста численности биологических популяций, зависимостей роста заболеваний населения от уровней загрязнения воздуха, воды и .других факторов, а также в задачах оперативного прогнозирования концентраций загрязнения воздуха в районах промышленных предприятий в зависимости от метеорологических факторов. Рассмотрены результаты экспериментальных исследований (по имитированным данным) на ЭВМ предлагаемых устойчивых методов идентификации параметров регрессионных моделей.

^. _Мдделированга_гтроцоссав_роста_численности_ биологичес= ких популяций. Модели процессов роста находят применение во многих областях науки: в биологии, ботанике, зоологии и экологии, - с их помощью описывается рост организмов, растений, ки-вотных и людей. Для решения многих задач моделирования и прогнозирования численности различных биологических популяций используются дискретные стохастические варианты моделей Гомпорт-ца. Стохастические варианты моделей Гомпертца получаются как естественное обобщение соответствующих детерминированных моделей добавлением на входе случайного процесса, отражающего совокупное действие влияющих на популяцию экзогоипых факторов, таких как пища, климат, хищники и т.д. Дискретные варианты этих моделей относятся к классу авторегроссиопных моделей, рассмотренных в плаве 5.

В общем случае стохастические дискретные варианты моделей Гомпертца можно представить в виде разностного уравнения:

1п ХШ^Ш х<г-1)-н?21п хи-гНйШ-^Ш, (29)

где г - дискретное время, 1=] ,2.....хШ -численность биологических популяций, е (1;) - неконтролируемое стохастическое возмущение типа дискретного белого шума, а с^Ш представляет собой функцию тренда и позволяет учитывать нестационарность среднего значения процесса роста. В работе рассмотрены основные способы задания функции тренда и показано, что с практической точки зрения представляет наибольший интерес полиномиальная функция тренда,

й (г)=в в г1. (30)

1 % ' О V =1 1+2 ^ '

Однако, использование полиномиального тренда в виде (30), делает задачу идентификации параметров ва> ■ ■ ■ модели (29) очень плохо обусловленной и при порядках полинома ч > 6 оценки, полученные стандартным методом наименьших квадратов, ока- • зываются совершенно бесполезными. Поэтому, для решения поставленной задач::, используются методы стохастической регуляризации разработанные в диссертации.

Серьезным недостатком стохастических дискретных вариантов модели Гомпертца (29) является также то, что в них стохастическое возмущение е^Ю отражает лишь внутреннюю стохастическую природу процесса роста численности биологических популяций, но, в них не учитываются случайные погрешности измерений численности биологических популяция неизменно присущие любому способу получения экспериментальных данных в биологических исследованиях. Поэтому, в работе рассмотрены задачи идентификации параметров моделей (29) в условиях, когда экспериментальные значения численности биологических популяций содержат неконтролируемые случайные возмущения. В диссертации для решения этих задач эффективно использованы методы рассмотренные в главе Б.

В данной главе также представлены результаты экспериментальных исследований на ЭВМ, показывающие эффективность разработанных в диссертации методов стохастической регуляризации (по сравнению с известными) при решении перечисленных задач идентификации параметров моделей роста биологических популяций.

2. _Мод9л^дваниэ_и_П2огноз^ованш_д^амики статистических показателей в медицинских и экологических исследованиях. Специалистов по медицинской статистики, организации здравоохранения, геронтологии в основном интересуют долговременные закономерные процессы и тенденции, т.е. большое значение в медицине имеют задачи, возникающие как следствие исследования проводимых в динамике. Анализ динамики статистических показателей основан на статистической теории анализа временных рядов или, как их чаще называют в медицинских исследованиях, рядов динамики. Ряды динамики в наиболее общем случае можно представить как сумму нескольких компонент: трендовой, сезонной и возмущающей.

Многие временные ряды с компонентами роста и колебаний можно эффективно представлять ковариационно-стационарными моделями, содержащими линейные и синусоидальные функции тренда, а также случайными возмущениями авторегрессионного типа. В общем случае класс ковариационно-стационарных моделей этого типа имеет вид:

x(t)=e + в t + о cos "t + £ sin "t + e tcos <ot + в tain «t +

о i 2 a 4 5

¿¡■„»e^xtt-J) + e<t). (31)

i

где ш=2п/т, T - период колебаний основной гармоники, обуславливающей сезонные изменения временного ряда.

Эффективное применение ковариационно-стационарных моделей класса (31) для анализа реальных временных рядов затрудняется из-за плохой обусловленности задачи регрессионного анализа, возникающей при оценивании параметров этих моделей, что приводит к снижению их прогнозирующих свойств. Поэтому, для оценивания параметров моделей класса (31) в диссертации предлагается использовать регуляризованный МНК, рассмотренный в главе 5.

Предлагаемая методика была' использована для разработки программного обеспечения (в задачах анализа и прогнозирования среднемесячных статистических показателей заболеваемости населения) входящего в состав ГОШ АГИС "Здоровье", внедренного ш* ряде СЭС страны (в том число на Новокуйбышевской и Тольяттинс-кой СЭС Самарской области). В этих задачах для прогнозирования некоторых нозологических форм (болезни верхних дахзтальных путей, болезни эндокринной системы, болезни крови и кроветворных

гв

органов, гипертаяическая болезнь, ишемическая болезнь сердца) были использованы ковариационно-стационарные модели вида (31), включающие экзогенные факторы (концентрация вредных примесей в воздухе и воде, метеорологические факторы).

Предложенные в диссертации методы идентификации были также использованы для решения задач моделирования при анализе статистических показателей детской смертности в Самарской области.

3._Прогноз^ованиэ_концентраций вредных примесей_в_возду-хе^ Важное значение для решения проблемы снижения роста заболеваемости играет эффективное решение задач прогнозирования и регулирования загрязнения атмосферы промышленными выбросами. Для прогнозирования загрязнения воздуха в городах и промышленных районах, обусловленного многими источниками, в настоящее время широко используются различные змпирико-статистические модели.

В диссертации для прогнозирования среднесуточных концентраций вредных примосей в воздухе предлагается использовать зм-пирико-статистичэскиэ модели в форме дискретных передаточных функций. Задача идентификации параметров таких моделей характеризуется достаточно большой размерностью. Число неизвестных параметров даже при порядке передаточной функции ш=1 равно 18. Для решения задачи идентификации параметров данных моделей были использованы алгоритмы рассмотренные в главе 5.

Разработанные модели на основе общего прогноза погоды позволяют прогнозировать концентрации вредных примесей в воздухе и осуществлять оперативный контроль и регулирование вредных выбросов промышленных предприятий в атмосферный воздух. Данные модели были использованы при разработке программного обеспечения входящего в состав ППП АГИС "Здоровье" и применяются для прогнозирования (на одни сутки) среднесуточных концентраций взвешенных веществ, двуокиси азота, окиси углерода, сернистого ангидрида, сероводорода, фенола, углеводородов и аммиака в атмосфере городов Новокуйбысэвска и Тольятти Самарской области.

Показано, что средние погрешности прогноза, подученные по предлагаемым в диссертации моделям,' существенно меньше соответствующих погрешностей прогноза полученных с помощью ранее известных моделей авторегрессионногс типа.

ЗАКЛЮЧЕНИЕ

Выполненные в работе исследования и разработанные на их основе теория, методы, алгоритмы и программы направлены на решение проблеш повышения эффективности применения вычислительной техники в решении задач экспериментально-статистического моделирования в медико-биологических и других научных исследованиях.

Основными выносимыми на защиту результатами диссертационной работы являются:

1. Теория некорректных задач регрессионного анализа, включающая: формальное определение приближенной стохастической СЛАУ, принципы нахождения статистически устойчивых оценок решений некорректных стохастических СЛАУ, методы и алгоритмы решения некорректных стохастических СЛАУ, возникающих в задачах решения плохо обусловленных и вырожденных задач регрессионного и конфлюентного анализов.

2. Численно устойчивые метода и алгоритмы решения некорректных стохастических СЛАУ и их реализация на ЭВМ.

3. Метода и алгоритмы стохастической регуляризации прк решении задач параметрической идентификации моделей, описываемых линейными разностными уравнениями.

4. Методика и результаты применения регулярных штодое решения некорректных задач регрессионного анализа в задачаз моделирования и прогнозирования: процессов роста биолотачосгав популяций по неточным данным и динамики заболеваний, а также задачах оперативного прогнозирования концентраций вредных примесей в атмосфере промышленных городов.

ОСНОВНЫЕ ШШШКАЦИИ ПО TBE ДИССЕРТАЦИИ

1. Бданов А.И. Решение некорректных стохастических линейны алгебраических уравнений рэгуляризованным методом макси мального правдоподобип//}!ШМ и МФ.-1988.-Т.28, N 9.-С.1420 1425.

2. Жданов А.И. Вычисление решений некорректных стохастичешш алгебраических уравнения регуляризованным методом наикэнь ших квадратов//Докл. АН СССР.-1989.-Т.306.-N 2. С.324-327.

3. Жданов А.И. О приближенных стохастических системах линейных алгебраических уравнониа//ЖВМ и МФ.-1989.-Т.29, N 12.-С. 177G-Î787.

4. Жданов А.И. Оптимальная регуляризация решений приближенных стохастических систем линейных алгебраических уравнений// ЖВМ и МФ.-1990.-Т.30, N 10.-С.1588-1593.

5. Жданов А.И. О вычислении псевдорешений некорректных стохастических линейных алгебраических уравнений//ЖВМ и МФ.-1991. - 1.31, N 10. - 0.1572-1575.

6. Жданов А.И. Рекуррентное оценивание минимальных собственных значений информационных матриц//Автоматика и телемеханика.-1&87.-N 4. - С.26-34.

7. Жданов А.И. Вычисление регуляризованных оценок наименьших квадратов коэффициентов авторегрессии по неточным данным// Автоматика и телемеханика.-1990.-N 3,- С.110-117.

8. Zhdanov A.I., Katsyba О.А. Strong con3i3tency of estimâtes code by the method of orthogonal projection3//Int. J. Syst. Sci. -1990. -V. 21 , N 8.- P. 1463-1 471 .

9. Жданов A.И., Кацюба О.А. Особенности применения метода наименьших квадратов для оценивания параметров линейных разностных операторов в задачах идентификации объектов управле-ния//Автоматика и телемеханика.-1979.-К 8.-С.86-95.

10. Жданов А.И., КащхЗа О.А. О состоятельных оценках решений некорректных стохастических алгебраических уравнений при идентификации параметров линейных разностных операторов// Изв. АН СССР. Техн. кибернетика.-1981.-N 5.-С.165-172.

11. Жданов А.И., Кацюба О.А. Идентификация по методу наименьших квадратов параметров уравнений авторогрессии при аддитивных ошибках измерений//Автоматика и телемеханика.-1982.-N 2.- С.29-38.

12. Жданов А.И., Кацюба О.А. О состоятельности оценок наименьших квадратов параметров разностных уравнения при автокор-релировэнпых помехах//Кибернетика.-1983.-К 5.-С. 102-107.

13. Жданов А.И., Кацюба О.А. Рекуррентное оценивание параметров стохастических линейных динамических систем с ошибками . по выходу и входу//Изв. АН СССР. Техн. кибернетика.-1988.-N 3.-С.191-194. -

14. Жданов А.И. Состоятельный алгоритм стохастической аппрок-симэции для идентификации параметров дискретной торедаточ-

ной функции //Всосоюз. конф. по теории адаптивных систем и ее применениям: Тез. докл.-М.-Ленинград, 1983. С.119.

15. Жданов А.И., Кацюба O.A. Оценивание параметров многосвязных линейных динамических систем с ошибками по выходу и входу//Управление многосвязными системами: Тез. докл. 5 Всесоюз. совещания.-М., 1984. С.90-91.

16. Жданов А.И., Кацюба O.A., Григоровский Б.К.'Планирование и исследование регрессионных моделей с учетом динамических свойств выходных интегрирующих операторов//Всосоюз. конф. по планир. и автоматиз. эксперимента в науч. исслод. Матом, теория экспорим.: Тез. докл.-М., 1976. С. 147-148.

17. Жданов А.И. Методы стохастической регуляризации в задачах моделирования динамических систем//Матем. модэлир. в машиностроении: Тез. докл. Всесоюз. школы-конф. 6-15 октября 1990.-Куйбышев, 1990. С.12-13.

18. Жданов А.И., Кагцоба O.A. Методы стохастической регуляризации в задачах обработки экспериментальных данных метеорологических исследовзний//Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов: IV Всесоюз. конф. 10-12 сентября 1991.- Петрозаводск, '..1991. С.9-10.

Подписано к печати 25.12.91. Тираж 100. Заказ 598. Бесплатно.

Отпечатано на ротапринте ЛГТУ.

195251, Сяикт-Петербур1\Пг)л»1ТРХничоска*,29