автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Рандомизированные алгоритмы оценивания и оптимизации при произвольных помехах
Оглавление автор диссертации — доктора физико-математических наук Граничин, Олег Николаевич
Введение
1 Некоторые задачи и методы теории оценивания
1.1 Исторический обзор.
1.1.1 Стохастические рекуррентные алгоритмы.
1.2 Предварительные примеры.
1.2.1 Оценивание величины постоянного сигнала, наблюдаемого на фоне помехи.
1.2.2 Задача об обнаружении сигнала.
1.2.3 Рандомизированные алгоритмы.
1.2.4 Функционал среднего риска.
1.2.5 Предсказание значений сигнала.
1.3 Элементы регрессионного анализа, МНК.
1.3.1 Наилучшая аппроксимация одной случайной величины с помощью другой.
1.3.2 Рекуррентные модификации МНК
1.4 Оптимальная фильтрация случайных процессов.
1.4.1 Фильтр Винера-Колмогорова.
1.4.2 Фильтр Калмана-Бьюси.
1.5 Метод стохастической аппроксимации
1.5.1 Поиск корня неизвестной функции.
Алгоритм Роббинса-Монро.
1.5.2 Минимизация функционала среднего риска.
1.5.3 Процедура Кифера-Вольфовица.
1.5.4 Рандомизированные алгоритмы стохастической аппроксимации.
2 Оценка параметров линейной регрессии при произвольных помехах
2.1 Постановка задачи, основные предположения.
2.2 Оценивание по методу стохастической аппроксимации.
2.3 Оценки по методу наименьших квадратов.
2.4 Экспериментальные результаты.
2.4.1 Задача об обнаружении сигнала при неизвестных, но ограниченных неслучайных помехах.
2.5 Доказательства теорем 2.1-2.4.
Оценка параметров авторегрессии и скользящего среднего при произвольных помехах
3.1 Применение к моделям авторегрессии
3.2 Оценивание параметров модели скользящего среднего.
3.3 Идентификация динамического объекта.
3.3.1 Пробный сигнал.
3.3.2 Введение параметра оценивания.
3.3.3 Рандомизированный алгоритм идентификации
3.4 Доказательство теоремы 3.2.
Фильтрация случайных процессов, наблюдаемых на фоне произвольных ограниченных помех
4.1 Предсказание сигнала, наблюдаемого на фоне произвольных ограниченных помех.
4.2 Отслеживание дрейфа параметров модели линейной регрессии.
4.2.1 Необходимые и достаточные условия стабилизации МНК.
4.2.2 Анализ свойств оценок при различных типах помех
4.3 Экспериментальные результаты.
4.3.1 Фильтрация (предсказание) сигнала
4.3.2 Оценивание изменяющихся параметров сигнала
Рандомизированные алгоритмы стохастической аппроксимации при произвольных помехах
5.1 Формулировки и обоснования рандомизированных алгоритмов С А
5.1.1 Постановка задачи и основные предположения
5.1.2 Пробное возмущение и основные алгоритмы.
5.1.3 Сходимость с вероятностью единица и в среднеквадратичном смысле.
5.1.4 Дифференцирующие ядра и распределения пробного возмущения.
5.1.5 Скорость сходимости.
5.2 Оптимальные порядки точности алгоритмов стохастической оптимизации.
5.2.1 Минимаксный порядок скорости сходимости рандомизированных алгоритмов СА
5.2.2 Нижняя граница для асимптотической скорости сходимости.
5.3 Экспериментальные результаты.
5.3.1 Сравнительное моделирование оценок ККВ и SPSA алгоритмов.
5.3.2 Пошаговое выполнение алгоритма
5.3.3 Программа на языке MATLAB
5.4 Доказательства теорем 5.1 и 5.2.
Применения рандомизированных алгоритмов
6.1 Способ обнаружения некоторых химических элементов в мишени.
6.2 Практические приложения рандомизированных алгоритмов СА
6.2.1 Синхронизация сигналов светофоров для управления движением на сети дорог.
6.2.2 Оптимальный выбор целей для систем оружия
6.2.3 Поиск скрытых объектов с помощью ЭЛО.
6.3 Обучающиеся системы
6.3.1 Аппроксимация функции с помощью линейной комбинации известных функций.
6.3.2 Модель обучаемой системы. Нейронные сети
6.3.3 Задача самообучения.
6.3.4 Применение при исследовании ритмической структуры стихов.
6.4 Оптимизация систем реального времени.
6.4.1 Отслеживание дрейфа экстремума нестационарного функционала.
6.4.2 Оптимизация работы маршрутизатора.
6.4.3 Оптимизация работы сервера
6.5 Оптимизация расчетов цен опционов.
6.5.1 Рынки, акции, фьючерсы, опционы.
6.5.2 Расчет текущей цены опционов
6.6 Квантовые компьютеры и рандомизированные алгоритмы.
6.6.1 Квантовые цепи.
6.6.2 Квантовая цепь, вычисляющая аппроксимацию вектора-градиента функции.
Введение 2001 год, диссертация по информатике, вычислительной технике и управлению, Граничин, Олег Николаевич
Актуальность темы. В последнее время развитие электронной техники приблизилось к порогу создания устройств с характеристиками искусственного интеллекта. При решении многих практических задач уже сейчас появилась реальная возможность эффективного использования новых математических алгоритмов оптимизации, оценивания неизвестных параметров динамических систем, оптимального и адаптивного управления объектами. При этом возникают потребности в использовании новых алгоритмов оптимизации или оценивания для более точного решения ряда проблем, в которых ранее довольствовались достижением цели стабилизации поведения динамической системы или получения некоторого наиболее вероятного множества, содержащего вектор неизвестных параметров.
По сравнению со стандартными детерминированными методами стохастическая оптимизация значительно расширяет диапазон практических задач, для которых можно найти точное оптимальное решение. Алгоритмы типа стохастической оптимизации позволяют эффективно решать проблемы в таких областях, как анализ информационных сетей; оптимизация, основанная на моделировании; обработка изображений и распознавание образов; обучение нейронных сетей и адаптивное управление. Ожидается, что роль стохастической оптимизации будет возрастать вместе с усложнением современных систем аналогично тому, как прирост населения и истощение природных богатств инициирует использование более интенсивных технологий там, где прежде они были не нужны. Логика современного развития вычислительной техники также ведет к замене традиционных детерминированных алгоритмов стохастическими, так как уже начали появляться первые квантовые компьютеры, работающие на стохастических принципах.
Точное решение любой проблемы возможно при точной постановке задачи, но связи и отношения в реально существующем мире настолько сложны и многообразны, что практически невозможно математически строго описать многие явления. Типичным подходом в теории является выбор близкой к реальным процессам математической модели и включение в неё различных помех, относящихся, с одной стороны, к грубости математической модели и, с другой стороны, характеризующих неконтролируемые внешние возмущения на объект или систему. Во многих задачах погрешности удобно интерпретировать как помехи (ошибки) наблюдения (измерения результатов эксперимента). При разработке алгоритмов оценивания в большинстве математических исследований последних 50-ти лет помехам в измерениях или ошибкам в описании свойств модели приписываются какие-либо полезные статистические характеристики. На их основе теоретически исследуются свойства оценок. Наиболее часто предполагается, например, центрированность помех. В инженерной практике широко используются алгоритмы, основанные на идеях обыкновенного метода наименьших квадратов, представляющего собой усреднение данных наблюдения. Если при этом предположение о центрированности помех было сделано без достаточных обоснований, то практическое использование алгоритмов такого типа нецелесообразно, а иногда и вредно. Так обстоят дела, например, в условиях возможного противодействия "противника". В частности, если помеха определяется детерминированной (неслучайной) неизвестной функцией (противник глушит сигнал) или помехи измерения — зависимая случайная последовательность, то результат применения к наблюдениям обычной операции усреднения никакой полезной информации в себе не несет. Эти трудности в использовании стандартных алгоритмов стохастической оптимизации обуславливают актуальность исследований алгоритмов, обеспечивающих высокое качество оценивания при минимальных предположениях о статистических свойствах помех.
Другая близкая проблема, с которой сталкиваются при практическом применении алгоритмов оценивания и оптимизации, — недостаточная вариативность последовательности наблюдений. Например, при синтезе адаптивного управления главная цель состоит в минимизации отклонения вектора состояния системы от заданной траектории, что часто приводит к вырожденной последовательности наблюдений. Это обуславливает сложность проблемы идентификации, для успешного проведения которой должно быть обеспечено "разнообразие" наблюдений. Для "обогащения" последовательности наблюдений в ряде работ предлагается рандомизировать стратегию управления, что делает актуальным изучение свойств рандомизированных алгоритмов идентификации.
Развитие и доступность вычислительной техники оказали воздействие на классические разделы математической статистики, теории оценивания и оптимизации, стимулируя разработку и давая приоритет последовательным схемам оценивания. Так получили широкое признание рекуррентные модификации метода наименьших квадратов, фильтр Кал-мана-Бьюси, процедуры стохастической аппроксимации Роббинса-Мон-ро и Кифера-Вольфовица.
Основа многих исследований по оптимизации сходимости рекуррентных алгоритмов при наблюдениях с помехами — работы Я.З.Цыпкина и
Б.Т.Поляка. Изучению свойств стохастических алгоритмов посвящены книги М.Вазана, В.Я.Катковника, М.Б.Невельсона и Р.З.Хасьминского, А.С.Позняка, Л.Льюнга и Г.Кушнера. В ситуации нерегулярных ограниченных помех в работах А.Б.Куржанского, А.А.Красовского, В.М.Кун-цевича, Ф.Л.Черноусько, В.Н.Фомина, В.А.Якубовича и др. исследуются методы получения гарантированных множеств, содержащих оцениваемые параметры.
Идея использования случайных входных сигналов для устранения эффекта смещения была выдвинута ещё Р.Фишером в виде рандомизированного принципа планирования эксперимента. Эта идея, в частности, привела к широкому использованию алгоритмов типа случайного поиска. В русскоязычной литературе эти алгоритмы детально исследовались, например, в работах Л.А.Растригина, А.Жилинскаса, С.М.Ермакова и A.A. Жиглявского.
Систематические исследования рандомизированных алгоритмов стохастической аппроксимации начались около пятнадцати лет назад, опираясь на работы Б.Т.Поляка, А.Б.Цыбакова, Дж.Спала, А.В.Гольден-шлюгера, Х.-Ф.Чена, Л.Гао и автора диссертации. Позже состоятельность рандомизированных алгоритмов при почти произвольных помехах также исследовалась в работах Л.Льюнга с Л.Гао (1997) и Х.-Ф.Чена, Т.Дункана, Б.Пассик-Дункан (1999), опубликованных в журнале IEEE Trans, on Automat. Control.
Для идентификации неизвестных параметров устойчивого объекта управления в работе Дж.Саридиса и Г.Стейна (1968) был предложен метод, основанный на использовании пробных сигналов, модифицированный для более широкого класса объектов С.А.Агафоновым и В.Н.Фоминым (1981,1982). Модифицированный метод опирался на определенный способ перепараметризации набора неизвестных параметров, правда, размерность вводимого нового матричного параметра была слишком высокой. Автором в совместной с В.Н.Фоминым работе [13] была предложена версия метода, позволяющая минимизировать число оцениваемых параметров. При ограниченных помехах в наблюдениях новый алгоритм идентификации в сочетании с алгоритмом построения минимаксного оптимального регулятора из [9, 5] позволил синтезировать статегию адаптивного оптимального управления. Подробное решение задачи о построении минимаксного оптимального регулятора при известных параметрах объекта управления было опубликовано автором совместно с А.Е.Бараба-новым в 1984 г. ([5]). В 1987 г. аналогичный результат был опубликован М.Дахлехом и Дж.Пирсоном, и эта работа была признана лучшей статьей года в журнале IEEE Trans, on Automat. Control. Возможности идентификации замкнутых систем управления с использованием пробных сигналов в канале обратной связи исследовались и в работах Х.-Ф.Чена с Л.Гао (1986), Л.Гао (1996).
На веб-сайте http://www.jhuapl.edu/SPSA/, организованном Дж.Слалом, можно найти множество ссылок на работы, в которых рандомизированные алгоритмы стохастической аппроксимации используются в практических приложениях.
Цель работы. Главная цель диссертационного исследования — развитие нового направления в теории стохастической оптимизации и оценивания, связанного с исследованием рандомизированных алгоритмов и обоснованием состоятельности их оценок без обычных предположений о центрированности и независимости помех наблюдения.
Эта цель предполагает разработку способов представления рандомизированных алгоритмов для решения задач минимизации функционалов типа среднего риска, оценивания параметров линейных моделей, слежения за изменяющимися во времени параметрами, фильтрации сигналов и идентификации неизвестных параметров объектов управления, а также выработку методики анализа их эффективности и доказательство состоятельности их оценок при почти произвольных помехах.
Методы исследования. В работе используются методы теории оценивания и оптимизации, математической статистики, теории управления, теории устойчивости, а также компьютерное моделирование.
Научная новизна. В работе получены результаты, дополняющие существующую теорию оценивания и стохастической оптимизации некоторыми новыми понятиями, теоретическими утверждениями общего порядка и эффективными алгоритмами решения задач оптимизации и оценивания. Все выносимые на защиту утверждения и доказательства являются новыми и принадлежат автору.
Практическая ценность. Следящие системы, системы автосопровождения, демпфирования, анализа информационных сетей, обработки изображений, распознавания образов, настройки нейронных сетей и адаптивного управления являются по существу системами подавления возмущений. Они широко распространены в электротехнике и механике, применяются всюду, где требуется повышение точности работы устройств. Точная формулировка ограничений на неопределенности для конкретной технической задачи осуществляется специалистом в предметной области, а возникающие математические проблемы должны иметь решение, доведенное до вычислительных алгоритмов. Данная работа содержит набор таких математических задач и алгоритмов расчета решений.
Особое внимание в диссертации уделено вопросам практической реализации алгоритмов. Работоспособность предлагаемых новых алгоритмов в условиях нестатистических ограниченных помех продемонстрирована значительным количеством примеров имитационного моделирования на ЭВМ.
В работе подробно рассмотрены следующие задачи: обнаружение полезного сигнала в условиях противодействия противника (п. 2.4), предсказание значений скалярного случайного процесса (п. 4.3.1), определение некоторых элементов химического состава мишеней (п. 6.1), оптимизация процесса настройки параметров двухуровневой нейронной сети (п. 6.3.2), оптимизация подбора параметров входных строк в модели реконструктивного моделирования стихосложения (п. 6.3.4), оптимизация работы маршрутизатора (п. 6.4.2), оптимизация работы сервера, обслуживающего очередь заданий (п. 6.4.3), оптимизация определения параметров кривой волатильности для расчета цен опционов в биржевой торговле (п. 6.5), идентификация неизвестных параметров и адаптивное субоптимальное управление дискретным динамическим объектом при ограниченных помехах (п. 7.4).
Апробация работы. Основные результаты работы докладывались на следующих научных конференциях: всесоюзная конференция "Теория адаптивных систем и её приложения" (Ленинград, 1983), 3-я международная школа "Анализ данных, ориентированный на модели" (С.-Петербург, 1992), международная конференция "Аппроксимация, вероятность и близкие вопросы" (Санта-Барбара, США, 1993), 2-ая, 3-я и 4-ая С.-Петербургские школы по моделированию (С.-Петербург, 1996, 1998, 2001), 6-ой С.-Петербургский симпозиум по теории адаптивных систем (С.-Петербург, 1999), 4-ая Пекинская международная конференция "Моделирование систем и научные вычисления" (Пекин, КНР, 1999), международная конференция "Имитационное моделирование, управление и вычисления" (Токио, Япония, 2000), 4-ая Российско-шведская конференция по управлению (Москва, 2001), а также на семинарах в Свободном университете г.Берлин (Германия, 1992), Институте системного анализа АН Китая (Пекин, КНР, 1999), Институте проблем управления им.В.А.Трапезникова РАН (Москва, 2000), Российском государственном педагогическом университете им.А.И.Герцена (С.-Петербург, 2001) и С.-Петербургском государственном университете (1987, 1991, 2001).
Публикации. Результаты работы представлены в 25 публикациях.
Структура и объем диссертации. Диссертация состоит из введения, семи глав, заключения, приложения и списка литературы общим объёмом 250 страниц. Список литературы содержит 175 наименований.
Заключение диссертация на тему "Рандомизированные алгоритмы оценивания и оптимизации при произвольных помехах"
Заключение
На защиту выносятся следующие результаты:
1. Рандомизированный алгоритм стохастической аппроксимации для оценивания параметров линейной регрессии и условия состоятельности его оценок (п. 2.2, теорема 2.1).
2. Вид предельной ковариационной матрицы ошибок оценивания параметров линейной регрессии по рандомизированному алгоритму стохастической аппроксимации (п. 2.2, теорема 2.2), оптимальный выбор параметров алгоритма.
3. Рандомизированный алгоритм стохастической аппроксимации с усреднениями для оценивания параметров линейной регрессии и условия состоятельности его оценок (п. 2.2, теорема 2.3).
4. Рандомизированный вариант метода наименьших квадратов для оценивания параметров линейной регрессии и условия состоятельности его оценок (п. 2.3, теорема 2.4).
5. Рандомизированный алгоритм идентификации неизвестных параметров линейного дискретного динамического объекта управления, подверженного действию ограниченных возмущений, при включении пробного возмущения через канал управления; способ перепараметризации набора неизвестных параметров; условия состоятельности оценок (п. 3.3, теорема 3.2).
6. Рандомизированный алгоритм для определения прогнозирующей оценки случайного процесса, порождаемого устойчивым линейным фильтром и наблюдаемого на фоне неизвестных, но ограниченных детерминированных помех. Анализ среднеквадратичного отклонения оценок (п. 4.1, теорема 4.1) и формула для оптимального значения размера шага алгоритма.
7. Анализ поведения оценок рандомизированного алгоритма стохастической аппроксимации с постоянным шагом для отслеживания изменений параметров линейной регрессии при неизвестных, но ограниченных детерминированных помехах, формула для оптимального размера шага алгоритма (п. 4.2, теорема 4.3).
8. Общий вид трех типов рандомизированных алгоритмов стохастической аппроксимации с одним или двумя измерениями и условия состоятельности их оценок в задаче минимизации функционала среднего риска п. 5.1, теорема 5.1).
9. Оптимальные, в смысле асимптотической скорости сходимости, варианты рандомизированных алгоритмов стохастической аппроксимации и условия, при которых их оценки в задаче минимизации функционала среднего риска достигают наилучшей асимптотической скорости сходимости (п. 5.1, теорема 5.2).
10. Способ построения субоптимального линейного стабилизирующего регулятора, минимизирующего предельное максимально возможное отклонение выхода линейного дискретного динамического объекта от заданной траектории, при известных его параметрах (п. 7.3, леммы 7.17.3).
11. Способ синтеза адаптивной субоптимальной стратегии управления, основанной на использовании пробных сигналов в канале обратной связи, для линейного дискретного динамического объекта, подверженного действию ограниченных возмущений, при априорной неопределенности о параметрах; условия достижения объектом цели управления (п. 7.3, теорема 7.1).
Библиография Граничин, Олег Николаевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Агафонов С.А. Алгоритм стохастической аппроксимации с возмущением на входе в задаче адаптивного управления линейным объектом. Л., 1981. Деп. в ВИНИТИ от 15 декабря 1981 г., No. 568281, 28 с.
2. Агафонов С.А., Фомин В.Н. Идентификация объектов управления с использованием пробных сигналов. Л., 1982. Деп. в ВИНИТИ от 3 августа 1982 г., No. 4226-82, 22 с.
3. Алберт, А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977, 223 с.
4. Барабанов А.Е. Оптимальное управление неминимально-фазовым дискретным объектом с произвольными ограниченными помехами // Вестн. Ленинград, ун-та, сер. 1, 1980, вып. 3, с. 119-120.
5. Барабанов А.Е., Граничин О.Н. Оптимальный регулятор линейного объекта с ограниченной помехой // Автоматика и телемеханика, 1984, No. 5, с. 39-46.
6. Вазан М. Стохастическая аппроксимация. М.: Мир, 1972.
7. Валкейла Э., Мельников A.B. Мартингальные модели стохастической аппроксимации и их сходимость // Теория вероятностей и её применения, 1999, вып. 2, с. 278-311.
8. Гапошкин В.Г., Красулина Т.П. О законе повторного логарифма для процессов стохастической аппроксимации // Теория вероятностей и её применения, 1974, вып. 4, с. 879-886.
9. Граничин О.Н. Оптимальное управление линейным объектом с нерегулярными ограниченными помехами // В сб.: Тезисы докладов и сообщений Всесоюзной конференции "Теория адаптивных систем и её применения", Москва-Ленинград, 1983, с. 26.
10. Граничин О.Н., Фомин В.Н. Синтез адаптивного управления с использованием пробных сигналов в канале обратной связи. Л., 1984. Деп. в ВИНИТИ, No. 1339-84В, 19 с.
11. Граничин О.Н., Фомин В.Н. Минимаксная оптимизация управления объектом на бесконечном промежутке времени. Л., 1985. Деп. в ВИНИТИ, No. 4851-85, 29 с.
12. Граничин О.Н., Фомин В.Н. Адаптивное управление с использованием пробных сигналов // Автоматика и телемеханика, 1986, No. 2, с. 100-112.
13. Граничин О.Н., Фомин В.Н. Метод динамического программирования в задаче минимаксного управления // Вестник Ленингр. ун-та, сер. 1, 1986, вып. 1, с. 26-30.
14. Граничин О.Н. Алгоритм стохастической аппроксимации с возмущением на входе для идентификации статического нестационарного объекта // Вестник Ленингр. ун-та, сер. 1, 1988, вып. 3, с. 92-93.
15. Граничин О.Н. Стохастическая аппроксимация с возмущением на входе при зависимых помехах наблюдения // Вестник Ленингр. унта, сер. 1, 1989, вып. 4, с. 27-31.
16. Граничин О.Н. Построение субоптимального регулятора линейного объекта с ограниченной помехой // Автоматика и телемеханика, 1990, No. 2, с. 59-62.
17. Граничин О.Н. Процедура стохастической аппроксимации с возмущением на входе // Автоматика и телемеханика, 1992, No. 2, с. 97-104.
18. Граничин О.Н. Оценивание точки минимума неизвестной функции, наблюдаемой на фоне зависимых помех // Проблемы передачи информации, 1992, No 2, с. 16-20.
19. Граничин О.Н., Волков A.A. Стохастические свойства динамических систем в механике. Учебное пособие. С.-Пб.: СПбГУ, 1996, 26 с.
20. Граничим, О.Н., Кривулин H.K. Моделирование нерегулярных явлений в динамических механических системах. Учебно-методическое пособие. С.-Пб.: Изд-во С.-Петерб. университета, 1997, 32 с.
21. Граничин О.Н., Лившиц А.Н., Соловьев В.Ф. О некоторых принципах создания робота познания // В сб.тр.: "Первой межд. конф. по мехатронике и робототехнике". С.-Петербург, 2000, т. 2, с. 83-86.
22. Граничин O.E. Построение дискретного субоптимального регулятора непрерывного объекта с нерегулярной ограниченной помехой // Автоматика и телемеханика, 2001, No. 3, с. 86-94.
23. Ермаков С.М. Метод Монте-Карло и смежные вопросы. М.:Наука, 1975, 471 с.
24. Ермаков С.М., Жиглявский A.A. Математическая теория оптимального эксперимента. М.:Наука, 1987, 320 с.
25. Ермольев Ю.М. О методе обобщенных стохастических градиентов и стохастических квазифейеровских последовательностях // Кибернетика, 1969, No. 2, с. 73-83.
26. Жилинскас А. Глобальная оптимизация. Вильнюс: Мокслас, 1986, 165с.
27. Катковник В. Я. Линейные оценки и стохастические задачи оптимизации. М.: Наука, 1976, 487 с.
28. Коган М.М., Неймарк Ю.И. Адаптивное управление. Горький: Изд-во ГГУ, 1987, 57 с.
29. Колесников Е.К., Курышев А.П., Мануйлов A.C. Активный дистанционный рентгеноспектральный анализ поверхностных пород небесных тел //В кн.: "Методы рентгеноспектрального анализа". Новосибирск: Наука, 1986, с. 85-93.
30. Колмогоров А.Н. Интерполирование и экстраполирование стационарных случайных последовательностей // Известия АН СССР, сер. матем., 1941, No. 5, с. 3-14.
31. Коростелев А.П. Стохастические рекуррентные процедуры: локальные свойства. М.: Наука, 1984, 208 с.
32. Котельников В.А. Теория потенциальной помехоустойчивости. М.: Госэнергоиздат, 1956, 151 с.
33. Красноперова М.А. Основы реконструктивного моделирования стихосложения. С.-Пб.: Изд-во С.-Петерб. университета, 2000, 237 с.
34. Красовский A.A., Белоглазое И.Н., Чигин Г.П. Теория корреляционно-экстремальных навигационных систем. М.: Наука, 1979, 447 с.
35. Красовский A.A. Справочник по теории автоматического управления. М.: Наука, 1987, 712 с.
36. Кунцевич В.М., Лычак М.М. Синтез оптимальных и адаптивных систем управления. Игровой подход. Киев: Наукова думка, 1985, 248 с.
37. Куржанский А.Б. Управление и наблюдения в условиях неопределенности. М.: Наука, 1977, 392 с.
38. Лъюнг Л., Сёдерстрём Т. Идентификация систем: теория для пользователя. М.: Наука, 1991, 431 с.
39. Марков A.A. Исчисление вероятностей. М.: ГИЗ, 1924.
40. Михалевич B.C., Гупал А.М., Норкин В.И. Методы невыпуклой оптимизации. М.: Наука, 1987, 279 с.
41. Невелъсон М.Б., Хасъминский Р.З. Стохастическая аппроксимация и рекуррентное оценивание. М.: Наука, 1972, 304 с.
42. Острем К., Виттенмарк В. Системы управления с ЭВМ. М.: Наука, 1987, 480 с.
43. Позняк A.C., Назин A.B. Адаптивный выбор вариантов. Рекуррентные алгоритмы. М.: Наука, 1986, 288 с.
44. Поляк Б. Т. Сходимость и скорость сходимости итеративных стохастических алгоритмов. 1. Общий случай // Автоматика и телемеханика, 1976, No 12, с. 83-94.
45. Поляк Б. Т. Сходимость и скорость сходимости итеративных стохастических алгоритмов. 2. Линейный случай // Автоматика и телемеханика, 1977, No. 4, с. 101-107.
46. Поляк Б. Т., Цыпкин Я.З. Адаптивные алгоритмы оценивания (сходимость, оптимальность, устойчивость) // Автоматика и телемеханика, 1979, No 3, с. 71-84.
47. Поляк Б.Т., Цыпкин Я.З. Оптимальные псевдоградиентные алгоритмы адаптации // Автоматика и телемеханика, 1981, No 8, с. 7484.
48. Поляк Б. Т., Цыпкин Я.З. Робастные псевдоградиентные алгоритмы адаптации // Автоматика и телемеханика, 1981, No 10, с. 91-97.
49. Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983.
50. Поляк Б.Т., Цыбаков А.Б. Оптимальные порядки точности поисковых алгоритмов стохастической аппроксимации // Проблемы передачи информации, 1990, No 2, с. 45-53.
51. Поляк Б. Т. Новый метод типа стохастической аппроксимации // Автоматика и телемеханика, 1990, No 7, с. 98-108.
52. Растригин Л.А. Случайный поиск. М.: Знание, 1979, 64 с.
53. Стратонович A.JI. Применение теории марковских процессов для оптимальной фильтрации сигналов / / Радиотехника и электроника, 1960, No. 11, с. 1751-1763.
54. Урясъев С. П. Адаптивные алгоритмы стохастической оптимизации и теории игр. М.:Наука, 1990, 182 с.
55. Фаддеев Л.Д., Якубовский O.A. Лекции по квантовой механике для студентов-математиков. Л.: Изд-во ЛГУ, 1980, 200 с.
56. Фелъдбаум A.A. О проблемах дуального управления //В кн.: "Методы оптимизации автоматических систем". М.: Наука, 1972, с. 89108.
57. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981, 448 с.
58. Фомин В.Н. Рекуррентное оценивание и адаптивная фильтрация. М.: Наука. 1984, 288 с.
59. Фомин В.Н. Методы управления линейными дискретными объектами. Л.: Изд-во Ленингр. ун-та, 1985, 336 с.
60. Фомин В.Н. Операторные методы теории линейной фильтрации случайных процессов. С.-Пб.: Изд-во СПбГУ, 1996, 306 с.
61. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.
62. Цыпкин Я.З. Информационная теория идентификации. М.: Наука, 1995.
63. Черноусько Ф.Л. Оценивание фазового состояния динамических систем: метод эллипсоидов. М.: Наука, 1988, 319 с.
64. Ширяев А.Н. Вероятность. М.: Наука, 1980, 574 с.
65. Ширяев А.Н. Основы стохастической финансовой математики, том 2, теория. М.: Фазис, 1998, 1017 с.
66. Якубович Е.Д. Решение одной задачи оптимального управления дискретной линейной системой // Автоматика и телемеханика, 1975, No. 9, с. 73-79.
67. Якубович Е.Д. Оптимальное управление линейной дискретной системой при наличии неизмеряемого возмущения // Автоматика и телемеханика, 1977, No. 4, с. 49-54.
68. Alessandri A., Parisini T. Nonlinear Modelling of Complex Large-Scale Plants Using Neural Networks and Stochastic Approximation // IEEE Transactions on Systems, Man, and Cybernetics. A, 1997, vol. 27, pp. 750-757.
69. APS Study: Science and Technology of Directed Energy Weapons // Rev. Mod. Phys., July 1987, vol. 59, No. 3, Part II.
70. Bai E-W., Yinyu Y., Tempo R. Bounded Error Parameter Estimator A Sequential Analytic Center Approach // IEEE Transactions on Automatic Control, 1999, vol. 44, No. 6, pp. 1107-1117.
71. Bennet C.H., Shor P.W. Quantum Information Theory // IEEE Transactions on Information Theory, 1988, vol. 44, pp. 2724-2742.
72. Blum J.R. Multidimensional Stochastic Appoximation // Ann. Math. Statist., 1954, vol. 9, pp. 737-744.
73. Bode H. W., Shannon C.E. A Simplified Derivation of Linear Least Square Smoothing and Prediction Theory // Proc. IRE, 1950, No. 38, pp. 417-425.
74. Busy R.S., Kalman R.E. New Results In Linear Filtering and Prediction Theory // J.Basic.Eng. ASME, 1961, vol. 83, No. 1, pp. 95-108.
75. Cauwenberghs G. Analog VLSI Autonomous Systems for Learning and Optimization. Ph.D. thesis, California Institute of Technology, 1994.
76. Chen H.F., Guo L. Convergence Rate of Least-squares Stochastic Systems // Int. Journal of Control, 1986, vol. 44, No. 5, pp. 1459-1477.
77. Chen H.F. Lower Rate of Convergence for Locating a Maximum of a Function // Ann. Statist., 1988, vol. 16, pp. 1330-1334.
78. Chen H.F., Duncan T.E., Pasik-Duncan B. A Kiefer-Wolfowitz Algorithm with Randomized Differences // IEEE Transactions on Automatic Control, 1999, vol. 44, No. 3, pp. 442-453.
79. Chin D. C. A More Efficient Global Optimization Algorithm Based on Styblinski and Tang // Neural Networks, 1994, vol. 7, pp. 573-574.
80. Chin D.C., Smith R.H. A Traffic Simulation for Mid-Manhattan with Model-Free Adaptive Signal Control // In: Proceedings of the Summer Computer Simulation Conference. 1994, pp. 296-301.
81. Chin D.C. Efficient Identification Procedure for Inversion Processing //In: Proceedings of the IEEE Conference on Decision and Control. 1996, pp. 3129-3130.
82. Chin D. C. Comparative Study of Stochastic Algorithms for System Optimization Based on Gradient Approximations // IEEE Transactions on Systems, Man, and Cybernetics. B, 1997, vol. 27, pp. 244-249.
83. Chin D.C., Srinivasan R. Electrical Conductivity Object Locator: Location of Small Objects Buried at Shallow Depths // In: Proceedings of the Unexploded Ordnance (UXO) Conference. 1997, pp. 50-57.
84. Chin D.C., Spall J.C., Smith R.H. Evaluation and Practical Consideration for the S-TRAC System-Wide Traffic Signal Controller. Transportation Research Board 77-th Annual Meeting, 1998, Preprint 981230.
85. Chin D. C. The Simultaneous Perturbation Method for Processing Mag-netospheric Images // Optical Engineering, 1999, vol. 38, pp. 606-611.
86. Dippon J., Renz J. Weighted Means in Stochastic Approximation of Minima // SIAM Journal of Control and Optimization, 1997, vol. 35, pp. 1811-1827.
87. Fabian V. Stochastic approximation of minima with improved asymptotic speed // Ann. Math. Statist., 1967, vol. 38, pp. 191-200.
88. Fisher R.A. The Design of Experiments. Edinburgh: Oliver and Boyd, 1935.
89. Fu M.C., Hill S.D. Optimization of Discrete Event Systems via Simultaneous Perturbation Stochastic Approximation // Transactions of the Institute of Industrial Engineers, 1997, vol. 29, pp. 233-243.
90. Gerencser L. Convergence Rate of Moments in Stochastic Approximation with Simultaneous Perturbation Gradient Approximation and Resetting // IEEE Transactions on Automatic Control, 1999, vol. 44, pp. 894-905.
91. Gerencser L., Kozmann G., Vago Z. SPS A for Non-Smooth Optimization with Application in ECG Analysis //In: Proceedings of the IEEE Conference on Decision and Control. 1998, Tampa, FL., pp. 3907-3908.
92. Goldenshluger A.V., Polyak B. T. Estimation of Regression Parameters with aArbitrary Noise // Mathematical Methods of Statistics, 1993, vol. 2, No. 1, pp. 18-29.
93. Goodwin G.C., Ramandge P. J., Caines P.E. Discrete Time Stochastic Adaptive Control // SIAM J. Contr. Optimiz., 1981, vol. 19, pp. 829853.
94. Goodwin G.C., Ninness B., Cockerell P., Saigado M. Illustration of an Integrated Approach to Adaptive Control // Int. J. Adaptive Control Signal Process, 1990, vol. 4, pp. 149-162.
95. Granichin O.N., Portnov A. Monochromatic Wave Direction Estimation // In: Proceedings of the 3-rd International Workshop on Model Oriented Data Analysis (MODA-3). St. Petersburg, 1992, pp. 12-13.
96. Granichin O.N., Portnov A. Asimptotic-optimality Stochastic Approximation Algorithms with Perturbation on the Input // In: Proceedings of the 2-nd Workshop on Simulation. St. Petersburg, 1996, pp. 322-327.
97. Granichin O.N. Best Strategy for Robbins-Monro Stochastic Approximation Algorithm // In: Proceedings of the 3-rd St. Petersburg Workshop on Simulation. St. Petersburg, 1998, pp. 428-431.
98. Granichin O.N., Fomin V.N. Adaptive Control with Test Signals // In: Proceedings of the 6-th St. Petersburg Symposium on Adaptive Systems Theory. St. Petersburg, 1999, vol. 1, pp. 73-78.
99. Granichin O.N., Fomin V.N. Adaptive Control with Exciting Signals // In: Proceedings of the 4-th Beijing Int. Conf. on System Simulation and Scientific Computing. Beijing, China, 1999, pp. 173-177.
100. Granichin O.N. Stochastic Approximation with Exciting Perturbation under Dependent Noises // In: Proceedings of the 2-nd Int. Conf. Control of Oscillations and Chaos. St. Petersburg, 2000, vol. 1, pp. 146149.
101. Granichin O.N. Unknown Parameters Identification With Excite Test Signals // In: Proceedings of the JSST Int. Conf. on Modeling, Control and Computation in Simulation (JSST'2000). Tokyo, Japan, pp. 248251.
102. Granichin O.N. Regression Parameters Estimation Under Arbitrary Noise //In: Proceedings of the 4-th St. Petersburg Workshop on Simulation. St. Petersburg, 2001, pp. 221-226.
103. Gydrfi L. Stochastic Approximation from Ergodic Sample for Linear Regression // Z. Wahrscti. Verw. Geb., 1980, vol. 54, pp. 47-55.
104. Guo L. Stability of Recursive Stochastic Tracking Algorithms // SIAM J.Contr. Optimization, 1994, vol. 32, pp. 1195-1225.
105. Guo L., Ljung L. Performance Analysis of General Tracking Algorithms // IEEE Transactions on Automatic Control, 1995, vol. 40, No. 8, pp. 1388-1402.
106. Guo L. Self-Convergence of Weighted Least-Squares with Applications to Stochastic Adaptive Control // IEEE Transactions on Automatic Control, 1996, vol. 41, No. 1, pp. 79-89.
107. Guo L., Ljung L., Wang G-J. Necessary and Sufficient Conditions for Stability of LMS // IEEE Transactions on Automatic Control, 1997, vol. 42, No. 6, pp. 761-770.
108. Haykin S., Neural Networks: A Comprehensive Foundation. New York: Macmillan, 1984.
109. Heydon B.D., Hill S.D., Havermans C.C. Maximizing Target Damage Through Optimal Aim Point Patterning // In: Proc. AIAA Conf. on Missille Sciences. Monterey, 1998, CA.
110. Hill S.D., Fu M.C. Transfer Optimization via Simultaneous Perturbation Stochastic Approximation // In: Proceedings of the Winter Simulation Conference, Alexopoulos C., Kang K., Lilegdon W.R., Golds-man D. eds. 1995, pp. 242-249.
111. Hill S.D., Heydon B.D. Optimal Aim Point Patterning. Report SSD/PM-97-0448, JHU/APL, Laurel, 1997, MD.
112. Hopkins H.S. Experimental Measurement of a 4-D Phase Space Map of a Heavy Ion Beam. Ph.D. thesis, Dept. of Nuclear Engineering, University of California (Berkeley), December 1997.
113. Ji X.D., Familoni B.D. A Diagonal Recurrent Neural Network-Based Hybrid Direct Adaptive SPSA Control System // IEEE Transactions on Automatic Control, 1999, vol. 44, pp. 1469-1473.
114. Khammash M. A New Approach to the Solution of the i\ Control Problem: The Scaled-Q Method // IEEE Transactions on Automatic Control, 2000, vol. 45, No. 2, pp. 180-187.
115. Kiefer J., Wolfowitz J. Statistical Estimation on the Maximum of a Regression Function // Ann. Math. Statist., 1952, vol. 23, pp. 462466.
116. Kleinman N.L., Hill S.D., Ilenda V.A. SPSA/SIMMOD Optimization of Air Traffic Delay Cost //In: Proceedings of the American Control Conference. 1997, pp. 1121-1125.
117. Krieger A., Masry E. Convergence Analysis of Adaptive Linear Estimation for Dependent Stationary Processes // IEEE Transactions on Information Theory, 1988, vol. 34, pp. 177-182.
118. Kushner H.J., Clark D.S. Stochastic Approximation Methods for Constrained and Unconstrained Systems. Berlin-Germany: SpringerVerlag, 1978, 259 p.
119. Kushner H.J., Yin G.G. Stochastic Approximation Algorithms and Applications. New York: Springer-Verlag, 1997, 415 p.
120. Landau I.D., Karimi A. A Recursive Algorithm for ARM AX Model Identification in Closed Loop // IEEE Transactions on Automatic Control, 1997, vol. 42, No. 10, pp. 1442-1447.
121. Lai T.L., Wei C.-Z. Extended Least Squares and Their Applications to Adaptive Control and Prediction in Linear Systems // IEEE Transactions on Automatic Control, 1986, vol. 31, No. 10, pp. 899-907.
122. Ljung L. Analysis of Recursive Stochastic Algorithms // IEEE Transactions on Automatic Control, 1977, vol. 22, pp. 551-575.
123. Ljung L. System Identification Theory for the User. Prentice-Hall, En-glewood Cliffs, NJ, 1986.
124. Ljung L., Guo L. The Role of Model Validation for Assessing the Size of the Unmodeled Dynamics // IEEE Transactions on Automatic Control, 1997, vol. 42, No. 9, pp. 1230-1239.
125. Luman R.R. Quantitative Decision Support for Upgrading Complex Systems of Systems. Ph.D. thesis, School of Engineering and Applied Science, 1997, George Washington University.
126. Maeda Y, Kanata Y. Learning Rules for Reccurent Neural Networks Using Perturbation and their Application to Neuro-control // Transactions of IEE of Japan, 1993, vol. 113-C, pp. 402-408.
127. Maeda Y., Kanata Y. Extended Adaptive Robbins-Monro Procedure Using Simultaneous Perturbation for a Least-Square Approximation Problem // In: Proceedings of the Asian Control Conference. 1994, pp. 383-386.
128. Maeda Y., Hirano H., Kanata Y. A Learning Rule of Neural Networks via Simultaneous Perturbation and its Hardware Implementation // Neural Networks, 1995, vol. 8, pp. 251-259.
129. Maeda Y. Time Difference Simultaneous Perturbation Method // Electronics Letters, 1996, vol. 32, pp. 1016-1018.
130. Maeda Y., De Figueiredo R.J. Learning Rules for Neuro-Controller via Simultaneous Perturbation // IEEE Transactions on Neural Networks, 1997, vol. 8, pp. 1119-1130.
131. Maeda Y., Nakazawa A., Yakichi K. Hardware Implementation of a Pulse Density Neural Network Using Simultaneous Perturbation Learning Rule // Analog Intergrated Circuits and Signal Processing, 1999, vol. 18, pp. 153-162.
132. Maryak J.L., Chin D.C. Stochastic Approximation for Global Random Optimization // In: Proceedings of the American Control Conference. 2000, pp. 3294-3298.
133. Maryak J.L., Smith R.H., Wvnslow R.L. Modeling Cardiac Ion Channel Conductivity: Model Fitting Via Simulation // In: Proceedings of the Winter Simulation Conference, Medeiros D.J., Watson E.F. eds. 1998, pp. 1587-1590.
134. Ruppert D. Stochastic Approximation // In: Handbook in Sequential Analysis, Ghosh B.K., Sen P.K. eds. New York: Marcel Dekker, 1991, pp. 503-529.
135. Sadegh P. Constrained Optimization via Stochastic Approximation with a Simultaneous Perturbation Gradient Approximation // Automatica, 1997, vol. 33, pp. 889-892.
136. Sadegh P., Spall J.C. Optimal Sensor Configuration for Complex Systems // In: Proceedings of the American Control Conference. 1998, pp. 3575-3579.
137. Sadegh P., Spall J.C. Optimal Random Perturbations for Stochastic Approximation using a Simultaneous Perturbation Gradient Approximation // IEEE Transactions on Automatic Control, 1998, vol. 43, No. 10, pp. 1480-1484.
138. Saridis G.M., Stein G. A New Algorithm for Linear System Identification // IEEE Transactions on Automatic Control, 1968, vol. AC-13, No. 4, pp. 592-584.
139. Saridis G.M., Lobbia R.N. Parameter Identification and Control of Linear Discrete-time System // IEEE Transactions on Automatic Control, 1972, vol. AC-17, No. 1, pp. 52-60.
140. Saridis G.M., Lobbia R.N. Comment on "Parameter Identification and Control of Linear Discrete-time System" // IEEE Transactions on Automatic Control, 1975, vol. AC-20, No. 3, p. 442.
141. Schweppe F.C. Uncertain Dynamic Systems. Prentic-Hall, 1973, 563 p.
142. Shor P. W. Quantum Computing // In: Proceedings of the 9-th Int. Math. Congress. Berlin, 1998, www.math.nine.edu/documenta/xvol-icm/Fields/Fields.html.
143. Sokolov V.F. Adaptive Suboptimal Control of a Linear System with Bounded Disturbances // Systems Control Letters, 1985, vol. 6, pp. 9398.
144. Sokolov V.F. Adaptive ix Robust Control for SISO Systems // Systems Control Letters, 2001, vol. 42, pp. 379-393.
145. Spall J. C. A Stochastic Approximation Technique for Generating Maximum Likelihood Parameter Estimates // In: Proceedings of the American Control Conference. 1987, pp. 1161-1167.
146. Spall J.C. Multivariate Stochastic Approximation Using a Simultaneous Perturbation Gradient Approximation // IEEE Transactions on Automatic Control, 1992, vol. 37, pp. 332-341.
147. Spall J.C., Cristion J.A. Nonlinear Adaptive Control Using Neural Networks: Estimation Based on a Smoothed Form of Simultaneous Perturbation Gradient Approximation // Statistica Sinica, 1994, vol. 4, pp. 1-27.
148. Spall J.C. A One-Measurement Form of Simultaneous Perturbation Stochastic Approximation // Automatica, 1997, vol. 33, pp. 109-112.
149. Spall J.C. Accelerated Second-Order Stochastic Optimization Using Only Function Measurements //In: Proceedings of the 36-th IEEE Conference on Decision and Control. 1997, pp. 1417-1424.
150. Spall J.C., Chin D.C. Traffic-Responsive Signal Timing for System-Wide Traffic Control // Transp. Res., Part C, 1997, pp. 153-163.
151. Spall J.C. Implementation of the Simultaneous Perturbation Algorithm for Stochastic Optimization // IEEE Transactions on Aerospace and Electronic Systems, 1998, vol. 34, pp. 817-823.
152. Spall J.C. An Overview of the Simultaneous Perturbation Method for Efficient Optimization / / Johns Hopkins APL Technical Digest, 1998, vol. 19, pp. 482-492, http: //techdigest.jhuapl.edu/td/tdl904/spall.pdf.
153. Spall J.C., Cristion J.A. Model-Free Control of Nonlinear Stochastic Systems with Discrete-Time Measurements // IEEE Transactions on Automatic Control, 1998, vol. 43, pp. 1198-1210.
154. Spall J.C. Adaptive Stochastic Approximation by the Simultaneous Perturbation Method // IEEE Transactions on Automatic Control, 2000, vol. 45, No. 10 , pp. 1839-1853.
155. Vidyasagar M. Statistical Learning Theory and Randomized Algorithms for Control // IEEE Control Systems , 1998, No 12, pp. 69-85.
156. Wang I.-J., Chong E. A Deterministic Analysis of Stochastic Approximation with Randomized Directions // IEEE Transactions on Automatic Control, 1998, vol. 43, pp. 1749-1749.
157. Weiner N. The Extrapolation, Interpolation and Smoothing of Stationary Time Series with Engineering Application. New York: Technology Press and Wiley, 1949.
158. White H. Artifical Neural Networks. Oxford: Blackwell, UK, 1992.
159. Young P. C. Recursive Estimation and Time-Series Analysis. An Indro-duction. Berlin-Heidelberg: Springer, 1984.
-
Похожие работы
- Рандомизированные алгоритмы стохастической оптимизации и их применение для повышения эффективности работы вычислительных комплексов и сетей
- Математическое обеспечение микрокомпьютеров мобильных объектов с групповым взаимодействием
- Рекуррентный алгоритм моделирования многомерных по входу линейных динамических систем с помехами во входных и выходных сигналах
- Алгоритмы и устройства фильтрации дискретно-непрерывных сигналов, устойчивые к действию негауссовских помех
- Разработка и исследование оптимальных на классе адаптивных поисковых алгоритмов в условиях коррелированных помех
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность