автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Методы анализа и идентификации неопределенных моделей эксперимента
Автореферат диссертации по теме "Методы анализа и идентификации неопределенных моделей эксперимента"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М. В. ЛОМОНОСОВА ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ
На правах рукописи
Кольцов Дмитрий Анатольевич
МЕТОДЫ АНАЛИЗА И ИДЕНТИФИКАЦИИ НЕОПРЕДЕЛЕННЫХ МОДЕЛЕЙ ЭКСПЕРИМЕНТА
Специальность 05.13.18 — Математическое моделирование, численные методы и комплексы программ
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2006 г.
Работа выполнена на кафедре компьютерных методов физики Физического факультета Московского Государственного Университета им. М. В. Ломоносова
Научный руководитель: кандидат физико-математических наук, доцент М. Л. Сердобольская
Официальные оппоненты: доктор физико-математических наук, профессор Э. Э. Гасанов доктор физико-математических наук, профессор П. В. Голубцов
Ведущая организация: Институт Прикладной Математики им. М.В. Келдыша Российской Академии Наук (ИПМ РАН)
Защита состоится 2006 г. в -З^^^на заседании Диссертационного
Совета К 501.001.17 при Мтсковском Государственном Университете им.М.В.Ломоносова (г. Москва, Ленинские горы, МГУ, Физический факультет, ауд. ).
С диссертацией можно ознакомиться в библиотеке Физического факультета МГУ.
Автореферат разослан
2006 г.
Ученый секретарь
Диссертационного Совета К 501.001.17 -
д.ф.-м.н., профессор —" П. А. Поляков
Общая характеристика работы Актуальность темы
В настоящее время математические модели эксперимента описывают довольно сложные явления и процессы. Это является одной из причин того, что модели эксперимента не могут быть заданы точно (являются неопределенными). В рамках измерительного эксперимента будем говорить о неопределенной модели измерений. При этом отметим, что ошибочное решение при выборе модели или неадекватный выбор класса возможных моделей могут привести к неверным результатам анализа и интерпретации данных эксперимента. Поэтому методы анализа и идентификации неопределенных моделей измерений составляют существенную часть математического моделирования, и полученные на их основе результаты являются чрезвычайно важными при экспериментальных исследованиях. Традиционно неопределенность связывается с незнанием конкретной модели измерений из некоторого априори заданного класса или с неуверенностью в истинности самого класса. При изучении новых типов явлений или при появлении новых способов их изучения может понадобиться введение нового понятия неопределенности модели измерений и переход на новый уровень ее (неопределенности) анализа.
Зачастую исследователь располагает несколькими способами изучения интересующего его явления, и каждому из них он сопоставляет свою неопределенную модель измерений. Предположение о наличии некоторой неизвестной априори связи между этими моделями требует более высокого уровня описания неопределенности. При этом остается открытым вопрос, как изменится качество алгоритма анализа и идентификации объединенной неопределенной модели измерений, построенной на основе отдельных неопределенных моделей измерений, если использовать дополнительную информацию о связи отдельных моделей.
Другой более высокий уровень неопределенности может быть связан с тем, что, во-первых, неизвестен класс, к которому принадлежит модель отдельного измерения, и, во-вторых, неизвестно, существует ли закономерность, определяющая соответствие номера отдельного измерения в последовательности наблюдений и конкретной его модели. В этих случаях мы будем говорить о нестационарной неопределенной модели измерений. Широко используемый подход, опирающийся на предположение о стохастической природе закономерности появления моделей отдельных измерений в последовательности наблюдений (байесовский подход) оказывается це всегда приемлемым. Подобные ситуации характерны для таких экспериментов, в которых за время измерения исследуемый объект и измерительная процедура могут эволюционировать неизвестным образом. При этих условиях исследователь может получить неадекватные оценки вероятностных характеристик процесса измерений. Кроме того, даже если исследователю и удалось построить адекватную стохастическую модель эксперимента, то она может оказаться слишком громоздкой и сложной для применения на практике.
Введение объединенных и нестационарных неопределенных моделей измерений при переходе на новый уровень описания неопределенности требует развития новых методоз анализа и идентификации этих моделей.
В диссертационной работе задача анализа и идентификации объединенных неопределенных моделей рассматривается для линейных схем измерений с аддитивным стохастическим шумом. При решении применяются математические методы, использующие в
своей основе теорию проверки статистических гипотез.-В книге [Пытьев, 2004]1 исследованы задачи, связанные с объединением моделей измерений. При этом не предполагается наличие априорной дополнительной информации о связи между отдельными моделями. В других работах, в том числе в работах [Андерсон, 1976] 2,[Кашьяп, Pao, 1983]3 тоже не рассматриваются такие постановки задач, в которых бы предполагалось наличие априорной дополнительной информации о связи между отдельными моделями измерений. В диссертационной работе предлагается определенным образом учесть подобную информацию и рассмотреть свойства соответствующей объединенной неопределенной модели измерений. Новые методы, предложенные в диссертационной работе, применяются к задачам морфологического анализа изображений. Необходимо отметить, что в известных нам к настоящему времени работах на эту тему, в том числе в работах [Ту, Гонсалес, 1979]4, [Вапник, 1974]5, [Алешин, 1998]®, [Пытьев, 1983]7, [Пытьев, 19S4]8, [Pyt'ev, 1993]э, [Богданов, Чуличков, 2002]10, [Javidi, 2002]11 ne исследуются задачи распознавания образов по нескольким предъявленным изображениям при наличии дополнительной информации о связи моделей формирования изображений и задача анализа изменений качества соответствующих алгоритмов распознавания при «внесении» дополнительной связующей информации. Предложенные в диссертационной работе методы анализа и идентификации объединенных неопределенных моделей измерений, построенные в предположении наличия дополнительной информации о связи отдельных неопределенных моделей измерений, позволили при определенных условиях эффективно проанализировать и решить указанные задачи морфологического анализа в контексте проблемы распознавания обвалов по данным бурения, полученным от трех различных датчиков [Кольцов, Пытьев, Чуличков, 2005]12, [Кольцов, 2005]13.
Подход, позволяющий в определенных случаях осуществлять идентификацию нестационарной неопределенной модели измерений, в которой предполагается «частичная байесовость» модели отдельного измерения, разработан в монографии [Пытьев, 2006]14,
1 Пытьев Ю.П., Методы математического моделирования измерительно-вычислительных систем, М.: физматлит, 2004.
2Андерсон Т., Статистический анализ временных рядов. М.: Мир, 1976.
3Кашъяп Р.Л., Pao А.Р., Построение динамических стохастических моделей по экспериментальным
данным. М.: Наука, 1983.
*Ту Док., Гонсалес Р., Принципы распознавания образов. М.: Мир,1979.
6Вапник В.П., Червоненкис А.Я., ТЪория распознавания образов. Статистические проблемы обучения. М.: Наука, 1974.
вАлешин C.B., Распознавание динамических образов, ч.1. М.: изд-во МГУ, 1998.
7Пытьев Ю.П., Морфологический анализ изображений // ДАН СССР, 1983, т.269, №3, с. 1061-1064.
8Пытьев Ю.П., Задачи морфологического анализа изображений // В сб. ст. «Математические методы исследования природных ресурсов Земли из космоса», М.: Наука, 1984, с. 41-82.
9Pyt'ev Yu.P., Morphological Image Analysis // Pattern Recognition and Image Analysis, vol. 3, X«l, 1993, p. 19-28.
10И. В. Богданов, А. Я. Чуличков, Применение локального морфологического фильтра при анализе изображений. В, Новгород: VI Международная конференция «Распознавание образов и анализ изображений. Новые информационные технологии». РОАИ-6-2002, 2002, с. 71-74.
nImage Recognition and Classification: Algorithms, Systems, and Applications, (B. Javidi,- ed.), Marcel-Dekker, New York, NY, 2002.
12Кольцов Д.А., Пытьев Ю-П., Чуличков А.И. Способ распознавания обвалов по данным бурения, полученным от трех различных датчиков, патент per. № 2005127312, 30 августа 2005 г.
КоУЛ\ов Д.А., Синтез модели эксперимента в задачах интерпретации данных. Распознавание обвалов по данным бурения скважин // Сб. трудов 1-й международной научно-практической конференции «Современные информационные технологии и ИТ-образование». М., 2005, стр. 607-614.
14Пытьев Ю.П., Возможность как альтернатива вероятности. Математические и эмпирические осно-
где основные результаты, определяющие качество метода идентификации, сформулированы в терминах сильной состоятельности оценок неопределенных характеристик модели. В настоящее время нам неизвестны другие работы, посвященные данной проблеме. Рассматриваемые в диссертационной работе подходы позволяют для нестационарной неопределенной модели измерений, в которой модели формирования отдельного измерения предполагаются стохастическими, построить алгоритмы идентификации, характеристики качества которых сформулированы в терминах переходных (по возможным значениям долей появлений моделей отдельных измерений в последовательности наблюдений) вероятностей ошибочных решений. Кроме того, указаны методы выбора оптимального (в определенном смысле) алгоритма идентификации в зависимости от особенностей задания нестационарной неопределенной модели измерений.
Цель диссертационной работы.
Целями диссертационной работы являются
1) разработка методов повышения качества алгоритма получения новых знаний об исследуемом объекте/явлении, основанных на учете дополнительной информации о связи нескольких неопределенных моделей измерений (о применении см. патент [Кольцов, Пы-тьев, Чуличков, 2005]), а именно разработка методов анализа и идентификации объединенных неопределенных моделей измерений, строящихся на основе отдельных неопределенных моделей измерений при наличии дополнительной информации о связи данных моделей;
2) разработка методов идентификации нестационарных неопределенных моделей измерений;
3) разработка и построение численных методов, алгоритмов и программ решения
• задачи распознавания образов по нескольким предъявленным изображениям при наличии дополнительной информации о связи моделей формирования изображений для построения алгоритма обнаружения и оценивания параметров обвалов по данным бурения, полученным от трех различных датчиков;
• задачи проверки нестационарных сложных гипотез;
• задачи эмпирического восстановления теоретико-возможностной модели.
Методы исследования
Методической и теоретической основами исследования являются методы решения экстремальных задач [Васильев, 1988]ь и задач проверки статистических гипотез [Боровков, 1984]16, а также методы анализа и интерпретации данных эксперимента [Пытьев, 1989]17, [Пытьев, 2004]. Анализ неопределенных моделей измерений, обсуждаемых в диссертации, опирается на теорию надежности выводов [Пытьев, 2004], [Пытьев, 2006]. При
бы, применения. М.: Физматлит, 2006.
15Васильев ФМ., Численные методы решения экстремальных задач. М.: Наука, 1988.
15 Бороа-кпв Л.Л., Математическая статистика. Оценка параметров. Проверка гипотез. М.: Наука, 1984.
17Пытьев 1С.II., Математические методы интерпретации эксперимента. М.: Высшая школа, 1989.
введении новых понятий качества анализа и идентификации неопределенных моделей были использованы идеи, сформулированные при обсуждении природы случайности [Чайковский, 2004]18, проблем эргодической теории [Балеску, 1978]19, [Ван Кампен, 1990]20, нелинейной динамики [Анищенко, Вадивасова, 1999]21, [Антценко, Астахов, 2003]22, [Ма-линецкий, Потапов, 20Q0]23 и теории игр [Петросян, Зенкевич, 1998]24. Численные эксперименты реализованы с использованием программ, написанных на языке C/C++, а также программ, составленных на базе платформы Matiab.
Научная новизна
Научная новизна работы состоит в том, что в ней получены следующие новые результаты:
1) предложены новые методы анализа и идентификации неопределенных моделей измерений для линейных схем измерения с аддитивным стохастическим шумом в случае, когда корреляционный оператор шума имеет вид Е = а21\
2) предложен метод повышения качества анализа и идентификации объединенной неопределенной модели, основанный на учете дополнительной информации о связи отдельных неопределенных моделей измерений; показано, что при переходе к использованию объединенной модели с учетом дополнительной связующей информации мощность построенного на основе метода максимальной надежности критерия проверки адекватности класса моделей измерений не изменяется, а вероятность ошибочного выбора (в соответствии с методом максимальной надежности) модели измерений может как увеличиваться, так и уменьшаться, в зависимости от значений параметров объединенной неопределенной модели;
3) введено понятие нестационарной неопределенной модели измерений, поставлена задача ее идентификации как задача проверки нестационарных сложных гипотез; при этом получены следующие результаты;
• в случае двух гипотез сформулировано условие разрешимости задачи идентификации, построен состоятельный критерий, проведена оценка переходных вероятностей ошибочных решений для данного критерия и указана связь полученных оценок с условием разрешимости и объемом выборки;
• решена задача идентификации нестационарной неопределенной модели измерений в случае произвольного конечного числа нестационарных сложных гипотез; сформу-
Чайковский Ю.В., О природе случайности. М.: Центр системных исследований - Институт истории естествознания и техники РАН, 2004.
19Валеску Р., Равновесная и неравновесная статистическая механика. М.: Мир, 1978.
30Ван Кампеп Я.Г., Стохастические процессы в физике и химии. М.: Высшая школа, 1990.
21 Анищенко B.C., Вадивасова Т.Е., Астахов В.В., Нелинейная динамика хаотических и стохастиче-
ских систем. Изд-во Саратовского универ-та.Саратов,1999.
23Анищенко B.C., Астахов В.В., Вадивасова Т.Е., Неймап A.B., Стрелкова Г.И., Шиманский^Гайер Л., Нелинейные эффекты в хаотических и стохастических системах. Москва-Ижевск: Институт компьютерных исследований, 2003.
33Малинецкий Г.Г., Потапов A.B., Современные проблемы нелинейной динамики. М.: Эдиториал УРСС, 2000.
24Петросян Л.А., Зенкевич H.A., Семина Е.А., Теория Игр. М.: Высш. шк., Книжный дом «Университет», 1998.
лировано условие разрешимости задачи, предложены два алгоритма идентификации и проведен сравнительный анализ их качества;
4) решена в новой постановке задача распознавания образов для линейной схемы измерений с аддитивным стохастическим шумом при неизвестном значении а1 в корреляционном операторе шума И = а21; в условиях неизвестного истинного класса моделей измерений разработана и применена процедура обнаружения обвалов и оценивания их параметров по данным бурения, полученным от трех различных датчиков, обладающая более высоким качеством (оцениваемым экспериментально на основе экспертных оценок) по сравнению с аналогичной процедурой, использующей данные от одного датчика;
5) предложено решение проблемы эмпирического восстановления возможности и проблемы идентификации типа среды в игровой постановке задачи о случайных блужданиях взаимодействующих частиц на основе разработанных методов идентификации нестационарных неопределенных моделей измерений.
Практическая ценность работы
Разработан новый инструмент для научных исследований и решения прикладных задач, который позволяет проводить анализ и идентификацию новых типов неопределенных моделей измерений: объединенной модели, построенной на основе отдельных неопределенных моделей измерений с использованием дополнительной информации об их связи, и нестационарной неопределенной модели.
При анализе и идентификации объединенных неопределенных моделей измерений полученные результаты позволяют для линейных схем измерений с аддитивным стохастическим шумом в известном смысле эффективно:
• в случае неизвестного параметра а2 корреляционного оператора шума по данным наблюдений верифицировать модель измерений и выбирать из заданного класса модель, наилучшим образом согласующуюся с результатами измерения;
• решать задачи анализа и идентификации объединенной неопределенной модели измерений при наличии и в зависимости от имеющейся дополнительной информации о связи отдельных неопределенных моделей измерений при известном и неизвестном параметре а2 корреляционного оператора шума как задачу проверки адекватности класса моделей измерений по отношению к данным наблюдений и как задачу синтеза модели измерений; в частности, полученные результаты позволяют строить и применять процедуры обнаружения объектов и идентификации их типов в случае, когда между классом моделей измерений и множеством типов объектов установлено взаимнооднозначное соответствие, а данные наблюдений представлены в виде нескольких наборов измерений, отвечающих, каждый, различным сторонам/способам исследования объекта (различным отдельным неопределенным моделям измерений).
Практическая ценность разработанных в диссертации методов идентификации нестационарных неопределенных моделей измерений заключается в том, что данные методы позволяют исследователю
• изучать объекты/явления, которые описываются нестационарными неопределенными моделями измерений, используя методы проверки нестационарных сложных
гипотез о стохастических моделях формирования отдельных измерений, при отсутствии какой-либо информации о том, есть ли и, если есть, то какова закономерность появления простых гипотез в последовательности наблюдений, а также решать задачу идентификации нестационарных неопределенных моделей измерений как задачу проверки нестационарных сложных гипотез, в частности при решении проблемы эмпирического восстановления возможности и при анализе различных сложных стохастических динамических систем с «внутренним шумом* (см. [Ван Кампен, 1990], и пример игровой задачи, связанной с изучением данных проблем, ее исследование и решение в [Кольцов, Сердобольская, 2006]25);
• в реальном эксперименте, учитывая различные особенности неопределенной модели измерений и условие разрешимости задачи идентификации модели, оценить минимальное необходимое число .¡Утт измерений, требующееся для достижения заданного исследователем уровня качества алгоритма идентификации; при этом может быть учтен фактор затрат, в том числе вычислительных, лриходящихся на одно отдельное измерение или на один отдельный акт принятия решения по отдельному измерению; осуществлять выбор оптимального (в определенном смысле) алгоритма идентификации, имеющего наименьшее значение ЛГтт, как при учете фактора затрат, так и при отсутствии учета данного фактора.
Предлагаемые методы и программы имеют целью повышение качества алгоритмов получения новых знаний об исследуемом объекте/явлении. Некоторые из полученных результатов применялись автором в составе исследовательской группы, работающей над задачами анализа изображений геологических структур в рамках договора о сотрудничестве между Физическим Факультетом МГУ им. Ломоносова и компанией «ЭсЫитЬегеег», по результатам исследований был оформлен патент [Кольцов, Пытьев, Чуличков, 2005].
Апробация работы
Результаты диссертационной работы докладывались на 1-й Международной научно-практической конференции «Современные информационные технологии и ИТ-образование», на конференциях «Математические методы распознавания образов-12», «Интеллектуальные системы и компьютерные науки-9», а также на научных семинарах кафедры МАТИС (механико-математический факультет МГУ) и кафедры КМФ (физический факультет МГУ).
Публикации по теме диссертации
По теме диссертации опубликовано б работ: одна работа в составе патента, 2 статьи в журналах и 3 статьи в трудах конференций.
Структура диссертационной работы
Диссертация состоит из введения, трех глав основного текста, заключения и списка литературы.
Кольцов Д.А., Сердобольская М.Л., Проверка сложных гипотез при отсутствии статистической устойчивости частоты // Обозрение прикладной и промышленной математики. М., 2006 (в печати).
Содержание работы
Введение содержит обоснование актуальности рассмотренных в диссертации проблем. Кроме этого, во введении определяются цели и задачи исследования, указывается методическая и теоретическая основы исследования и практическая ценность работы.
Для широкого класса экспериментов математическую модель процесса измерений можно записать следующим образом:
й = М(»,7>1ч), г = 1,.. (1)
где скалярная величина & задает результат г-го измерения объекта/явления; вектор / образован интересующими исследователя, но не наблюдаемыми непосредственно, неизвестными параметрами объекта/явления (измеряемый сигнал); ц моделирует неточность измерений; М(-) - функция, описывающая модель формирования отдельного измерения. Если известны вид зависимости функции М(•) от своих аргументов, область ее определения и математическая природа сигнала / и «шума» г^, г = 1,..., ЛГ, то модель измерений считается полностью определенной. В противном случае (т.е. если какие-либо из указанных характеристик неизвестны полностью или частично) будем говорить о неопределенной модели измерений. При этом, как правило, предполагается заданным некоторое множество М возможных моделей М(-) или, в более общей постановке, класс М. таких множеств. В последнем случае мы считаем, что в (1) модель формирования отдельного измерения принадлежит априори неизвестному множеству М* € М.. Будем обозначать в общем случае неопределенную модель измерений символом М, отождествляя ее в известном смысле с классом М и формальным описанием математических свойртв и характеристик данного класса.
Первая глава посвящена разработке методов анализа и идентификации объединенных неопределенных моделей измерений в случае линейной схемы измерений с аддитивным стохастическим шумом, которую мы запишем в виде
+ (2)
где и = {ь<1,..., 1>дг) - случайный вектор со значениями^ в евклидовом пространстве 72^, А : Т1Ш —> - (ЛГ х т)-матрица с неслучайными элементами ||А|]у = =
1,... ,N,3 = 1,... ,771, моделирующая измерительный прибор, / € - т-мерный вектор.
Анализ и идентификация неопределенных моделей измерений в случае линейной схемы измерения с аддитивным стохастическим шумом.
В начале главы вводится согласно [Пытьев, 2004] понятие модели измерений [Л, 2] : сигнал f 6 72.та считается неслучайным априори произвольным вектором, среднее значение Ей вектора шума V равно нулю, £ - корреляционный оператор вектора ¡7.
Для заданной модели измерений [А, 2] сформулирована согласно [Пытьев, 2004] задача интерпретации данных эксперимента (измерений). Данная задача в диссертационной работе ставится как задача снятия неопределенности в эксперименте по вектору £//, под которым понимаются параметры объекта, интересующие исследователя, и - линейный оператор. Приводится решение задачи интерпретации согласно [Пытьев, 2004], в которой качество интерпретации охарактеризовано на основе величины к «среднеквадратичной погрешности» интерпретации [Пытьев, 2004].
В предположении, что в модели [А, Е] существует неопределенность связанная с незнанием верен ли оператор А (является ли оператор А оператором истинной модели измерений), рассмотрена задача получения на основе неопределенной модели [А, £] новых знаний о процессе исследования объекта как задача проверки адекватности модели измерений При этом предполагается, что вектор шума V имеет нормальное распределение N(0, а21), где I - единичный оператор в 1iN. Величина сг2 может являться как известным, так и неизвестным параметром неопределенной модели измерений.
Пусть параметр а2 является неизвестным для исследователя. Если рассматривать а2 как «мешающий» параметр, то задачу проверки адекватности модели измерений [А, £] можно сформулировать как следующую задачу проверки гипотез:
Я1: ?~N(S,E), аеЩА)\ЩАа),
Я2: а?ЩА), ( )
где Aq : Tí1 —• 1ZN - оператор, элементы матрицы которого совпадают с координатами произвольного фиксированного вектора из 7i(Á) {TZ{Á) - пространство значений оператора А; выражение 7v(A) \ TZ(A<¡) обозначает теоретико-множественную разность). Данная задача обладает определенным свойством симметрии, связанным с наличием инвариантности суждений в пользу гипотезы Я1 или Н2 относительно преобразований д е G, где G - группа преобразований д пространства 1ZN, действующих по формуле
х дх = wZx + г,
м/0 - число; {Z} - группа ортогональных преобразований в 1ZN, оставляющих неподвижными линейные подпространства IZ^Aq) з И(А)р|7?А(Ло) и 1Z(Aq); z - произвольный вектор из подпространства 1Z¿(Aq). Пусть П, По - ортогональные проекторы на V,{A) и TZ(Aq), соответственно. На основе проведенных в диссерационной работе обзора и анализа методов решения задач проверки гипотез, в том числе методов, связанных с использованием принципа инвариантности ¡Pao, 1968]26, [Вальд, 1960J27, [Вальд, 1967]28, [Уилкс, 1967]29, [Леман, 1979]30, [Боровков, 1984], [Пытьев,2004], построено решение задачи (3) и доказано следующее утверждение.
Утверждение 1. Функционал j(а:) = ¡¡(/—П)х|[2|(По:г||~2 есть максимальный инвариант группы преобразований G. В классе инвариантных критериев существует равномерно наиболее мощный, который отклоняет гипотезу Я1 по наблюдению £ всякий раз, когда Í(í) > Í¡>(£)> гДе константа jb(t) выбирается таким образом, чтобы уровень критерия был равен £, е € [0,1].
В соответствии с данным утверждением, если выполняется j(í) > jb[s), то модель измерений [А, £] признается неадекватной наблюдениям, в противном случае модель принимается как не противоречащая наблюдаемым измерениям.
2вРао С.Р., Линейные статистические методы и их применения. М.: Наука, 1968.
27Валъд Л., Последовательный анализ. М.: Фиэматгиз, 1960.
"*ъВалъд А., Статистические решающие функции. Позиционные игры. М.: Наука, 1967.
29 Уилтсс СМатематическая статистика. М.: Наука, 1967.
30Леман Э.т Проверка статистических гипотез. М.: Наука, 1979,
По аналогии с методикой, изложенной в [Пытьев, 2004], на основе понятия надежности гипотезы Я1 при альтернативе Я2 введена следующая величина:
оо
«¿©-у р^,
Ж)
где pTkXtko(-) - плотность распределения Фишера с kj_ = rank (7 — П), = rank По = 1 степенями свободы. Статистика а^2 (£) названа надежностью модели [Л, £] в случае неизвестного параметра ст2 корреляционного оператора вида Е = a2 J (в [Пытьев, 2004] введена величина <*a(£)j которая характеризует надежность модели измерений в случае известного корреляционного оператора Е). В диссертационной работе показано, что случайная величина а^ (£) при истинной гипотезе Н1 чаще принимает значения, бо'лыпие 1/2 и близкие к единице, чем значения, меньшие 1/2 и близкие к нулю (на отрезке [ОД]), в отличие от ситуации, когда гипотеза Я1 неверна. Таким образом, относительно большое значение надежности ад (£) свидетельствует в пользу непротиворечивости модели измерений, а относительно малое значение - в пользу неадекватности модели (ср. со свойствами Qa(£)i отмеченными в [Пытьев, 2004]).
Пусть оператор А является неизвестным элементом параметрического класса А. В таких условиях неопределенной модели измерений сопоставляется класс М = {[Л,Е], Л 6 Л} моделей измерений, для неопределенной модели вводится соответствующее обозначение М. (далее мы будем использовать обозначение класса М моделей измерений для обозначения соответствующей неопределенной модели измерений, отождествляя в известной степени класс Л4 и неопределенную модель) и ставится задача снятия неопределенности в модели М по параметру А как задача анализа и идентификации неопределенной модели М. измерений, которая состоит из двух различных подзадач: задачи проверки адекватности в целом используемого класса М моделей по отношению наблюдаемому процессу измерений (задача анализа модели А4) и задачи оценивания оператора А, А е Л, истинной модели измерений (задача идентификации модели М по параметру А\ эта задача далее называется задачей синтеза модели измерений)-, указана связь этих подзадач: решение второй подзадачи может представлять интерес для исследователя только в том случае, если при решении первой подзадачи, класс М. признан в известном смысле адекватным.
Задача проверки адекватности класса М ставится как задача проверки сложных гипотез о параметре распределения вектора f = a+ F,£ ~ N (а, Е); при этом осуществляются две различные постановки задачи в зависимости от того, является ли параметр а2 известным или неизвестным:
Н\-. аеЦЩА), 56 U
Н2Л: а^ЦЩЛ), (а) Я»„а : а £ 1jV(A), (Ь) (4)
АеЛ ' АеЛ
здесь постановка (а) соответствует случаю известного параметра а2, а постановка (Ь) - случаю неизвестного параметра сг2; Ао : V} —» 1iN - оператор, элементы матрицы которого совпадают с координатами произвольного фиксированного вектора из 1Z(A). Предложено решение на основе метода максимальной надежности выбора модели измерений [Пытьев, 2004]. Пусть критерий отклоняет класс Л4 всякий раз, когда реализация
(вектор наблюдений) попадает в критическую область {х е И.1* : а,(х) < аб(г)}, где а*(х) обозначает максимальную надежность,
а.® = тах{5^(ё) 1 [Л, £] е М), (5)
а значение ^¡.(е) выбирается таким образом, чтобы уровень критерия был равен заданной исследователем величине е 6 [0,1]. Здесь - надежность или а^ (£) модели
измерений [Л, Е] в зависимости от того, какой рассматривается случай: случай известного или неизвестного параметра ст2, соответственно.
Для предложенного метода проверки адекватности класса М. моделей вводится понятие качества проверки: характеристикой качества является величина РА(е) мощности предложенного критерия при фиксированном уровне критерия е.
Задача синтеза модели измерений поставлена как задача оценивания оператора А истинной модели измерений в предположении, что вектор £ формируется по схеме £ = а+Р, где а 6 ~Я(А), и Л - неизвестный исследователю фиксированный оператор из класса Л. Предложено решение данной задачи: в качестве результата синтеза принимается модель измерений, доставляющая экстремум в оптимизационной задаче (5). Качество ал процесса синтеза охарактеризовано в терминах-вероятности ошибочного решения при оценивании оператора Л истинной модели измерений по методу максимальной надежности:
ал = sup 7.AZA
Рг (axgmaxQx(i) ^ Л I f = Af + V ) = sup Рг (л.(£) ^ Л U = Л/ +
\ АеА л I / J,AeA v I '
(под ошибочным решением понимается оценка Л,(£) оператора Л истинной модели измерений такая, что Л»(£) ф А\ качество тем выше, чем меньше указанная вероятность).
Алгоритм анализа и идентификации неопределенной модели АЛ измерений при известном параметре а1, осуществляющий проверку адекватности класса М и синтез модели измерений, сводится к построению решения следующей задачи минимизации, осуществляемой по наблюдению реализации £ = х :
г.(х) = т1п||(/-Пд)г||2, (6)
АеА
а соответствующий алгоритм для неизвестного а2, - к поиску решения следующей задачи оптимизации:
Мх)~ !Рт —ИТТ — > (7)
АеА ЦПо1|Г
где Пд- - ортогональный проектор на 7Z(A), По - ортогональный проектор на 7£(Ло), Ло - оператор, элементы матрицы которого совпадают с координатами произвольного фиксированного вектора из И(А). Пусть ть(е) и jb(e) - решения следующих уравнений при определенном значении е
ос оо
J P4(r,0)dy = аь(е), J ртк±,ка = af(s)>
Tb(l) jb(c)
где prfc(y;0) - плотность центрального х2"распРеДеления с к = rank (7 — П) степенями свободы; а&(е) и <Уаь (е) являются константами, определяющими критические области соответствующих критериев проверки адекватности класса ЛЛ моделей; значения
о£г(е) выбираются так, чтобы уровень критериев был равен е. Процесс анализа и идентификации неопределенной модели М измерений можно осуществлять следующим образом. Если r,(z) < 7i(e) Уь(е))> то в случае известного (неизвестного) параметра а1 для данной реализации £ = х можно считать уровень адекватности модели измерений, отвечающей оператору А,(х), приемлемым; т.е. можно признать класс М адекватным наблюдаемым измерениям, а в качестве результата синтеза можно принять модель измерений, отвечающую оператору А„{х), доставляющему экстремум в (5). В противном случае, если ть(е) < r»(i) О'ь(е) < то следует признать модель, отвечающую оператору Л,(х), неадекватной наблюдаемым измерениям. При этом класс М следует признать неадекватным измерениям, а результат синтеза на основе класса М -неприемлемым.
Анализ и идентификация объединенной неопределенной модели измерений.
Построение объединенной неопределенной модели Мд измерений осуществляется на основе Т отдельных неопределенных моделей измерений Mt, i = 1,... ,Т, с использованием дополнительной информации о их связи с целью создания алгоритма получения новых знаний, возможно, обладающего более высоким качеством, чем в отсутствии связующей информации.
Предположим, что каждая модель Mt отвечает различным сторонам/способам измерения одного и того же исследуемого объекта, каждой неопределенной модели Mt сопоставлена своя схема измерений
= л(7+1*> е
и свой класс Mt = {Иг. £t], At 6 At, £( = моделей измерений, где At - параметрический класс операторов: At — {At(ct), ct £ Ct}, t = 1,...,T. Под дополнительной связующей информацией понимается любая априорная информация вида c({q}) = 0 о связи параметров ci,..., су. Объединенная неопределенная модель Мд измерений строится на основе объединенной схемы измерений f^1',---,^7' с учетом дополнительной связующей информации:
?<т>=в{с)7+рЮ,
-f(l>-
, рСО = , В(С) =
Ат(ст)_
Объединенной неопределенной модели Мд измерений сопоставляются класс моделей измерений
Мд = |[В(С), Е„] : С ({<*}) = О, С( € С,, 4 = 1,... ,Т,Е9 = а21}.
При заданных моделях измерений Ми ' = 1> ■ ■ •, Т, роль связующей информации при интерпретации данных эксперимента играет лишь та особенность, что каждая модель отвечает процессу измерений одно и того же фиксированного вектора /. В отсутствии данной связующей информации (когда предполагается, что разным отдельным моделям измерений могут отвечать соответственно процессы измерений различных векторов /)
понятие качества интерпретации данных, производимой на основе соответствующей объединенной модели измерений, определяется в терминах следующей величины «общей» погрешности интерпретации: = эир4 где 1ц, - характеризует отвечающую заданной модели Мь «среднеквадратичную погрешность» интерпретации.
Для объединенной неопределенной модели Мд измерений в случае, когда не задана дополнительная связующая информация, введены понятия качества алгоритмов анализа и идентификации модели Мд, а именно понятие качества проверки адекватности классов Ми Ь = 1,..., Т, наблюдаемым измерениям и понятие качества синтеза модели измерений. Для этого используются величины = Ш|/3^(е) и а^ = вгц^аг*',
соответственно, при фиксированном уровне е; отмечается также роль категории «эмпирического качества» (качества, оцениваемого эмпирически, экспериментально, по одному результату наблюдения { = х на основе величины а»(£) : чем выше значение а*(£)> тем выше эмпирическое качество процесса анализа неопределенной модели измерений).
Алгоритмы анализа и идентификации объединенной неопределенной модели М3 измерений построены на основе естественного обобщения алгоритмов анализа и идентификации модели М как в случае известного, так и в случае неизвестного параметра а2. Также на основе обобщения определено следующее: для заданной объединенной модели Мд при наличии связующей информации определена характеристика качества интерпретации (Л3; предполагается, что интерпретация осуществляется при определенной модели измерений), и для объединенной неопределенной модели Мд измерений при наличии дополнительной информации о связи в свою очередь определены характеристики качества алгоритмов анализа и идентификации модели Мд, соответствующие процессу проверки адекватности класса Мд (/Зя(е)) и процессу синтеза модели измерений (а9).
Поставлена задача сравнительного анализа качества рассмотренных и разработанных в рамках объединенной модели М3 измерений алгоритмов анализа и интерпретации данных эксперимента при наличии и отсутствии информации о связи (под анализом данных подразумевается анализ модели измерений). Данная задача сводится к анализу соотношений величин и №,Рд(Е),ад, соответственно.
В [Пытьев, 2004] показано, что переход к использованию определенной объединенной модели Мд с учетом связующей информации не может увеличить погрешность интерпретации {№ ^ а в реальных случаях, как правило, способствует уменьшению данной погрешности (/г3 < Л<т>). В диссертационной работе получено, что мощность (основанного на методе максимальной надежности) критерия проверки адекватности класса Ма не изменяется (/?^(е) = /33(е)) при переходе к использованию объединенной неопределенной модели Мд с учетом дополнительной информации о связи как при известном, так и при неизвестном параметре а2.
При сравнении качества синтеза модели измерений рассмотрен случай известного параметра а2. Для решения этой задачи введено условие транзитивности связей отдельных неопределенных моделей измерений: условие считается выполненным, если согласно дополнительной связующей информации С({с[}) = 0 не допускается ситуация, когда часть параметров с1,...,сг, отвечают истинным моделям измерений, а часть — ошибочным.
Показано, что если условие транзитвиности связей выполнено, то вероятность ошибочного выбора модели измерений может как увеличиваться (а3 > а^), так и уменьшаться (а3 < а^, приводятся конкретные примеры) при переходе к использованию объединенной неопределенной модели с учетом дополнительной информации о связи, в зависимости от значений параметров объединенной неопределенной модели. Если уело-
вие транзитивности связей не выполнено, то при переходе к использованию объединенной неопределенной модели Мд измерений с учетом дополнительной связующей информации качество синтеза модели измерений не увеличивается (а9 ^ с*'^).
Вторая глава посвящена разработке методов идентификации нестационарных неопределенных моделей измерений.
Под нестационарной неопределенной моделью М. измерений понимается такая неопределенная модель измерений, в которой задан класс М. множеств М возможных моделей формирования отдельного измерения в схеме (1) (здесь будем использовать обозначение класса М, как и в первой главе, только уже для обозначения нестационарной неопределенной модели измерений, отождествляя ее в известной степени с классом М. и формальным описанием математических свойств и характеристик данного класса); при этом считается, что каждое измерение произведено в рамках некоторой модели из одного фиксированного, но неизвестного априори множества М* € М, другими словами, М{г) € М*, М* 6 М, для любого г = 1,...,.ЛЛ Кроме того предполагается также, что неизвестно, какая именно модель из множества М* реализуется в измерении & с конкретным номером г. Таким образом, в отличие от рассмотренного в первой главе случая, отсутствует априорная информация о функции М(-) как отображении множества {1,..., Л*"} на множество М* и неизвестно, какое именно множество М* € М отвечает данному набору наблюдений. Такую модель измерений мы называем нестационарной неопределенной моделью измерений. В работе предполагается, что класс М. состоит из конечного набора V множеств М",г> = 1,..., V, моделей, причем М"1 ПМ"3 = 0, цг ^ Задача идентификации нестационарной неопределенной модели М. измерений ставится как задача определения по полученным в эксперименте наблюдениям £] = ц,... = гдг такого номера и*, который отвечает истинному множеству возможных моделей формирования отдельного измерения.
Приведены постановки задач идентификации нестационарных неопределенных моделей измерений в различных областях научных исследований для того, чтобы продемонстрировать актуальность задачи построения методов идентификации таких моделей.
Приведено изложение проблемы эмпирического восстановления возможности, сформулированной в [Пытьев, 2006]. Показано, что данную проблему можно понимать как задачу идентификации нестационарной неопределенной модели М измерений, в которой каждому номеру V сопоставлен свой «неприводимый» класс возможностей, однозначно определяющий теоретико-возможностную модель эксперимента. По аналогии с [Пытьев, 2006] данная задача сведена к задаче проверки нестационарных сложных гипотез, отличие которой от традиционных задач состоит в следующем. В традиционных постановках предполагается, что по наблюдениям за реализациями случайной величины необходимо принять решение о том, какая из сложных гипотез о распределении данной величины верна; при этом либо при каждом наблюдении верна всегда одна и та же простая гипотеза в составе неизвестной сложной, либо выбор простой гипотезы, отвечающей конкретной реализации, осуществляется случайным образом (байесовский подход). В обоих случаях имеет место статистическая устойчивость частоты конкретной реализации в бесконечно длинном ряду наблюдений. Согласно [Пытьев, 2006] в задаче эмпирического восстановления возможности снимается требование устойчивости частот, и возникает задача проверки нестационарных сложных гипотез, для которой не задана (и, тем более, не известна априори) какая-либо закономерность проявления простых гипотез в последовательности распределений наблюдений случайной величины, на распределения возможностей лишь накладывается требование «стохастической измеримости». В диссертационной ра-
боте рассматривается постановка задачи эмпирического восстановления, совпадающая с «наиболее общей» постановкой, приведенной в [Пытьев, 2006}. Предложены новые методы решения этой задачи.
Наряду с проблемой эмпирического восстановления возможности в главе рассмотрена проблема идентификации типа среды в игровой постановке задачи о случайных блужданиях частиц с взаимодействием (см. [Кольцов, Сердобольская, 2006]). Приведено описание системы частиц и правил их перемещения и взаимодействия, а также постановка задачи идентификации типа среды по результатам наблюдения за одной частицей (с фиксированным номером), отмечена актуальность поставленной задачи в контексте известных задач идентификации типов сред. Характерной особенностью этой системы является то, что наряду с «внешним шумом» в ней может присутствовать также и «внутренний шум», связанный с трудно устранимой аналитическими и вычислительными методами неопределенностью в правилах перемещения и взаимодействия частиц, Согласно [Ван Кампен, 1990] под внешним шумом понимаются флуктуации, возникающие в детерминированной системе под действием случайной силы, стохастические свойства которой считаются известными исследователю; внутренний шум обусловлен такими характерными свойствами системы как дискретность, нелинейность динамической модели поведения системы (возможно наряду с относительно большой размерностью системы). В частности, внутренний шум может быть обусловлен тем, что сама система состоит из дискретных частиц, он является неотъемлемым свойством самого механизма эволюции состояния системы и не может быть отделен от ее уравнения движения. Приводится обзор наиболее глубоко и детально изученных методов, применяющихся для исследования различных систем взаимодействующих частиц, в том числе методов кинетической теории [Лифшиц, Питаев-ский, 2002]31, [Балеску, 1978], [Ван Кампен, 1990], [Монин, Яглом, 1967]32, [Кубо, 1967]33, [Кляцкин, 2001]34, [Кляцкин, 2003]35 и теории ветвящихся процессов с взаимодействием [Калинкин, 1983]36, [Калинкин, 2002а]37, [Калинкин, 20026]38. Указаны особенности и области применимости изложенных в методах подходов. Показано, что особенности предлагаемой игровой задачи не позволяют исследовать ее с помощью известных традиционных методов анализа систем взаимодействующих частиц, в том числе с помощью методов кинетической теории и теории ветвящихся процессов с взаимодействием.
Показано, что задача идентификации типа среды может быть сведена к задаче идентификации нестационарной неопределенной модели измерений.
Кроме того, на основе рассмотренных подходов к анализу систем взаимодействующих частиц в применении к задаче идентификации типа среды подчеркнуты особенности контекста научных исследований, в котором может возникать задача идентификации
31 Лифшиц В.М., Питаевский Л.П., Физическая кинетика. М.: Физматлнт, 2002.
32Монин A.C., Яглом A.M., Статистическая гидромеханика. М.: Наука, 1967.
33Кубо Р., Статистическая механика. М.: Мир, 1967.
34 Кляцкин В.И., Стохастические уравнения глазами физика (Основные положения, точные результаты и асимптотические приближения). М.: Физматлит, 2001.
35Кляцкин В.И., Динамика стохастических систем. М.: Физматлит, 2003.
зв Калинкин A.B., Стационарное распределение системы взаимодействующих частиц с дискретными состояниями // Доклады АН СССР, 1983, т. 268, вып. 6, с. 1362-1364.
37Калинкин A.B., Марковские ветвящиеся процессы со взаимодействием // УМН, 2002, т.56, №.2, с. 23-84.
38Калинкин A.B., Вероятность остановки на границе случайного блуждания в четверти плоскости и ветвящийся процесс с взаимодействием частиц // Теория вероятностей и ее применения, 2002, т. 47, вып. 3, с. 452-474.
нестационарных неопределенных моделей измерений; отмечено при этом, что одним из основных признаков такого контекста является наличие. «внутреннего шума» в исследуемой системе (о понятии «внутреннего шума» системы см. подробнее в [Ван Кампен,
Идентификация нестационарной неопределенной модели измерений и проверка нестационарных сложных гипотез.
Приведена формальная постановка задачи идентификации нестационарной неопределенной модели М измерений как задачи проверки нестационарных сложных гипотез.
Пусть в модели М заданы множества М",« = 1.....V, возможных моделей формирования отдельного измерения, М"1 М"2 = 0,Щ ф У2- Будем считать, что данные множества являются конечными и дискретными и, что каждый элемент любого из множеств М" определяет стохастическую модель формирования отдельного измерения т.е. каждому элементу сопоставлено некоторое фиксированное распределение вероятностей значений случайной величины Также будем рассматривать случай конечного дискретного множества элементарных исходов случайной величины В таком случае, если сопоставить каждому множеству М" сложную гипотезу Я" о распределении то задача идентификации нестационарной неопределенной модели измерений может быть поставлена как следующая задача проверки нестационарных сложных гипотез.
Пусть Я" = {Я",... , Я^}, V = 1,..., V, — классы сложных гипотез о распределении случайной величины, т„ - число простых гипотез в составе и-й сложной. Первоначально рассматривается случай V = 2. Предполагается, что решение о том, какая из сложных гипотез верна, принимается на основании реализации /^-мерного случайного вектора £ = (£г, •.. ,£лг), координаты которого независимы, и распределение каждой из них контролируется какой-либо (произвольной и, вообще говоря, меняющейся вместе с номером координаты) простой гипотезой в составе (фиксированной) сложной. Мы считаем, что любая реализация случайной величины принадлежит известному конечному множеству элементарных исходов X = {а^,... ,15}. Пусть Рг(- | Щ), I = 1,2, ...,т„, - распределения вероятностей, отвечающие простым гипотезам Щ в составе сложных Я", V — 1,2. Относительно данных распределений известно, что они удовлетворяют лишь
в
общим условиям: Рг(- | Щ) : X —♦ [0,1], I Щ) = 1, и каких-либо дополнитель-
5=1
ных ограничений на них не накладывается.
Изначально в главе поставленная задача рассматривается как традиционная задача проверки двух сложных гипотез
о распределении ЛГ-мерного вектора £. Сформулированы критерии качества решения задачи в такой постановке, а также понятие разрешимости задачи-, задача проверки нестационарных сложных гипотез считается разрешимой, если существует состоятельный критерий для проверки данных гипотез. Условие разрешимости состоит в следующем. Пусть
1990]).
= (Я?,. •■,#?„)> б Я", п = 1.....N. « = 1,2,
Если существуют такие у" 6 Г", что для каждого а = 1,2,... , 5,
то в данной постановке задача проверки Н1 против Н2 неразрешима, если это условие не выполнено, то задача проверки гипотез о распределении вектора является разрешимой. Отметим, что указанное условие разрешимости эквивалентно аналогичному условию, приведенному в [Пытьев, 2006]. Сформулированы общая минимаксная и общая байесовская постановки задачи. Показана эквивалентность оптимальных решений общей задачи проверки гипотез в указанных постановках при определенных условиях, согласованных с условием разрешимости данной задачи.
При этом показано, что построение оптимального критерия, основанного на случайном векторе и получение оценок качества этого критерия сопряжены со значительными аналитическими и вычислительными трудностями. Предложен следующий альтернативный алгоритм решения задачи проверки нестационарных сложных гипотез (критерий голосования).
Шаг 1. Априори (т.е. независимо от полученной в эксперименте реализации случайного вектора £) ищется решение следующей «одномерной» минимаксной задачи: пусть при 7Г = 7г* = {тг^ (■)> 7Гз(-)), достигается
£» = пиптах (тахЬ(7Г1 | Я2,72),тах!.(7Г2 | Я1^1) | , (9)
\ -г1 71 )
где
5 ты
Цпе I Н\7") = $>*(*.)£№»(*» I Щ)> 7" 6 Г», (10)
8=1 <=1
где - потери, сопровождающие ошибочное решение в пользу сложной гипотезы Я" при том, что реализация получена в рамках распределения, соответствующего простой
гипотезе Щ, С ф и, I = 1.....V, V = 1,2. Набор 7" = (7^,...,) характеризует
указанную выше «нестационарность» распределения: 7" есть доля координат вектора £, для которых верна ¿-я простая гипотеза из ЯВероятность 0 < ^ 1 определяет
рандомизированное правило принятия решения ж по одному наблюдению = х3 : с вероятностью щ(хв) принимается гипотеза Н", с вероятностью 7Гг(а;а) = 1 — 7Г„(хя) -гипотеза Н", V ф 5, в = 1,..., 51; 711 (х) + ■к?.{х) = 1, V х е X.
Шаг 2. Вводится величина т^.(х) такая, что т^(х) = если в результате ран-
домизированной процедуры, определяемой решающим правилом тх *, количество тех элементов вектора х, по которым была принята гипотеза Я", равно Л^, N1+ N2 — N. Величина Тр/(х) определяет частоту принятия гипотезы Н° в серии наблюдений , *. -, .
Шаг 3. Задается множество принятия гипотезы Я". Если т^,(х) попадает в это множество, то принимается гипотеза Я", в противном случае - гипотеза Н", V ф V. В сущности речь идет о голосовании в пользу той или иной гипотезы, осуществляемого по результатам каждого наблюдения в серии х51,..., хад,.
Введем обозначение
■Ргу(Т, < т» = т},(£) < Т2) = тахРг^ < тц < Т2 | Я",7") (11)
для максимального значения вероятности события {Г1 < тн < Тг} при условии, что верна гипотеза Я" и истинным в эксперименте является набор долей 7". При фиксированных Я", 7ю величина Тдг является функцией случайного вектора £ с фиксированным распределением, поэтому мы можем ввести Рг(- | Я", 7") - переходное (по 7") распределение тдг. В диссертационной работе доказана следующая теорема.
Теорема 1. Пусть в (10) потери I" = 1, г = 1,..., гщ, V ф 5,-г/, й = 1,2. Тогда
1) если не существуют такие наборы 7" 6 Г", что выполнено равенство (8), то задача проверки нестационарных сложных гипотез Нг,Н2 разрешима и в (9) риск £» < 1/2. При этом
в Э
тах£Рг(х* 11ф*1(х3) = Е^ < 1/2 < Е^п = 1шп^Рг(х8 | Я?К(х3), 1 *=1 *
и для любого Е € (Е^а*,
■PriÍTN <Т)< JV-1(2(- Е))~2 = O(N-I), ■Pr2{rN > Т) < ^-1(2(£-Е2,м))-2 = 0(JV-i).
(12)
2) если найдутся наборы 7" 6 Г" такие, что выполнено равенство (8), то задача проверки нестационарных сложных гипотез неразрешима и в (9) риск L, = 1/2.
Данная теорема позволяет связать условие разрешимости L, < 1/2 с оценками максимальной по наборам -yv переходной вероятности ошибочных решений и объемом выборки. Проведено исследование структуры оптимального решающего правила W (см. (9)), а также особенностей его построения. Кроме того, критерий голосования применен в случае, когда ф- 1 для некоторых значений г, г — 1,..., тц, v = 1,2.
Идентификация нестационарной неопределенной модели измерений в случае произвольного конечного числа нестационарных сложных гипотез.
В диссертационной работе сформулировано обобщенное условие разрешимости для задачи проверки произвольного конечного числа V > 2 нестационарных сложных гипотез.
Утверждение 2. Для того, чтобы общая задача проверки произвольного конечного числа нестационарных сложных гипотез была разрешима, необходимо и достаточно, чтобы для любой пары сложных гипотез не выполнялось условие (8).
Предложен вариант решения, являющийся обобщением критерия голосования на случай V > 2 - так называемый «игровой» критерий. Ключевой особенностью данного подхода является то, что в его основу положен принцип проведения командных игровых турниров: каждая команда играет с каждой (в нашем случае команде отвечает сложная гипотеза, и в каждой паре команд результат игры определяется с помощью критерия голосования), победитель выявляется по сумме побед. Алгоритм «игрового» критерия. ШАГ 1. Рассмотрим следующие оптимизационные задачи:
L^v» = min max fmaxL(T>2> ¡ | , (13)
где
S T7lt>
= vi>v2-, V1,V2 = 1,...,V-, (14)
3=1 i=l
задача определения номера истинной сложной гипотезы разрешима при условии, что та< 1/2 (см. Утверждение 2); введем = 1/2—i„;t_ и обозначим £ = mine«,«,.
«iva 'j; v-j
Шаг 2. При условии, что реализация случайного вектора £ = х, для каждой пары значений «1,112 построим случайные величины тй1'"* такие, что
Рг№ « = 1 I £» = *.) = *£*>(*.), Рг№" " = О I е„ = X.) = *Ы(хш),
где тг„ь„г = '(•)) - решающее правило, доставляющее минимум в (13), а также
следующие случайные величины:
■¿VI, - ,
N
1,
П=1
0, ¿Е^О/з'
П=1
1*1
(15)
Шаг 3. Принимается сложная гипотеза с номером V* = а^тах£". Предложен также так называемый «частотный» критерий. Алгоритм -«частотного» критерия. Шаг 1. Выбирается значение еа из множества (0, Ьт), где
Ьт = тт тт тах
5>грк*. I яг) - I **?)
(16)
Отметим, что если условие разрешимости (см. Утверждение 2) не выполнено, то Ьт равно нулю, и Еа € (0, Ьт) не существует.
Шаг 2. По реализации случайного вектора £ = х для каждого V осуществляется поиск максимального по всем значениям {7?}':1,т„ числа выполняющихся неравенств
ту
1>х(х) — Е 7?Рг(г5 I Щ) ^ £°> 5 = 1,2,..., 5 (1/5(х) - частота появления элементарного >=1
исхода х3 в векторе х). Для этого вводится следующие случайные величины:
I 7")
".С®) - Е 7?Рг(*.1 Щ)
<=г
ттц,
".СЮ - Е 7?Рг(х6 | Щ) <=1
> £а> '
(17)
р"(х | 7") = Е ^0е I 7")'в = 1> • • • 1V = 1,..., V. Далее решается следующий набор оптимизационных задач:
рЧ{х) = тахр"(г | 7й), г) = 1.....V.
(18)
Шаг 3. Принимается сложная гипотеза с номером V = V*, для которого выполняется указанное в ШАГЕ 2 максимальное число неравенств: = аг§тахр"(х).
Этот критерий является модификацией разработанного в [Пытьев, 2006] алгоритма идентификации нестационарной неопределенной модели измерений.
Качество алгоритмов идентификации нестационарной неопределенной модели М, основанных на «игровом» и «частотном» критериях, охарактеризовано в терминах переходных (по наборам 7") вероятностей ошибочных решений, принимаемых при идентификации.
Для переходной вероятности ошибочного решения «игрового» и «частотного» критериев получены следующие оценки:
= шах С) < Ve~2N^, Pr(pv*v' = rnaxpi) < ^ + , (19)
соответственно, где v* обозначает номер истинной сложной гипотезы; при получении данных оценок использовалось неравенство Хёфдинга [Hoeffding, 1963]39, [Вапник, 1974], [Вапник, 1979]40. Построенные оценки позволили для «игрового» и «частотного» критериев доказать их состоятельность; на основе полученных результатов указана связь приведенных оценок с обобщенным условием разрешимости, сформулированным в Утверждении 2, и объемом выборки N.
Проведен анализ качества алгоритмов идентификации нестационарной неопределенной модели Л1, основанных на «игровом» и «частотном» критериях. На основе оценок (19) показано, что в различных нестационарных неопределенных моделях в зависимости от требуемого уровня переходных вероятностей ошибочных решений и объема выборки более предпочтительным может оказаться алгоритм идентификации, основанный либо на «игровом», либо на «частотном» критерии.
В [Пытьев, 2006] построен метод проверки нестационарных сложных гипотез, применяющийся в том числе и к задаче восстановления возможностной модели по данным наблюдений. Согласно данному методу решение принимается следующим образом. Для полученной в эксперименте реализации £ = х находятся значения vs (г), s = 1,..., 5, и решается оптимизационная задача:
v — arg mm mm max
» 7" sg{l,,..,s}
(20)
Далее принимается сложная гипотеза с номером и*.
Приведенный критерий обладает свойством сильной состоятельности (оценка v" для номера истинной сложной гипотезы является сильно состоятельной [Пытьев, 2006]). В отличие от «игрового» и «частотного» критериев основные утверждения относительно качества критерия, предложенного в [Пытьев, 2006], сформулированы в терминах «сходимости с вероятностью единица».
В диссертационной работе произведено сравнение критериев в условиях, когда принимается во внимание фактор затрат, сопутствующих отдельному измерению или отдельному принятию решения по всей выборке. Получено следующее: «игровой» критерий может быть рассчитан априорно вне зависимости от реальных наблюдений, и в связи с этим он может обладать реальным преимуществом над «частотным» критерием и критерием, построенным в [Пытьев, 2006]. При учете фактора вычислительных затрат проведено сравнение качества критериев на основе значений, принимаемых функцией потерь R(S) для каждого из критериев. Функция потерь определялась следующим образом: R(8) — max avwv+a$, где 6 обозначает критерий, а„ - переходная (по набору 7") вероятность отвергнуть v-ую сложную гипотезу, когда она верна, w„ - сопутствующие
39Hoeffding W., Probability inequalities for sums of bounded random variables. Am. Statist. Assoc. J., v.58( p. 13-30, 1963.
л0 Вапник В.И., Восстановление зависимостей по эмпирическим данным. М.: Наука, 1979.
этому решению потери, V ~ 1,..., V, - вычислительные затраты, отвечающие каждому единичному акту принятия решения по всей выборке £ в соответствии с критерием <?. Получено, что если только исследователь считает, что для всех трех критериев выполняется 1с(>ов принятой им шкале, то указанные апостериорные критерии («частотный» и критерий, предложенный в [Пытьев, 2006]) являются сопоставимыми с «игровым» критерием в смысле значений Я(<5); в противном же случае оптимальным для использования исследователем следует признать алгоритм идентификации, основанный на «игровом» критерии.
Предложены методы построения алгоритмов идентификации нестационарной неопределенной модели измерений на основе последовательных «игрового» и «частотного» критериев и отмечено, что для таких критериев также сохраняют силу выводы о характеристиках качества «игрового» и «частотного» критериев, полученные при учете фактора затрат.
Третья глава посвящена приложениям разработанных в первой и второй главах диссертационной работы методов анализа и идентификации неопределенных моделей измерений.
Распознавание образов по нескольким предъявленным изображениям.
В диссертационной работе используется аппарат морфологического анализа изображений, для которого ключевым является понятие формы изображения объекта [Пытьев, 83], [Пытьев, 84], [Ру(;'еу, 93], и рассматриваются постановки задач распознавания, связанные с проблемами анализа мозаичных изображений, поэтому в последующем изложении под рассматриваемыми в эксперименте изображениями подразумеваются мозаичные изображения.
На основе поставленной в первой главе задачи анализа и идентификации неопределенной модели М измерений поставлена соответствующая задача распознавания образа Л 6 Л по предъявленному (мозаичному) изображению с аддитивным стохастическим шумом. При этом в постановке задачи распознавания предполагается, что схема формирования изображения в шуме определяется схемой измерения (2), в которой вектор / определяет яркости изображений на множествах постоянной яркости, а оператор А\ € А = {А\, А € Л} определяет однозначно области постоянной яркости и соответственно форму изображения некоторого образа Л. На основе разработанного в первой главе метода анализа и идентификации неопределенной модели М измерений для случая неизвестного параметра а2 построен метод распознавания образа Л Е Л по предъявленному (мозаичному) изображению с аддитивным стохастическим шумом. В разработанном алгоритме распознавания (алгоритме 1) процедура обнаружения объекта на изображении построена на основе процедуры проверки адекватности класса М. соответствующей неопределенной модели измерений, а процедура идентификации объекта - на основе процедуры синтеза модели измерений. В рамках морфологического анализа можно сказать, что в задаче проверки адекватности класса М., если И^ - форма изображения образа А, которой сопоставлен оператор проецирования Щ на К(Л\), то процесс выбора некоторого вектора 5о = ао(^) : ЗД 6 7£(А\), определяющего оператор Ао (см. постановку (4Ь)), эквивалентен процессу выбора некоторого подмножества 1У\о множества \¥\, т.е. эквивалентен выбору некоторого, «менее детального», чем образ А, образа д\, изображение которого по форме не сложнее, чем изображение образа А, А 6 Л. Поэтому с точки зрения морфологического подхода в задаче проверки гипотез, отвечающей задаче проверки адекватности класса М, фактически проверяется гипотеза о том, что предъявленное в эксперименте изображение по форме не сложнее, чем изображение некоторого образа А из
ш = тшЛх, А) = Ш1",,'^ , (21)
множества Л, и одновременно не сравнимо по форме с изображением «менее детального», чем образ А, образа <д, против альтернативы, заключающейся в том, что предъявленное изображение не сравнимо по форме с изображениями образов из множества Л (понятия «форма изображения д», «изображение дх не сложнее по форме, чем изображение д2*> «изображение несравнимо по форме с изображением у2» приводятся и определяются согласно [Пытьев, 83], [Пытьев, 84], [Ру1'еу, 93]).
Алгоритм 1 заключается в следующем. Пусть предъявлено некоторое изображение £ = х для распознавания, а также выбран в соответствии с требованиями алгоритма анализа и идентификации неопределенной модели М, изложенными в первой главе, уровень г и отвечающее ему пороговое значение й(е). Далее процедура поиска решения в задаче распознавания сводится к процедуре поиска решения в следующей оптимизационной задаче:
1|(7-Пл)хЦ2 лёл ||П0х||2
где Па - ортогональный проектор на "Я{А\), в известной степени однозначно определяющий форму изображения объекта, имеющего образ Л [Пытьев, 83], [Пытьев, 84], [Ру^у, 93]; По - ортогональный проектор на 7£(Ло), А) ~ оператор, элементы матрицы которого совпадают с координатами произвольного фиксированного вектора из 7£(Ла). Пусть найдено значение А*(х), доставляющее экстремум в задаче (21), и соответствующее значение j»(x) функционала э(х,\) в точке Л = Л*. Тогда процедура обнаружения объекта на изображении определяется так: в случае, если (Т) < ]ь{е), принимается решепие о наличие объекта на изображении, в противном случае - решение о его отсутствии. Если ^«(г) то результатом процедуры идентификации объекта на изображении следует
признать то, что объект имеет образ Л* (х).
Отмечены особенности алгоритма 1, связанные в том числе с тем, что исследователь должен, вообще говоря, располагать довольно «весомой» априорной информацией об исследуемых объектах и условиях регистрации изображений для того, чтобы осуществлять для каждого А е Л, выбор какого-либо вектора, определяющего оператор Ао, а следовательно и оператор По в ](х) (см. первую главу). С учетом приведенных особенностей алгоритма 1 указано, что постановка задачи анализа и идентификации неопределенных моделей измерений (см. в первой главе постановку (4Ь) задачи проверки адекватности класса М), для решения которой при рассмотрении проблемы распознавания образов был построен алгоритм 1, в контексте морфологического анализа является сильно специализированной и редко используется. В связи с этим предложена другая, несколько модифицированная, постановка задачи анализа и идентификации неопределенных моделей измерений и соответствующая данной постановке постановка задачи распознавания. Основные изменения в постановке задачи анализа и идентификации коснулись задачи проверки адекватности класса М моделей; вместо (4Ь) была сформулирована следующая задача проверки адекватности класса М :
а б и (7г(Л)\К(Л0))
Аел ; (22)
зеЯ(Л о)
здесь Ао : И1 —» - оператор, все элементы матрицы которого равны единице. Построен соответствующий модифицированный алгоритм (алгоритм 2) распознавания образа А £ Л по предъявленному его изображению в шуме при неизвестной дисперсии
шума. и2. Модификация постановки задачи распознавания заключается в следующем. В контексте морфологического подхода можно сказать, что в соответствующей процедуре обнаружения объекта, отвечающей задаче (22) проверки адекватности класса М, в модифицированной постановке задачи распознавания фактически требуется проверить гипотезу о том, что предъявленное для распознавания изображение по форме не сложнее, чем изображение некоторого образа из множества Л, и зависит от формы изображения этого образа (не является независимым от формы данного изображения), против альтернативы, что предъявленное изображение не зависит от формы изображений образов из множества Л. Другими словами, предполагается, что либо действительно предъявленное изображение по форме не сложнее, чем изображение некоторого образа из Л, и не является при этом изображением по форме не сложнее, чем изображение ровного поля зрения, либо предъявленное изображение соответствует изображению, которое по форме не сложнее, чем изображение ровного поля зрения (понятие «независимость изображения д: от формы изображения д2> приводится и определяется согласно [Пытьев, 75]41, ¡Пытьев, 83], [Пытьев, 84], [РуУеу, 93]).
Основным отличием алгоритма 2 от алгоритма 1 является то, что алгоритм 2 основан на критерии, зависящем от несколько иного, отличающегося от функционала ](х) максимального инварианта: функционала
.11(П-По)г||Д 3{х,~ Ц(/-п)гЦ2 '
где П - ортогональный проектор на Н-{А), По - ортогональный проектор на ровное поле зрения, на 71(Ао), а оператор А однозначно определяет форму мозаичного изображения какого-либо объекта. Пусть С - группа преобразований д' пространства 72.^ Э х, действующих по формуле
х —»<?'з? = 'шZx + 3?,
где ш ф 0 - число; {Z} - группа ортогональных преобразований в "П1*, оставляющих неподвижными линейные подпространства 7£д(.Ао) и 7£(Ао); г - произвольный вектор из И(Ао). Доказано
Утверждение 3. Функционал з'(х) есть максимальный инвариант группы преобразований С.
В диссертационной работе приводится формальная постановка задачи распознавания обвалов по данным бурения, полученным от трех различных датчиков. Геометрическая модель обвала определяет изображение обвала как след в виде вертикальной полосы на поле зрения, образованный пересечением кругового цилиндра (колодца) и слоя, параллельного оси цилиндра. Параметрами обвала Л, определяющими форму его изображения, являются азимутальный угол плоского слоя и толщина слоя. Для оценки характеристик скважины и поиска обвалов предварительно на бур устанавливаются три датчика, которые, вращаясь вместе с буром вокруг его оси, осуществляют измерения электрической проводимости (которые пересчитываются затем в значения сопротивления) среды, окружающей бур, и имеют различный (высокий, средний и низкий) уровень глубины сканирования. Это помогает более детально отследить форму обвала. Каждому измеренному значению электрического сопротивления сопоставляется по определенному закону значение яркости, и данные от трех датчиков для морфологического анализа представляются
41 Пытьев Ю-П., Традиционный анализ изображений // Кибернетика, 1975, Л*'-3, стр. 130-139.
в виде трех изображений. В диссертационной работе задается дополнительная связующая информация для отвечающих разным датчикам схем измерений: предполагается, что между глубиной проникновения датчика и значением электрического сопротивления существует линейная зависимость.
На основе разработанного в первой главе метода анализа и идентификации объединенной неопределенной модели измерений и на основе естественного обобщения алгоритма 2, в условиях неизвестного истинного класса моделей измерений разработана и применена процедура (и соответствующий алгоритм, алгоритм 3) обнаружения и оценивания пара/метров обвалов по данным бурения, полученным от трех различных датчиков, обладающая более высоким эмпирическим качеством (оцениваемым экспериментально на основе экспертных оценок) по сравнению с аналогичной процедурой, основанной на алгоритме 2, использующей данные от одного датчика. Были произведены несколько вычислительных экспериментов на реальных данных, полученных в процессе бурения скважин. В оценке качества алгоритма принимали участие эксперты, которые профессионально занимаются идентификацией геологических структур на изображениях, полученных по данным бурения. Приведены исходные данные одного из вычислительных экспериментов и полученные на основе этих данных результаты работы процедур, отвечающих алгоритмам 2 и 3, а также отмечены особенности приведенных результатов, которые учитывались при оценке эмпирического качества данных процедур.
Эмпирическое восстановление возможности.
В диссертационной работе произведено вычислительное моделирование эксперимента по эмпирическому восстановлению теоретико-возможностной модели и на его примере проиллюстрированы особенности построения и применения алгоритмов идентификации нестационарных неопределенных моделей измерений, а также проверены полученные во второй главе выводы о качестве данных алгоритмов. Задачи эмпирического восстановления возможности, включая задачу эмпирического гранулирования, поставлены и решены в [Пытьев, 2006]. В работах [Зубюк, 2005], [Фаломкина, 2006] также рассмотрены задачи эмпирического восстановления возможности и предложены альтернативные постановки задачи и методы решения. В диссертационной работе рассмотрена общая постановка задачи эмпирического восстановления, сформулированная в [Пытьев, 2006]. Отличие предложенной в диссертационной работе процедуры эмпирического восстановления возможности от процедуры, предложенной в [Пытьев, 2006], содержится в методе решения задачи восстановления как задачи проверки нестационарных сложных гипотез (об этом подробнее см. выше описание второй главы). В [Зубюк, 2005] приведены оценки для вероятностей ошибочных решений при идентификации возможностной модели, подтверждающие состоятельность предлагаемого метода идентификации и позволяющие так же, как и в предлагаемых в данной работе алгоритмах, связать качество процесса принятия решения с объемом выборки. При этом необходимо отметить, что в работе [Зубюк, 2005] в постановке задачи восстановления предполагается фиксированной стохастическая модель формирования отдельного измерения при переходе от одного наблюдения к другому наблюдению, то есть, в терминах приведенной выше постановки задачи проверки нестационарных сложных гипотез, считается фиксированной (но неизвестной) какая-либо простая гипотеза в составе сложной гипотезы Нп, V =■ 1,..., V, что отличает задачу, рассмотренную в [Зубюк, 2005], от рассмотренной в диссертационной работе задачи восстановления возможности. В [Фаломкина, 2006] задача эмпирического восстановления возможности поставлена и решена для варианта теории возможностей,
фрагментарно рассмотренного в [Пытьев, 2000]42, в котором возможность принимает значения в шкале С = ([0,1],^,+,«), где сложение «+» определено как «шах», умножение «•» - как «обычное» умножение «•». В диссертационной работе рассмотрена постановка задачи эмпирического восстановления для варианта теории возможностей, в котором возможность принимает значения в шкале С. = ([0,1], +, •), где сложение «+» определено как «шах», умножение «•» — как «тт».
При моделировании эксперимента по эмпирическому восстановлению возможности рассмотрена теоретко-возможностная модель стохастического эксперимента, в которой предполагается, что множество элементарных исходов состоит из трех элементов, и при этом отсутствует какая-либо информация о частичной упорядоченности значений возможности элементарных исходов.
Теоретико-возможностной модели сопоставляется нестационарная неопределенная модель М измерений, в которой определяются V = 25 множеств М",г> = 1,...,25, возможных моделей формирования отдельного измерения. Каждое из них взаимнооднозначным образом сопоставляется своему «неприводимому» классу Р(„) возможностей, V = 1,... ,25, и задается так, чтобы выполнялось определенное условие «согласованности» с соответствующим классом Рг(„) вероятностей [Пытьев, 2006]. В работе рассматривается случай конечных дискретных множеств М",г> = 1, ...,У (см. вторую главу), поэтому данные множества были дискретизованы в двух вариантах: с шагом ¿¿2 = 0.06 и с шагом «¿2 = 0.05. Каждому из вариантов сопоставлена своя нестационарная неопределенная модель измерений: Мх и Л^г, соответственно.
Для моделей М\ и Мг построены алгоритмы идентификации, основанные на игровом и частотном критериях. Получено, что задача идентификации модели М\ является разрешимой, а задача идентификации модели М? - нет. Для нестационарной неопределенной модели проведен модельный вычислительный эксперимент и найдена зависимость наблюдаемых частот ошибочных решений алгоритмов идентификации от объема выборки N. Приведены графики частот ошибочных решений для алгоритмов идентификации, основанных на игровом и частотном критериях, и соответствующие теоретические оценки переходных вероятностей ошибочных решений для данных алгоритмов.
Результаты показали, что полученные на основе результатов второй главы теоретические оценки существенно завышают количество наблюдений, необходимых для достижения приемлемой точности алгоритма принятия решения в соответствующей задаче проверки нестационарных сложных гипотез. Проблема исследования точности теоретических оценок для переходных вероятностей ошибочных решений в задаче проверки нестационарных сложных гипотез не ставилась одной из задач в данной работе и может являться предметом дальнейшего отдельного изучения. Алгоритм идентификации, основанный на частотном критерии оказался более предпочтительным, чем алгоритм идентификации, основанный на игровом критерии, и это находится в полном согласии с теоретически полученным на основе результатов второй главы выводом о том, что преимуществом в эксперименте должен обладать основанный на частотном критерии алгоритм идентификации.
Идентификация типа среды в игровой постановке задачи о случайных блужданиях взаимодействующих частиц.
В диссертационной работе произведено моделирование эксперимента по идентификации типа среды в игровой постановке задачи о случайных блужданиях взаимодействую-
42Пытьев Ю.П., Возможность. Элементы теории и применения. М.: Эдиториал УРСС, 2000.
гцих частиц. При этом рассматривалась система из 50 частиц, движущихся в дискретном времени по дискретной двумерной сетке. На каждом шаге частицы случайным образом смещаются и взаимодействуют по определенным игровым правилам.
Пусть D - координатная сетка на плоскости (с квадратной структурой). Вудем считать, что у сетки «сшиты» нижняя и верхняя, а также левая и правая границы (сетка замкнута на тор). Кроме того, предположим, что сетка D разделена на одинаковые непересекающиеся прямоугольники Dob размера hx х hy, а = 1,..., Л, Ь = 1,...,В, задающие области взаимодействия частиц. В начальный момент времени i = 0 в узлах сетки расположены С частиц. В моменты времени tn = n, п = 1,2,..., каждая частица совершает прыжок так, что двумерный радиус-вектор ее смещения задается формулой £(п) = Х(п) + ¿'(п), где Х(п) - смещение, связанное со взаимодействием частиц, ¡7(п) - случайный вектор погрешности. Принимается следующая игровая модель взаимодействия частиц:
• считается, что взаимодействие происходит только между частицами, находящимися в одной и той же области £>в(,;
• с каждой частицей связан не зависящий от времени вектор Rc, называемый инструкцией, с = 0,1,..., С - номер частицы;
• каждая частица выбирает из инструкций, полученных от всех своих соседей (частиц, находящихся с ней в одной и той же области взаимодействия .Dai), наиболее «типичную» и совершает перемещение в соответствии с ней; если в области взаимодействия не оказалось ни одного соседа, то частица продолжает прежнее движение;
• наиболее типичная инструкция определяется как ближайшая к средней: для частиц с номерами с\,..., с/,
Rc, — argmin
;=1
• таким образом, если в момент времени ¿п = п в одной области £>0(, вместе с с-й частицей оказались Ь > 0 соседей, то вектор смещения с-й частицы есть
• предполагается, что частица исполняет инструкцию с некоторой погрешностью, задаваемой случайным вектором Р(п).
Среди частиц ода а представляет собой частицу, за которой осуществляется наблюдение (частица-зонд), а остальные моделируют влияние среды, и их перемещения наблюдению не доступны. Предполагается, что даны V типов сред, каждому типу среды отвечает свое множество инструкций (данные множества не пересекаются). Таким образом, имеется набор реализаций двумерных случайных векторов = 1>... описывающих пе-
ремещения частицы-зонда, на основании которых необходимо принять решение в пользу того или иного типа и среды, V — 1,..., У.
Рис. 1: Примеры реализаций траектории движения частицы в средах различных типов V : а) V = 1; Ь) V = 2; с) V = 3; (1) V — 4. Номера на рисунке отвечают разным реализациям.
При моделировании эксперимента по идентификации типа среды значение С было выбрано равным 50, были заданы четыре типа среды (К = 4) и другие параметры задачи идентификации, а также соответствующая нестационарная неопределенная модель Л4 измерений.
Проведено несколько вычислительных экспериментов по моделированию процесса перемещений на Л/" = 26000 шагов частицы-зонда для четырех типов сред (см. примеры реализаций траектории движения частицы-зонда для различных типов сред на рис.1). Траектории движения носят сложный запутанный характер, резко меняют направление и могут оказаться совершенно непохожими для разных реализаций движений в среде одного и того же типа и схожими для разных типов сред. Это позволило наглядно продемонстрировать, что решение задачи идентификации типа среды при помощи определенных традиционных методов анализа случайных блужданий, методов статистического анализа, методов кинетической теории, методов теории ветвящихся процессов с взаимодействием, в данном случае затруднительно.
Для данной нестационарной неопределенной модели измерений построены и применены алгоритмы идентификации модели, основанные на игровом и частотном критериях. Показано, что задача идентификации разрешима. Проведен модельный вычислительный эксперимент и получена зависимость наблюдаемых частот ошибочных решений алгоритмов идентификации модели М от объема выборки N.
Результаты вычислительного эксперимента представлены в виде графиков частот ошибочных решений для алгоритмов идентификации, основанных на игровом и частотном критериях, и графиков теоретических оценок переходных вероятностей ошибочных решений для данных алгоритмов. Данные результаты показали, что теоретические оценки завышают количество наблкэдений, необходимых для достижения приемлемой точности алгоритма принятия решения в соответствующей задаче проверки нестационарных сложных гипотез. Оказалось, что в данном случае алгоритм идентификации, основанный на игровом критерии, имеет примерно то же эмпирическое качество, что и алгоритм идентификации, основанный на частотном критерии, хотя согласно теоретическому выводу, полученному на основе результатов второй главы в рамках конкретной нестационарной неопределенной модели М измерений, более предпочтительным должен являться алгоритм, основанный на игровом критерии. Здесь мы не ставили задачей решение вопроса о том, насколько полученные во второй главе теоретические оценки качества алгоритмов идентификации являются достаточно приемлемыми для того, чтобы осуществлять выбор наиболее подходящего (в смысле качества) алгоритма идентификации для данной нестационарной неопределенной модели измерений. Рассмотрение указанного вопроса может являться предметом дальнейших исследований.
В заключении сформулированы основные результаты диссертации.
Результаты диссертации опубликованы в следующих работах:
1) Кольцов Д.А., Синтез модели эксперимента в задачах интерпретации данных. Распознавание обвалов по данным бурения скважин // Сб. трудов 1-й международной научно-практической конференции «Современные информационные технологии и ИТ-образование», М., 2005, стр. 607-614.
2) Кольцов Д.А., Сердоболъская М.Л., Об одной нетрадиционной задаче проверки сложных гипотез //Докл. 12-ой Всероссийской конференции. «Математические методы распознавания образов», М., 2005, стр. 134-137.
3) Кольцов Д.А., Пыгпъев Ю.П., Чуличков А.И., Способ распознавания обвалов по данным бурения, полученным от трех различных датчиков, патент рег. № 2005127312, 30 августа 2005 года.
4) Кольцов Д-А., Сердоболъская М.Л., Идентификация типа среды в игровой постановке задачи о случайных блужданиях взаимодействующих частиц // Труды 9-й Международной конференции «Интеллектуальные системы и компьютерные науки», т.1, М., 2006, стр. 139-141.
Кольцов Д-А., Инвариантный критерий в задаче проверки адекватности модели измерений // Вестник Московского университета. Сер. 3. Физика. Астрономия, Лг»6, М., 2006, стр. 62-65. I
б) Кольцов Д-А., Сердобольская М.Л., Проверка сложных гипотез при отсутствии статистической устойчивости частоты // Обозрение прикладной и промышленной математики, М., 2007.
Подписано к печати i7.Li.rX Тираж 1СС Заказ '21
Отпечатано в отделе оперативной печати физического факультета МГУ
Оглавление автор диссертации — кандидата физико-математических наук Кольцов, Дмитрий Анатольевич
Введение
1 Анализ и идентификация объединенных неопределенных моделей измерений
1.1 Анализ и идентификация неопределенной модели измерений. Синтез модели [А, Е].
1.1.1 Синтез модели [А, Е] как задача проверки статистических гипотез.
1.1.2 Классы статистических критериев проверки гипотез.
1.1.3 Инвариантные критерии проверки статистических гипотез и максимальный инвариант.
1.1.4 Проверка адекватности модели измерений.
1.1.5 Проверка адекватности классов моделей измерений и синтез модели измерений.
1.2 Использование информации о связи неопределенных моделей измерений. Объединенная неопределенная модель.
1.3 Сравнение качества анализа и идентификации объединенных неопределенных моделей измерений в отсутствии дополнительной информации о связи и при ее использовании.
2 Идентификация нестационарных неопределенных моделей измерений
2.1 Постановки задач идентификации нестационарных неопределенных моделей измерений в различных областях научных исследований.
2.1.1 Теория возможностей. Проблема эмпирического восстановления возможности.
2.1.2 Идентификация типа среды в игровой постановке задачи о случайных блужданиях частиц с взаимодействием.
2.2 Идентификация нестационарных неопределенных моделей измерений как задача проверки нестационарных сложных гипотез.
2.3 Обзор свойств традиционных классов статистических критериев в контексте задачи проверки нестационарных сложных гипотез.
2.3.1 Наиболее мощные и равномерно наиболее мощные критерии.
2.3.2 Минимаксные и байесовские критерии.
2.3.3 Последовательные и асимптотически оптимальные критерии.
2.4 Проверка двух нестационарных сложных гипотез. Критерий голосования.
2.5 Проверка произвольного конечного числа нестационарных сложных гипотез.
2.5.2 «Частотный» критерий.
2.6 Анализ качества «игрового» и «частотного» критериев.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Кольцов, Дмитрий Анатольевич
Актуальность исследования
Анализ и интерпретация данных эксперимента играют одну из основополагающих ролей при получении новых знаний об исследуемых объектах. При этом для решения математических задач требуется формальное описание исследуемого явления. В данном описании могут присутствовать как известные, так и неизвестные параметры. Проблема получения новых знаний сводится к получению информации о неизвестных параметрах но известным. Есть разные классы математических моделей эксперимента, которые оперируют как с детерминированными параметрами, так и с параметрами, имеющими случайный или нечеткий характер. Для анализа и идентификации этих моделей применяются методы дискретного [1]—[4], [5], функционального [6], комбинаторно-логического анализа [7], теории вероятностей [8], [9], [10], нечеткой логики [11], [12], теории возможностей [13], [14] и т.д.
В настоящее время в различных областях экспериментальных научных исследований математические модели эксперимента отвечают довольно сложным исследуемым явлениям или процессам. Это является одной из причин того, что модели эксперимента не могут быть заданы точно (являются неопределенными). В рамках измерительного эксперимента будем говорить о неопределенной модели измерений. При этом отметим, что ошибочное решение при выборе модели или неадекватный выбор класса возможных моделей могут привести к неверным результатам анализа и интерпретации данных эксперимента. Поэтому методы анализа и идентификации неопределенных моделей измерений составляют существенную часть математического моделирования, и полученные на их основе результаты являются чрезвычайно важными при экспериментальных исследованиях.
Для широкого класса экспериментов математическую модель измерений можно записать следующим образом: = (1) где - г-ое отдельное наблюдение за объектом/явлением в эксперименте, г = 1,., ./V; М(г, /, щ) - функция, задающая возможные модели формирования отдельного измерения £¿5 / - ненаблюдаемые (неизвестные) параметры измеряемого объекта; щ моделирует неточность измерений («шум»). Если известны вид зависимости функции М(-) от своих аргументов, область ее определения и математическая природа сигнала / и шума 1,., ./V, то модель измерений считается полностью определенной. В противном случае (т.е. если какие-либо из указанных характеристик неизвестны полностью или частично) будем говорить о неопределенной модели измерений. При этом, как правило, будем предполагать заданным некоторое множество М возможных моделей М(-) или, в более общей постановке, класс М таких множеств. В последнем случае мы считаем, что в (1) модель формирования отдельного измерения принадлежит априори неизвестному множеству М* € М. Будем обозначать в общем случае неопределенную модель измерений символом М, отождествляя ее в известном смысле с классом М и формальным описанием математических свойств и характеристик данного класса. Задачей анализа неопределенной модели М будем называть задачу проверки ее адекватности наблюдаемым измерениям, а задачей идентификации модели М - задачу оценивания неизвестных параметров этой модели.
Традиционно неопределенность связывается с незнанием конкретной модели измерений из некоторого априори заданного класса или с неуверенностью в истинности самого класса. При этом необходимо отметить, что исследователь может оперировать при описании модели наблюдаемого явления/объекта различными видами неопределенности. Среди них можно отметить статистическую неопределенность, важной чертой которой является то, что априори известными являются вероятности всех возможных исходов эксперимента. Другой тип неопределенности характерен для теоретико-игрового контекста и игр с полной информацией. В любой момент времени игрок обладает полной информацией о текущем положении дел. С формальной математической точки зрения возможно перебором всех вариантов и анализом всех возможных последствий выбрать оптимальный ход. Однако число возможных ходов и их последствий настолько велико, что на практике этого невозможно сделать. Неопределенность этого типа является комбинаторной. Существует неопределенность более высокого уровня, которая может быть связана с тем, что исследователь, обладая более или менее точной информацией о моделях отдельного наблюдения, не знает, какова закономерность появления этих моделей в последовательности наблюдений [15]—[19], [20]. Различают и другие виды неопределенности [21]—[25]. При изучении новых типов явлений или при появлении новых способов их изучения может понадобиться введение нового понятия неопределенности модели измерений и переход на новый уровень ее (неопределенности) анализа.
Необходимо отметить, что многие задачи анализа и идентификации неопределенных моделей измерений решены с использованием стохастических методов [26], [27], [28]. Приведенные в указанных работах методы анализа и идентификации снабжены сопутствующими характеристиками качества, которые определяются в рамках традиционного аппарата теории вероятностей [8]. Адекватность предлагаемых методов исследования явлений в сущности определяется тем, насколько неточность измерений, вычисляемая в соответствии с принятым исследователем представлением о модели явления, укладывается в рамки стохастической модели шума в схеме (1).
Зачастую исследователь располагает несколькими способами изучения интересующего его явления, и каждому из них он сопоставляет свою неопределенную модель измерений. Предположение о наличии некоторой неизвестной априори связи между этими моделями требует более высокого уровня описания неопределенности. При этом остается открытым вопрос, как изменится качество алгоритма анализа и идентификации объединенной неопределенной модели измерений, построенной на основе отдельных неопределенных моделей измерений, если использовать дополнительную информацию о связи отдельных моделей. Такое построение объединенной модели и создание па ее основе нового метода получения новых знаний об исследуемом объекте можно осуществить не всегда. Это во многом зависит от того, насколько глубоко способен исследователь видеть природу наблюдаемого явления и при этом формировать адекватные гипотезы о связи.
Существует важный класс явлений, который в настоящее время не поддается удовлетворительному описанию в рамках традиционных подходов дискретного, системного или функционального анализов, или в контексте стохастических моделей неопределенности [14]. Таким явлениям может быть свойственна комбинаторная неопределенность, заложенная в структуру нх организации и являющаяся их неотъемлемой частью («внутренним» шумом), наряду с другими видами неопределенности, о которых исследователь располагает достаточно полной информацией («внешний» шум; подробнее о понятиях «внутреннего» и «внешнего» шума см. в [29]). Сложность анализа систем с «внутренним» шумом связана с тем, что взаимосвязи неопределенных моделей отдельных измерений определяются наличием практически не поддающейся анализу некоторой неявной функции, определяющей эволюцию наблюдаемого явления и косвенно, тем самым, связь результатов отдельных измерений. Для таких явлений, которые обладают указанными свойствами, при их описании может быть необходимо введение новых понятий неопределенности, отвечающих меньшей степени детерминированности представлений исследователя о наблюдаемом явлении. Так, новый, более высокий уровень неопределенности может быть связан с тем, что, во-первых, неизвестен класс, к которому принадлежит модель отдельного измерения, и, во-вторых, для последовательности наблюдений неизвестно, существует ли закономерность, определяющая соответствие номера отдельного измерения и конкретной его модели. В этих случаях мы будем говорить о нестационарной неопределенной модели измерений. Широко используемый подход, опирающийся на предположение о стохастической природе закономерности появления моделей отдельных измерений в последовательности наблюдений (байесовский подход [30]) оказывается не всегда приемлемым. Подобные ситуации характерны для таких экспериментов, в которых за время измерения исследуемый объект и измерительная процедура могут эволюционировать неизвестным (возможно, неслучайным) образом. При этих условиях исследователь может получить неадекватные оценки вероятностных характеристик процесса измерений. Кроме того, даже если исследователю и удалось построить адекватную стохастическую модель эксперимента, то она может оказаться слишком громоздкой и сложной для применения на практике.
Введение объединенных и нестационарных неопределенных моделей измерений при переходе на новый уровень описания неопределенности требует развития новых методов анализа и идентификации этих моделей.
В диссертационной работе задача анализа и идентификации объединенных моделей рассматривается для линейных схем измерений с аддитивным стохастическим шумом. При решении применяются математические методы, использующие в своей основе теорию проверки статистических гипотез. В книге [27] исследованы некоторые задачи, связанные с объединением моделей измерений. При этом не предполагается наличие априорной дополнительной информации о связи между отдельными моделями. В других работах, в том числе в работах [31], [28] тоже пе рассматриваются такие постановки задач, в которых бы предполагалось наличие априорной дополнительной информации о связи между отдельными неопределенными моделями измерений. В диссертационной работе предлагается определенным образом учесть подобную информацию и рассмотреть свойства соответствующей объединенной неопределенной модели измерений. Новые методы, предложенные в диссертационной работе, применяются для решения задач морфологического анализа изображений. Необходимо отметить, что в известных нам к настоящему времени работах на эту тему, в том числе в работах [32], [33],[7], [34]—[38] не исследуются задачи распознавания образов по нескольким предъявленным изображениям при наличии дополнительной информации о связи моделей формирования изображений и задача анализа изменений качества соответствующих алгоритмов распознавания при «впесении» дополнительной связующей информации. Предложенные в диссертационной работе методы анализа и идентификации объединенных неопределенных моделей измерений, построенные в предположении наличия дополнительной информации о связи отдельных неопределенных моделей измерений, позволили при определенных условиях эффективно проанализировать и решить указанные задачи морфологического анализа в контексте проблемы распознавания обвалов по данным бурения, полученным от трех различных датчиков [39], [40].
Подход, позволяющий в определенных случаях осуществлять идентификацию нестационарной неопределенной модели измерений, в которой предполагается «частичная бан-есовость» модели отдельного измерения, разработан в монографии [14], где основные результаты, определяющие качество метода идентификации, сформулированы в терминах сильной состоятельности оценок неопределенных характеристик модели. В настоящее время нам неизвестны другие работы, посвященные данной проблеме. Рассматриваемые в диссертационной работе подходы позволяют для нестационарной неопределенной модели измерений, в которой модели формирования отдельного измерения предполагаются стохастическими, построить алгоритмы идентификации, характеристики качества которых сформулированы в терминах переходных (по возможным значениям долей появлений моделей отдельных измерений в последовательности наблюдений) вероятностей ошибочных решений. Кроме того, указаны методы выбора оптимального (в определенном смысле) алгоритма идентификации в зависимости от особенностей задания нестационарной неопределенной модели измерений.
Цели и задачи исследования.
Целями диссертационной работы являются
1. разработка методов повышения качества алгоритма получения новых знаний об исследуемом объекте/явлении, основанных на учете дополнительной информации о связи нескольких неопределенных моделей измерений (о применении см. патент [40]), а именно разработка методов анализа и идентификации объединенных неопределенных моделей измерений, строящихся на основе отдельных неопределенных моделей измерений при наличии дополнительной информации о связи данных моделей;
2. разработка методов идентификации нестационарных неопределенных моделей измерений;
3. разработка и построение численных методов, алгоритмов и программ решения
• задачи распознавания образов по нескольким предъявленным изображениям при наличии дополнительной информации о связи моделей формирования изображений для построения алгоритма обнаружения и оценивания параметров обвалов по данным бурения, полученным от трех различных датчиков;
• задачи проверки нестационарных сложных гипотез;
• задачи эмпирического восстановления теоретико-возможностной модели.
Методическая и теоретическая основы исследования
Методической и теоретической основами исследования являются методы решения экстремальных задач [41] и задач проверки статистических гипотез [30], а также методы анализа и интерпретации данных эксперимента [26], [27]. Анализ неопределенных моделей измерений, обсуждаемых в диссертации, опирается па теорию надежности выводов [27], [14]. При введении новых понятий качества анализа и идентификации неопределенных моделей были использованы идеи, сформулированные при обсуждении природы случайности [21], проблем эргодической теории [42], [29], нелинейной динамики [43], [44], [45] и теории игр [20]. Численные эксперименты реализованы с использованием программ, написанных на языке С/С-Н-, а также программ, составленных па базе платформы Ма^аЬ.
Практическая ценность работы
Разработан новый инструмент для научных исследований и решения прикладных задач, который позволяет проводить анализ и идентификацию новых типов неопределенных моделей измерений: объединенной модели, построенной на основе отдельных неопределенных моделей измерений с использованием дополнительной информации об их связи, и нестационарной неопределенной модели.
При анализе и идентификации объединенных неопределенных моделей измерений полученные результаты позволяют для линейных схем измерений с аддитивным стохастическим шумом в известном смысле эффективно:
• в случае неизвестного параметра а2 корреляционного оператора шума по данным наблюдений верифицировать модель измерений и выбирать из заданного класса модель, наилучшим образом согласующуюся с результатами измерения;
• решать задачи анализа и идентификации объединенной неопределенной модели измерений при наличии и в зависимости от имеющейся дополнительной информации о связи отдельных неопределенных моделей измерений при известном и неизвестном параметре о1 корреляционного оператора шума как задачу проверки адекватности класса моделей измерений по отношению к данным наблюдений н как задачу синтеза модели измерений; в частности, полученные результаты позволяют строить и применять процедуры обнаружения объектов и идентификации их типов в случае, когда между классом моделей измерений и множеством типов объектов установлено взаимнооднозначное соответствие, а данные наблюдений представлены в виде нескольких наборов измерений, отвечающих, каждый, различным сторонам/способам исследования объекта (различным отдельным неопределенным моделям измерений).
Практическая ценность разработанных в диссертации методов идентификации нестационарных неопределенных моделей измерений заключается в том, что данные методы позволяют исследователю
• изучать объекты/явления, которые описываются нестационарными неопределенными моделями измерений, используя методы проверки нестационарных сложных гипотез о стохастических моделях формирования отдельных измерений, при отсутствии какой-либо информации о том, есть ли и, если есть, то какова закономерность появления простых гипотез в последовательности наблюдений, а также решать задачу идентификации нестационарных неопределенных моделей измерений как задачу проверки нестационарных сложных гипотез, в частности при решении проблемы эмпирического восстановления возможности и при анализе различных сложных стохастических динамических систем с «внутренним» шумом (см. [29], и пример игровой задачи, связанной с изучением данных проблем, ее исследование и решение в [46]);
• в реальном эксперименте, учитывая различные особенности неопределенной модели измерений и условие разрешимости задачи идентификации модели, оценить минимальное необходимое число измерений, требующееся для достижения заданного исследователем уровня качества алгоритма идентификации; при этом может быть учтен фактор затрат, в том числе вычислительных, приходящихся на одно отдельное измерение или на один отдельный акт принятия решения по отдельному измерению; осуществлять выбор оптимального (в определенном смысле) алгоритма идентификации, имеющего наименьшее значение Л^т как при учете фактора затрат, так и при отсутствии учета данного фактора.
Предлагаемые методы и программы имеют целью повышение качества алгоритмов получения новых знаний об исследуемом объекте/явлении. Некоторые из полученных результатов применялись автором в составе исследовательской группы, работающей над задачами анализа изображений геологических структур в рамках договора о сотрудничестве между Физическим Факультетом МГУ им. Ломоносова и компанией «БсЫитЬе^ег», по результатам исследований был оформлен патент [40].
Апробация работы
Результаты диссертационной работы докладывались на 1-й Международной научно-практической конференции «Современные информационные технологии и ИТ-образование», на конференциях «Математические методы распознавания образов-12», «Интеллектуальные системы и компьютерные науки-9», а также па научных семинарах кафедры МАТИС (механико-математический факультет МГУ) и кафедры КМФ (физический факультет МГУ).
Публикации по теме диссертации
По теме диссертации опубликовано 6 работ: одна работа в составе патента, 2 статьи в научных журналах и 3 статьи в трудах конференций.
Структура диссертационной работы
Диссертация состоит из введения, трех глав основного текста, заключения и списка литературы.
Заключение диссертация на тему "Методы анализа и идентификации неопределенных моделей эксперимента"
Основные результаты диссертационной работы состоят в следующем:
• предложены новые методы анализа и идентификации неопределенных моделей измерений для линейных схем измерения с аддитивным стохастическим шумом в случае, когда корреляционный оператор шума имеет вид £ = сг2/;
• предложен метод повышения качества анализа и идентификации объединенной неопределенной модели, основанный па учете дополнительной информации о связи отдельных неопределенных моделей измерений; показано, что при переходе к использованию объединенной модели с учетом дополнительной связующей информации мощность построенного на основе метода максимальной надежности критерия проверки адекватности класса моделей измерений не изменяется, а вероятность ошибочного выбора (в соответствии с методом максимальной надежности) модели измерений может как увеличиваться, так и уменьшаться, в зависимости от значений параметров объединенной неопределенной модели;
• введено понятие нестационарной неопределенной модели измерений, поставлена задача ее идентификации как задача проверки нестационарных сложных гипотез; при этом получены следующие результаты: в случае двух гипотез сформулировано условие разрешимости задачи идентификации, построен состоятельный критерий, проведена оценка переходных вероятностей ошибочных решений для данного критерия и указана связь полученных оценок с условием разрешимости и объемом выборки; решена задача идентификации нестационарной неопределенной модели измерений в случае произвольного конечного числа нестационарных сложных гипотез; сформулировано условие разрешимости задачи, предложены два алгоритма идентификации и проведен сравнительный анализ их качества;
• решена в новой постановке задача распознавания образов для линейной схемы измерений с аддитивным стохастическим шумом при неизвестном значении а2 в корреляционном операторе шума Е = а2/; в условиях неизвестного истинного класса моделей измерений разработана и применена процедура обнаружения обвалов и оценивания их параметров по данным бурения, полученным от трех различных датчиков, обладающая более высоким качеством (оцениваемым экспериментально на основе экспертных оценок) по сравнению с аналогичной процедурой, использующей данные от одного датчика;
• предложено решение проблемы эмпирического восстановления возможности и проблемы идентификации типа среды в игровой постановке задачи о случайных блужданиях взаимодействующих частиц па основе разработанных методов идентификации нестационарных неопределенных моделей измерений.
Разработан новый инструмент для научных исследований и решения прикладных задач, который позволяет проводить анализ и идентификацию новых типов неопределенных моделей измерений: объединенной модели, построенной на основе отдельных неопределенных моделей измерений с использованием дополнительной информации об их связи, и нестационарной неопределенной модели.
Заключение
Библиография Кольцов, Дмитрий Анатольевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Журавлев Ю.И., Флеров Ю.А., Вялый М.Н., Дискретный анализ. Основы высшей алгебры. М.: МЗ-Пресс, 2006.
2. Журавлев Ю.И., Флеров Ю.А., Дискретный анализ. М.: МФТИ, 1999.
3. Романовский И. В., Дискретный анализ. СПб: Невский диалект, Физматлит, Лаборатория Базовых Знаний, 2001.
4. Андерсон Д., Дискретная математика и комбинаторика. М.: Вильяме, 2003.
5. Ковалев М.М., Дискретная оптимизация (целочисленное программирование). М.: Эдиториал УРСС, 2003.
6. Колмогоров А.Н., Фомин C.B., Элементы теории функций и функционального анализа. М.: Наука, 1976.
7. Алешин C.B., Распознавание динамических образов, ч.1. М.: изд-во МГУ, 1998.
8. Колмогоров А.Н., Теория вероятностей и математическая статистика. Сб. статей. М.: Наука,1986.
9. Феллер В., Введение в теорию вероятностей и ее приложения, Т.1,2. М.: Мир, 1964.
10. Ширяев А.Н., Вероятность. М.: Физматлит, 2004.
11. Zadeh L.A., Fuzzy sets as a basis for a theory of possibility 11 Fuzzy Sets and Systems, 1978, №1, p. 3-28.
12. Zadeh L.A., Fuzzy sets 11 Information and Control, 1965, v.8, p. 235-350.
13. Пытъев Ю.П., Возможность. Элементы теории и применения. М.: Эдиториал УРСС, 2000.
14. Пытъев Ю.П., Возможность как альтернатива вероятности. Математические и эмпирические основы, применения. М.: Физматлит, 2006.
15. Винник В.Ю., Философия информации и сложных систем, 1999, http://www.referatus.ru/refs/0/95/81.zip.
16. Урсул А.Д., Информация. Методологические аспекты. М.: Наука, 1971.
17. Урсул А.Д., Отражение и информация. М.: Мысль, 1973.
18. Урсул А.Д., Природа информации. М.: Политиздат, 1968.
19. Урсул А.Д., О природе информации. // Вопросы философии, 1965, № 3.
20. Петросян JI.A., Зенкевич H.A., Семина Е.А., Теория Игр. М.: Высш. шк., Книжный дом «Университет», 1998.
21. Чайковский Ю.В., О природе случайности. М.: Центр системных исследований -Институт истории естествознания и техники РАН, 2004.
22. Шенъ А., Алгоритмическая сложность и случайность: недавние результаты // ТВП, 1992, т.
23. Успенский В.А., Что такое нестандартный анализ. М.: Наука, 1987.
24. Успенский В.А., Семенов A.J1., Теория алгоритмов: основные открытия и приложения. М.: Наука, 1987.
25. Хреннников А.Ю., Неархнмедов анализ и его приложения. М.: Физматлит, 2003.
26. Пытъев Ю.П., Математические методы интерпретации эксперимента. М.: Высшая школа, 1989.
27. Пытъев Ю.П., Методы математического моделирования измерительно-вычислительных систем, М.: Физматлит, 2004.
28. Кашъяп Р.Л., Pao А.Р., Построение динамических стохастических моделей по экспериментальным данным. М.: Наука, 1983.
29. Ван Кампен Н.Г., Стохастические процессы в физике и химии. М.: Высшая школа, 1990.
30. Боровков A.A., Математическая статистика. Оценка параметров. Проверка гипотез. М.: Наука, 1984.
31. Андерсон Т., Статистический анализ временных рядов. М.: Мир, 1976.
32. Ту Док., Гонсалес Р., Принципы распознавания образов. М.: Мир, 1979.
33. Вапник В.Н., Червоненкис А.Я., Теория распознавания образов. Статистические проблемы обучения. М.: Наука, 1974.
34. Пытъев Ю.П., Морфологический анализ изображений. // ДАН СССР, 1983, т.269, №5, с. 1061-1064.
35. Пытъев Ю.П., Задачи морфологического анализа изображений. // В сб. ст. «Математические методы исследования природных ресурсов Земли из космоса», М.: Наука, 1984, с. 41-82.
36. Pyt'ev Yu.P., Morphological Image Analysis. // Pattern Recognition and Image Analysis, vol. 3, №1, 1993, p. 19-28.
37. Image Recognition and Classification: Algorithms, Systems, and Applications, (B. Javidi, ed.), Marcel-Dekker, New York, NY, 2002.
38. Кольцов Д. А., Пытпъев Ю.П., 11уличков А.И., Способ распознавания обвалов поданным бурения, полученным от трех различных датчиков, патент per. № 2005127312, 30 августа 2005 года.
39. Васильев Ф.П., Численные методы решения экстремальных задач. М.: Наука, 1988.
40. Балеску Р., Равновесная и неравновесная статистическая механика. М.: Мир, 1978.
41. Анищенко B.C., Вадивасова Т.Е., Астахов В.В., Нелинейная динамика хаотических и стохастических систем. Изд-во Саратовского универ-та.Саратов, 1999.
42. Анищенко B.C., Астахов В.В., Вадивасова Т.Е., Нейман A.B., Стрелкова Г.И., Шиманский-Гайер Л., Нелинейные эффекты в хаотических и стохастических системах. Москва-Ижевск: Институт компьютерных исследований, 2003.
43. Малинецкий Г.Г., Потапов A.B., Современные проблемы нелинейной динамики. М.: Эдиториал УРСС, 2000.
44. Кольцов Д.А., Сердобольская М.Л., Проверка сложных гипотез при отсутствии статистической устойчивости частоты // Обозрение прикладной и промышленной математики. М., 2007.
45. Корнфелъд И.П., Синай Я.Г., Фомин C.B., Эргодическая теория. М.: Наука, 1980.
46. Синай Я.Г., Введение в эргодическую теорию М.: Фазис, 1996.
47. Синай Я.Г., Современные проблемы эргодической теории. М.: Физматлит, 1995.
48. Орнстейн Д., Эргодическая теория, случайность и динамические системы. М.: Мир, 1978.
49. Бланк М.Л., Устойчивость и локализация в хаотической динамике. М.: МЦНМО, 2001.
50. Арнольд В.И., Авец Ф., Эргодические проблемы классической механики. Ижевск: Ижевская респ. типография, 1999.
51. Pao С.Р., Линейные статистические методы и их применения. М.: Наука, 1968.
52. Леман Э., Проверка статистических гипотез. М.: Наука, 1979.
53. Уилкс С., Математическая статистика. М.: Наука, 1967.
54. Валъд А., Последовательный анализ. М.: Физматгиз, 1960.
55. Валъд А., Статистические решающие функции. Позиционные игры. М.: Наука, 1967.
56. Граничин О.Н., Введение в методы стохастической оптимизации и оценивания. СПб.: Изд-во С.-Петербургского университета, 2003.
57. Гилл А., Введение в теорию конечных автоматов. М.: Мир, 1966.
58. Брауэр В., Введение в теорию конечных автоматов. М.: Радио и связь, 1987.
59. Кудрявцев В.В., Алёшин С.В., Подколзин А.С., Введение в теорию автоматов. М.: Наука, 1985.
60. Козлов В.Я., Сачков В.Н., Маслов В.А., Труды по дискретной математике. Том 6. М.: Физматлит, 2002.
61. Чуличков А.И., Основы теории измерительно-вычислительных систем сверхвысокого разрешения (линейные стохастические измерительно-вычислительные системы). Тамбов: Изд-во ТГТУ, 2000.
62. Мамедов М.И., Статистический критерий проверки гипотезы о несмещенности структуры модели // Автоматика, 1986, №4, с. 63-65.
63. Durgaryan I.S., Pashchenko F.F., Information methods in identification // Trans. 9th Prag. Conf. Inf. Theory, Statist. Dicis. Funct. Random Process. Prague, June 28-July 2, 1982. V.A., Prague, 1983, p. 207-214.
64. Ellefon R.R.W., Is the Regression Equation Adequate? A Generalization // Technometrics, 1978, vol.20, №3, p.313-315.
65. Giles D.E.A., Preliminary test estimation in mis-specified regressions // Econ. Lett., 1986, vol.21, JV«4, p.325-328.
66. Hocking R.R. Developments in linear regression methodology: 1959-1982 // Technometrics, 1983, v.25, №3, p. 219-230; Discuss, p. 230-249.
67. Kapteyn A., Wansbeek Т., Errors in variables: consistent adjusted least squares (CALS) estimation // Commun. Statist. : Theory and Meth., 1984, v.13, №5, p.1811-1837.
68. Kubacek L., Regression model with estimated covariance matrix // Math. Slov., 1983, v.33, №4, p.395-408.
69. Scariano S.M., Neill J. W., Davenport J. M., Testing regression Function adequacy with correlation and without replication // Commun. Statist. Theory and Meth., 1984, v.13, №10, p. 1227-1237.
70. Пытъев Ю.П., О точности и надежности интерпретации совокупности измерений // Вестник Моск. ун-та. Серия Физика, Астрономия, 1986, т. 27, №5, с.3-7.
71. Пытъев Ю.П., Точность и надежность интерпретации косвенных измерений // ДАН СССР, 1987, т.295, №3, с.543-545.
72. Кляцкин В.И., Динамика стохастических систем. М.: Физматлит, 2003.
73. Кляцкин В.И., Стохастические уравнения глазами физика (Основные положения, точные результаты и асимптотические приближения). М.: Физматлит, 2001.
74. Ван Трис Г., Теория обнаружения, оценок и модуляции. М.: Советское радио, 1972, т.1.
75. Кольцов Д.А., Инвариантный критерий в задаче проверки адекватности модели измерений // Вестник Московского университета. Сер. 3. Физика. Астрономия, №6, М., 2006, стр. 62-65.
76. Колмогоров А.Н., Теория информации и теория алгоритмов. М.: Наука, 1987.
77. Алимов Ю.И., Кравцов Ю.А., Является ли вероятность "нормальной"физической величиной? // УФН, 1992, т. 162, № 7, с. 149-182.
78. Кравцов Ю.А., Случайность, детерминированность, предсказуемость // УФН, 1989, т. 158, № 1, с. 93-122.
79. Вернулли Я., О законе больших чисел. М.: Наука, 1984, ч.4.
80. Лифшиц Е.М., Питаевский Л.П., Физическая кинетика. М.: Физматлит, 2002.
81. Монин А.С., Яглом A.M., Статистическая гидромеханика. М.: Наука, 1967.
82. Кубо Р., Статистическая механика. М.: Мир, 1967.
83. Калинкин А.В., Марковские ветвящиеся процессы со взаимодействием // УМН, 2002, т.56, №.2, с. 23-84.
84. Калинкин А.В., Вероятность остановки на границе случайного блуждания в четверти плоскости и ветвящийся процесс с взаимодействием частиц // Теория вероятностей и ее применения, 2002, т. 47, вып. 3, с. 452-474.
85. Калинкин А.В., Стационарное распределение системы взаимодействующих частиц с дискретными состояниями // Доклады АН СССР, 1983, т. 268, вып. 6, с. 1362-1364.
86. Lukic В., Jeney S., Tischer С., Kulik A. J., Forro L., and Florin E.-L., Direct observation of nondiffusive motion of a Brownian particle // Physical Review Letters, 2005, vol. 95, 160601.
87. Олемской A.M., Суперсимметричная теория неравновесной стохастической системы в приложении к неупорядоченным гетерополимерам // УФН, 2001, т. 171, №5, с. 503-538.
88. Ivanov V.V., Ivanov Valery V., Kalinovsky Yu.L. and Zrelov P.V., Statistical and kinetic models of Internet traffic flows // Int. Conf. «Distributed computing and Grid-technologies in science and education», Dubna, 2004, Book of abstracts, p.87.
89. Astumian R.D., Bier M., Fluctuation driven ratchets: Molecular motors // Physical Review Letters, 1994, vol. 72, p. 1766-1769.
90. Reiman P., Brownian motors: noisy transport far from equilibrium 11 Physical Reports, 2002, vol. 3G1, p. 57-265.
91. Engel A., Reimann P., Thermal Ratchet Effects in Ferrofluids // Physical Reviews, 2004, vol. 70, 051107.
92. Логинов B.M., Лешаков О.Э., Индуцированные шумом переходы в системе коагулирующих частиц //ЖТФ, Письма, 2001, т. 27, вып.15, с. 9-14.
93. Чжун Кай Лай, Однородные цепи Маркова. М.: Наука, 1964.
94. Гихман И.И., Скороход А.В., Введение в теорию случайных процессов. М.: Наука, 1977.
95. Севастьянов Б.А., Калинкин А.В., Ветвящиеся случайные процессы с взаимодействием частиц // Доклад АН СССР, 1982, т. 264, №2, с.306-308.
96. Севастьянов Б.А., О некоторых типах марковских процессов // УМН, 1949, т. 4, №4, с. 194.
97. Евдокимов А.В., Метод нечеткой линеаризации для численного решения алгебраических и дифференциальных уравнений // Электронный журнал "Исследовано в России 2003, т.6.
98. Smyth P., Model Selection for Probabilistic Clustering Using Cross-Validated Likelihood // Statistics and Computing, 2000, vol.10, №.1, p.63-72.
99. McLachlan G., Krishnan Т., The EM algorithm and extensions. Wiley series in probability and statistics. John Wiley and Sons, 1997.
100. Jorgensen M., A dynamic EM algorithm for estimating mixture proportions // Statistics and Computing, 1999, vol.9, №4, p.299-302.
101. Solka Jeffrey L., Wegman Edward J., Priebe Carey E., Poston Wendy L., Rogers George W., Mixture structure analysis using the Akaike Information Criterion and the bootstrap 11 Statistics and Computing, 1998, vol.8, №3, p.177-188.
102. Хеллман О., Введение в теорию оптимального поиска. М.: Наука, 1985.
103. Gatto R-, Symbolic computation for approximating distributions of some families of one and two-sample nonparametric test statistics // Statistics and Computing, 2000, vol.11, JV«1, p.89-95.
104. Булинский А.В., Ширяев A.H., Теория случайных процессов. М.: Физматлит, 2005.
105. Lee Stephen М. S., Wong Irene О. L., A hybrid approach based on saddlepoint and importance sampling methods for bootstrap tail probability estimation // Statistics and Computing, 2002, vol.12, №3, p.209-217.
106. Вапник B.H., Алгоритмы и программы восстановления зависимостей. М.: Наука, 1984.
107. Линник Ю.В., Статистические задачи с мешающими параметрами. М.: Наука, 1966.
108. Кольцов Д.А., Сердоболъская M.JI., Об одной нетрадиционной задаче проверки сложных гипотез // Математические методы распознавания образов. Доклады 12-ой Всероссийской конференции. М., 2005, стр. 134-137.
109. Ваппик В.Н., Восстановление зависимостей по эмпирическим данным. М.: Наука, 1979.
110. Hoeffding W., Probability inequalities for sums of bounded random variables. Am. Statist. Assoc. J., v.58, p. 13-30, 1963.
111. Карманов В.Г. Математическое программирование. М.: Физматлит, 2004.
112. Еремин И.И., Астафьев Н.Н., Введение в теорию линейного и выпуклого программирования. М.: Наука, 1976.
113. Еремин И.И., Мазуров В.Д., Астафьев Н.Н., Несобственные задачи линейного и выпуклого программирования. М.: Наука, 1983.
114. Pyt'ev Yu.P., The Morphology of Color (Multispectral) Images, // Pattern Recognition and Image Analysis, vol. 7, №4, 1997, p. 467-473.
115. Pyt'ev Yu.P., Methods for Morphological Analysis of Color Images, // Pattern Recognition and Image Analysis, vol. 8, №4, 1998, p. 517-531.
116. Животников Г.С., Пытъев 10.П., Фаломкин И.И., Об алгоритме фильтрации кусочно-постоянных изображений. // Интеллектуальные системы, 2005, т. 9, вып.1-4, стр. 157-183.
117. Фаломкин И.И., Обобщенный алгоритм адаптивной морфологической фильтрации изображений. // Труды 9-й Международной конференции «Интеллектуальные системы и компьютерные иауки», т. 1, М., 2006, стр. 291-294.
118. Evsegneev S. О., Pyt'ev Yu. P., Analysis and recognition of piecewise constant texture images, // Pattern Recognition and Image Analysis, vol. 16, №3, 2006, p.398-405.
119. Зубюк А.В., Эмпирическое восстановление возможности // Сб. докл. XII всероссийской конф. «Математические методы распознавания образов», 2005, с. 112-115.
120. Фаломкина О.В., Исследование нечетких и неопределенных нечетких методов анализа и интерпретации данных, Дисс. . канд.физ.-матем.наук, Москва, 2006.
121. Гукенхеймер Дж., Холмс Ф., Нелинейные колебания, динамические системы и бифуркации векторных полей. Москва-Ижевск: Институт компьютерных исследований, 2002.
-
Похожие работы
- Минимаксное параметрическое оценивание в линейных обобщенных неопределенно-стохастических регрессионных моделях
- Методы оценивания параметров статистически неопределенной линейной модели
- Исследование нечетких и неопределенных нечетких методов анализа и интерпретации данных
- Методы минимаксного оценивания в многомерных линейных моделях наблюдения при наличии геометрических ограничений на моментные характеристики
- Анализ и синтез робастных динамических систем со структурными линейными и нелинейными неопределенностями
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность