автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование непараметрических вероятностных моделей стохастических систем
Автореферат диссертации по теме "Разработка и исследование непараметрических вероятностных моделей стохастических систем"
На правах рукописи
СЛОНОВА ЛИДИЯ АДОЛЬФОВНА
РАЗРАБОТКА И ИССЛЕДОВАНИЕ НЕПАРАМЕТРИЧЕСКИХ ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ СТОХАСТИЧЕСКИХ СИСТЕМ
Специальность 05.13.01 - Системный анализ, управление и обработка
информации (по отраслям: информатика, вычислительная техника и управление)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Красноярск - 2004
Работа выполнена в ГОУ ВПО «Красноярский государственный торгово-экономический институт».
Научный руководитель: доктор технических наук, профессор
Медведев Александр Васильевич
Официальные оппоненты: доктор физико-мематических наук,
профессор Багаев Борис Михайлович '
кандидат физико-мематических наук, доцент Сафонов Константин Владимирович
Ведущая организация: Институт вычислительного моделирования
СО РАН, г. Красноярск
Защита состоится «Л$» ОЛ-^МЛ. 2004г. в ^часов на заседании диссертационного совета Д 212.249.02 при Сибирском государственном 'аэрокосмическом университете имени академика М.Ф. Решетнева по адресу: 660014, г. Красноярск, просп. им. газ. "Красноярский рабочий", 31, зал заседаний совета.
С диссертацией можно ознакомится . в библиотеке Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева.
Автореферат разослан
Ученый секретарь диссертационного совета д.т.н., профессор
И.В. Ковалев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В связи с развитием таких направлений науки и информационных технологий, как математическое моделирование, системный анализ, обработка статистической информации стало возможным построение математических моделей сложных экономических, технических и др. систем. Прогрессивная методология системного анализа, имеющая общетеоретическое значение при рассмотрении сущности и общих принципов исследования сложных систем, позволяет поставить задачу познания объекта (процесса, явления) в конкретных науках и выбрать эффективную стратегию его изучения как системы. Высокая результативность методологии системного анализа позволяет ставить и решать задачи организации, функционирования и дальнейшего развития сложных систем и составляющих элементов. Одним из основных аспектов изучения объектов различной природы является построение математических моделей (аналитических или имитационных). Их создание может быть осуществлено на основе изучения некоторой совокупности величин, описывающих поведение объекта или системы в целом. Моделирование на основе результатов реализаций «вход-выход» называют идентификацией объектов или систем. Задачу идентификации можно рассматривать как с позиций параметрического, так и непараметрического подходов. Традиционно многие задачи, связанные с обработкой статистических данных, решаются в предположении существования достаточной информации, как о самих изучаемых системах, так и о свойствах действующих на них возмущений. В настоящее время накоплен большой опыт моделирования стохастических систем, где считается, что на основе априорных сведений может быть задана параметрическая (линейная или нелинейная) структура модели системы с точностью до нескольких параметров, которые и подлежат определению. Кроме того, считается известным характер воздействия помехи на систему (обычно аддитивный), а также функции распределений или плотностей возмущений предполагаются известными либо полностью, либо с точностью до конечного набора неизвестных параметров. В данном случае рассматривается задача идентификации в достаточно
широко изучена и включает в себя множество исследованных алгоритмов. В этой области наиболее существенные результаты получили Л. Льюнг, Н.С. Райбман, Э.П. Сейдж, Д.Л. Мелса, Ф. Фишер, А. Хальд, Г. Хан, С. Шапиро, ЯЗ. Цыпкин, П. Эйкхофф и другие. Применение такого подхода связано с неизбежным выбором вида модели. Однако все чаще приходится иметь дело с системами, структура которых и характер возмущений практически неизвестны. При этом доступная нам априорная информация о распределениях помех носит настолько неопределенный характер, что для построения математической модели системы нет оснований воспользоваться тем или иным параметрическим семейством распределений. В этом ■ случае говорят о непараметрической априорной неопределенности и об идентификации в широком смысле. Достойный вклад в развитие теории решения задач в условиях непараметрической априорной неопределенности, внесли такие ученые как Ю.Г. Дмитриев, А.В. Добровидов, В.А Епанечников, В.П. Живоглядов, И.А. Ибрагимов, АЛ. Катковник, Ю.А. Кошевник, Г.М. Кошкин, А.В. Лапко, Г.М. Мания, А.В. Медведев, Э.А. Надарая, Ю.С. Новак, А.И. Рубан, Ф.П. Тарасенко, Ю.К. Устинов, В. Хардле, Е. Парзен, М. Розенблатт, Н.Н. Ченцов и другие. Несмотря на бедность исходной информации, непараметрические процедуры во многих случаях намного выигрывают в эффективности, по сравнению с параметрическими, если выбранная параметрическая модель не адекватна наблюдаемым данным. Это подтверждает актуальность разработки и исследования непараметрических методов при построении моделей систем.
Задача идентификации состоит в установлении статистической зависимости на основе выборки. Наличие стохастической связи между входными и выходными измеряемыми величинами предполагает, что каждому фиксированному значению входной переменной соответствует определенное (условное) распределение вероятностей выходной переменной с плотностью р(у1х).. Можно рассматривать некоторую типичную характеристику этого распределения, такую, как среднее, мода, медиана и т. п. Вообще говоря, это значение ух зависит от х и получаемую зависимость называют теоретической функцией регрессии..Если в качестве ух выбирать условное среднее, то будем
получать среднюю регрессию, если за ух принять моду, то получается модальная регрессия, в случае выбора за ух медианы, говорят о медианнойрегрессии.
Традиционно на практике применяют регрессионные модели (имея в виду среднюю регрессию), т. е. модели вида:
у = М{Пх). (1)
Построение и исследование регрессионных моделей можно рассматривать как с позиций параметрического, так и непараметрического подходов. Однако следует заметить, что использование моделей средней регрессии оправдано, если условная плотность распределения выходных переменных при данном значении входа имеет симметричный, например нормальный, или близкий к нему вид. В -последнее время появилась потребность многих наук в обработке данных, не имеющих характерное гауссовское распределение. В частности, таковы многие задачи экономики, социологии, биологии и других наук. В этом случае, более разумно в качестве оценки выхода при фиксированном входе выбирать наиболее вероятное значение распределения или моду условной плотности, т. е. строить модели в и у = гпос1{К/х}, : ( 2 )
или у = то&р{у/х), (2а)
называемые в дальнейшем модально-регрессионными, или моделями модальной регрессии. Следует отметить, при использовании модально-регрессионных моделей получаемые оценки выходов являются робастными, т. е. менее чувствительными к влиянию грубых ошибок, попавших в статистический материал. Работа посвящена разработке различных подходов к построению модально-регрессионных моделей, которые при решении ряда практических задач являются более эффективными, чем классические модели средней регрессии. Построение и исследование регрессионных моделей рассмотрено с позиций параметрического и непараметрического подходов в трудах и фундаментальных монографиях по математической статистике отечественных и зарубежных ученых, но в них не нашли отражения методы и алгоритмы построения модально-регрессионных моделей, что подтверждает актуальность темы диссертации.
б
Цель работы состоит в построении непараметрических модально-регрессионных моделей идентификации стохастических объектов по наблюдениям входа и выхода, измеренными с помехами, а также в решении, возникшей в связи с этим, задачей оценивания моды условного распределения.
Методы исследований. При решении указанных задач используется современный вероятностно-статистический аппарат и непараметрические методы оценивания плотностей.
Основные защищаемые положения:
1. Алгоритмы построения модально-регрессионных моделей.
2. Новая непараметрическая оценка функции распределения и теоремы сходимости.
3. Методика определения оптимального параметра размытости на основании предложенных критериев для непараметрического оценивания плотностей Розенблатта-Парзена.
4. Метод нелинейных преобразований выборок, имеющих асимметричные плотности к выборкам с распределениями близкими к нормальным.
Практическая ценность работы определяется широкой применимостью теоретических результатов и предложенных методов идентификации в математическом моделировании, в обработке статистической информации и системном анализе при изучении работы сложных стохастических объектов и систем, наблюдаемые входные и выходные данные которых осуществляются с помехами с неизвестными функциями плотностей распределения. Разработанные в диссертации методы построения модально-регрессионных моделей могут быть использованы в широком круге приложений экономики - инвестиционный анализ, принятие решений, управление риском и др.
Научная новизна. Основные результаты диссертации являются новыми в области идентификации стохастических объектов:
- предложен новый метод моделирования стохастических систем, а именно, новый класс модально-регрессионных моделей;
- сконструирована непараметрическая оценка условной плотности и предложена новая непараметрическая оценка функции распределения,
доказаны теоремы асимптотической, сходимости этих оценок к оцениваемым функциям в среднеквадратическом смысле;
- предложены • критерии ■ выбора оптимального значения параметра размытости в оценках одномерных плотностей Розенблатта-Парзена.
- выведены формулы определения моды плотности в зависимости от асимметрии распределения для некоторого вида изучаемых данных и аналитически построен интервал, которому мода принадлежит;
- разработан метод преобразования статистических данных, имеющих асимметричное распределение,- к симметричному распределению с использованием преобразующей логарифмической функции, и предложен критерий нахождения оптимального значения ее параметра.
Апробация работы. Основные результаты диссертации были представлены и докладывались на: V, VII Всероссийских научно-практических конференциях «Проблемы информации региона. ПИР» (Красноярск 1999, 2001гг.); I, II Всесибирских конгрессах женщин-математиков (Красноярск 2000,2001 гг.); IV, V Международных симпозиумах «Интеллектуальные системы» INTELS '2000, 2002 (Москва 2000г., Калуга 2002г.); Международной научной конференции «Интеллектуальные системы и информационные технологии управления IS&ITC-2000» (Псков 2000г.); VIII Международной конференции «Математика. Компьютер. Образование.» (Пущино 2001г.); Межрегиональной научно-практической конференции преподавателей и работников торговли (Красноярск 2001г.); Всероссийской научно-практической конференции с международным участием «Достижения науки и техники - развитию сибирских регионов» (Красноярск 2001г.); VI Международной конференции "Computer Data Analysis and Modeling" (Минск 2001г.); III Международной конференции «Кибернетика и технологии XXI века» (Воронеж 2002г.); I, II Всероссийской конференции по финансово-актуарной математике и смежным вопросам ФАМ' 2002, 2003 (Красноярск 2002, 2003 гг.); Межрегиональной конференции «Математические модели природы и общества» (Красноярск 2002г.); Международной научно-практической конференции САКС-2002 (Красноярск 2002); III межвузовской научной конференции аспирантов (Красноярск 2003г.).
Публикации. По теме диссертации опубликовано 15 печатных работ, в том числе, лично - 8; в виде статей -13. Основные результаты научных исследований по теме диссертации содержатся в 11 работах. Личный вклад соискателя состоит в разработке методов и алгоритмов, описанных в печатных трудах.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения. Общий объем диссертации составляет 130 страниц. Библиографический список содержит 104 названия.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы, приводится обзор научной литературы, которая посвящена рассматриваемой тематике. Сформулированы объект и предмет исследования, определены цели работы и методы их достижения.
Первая глава посвящена обзору основных методов оценивания плотностей, в частности рассмотрены параметрические и непараметрические подходы. В отдельном параграфе выделены и рассмотрены непараметрические оценки функции плотности р(х) Розенблатта-Парзена, которые используются в работе и имеют вид:
1) в случае, если х - скалярная величина
где параметр размытости Сц удовлетворяет условиям:
Су>0; lim Cs = 0; lim SCs = ю,
S-юо S-+ a>
а интегрируемая с квадратом колоколообразная функция Ф0 такова, что
(3)
(4)
ф^Ъос, .CS )
V*6fi(*),
Н
«W
x-xj
<fc = l
(5)
2) если вход х = (х',х2.....хк) - векторная величина, то в качестве оценки
плотности р(х) Vjc е i2(jc) может быть использована, например, статистика:
(
:J -XI
(6)
Iiis* xJ-xJ
Sj=iCJsi=ij=i
i /
'Интегрируемые с квадратом функции 'Ф(-) в (6) удовлетворяют условиям типа (5), а последовательности Cs = (C£;Cj;...;C£) удовлетворяют условиям (4), кроме
последнего предельного соотношения, которое в многомерном случае будет
к _
выглядеть (4а)
S-*О
Все численные расчеты проводились с использованием функции вида
1 при\и\<.-& Ф(И) = . 5 J
О, при | и |> >/5
На основе оценок плотностей (3,6), сконструированы оценки условных
n (v/rV р (у^х)
плотностей ps(y/x), исходя из определения, т. е. по формуле ps(y/x) = ——-—.
Ps(x)
Для полученных оценок доказана следующая
Теорема 1: Пусть р(х,у)>0,а р3(у/х) ограничена для всех х,у е П(х,.у).
тогда статистика сходится в
среднеквадратическом смысле к условной плотности и является ее
асимптотически несмещенной оценкой.
Доказательство теоремы основано на использовании следующих лемм. Лемма 1.1. В условиях теоремы имеет место соотношение:
л л
Лемма 1.2. Несмещенной оценкой р (х,у) является рЦх,у), т.е. lim ММ(х,у)\= р2(х,у).
i-XJO
Следствие. Аналогично можно показать, что несмещенной оценкой
р2(х) янляется Pj(x), т.е. \im м\р%(х)\= р2(х).
Ш_кЛА '
Лемма 13. В условиЯх^роремЦы
соотношение
е рассматрИваюМ®^Н*МаРаметри
Во второй главе рассматриваюмяр^н*параметрические регрессионные алгоритмы идентификации, обоснована и приведена постановка задачи, приводящая к определению моды условного распределения. С помощью оценок совместной плотности • Розенблатта-Парзена построены регрессионная (7) и модально-регрессионная (8) непараметрические модели при к- мерных входных переменных. •
(7)
y=moüps(yl % тоД-]ГФ
4syH
У-У1
№
Oy
Xt-Xi
к QiX ./
(8)
В многомерном случае все компоненты вектора входных переменных предварительно нормируют, что позволяет определять один параметр размытости С1Х в формуле (7), который находят, используя среднеквадратичный критерий:
1 5 _ N2
Си=аг81тапЖгег(С„) = агвпт-2(>'/-;уДх<,Си)) . (9)
5Х Чи « /=1
При построении модально-регрессионных моделей (8) необходимо определить (к+1)-мерный вектор параметров размытости, а именно:
С3 =(С!У,С1Х,С^Х,...>С^Х). Вопрос о практическом нахождении этого вектора
пока остается открытым. В работе предлагается при построении модально-регрессионных моделей использовать прием, который позволяет обойти вопрос нахождения многомерного параметра размытости, а именно восстанавливать одномерную условную плотность выходов при каждом фиксированном входе. В
формуле (7) множители при у/ под знаком суммы можно интерпретировать как соответствующие веса, т. е. при оценивании выхода по регрессионной модели при каждом фиксированном входе находится средневзвешенное для тех у. для
которых произведение колоколообразных функций
\ у
не равно
нулю. При построении модально-регрессионных моделей для тех же находится оценка моды плотности их распределения, т.е. оценивание происходит по одномерной выборке. Итак, при построении модально-регрессионных моделей по критерию (9) определяется значение оптимального параметра размытости С!Х. Затем, используя многомерную индикаторную функцию
0(3с) =
при каждом фиксированном значении входа формируется выборка
выходных значений случайной величины
&•©(*,)}, (10) т. е. в выборку отбираются лишь те значения выходов для которых функция равна единице. Получив, таким образом, одномерную выборку
случайной величины по ней находим оценку моды распределения
(11)
В зависимости от способа оценивания моды в (11) получаем разные модели. Предлагается два способа нахождения оценки моды условного распределения по одномерной выборке (10). Один из способов заключается в том, что для полученных значений выходов восстанавливается плотность, которая является оценкой условной плотности распределения Затем находится
абсцисса максимума этой оценки (модель А). Восстановление плотностей происходит с применением оценок (3). Этот прием основан на том, что Е. Парзеном была введена оценка моды распределения, а именно:
pJ(0s) = maxps(x). Причем, когда мода 0-единственна, доказана х
состоятельность и асимптотическая нормальность этой оценки 0S.
Также предлагается другой способ нахождения моды условной плотности, который состоит в том, что для некоторого типа данных мода находится •аналитически (модель В). Этому способу посвящена глава 3.
Существенное влияние на качество оценок (3) оказывает параметр размытости, для нахождения которого предлагается несколько критериев и приводятся численные исследования их применения на модельных примерах. В каждом из приведенных далее критериев используется полученная в работе новая непараметрическая оценка функции распределения.
i i г\ ts~ r\ttt ts~\ 7 ТТО ГГ1ЛОТ/''ГТЛ/'А ifTT TJAVATTTT^i ТЛ Г\АИ 7ТТТ ФОФАН ТТО TTT/-"-vTTATTTXTX ТТОТТ
Р(Х = xt)=P(Xi ¿Х<хм) = р(~ф1Ч1 -*,). Тогда (13)
где вероятность элементарного собЙ^ия определим следующим образом
Р(Х = xt)=P(xt йХ<хм) = -*,).
Тогда (13)
i=l
Заменяя в формуле (13) значением непараметрической оценки (3)
плотности в точке получим:
О, при д: < JTi,
, при <х£х%, k = 2,S (14)
\ У
1, при X > хц.
Для практического использования оценки (14) доказана следующая Теорема 2. Непараметрическая оценка FgjOO функции распределения асимптотически сходится к F(x) в среднеквадратическом смысле, т.е.
FS2(x) =
1 fc-l s
S 1=1 7=1
ти •
lim m|(F(*)-Fs2(x))2}=0.
С_кип *
5-» оо
Для доказательства потребуются следующие леммы.
Лемма 2.1. Предел разности значений оценки /^ОО в соседних точках вариационного ряда равен нулю при 5 оо, т. е.
V»
Лемма 2.2. Значение оценки функции распределения в точке х}_1 стремится к единице при Б —> оо, т. е.
ШпО-р^.оМ.
Я-*«!
При нахождении оптимальных параметров размытости в работе предлагалось несколько подходов. Один из них состоит в том, что можно рассматривать параметр размытости как функцию выборочных значений С§ =С$(х), т. е. находить для каждого выборочного значения хк свой оптимальный С3(хк). В этом случае в качестве непараметрической оценки функции распределения при применяется оценка вида:
/г .4. Г. Л
(14а)
^iW/W j=I
2--XJ
\
Csto)
Критерий можно записать, используя условие минимального отклонения £
эмпирической F^x^)?* — функции распределения от оценки Fs2{xk). Из S
теоремы Гливенко известно, что F^(x) сходится к F(x) равномерно по х. Это говорит о высоком качестве такой оценки неизвестного распределения. Итак, параметры размытости для каждого выборочного значения выбираются из условия
С, (**) = arg min Щ (Cs (*)) = arg min (/3 (** ) - FS2 (**))2. (15)
OKx) Cs(x)
Численный пример 1.
Для выборки объема S-600, гистограмма которой представлена на рисунке 1, была восстановлена плотность (рисунок 2), где параметры размытости
определялись по формуле (15).
т—1—1—I-I—I—I—I—г
ггп'Иш
.—шТЙТг'-
Т-1-1-1-1-1-1-г
■1 -и •> -и -1 и • и 1 и )
Рисунок 1
Рисунок 2
График восстановленной плотности имеет осциллирующий вид. Поэтому решено было предложить критерий, позволяющий находить один параметр размытости для всех выборочных значений, который был получен на основе использования величины:
(16)
\{Рэ(х)-Р(х)У<1Р(х). -со
Разбив всю область интегрирования в (16) на интервалы
(-«>, Х2), (х2, х3), . . . ,(х3_и х3), (х3, +оо)
и учитывая определение эмпирической функции распределения, получим
*1 $-1 (и Л2 +00
]Г= \(й-Г(х))2/ --*"(*) / 0-Р(х))2ар.
-00 к=\ хк ^ )
Интегрирование правой части (17) подробно рассмотрено в работе. В результате получено выражение
(17)
W
1 1 .
(18)
Отсюда, заменив Р{х^) на значения непараметрической оценки Рщ(х^) и отбросив первое слагаемое, которое не зависит от С, получим критерий вида:
Щ (С,)
5 (
= ПШ1 2 .
с*
2к — \ 25
(19)
График поведения этого критерия показан на рисунке 3. На рисунке 4
представлен график восстановленной функции плотности при
Рисунок 3
Рисунок 4
По рисунку 4, можно сделать вывод, что восстановленная плотность имеет более гладкий вид, а вычисления по критерию (19) имеют меньший объем. Поэтому при восстановлении плотностей можно использовать этот критерий, позволяющий находить один оптимальный параметр для всех значений выборки. Его же можно применять и для выборок малого объема (см. далее рисунки 10,11).
В третьей главе рассматриваются методы нахождения моды плотности без восстановления последней. В практике обработки статистических данных уже применялись некоторые приемы, основанные на нелинейных преобразованиях, для нахождения числовых характеристик случайных величин. При моделировании невозможно учесть все факторы, влияющие на измеряемые входные и выходные данные. При построении моделей с использованием данных экономического, медицинского, экологического характера эти факторы обычно, носят не аддитивный, а мультипликативный характер. С помощью центральной предельной теоремы можно показать, что их закон распределения близок к логарифмически нормальному при самых общих условиях, аналогично тому, как нормальное распределение имеет место при сложении ошибок.
Логарифмически нормальное распределение случайной величины X можно распространить на случай интервала, отличного от введя параметр
характеризующий ' центр этого распределения. Оно имеет положительную асимметрию и характеризуется тем, что логарифм случайной величины (х0 +х) подчиняется нормальному распределению.
Иногда на практике приходится рассматривать данные, распределение которых получается из логнормального, зеркальным отображением относительно прямой х = х^, и имеющем отрицательную асимметрию. В этом случае логарифм
случайной величины (.*о~ •*) имеет нормальное распределение. Учитывая, что изучаемый признак имеет логнормальное или зеркально отраженное распределение, можно аналитически выразить моду плотности, найдя корень уравнения р'(х) = 0. В работе подробно приведено решение данного уравнения, в результате ■ были получены - следующие формулы для определения моды плотности:
1) при положительной асимметрии
Щх = (^ех + х0)е~°3 -Х0, (20)
по определению равно:
1=1
II _ » л . / _ ■ „ \
а2 =-^-2(1п(х< + х0)-Ь(Мех +х0))2 *'+Хо ); (21)
■гт1,=1 {Мех+х0)
+<*> 2
X- \хр(х)с!х = (Мех + хо)е°'5а -Хо
—оо
2) при отрицательной асимметрии
2
(20а)
х=х0-(Мех-хй)е°-5а2.
Далее был найден интервал, которому принадлежит мода, а именно:
1) при положительной асимметрии:
2) при отрицательной асимметрии:
Во всех приведенных выше формулах участвует параметр от значения которого существенно зависит точность полученных формул. Во втором параграфе третьей главы был предложен и численно опробован способ, который позволяет однозначно находить значение параметра х0. Поскольку, после преобразования случайной величины X должна получиться случайная величина Y с симметричной плотностью, то среднее значение преобразованной величины и медиана должны быть близки, т. е. должно выполняться приближенное
равенство у = М^.
При положительной асимметрии применяется преобразование у = 1п(д:о + х),
[ 1 з -
следовательно у = — £ 1п(х,- + х0 ) = 1п П (х^ + х0)! , а М^ = ЩМех + х0 ) • 5 /=1 <=1
При отрицательной асимметрии трансформирующую функцию предлагается
выбирать в виде У = — 1п(хо — х) (знак минус выбран для того, чтобы
преобразующая функция была монотонно возрастающей).
Для нахождения х0 используется критерий:
х0 =кgгcmWi(xй) = ЗIgTDm(y-MeyY■.
(22)
■*0
Далее приведен пример применения логарифмического преобразования выборочных данных с асимметричной функцией плотности. Численный пример 2.
На рисунке 5 показана гистограмма выборки объема 5=114, на рисунке 6 -гистограмма преобразованной выборки. На рисунке 7 - график критерия (22)
П 1.4 а ]£
П 24 2£
Рисунок 5
Рисунок 6
0 98 1.01 1.04 107 1.10 1.13 1.16 1.19
Рисунок 7
Следует заметить, что данный прием может быть применен как для выборок большого, так и малого объемов.
Численный пример 3. На рисунке 8 представлено графическое расположение точек выборки (S=14).
-1-Н——Ч-•-н*-» --1-(—^ X
2.2 2.8 3.4 4 4.6 5.2 5.8 6.4 7
Рисунок 8
М..=5.16.
Ясно, что асимметрия отрицательна, медиана 5.16, среднее значение
г=Л 7Т А* ■ „
х=4.72, мода, вычисленная по формуле (20а) Мох= 5.516. График поведения
критерия представлен на рисунке 9. Значение параметра х0, выбранное по
этому критерию пятшо * =6 А
'Ь
6.8 7 7.2 7.4 7.6 7.8 8
Рисунок 9
Судя по расположению точек на рисунке 8, полученное значение моды
1 Ж _í rt/
Мох- 5.516 можно считать приемлемым.
В работе также приведен пример, позволяющий провести сравнительный анализ применения различных методов для нахождения оценки моды, а именно, найти максимум восстановленной плотности и определить моду непосредственно по формуле (20).
Численный пример 4.
На рисунке 10 показано графическое расположение точек выборки объема 5=22.
-♦ ' » I-.и ...4».» |-М-—И-1-> „
. 3.8 3.84 3.87 3.91 3.94 3.98 4.01 4.05 4.08 4.12 4.15 х
Рисунок 10
.. _л лл Л I/ —i t\ei
В данном случае асимметрия у^ =0.414, мед иаенЪ.'Ж1о д а , вычисленная по формуле (20) равна Мт =3.954. На рисунке 11 представлен график поведения
критерия (22). Значение х0=3.8. На рисунке 12 показан график критерия (19) Жц(Сц) для данной выборки, оптимальное С, =0.03.
ш
IИ 10"* и 11Р
125 |<Г* 1 10"» и 10~' ЯО-' ало"1
V
31 и и и И и О 44 и и
Рисунок 11 Рисунок 12
На рисунке 13 представлен график восстановленной плотности. Оценкой моды
■ Ж _1
является абсцисса глобального максимума Мт=3.963. 4
р«оо
ЗЛ>
X
Рисунок 13
Вывод. В обоих случаях оценки моды получились приблизительно одинаковыми, что подтверждает предположение о том, что при асимметричном распределении оценку моды можно находить, используя формулы (20) или (20а) в зависимости от асимметрии.
В четвертой главе представлены численные исследования работы регрессионной и модально-регрессионнных моделей. Было проведено имитационное моделирование объекта. Далее была исследована работа предложенных модально--регрессионных моделей. Проведен сравнительный анализ оценивания выходов по регрессионной и предложенным модально-регрессионным моделям (вида А и В), посчитаны ошибки по этим моделям. Для исследования предлагается несколько модельных примеров (для наглядности рассматривался случай двумерной входной переменной), которые отличаются тем, что на выходную переменную накладывалась помеха £ с разной функцией
плотности распределения р(4)- Рассматривались случаи с симметричной плотностью помехи, а именно: равномерное и нормальное распределения. А также случаи ее асимметричного распределения. Были посчитаны оценки выхода, найденные с использованием регрессионной и модально-регрессионным моделям и посчитаны абсолютные ошибки ррег и рт0& моделей по формуле:
Р-^Е^-Л^и2)]2. (23)
где в качестве значений подставлялись оценки, найденные
соответственно по регрессионной и модально-регрессионной моделям.
Ниже представлены некоторые примеры, приведенные в работе, оценивания выходов по регрессионной и модально-регрессионным моделям. Оценки выхода, найденные по той или иной модели, были совмещены с имеющимися выходными данными на одном сравнительном чертеже. Здесь и далее круглыми точками отмечены реальные выходные данные, квадратными точками отмечаются оценки. На рисунках из всех значений выборки показаны первые 40.
Далее приведен пример наложения на выход нормально распределенной помехи. При построении регрессионной модели параметр размытости был определен по критерию (9), график которого изображен на рисунке 14. УЛ-едССэ) А
I -1-,-1-1-
Рисунок 14
Сравнительные графики применения моделей представлены на рисунке 15 (оценка выхода по регрессионной модели) и рисунок 16 (оценка по модально-регрессионной модели вида А). Ошибки составили
* Рисунок 15 Рисунок 16
I
Можно сделать вывод, что при наложении помехи, имеющей симметричное распределение, обе модели работают практически одинаково. | На рисунках 17,18 показаны сравнительные графики использования
моделей при наложении асимметричной помехи. Ошибки составили | ррег -0,221, рто<1 =0,0464.
' Регрессионная модель Модально-регрессионная модель
Рисунок 17 Рисунок 18
При несимметричной помехе модально-регрессионная модель работает | существенно лучше, чем регрессионная. Это подтверждают и сравнительные
графики и значения ошибок, посчитанные для обеих моделей. | Сравнивая работу регрессионной и модально-регрессионной вида В
моделей при наложении помехи, имеющей симметричное распределение, можно , сделать вывод, что регрессионная модель работает лучше. Это объясняется тем, ,что при выводе аналитических формул для нахождения моды (20 или 20а)
1
выдвигалось предположение о помехе, которая имеет распределение близкое к логарифмически нормальному, что в данном случае не соответствует действительности.
Далее приведены примеры наложения помех с асимметричной плотностью.
{
На рисунках 19 и 20 представлена пара сравнительных графиков, когда накладывалась помеха, имеющая логнормальное распределение.
Регрессионная модель Модально-регрессионная модель .
Рисунок 19 Рисунок 20
Ошибки составили уРрег=0,3621 и рт1а& =0,0441.
Вывод: при наложении помехи, имеющей асимметричное распределение близкое к логнормальному (с положительной или отрицательной асимметрией), оценки по модально-регрессионной модели (вида В) значительно ближе к реальным выходам объекта, чем оценки, полученные по регрессионной модели. Это подтверждается и сравнительными графиками (рисунки 19,20) и тем, что абсолютные ошибки, вычисленные при использовании модально-вероятностной модели Pmod, на порядок меньше ошибок ррег, посчитанных при оценивании по
регрессионной модели.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Предложен новый класс модально--регрессионных моделей при идентификации объектов и несколько методов их построения.
2. Сконструирована непараметрическая оценка условной плотности и получена новая непараметрическая оценка функции распределения, доказаны теоремы асимптотической сходимости этих оценок к оцениваемым функциям в среднеквадратическом смысле.
3. Предложены критерии выбора параметров размытости для оценок плотностей Розенблатта-Парзена и исследовано их применение на различных выборках.
4. Выведены формулы нахождения моды для данных, имеющих распределение близкое к логарифмически нормальному или зеркально ему отраженному.
5. Предложен способ преобразования статистических данных, имеющих логнормальное распределение к нормальному.
Основные результаты диссертации опубликованы в работах
1. Слонова, Л. А. Идентификация многосвязных систем при неполной информации / А.П. Красноштанов, Е.В. Куприянова, М.А. Процыкова и др. // Тр. Междунар. науч. Конф. Intelligent Systems and Information Technologies in Control, г. Псков. - Спб., 2000. - С. 19-21.
2. Слопова, Л.А. К исследованию непараметрических вероятностных моделей / Е.В. Куприянова, Л.А. Слонова, В.М. Пысин // Вестник НИИ СУВПТ. / НИИ СУВПТ. - Вып.4. - Красноярск, 2000. - С.53-79.
3. Слонова, Л А. О непараметрической оценке вероятностной и регрессионной моделей в нестационарных условиях / М.А Процыкова, С.А Раковская, Л.А. Слонова // Тез. докл. 8-й Междунар. конф. Математика. Компьютер. Образование, г. Пущино. - М.: Прогресс-Традиция, 2001.- С. 218.
4. Слонова, Л.А. Об одном алгоритме построения непараметрических вероятностных моделей / Л.А. Слонова //2-й сибир. конгресс женщин-математиков /Краснояр. гос. ун-т. - Красноярск, 2002. - С. 133-138.
5. Слонова, Л.А. Об одном подходе к построению непараметрических вероятностных моделей / Л.А. Слонова // Труды 1-й Всерос. ФАМ'2002 конференции. Ч. 2 / ИВМ СО РАН. - Красноярск, 2002. - С. 251-258.
6. Слонова, Л.А. Об одном критерии при непараметрическом восстановлении неизвестных распределений / ЛА. Слонова // Труды межрегион, конф. «Математ. модели природы и общества» / КГТЭИ. - Красноярск, 2002. -С. 205-211.
7. Слонова, Л.А. Об одном подходе к нахождению моды плотности распределения / Л.А. Слонова // Труды межрегион, конф. «Математ. модели природы и общества» / КГТЭИ. - Красноярск, - С. 212-222.
8. Слонова, Л.А. К вопросу построения вероятностных моделей / Л.А. Слонова // Тез. докл. Междунар. науч.-практич. конф. САКС-2002 / СибГАУ. -Красноярск, 2002. - С. 320-322.
9. Слонова, ЛА. Об одном подходе к нахождению наиболее вероятного значения по наблюдениям / Л.А. Слонова // Труды 2-й Всерос. ФАМ'2003 конф. Ч. 2 / ИВМ СО РАН. - Красноярск, 2003. - С. 195-199.
10. Слонова, ЛА. О различных подходах при моделировании экономических систем / Л.А. Слонова // Материалы 3-й межвуз. науч. конф. аспирантов «Актуальные проблемы современной науки и пути их решения» / КГТЭИ. -Красноярск, 2003. - С. 47-50.
11. Слонова, ЛА. О стохастическом моделировании экономических систем / Л.А. Слонова // Проблемы экономики и управления.- 2003. - № 1.- С. 17-20.
12. Slonova LA. The identification of multipli connected systems under incomplete information / A. P. Krasnoshtanov, E.V. Kupriyanjva, M.A Protsykova et al. // Тр. 4-го Междунар. симпозиума ИНТЕЛС'2000. - M.: РУСАКИ, 2000. -С.99-101.
13. Slonova, LA. To One Class of Non-parametric Models of Multivariate-Diraensional Processes / I.A. Krasnoshtanova, L.A. Slonova // Proceeding of the Sixth International Conference «Computer Data Analysis and Modeling». - Minsk: BSU,2001.-Vol2.-P. 18-22.
14. Slonova, LA. Constructing of the nonparametric probabilistic models of the stochastic processes / T.S. Korchagina, LA. Krasnoshtanova, I.P. Michailenko et al. // Труды 5-го Междунар. симпозиума "Интеллектуальные системы". ИНТЕЛС'2002, г. Калуга. М.: Изд - во МГТУ имени Н.Э. Баумана, 2002. -С. 324-327.
15. Slonova, LA. Adaptive non-parametric models and solution adoption algorithms / M.G. Berezovsky, A.V. Kuchmasov, A.V. Medvedev et al. // Труды. 3-й Междунар. конф. «Кибернетика и технология двадцать первого века». / ВГТУ.- Воронеж, 2002. - С.577-588.
I
I
\
( Соискатель:
[ Слонова Лидия Адольфовна
Разработка и исследование непараметрических вероятностных
!
моделей стохастических систем Автореферат диссертации
[ Попписано в печать
«2£у> Тираж 100 экз. Формат 60x84/16
Объем 1.0 п. л. Заказ № М
Изготовлено в ООО «Печатные технологии» 660017, г.Красноярск, улЛенина 113. оф.416 т. (3912) 23-52-73,29-63-58
<м
' ! 1С
Оглавление автор диссертации — кандидата физико-математических наук Слонова, Лидия Адольфовна
Введение.
Глава 1. Методы оценивания плотности вероятностей.
1.1. Параметрическое оценивание плотностей.
1.2. Сведения о непараметрических оценках плотности.
1.3. Непараметрические оценки плотности Розенблатта-Парзена.
1.4. Непараметрические оценки условной плотности. Теорема сходимости.
Глава 2. Непараметрические вероятностные алгоритмы идентификации.
2.1. Постановка задачи идентификации, приводящая к определению моды условной плотности.
2.2. Оптимизация непараметрических оценок.
2.3. О некоторых оценках функции распределения.
2.4. О нахождении оптимального параметра размытости при восстановлении плотности одномерного распределения.
Глава 3. Алгоритмы нахождения наиболее вероятного значения плотности.
3.1. Аналитическое нахождение моды.
3.2. Способы нахождения параметра х0 при логарифмической трансформации исходных данных.
3.3. Нахождение моды плотности, используя систему кривых Пирсона.
3.4. Численные исследования применения метода логарифмической трансформации и применения аналитических формул определения моды.
Глава 4. Численные исследования работы регрессионной и модально-ре^эессионных моделей.
4.1. Имитационное моделирование объекта.
4.2. Сравнительный анализ работы регрессионной и модально-регрессионной (вида А) моделей.
4.3. Сравнительный анализ работы регрессионной и модально-регрессионной (вида В) моделей.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Слонова, Лидия Адольфовна
Актуальность темы. В связи с развитием таких направлений науки и информационных технологий, как математическое моделирование, системный анализ, обработка статистической информации стало возможным построение математических моделей сложных систем. Прогрессивная методология системного анализа [2], имеющая общетеоретическое значение при рассмотрении сущности и общих принципов исследования сложных систем, позволяет поставить задачу познания объекта (процесса, явления) в конкретных науках и выбрать эффективную стратегию его изучения как системы. Эта методология на основе сравнительного анализа альтернативных решений позволяет выбрать соответствующую концепцию построения и совершенствования моделей сложных систем, сформулировать общие условия, обеспечивающие успешную работу ряда компонент при их объединении в одно целое. Высокая результативность методологии системного анализа позволяет ставить и решать задачи организации, функционирования и дальнейшего развития сложных систем, у которых состав и границы далеко не очевидны.
Попытки моделирования сложных систем привели к появлению множества приемов, подходов, которые постепенно обобщались, образуя определенную технологию преодоления количественных и качественных сложностей. Такие ситуации возникали в разных сферах практической деятельности, а соответствующие технологии вместе с их теоретическими основами получали разные названия: в инженерной деятельности - «методы проектирования», «системотехника»; в экономике - «исследование операций»; в административном и политическом управлении — «системный подход», «политология»; в прикладных научных исследованиях - «имитационное моделирование» и т. п.
Построение математических моделей является эффективным методом исследования различных объектов и систем. Внимание к вопросам построения моделей объектов и систем в условиях их функционирования обусловлено высокой практической значимостью. В работах [5,12,21] рассматриваются проблемы моделирования, отличающиеся и методами и алгоритмами. В [71] особое внимание уделяется построению математических моделей (аналитических или имитационных), реализуемых на современных ЭВМ. Моделирование используется для принятия обоснованных решений в различных сферах деятельности.
Создание моделей может быть осуществлено на основе изучения некоторой совокупности входных и выходных величин, которые описывают поведение объекта. Моделирование на основе результатов реализаций «вход-выход» известно в настоящее время как идентификация объектов или систем.
Задача идентификации состоит в оценивании функции на основе выборки в форме: = /5(х,у1ух(), (В.1) где у>1 - выходные, а. X; =(х};х?;.;х£) - входные измеряемые величины, = 1,5, 5 - объем выборки. Для нахождения оценки (В.1) могут быть применены как параметрические, так и непараметрические методы. В зависимости от применяемых методов формулы типа (В.1) являются параметрическими или непараметрическими моделями объекта.
Любые данные, представляющие собой количественные характеристики каких-либо объектов или систем, формируются под воздействием множества факторов, не все из которых доступны внешнему контролю. Обычно предполагают, что все факторы, не учтенные явно в модели, оказывают на объект или систему некоторое результирующее воздействие, значение которого невозможно предсказать заранее. Его можно рассматривать как некоторую случайную величину % с неизвестной плотностью распределения р(£,). При построении моделей с использованием данных экономического, медицинского, экологического характера все факторы, не учтенные в модели, обычно, носят не аддитивный, а мультипликативный характер. С помощью центральной предельной теоремы можно показать, что их закон распределения близок к логарифмически нормальному при самых общих условиях, аналогично тому, как нормальное распределение имеет место при сложении ошибок. Введение случайного компонента в модель приводит к тому, что взаимосвязь остальных ее переменных перестает быть строго детерминированной и становится стохастической. Наличие стохастической (вероятностной) связи между входными и выходными измеряемыми величинами предполагает, что каждому фиксированному значению входной переменной соответствует определенное (условное) распределение вероятностей выходной переменной с плотностью р(у/х). Можно рассматривать некоторую типичную характеристику этого распределения, такую, как среднее, мода, медиана и т. п. [32]. Вообще говоря, это значение будет зависеть от х и может быть обозначено ух. При изменении х, точка (х, ух) описывает некоторую кривую, которая называется модельной линией регрессии, а саму функцию — модельной функцией регрессии. Если в качестве ух выбирать условное среднее, то будем получать среднюю регрессию, если за ух принимать моду, то получается модальная регрессия, в случае выбора за ух медианы, говорят о медианной регрессии.
Стохастическая природа данных обуславливает необходимость применения специальных адекватных им статистических методов для их анализа и обработки. Для одного и того же объекта в зависимости от конкретных требований практики и типа решаемой задачи может быть построен ряд моделей. В математической статистике можно выделить два подхода к решению одних и тех же задач. Эти подходы обусловили возникновение двух больших групп методов: параметрического и непараметрического, в определенной мере конкурирующих и противостоящих друг другу.
Группа параметрических методов предполагает достаточный объем априорной информации о закономерностях функционирования изучаемых объектов, поскольку в этом случае необходимо на первом этапе определить параметрический класс моделей с точностью до набора вектора параметров. Если класс моделей, к которому принадлежит изучаемый объект, задан, то рассматривают постановку задачи идентификации в «узком смысле», которая трактуется как оценивание коэффициентов алгебраического или дифференциального уравнения объекта.
Общим вопросам идентификации в узком смысле посвящено много научной литературы. В книгах П. Эйкхоффа [72,84] рассмотрены основные понятия и определения модели, постановка задач оценивания параметров и методы решения задач для различных классов объектов. Э.П. Сейдж и Д.Л. Мелса в [63] рассматривают классические методы получения модели, базирующиеся на корреляционной теории случайных функций, методы стохастической аппроксимации. Исследуют оптимальные байесовские оценки и оценки максимума правдоподобия. В работах Н.С. Райбмана и В.М. Чадеева [57,58] рассматриваются общие методы и алгоритмы построения моделей, на базе которых решаются задачи выбора структуры параметров на основе данных «вход-выход». Формулируется постановка задачи идентификации и предлагаются методы построения линейных и нелинейных моделей. Все эти модели изучаются с точки зрения математического описания, т. е. приводятся соотношения, использующие данные наблюдения объекта. В книге ЯЗ. Цыпкина [82] в основном изложение касается идентификации линейных объектов, описывающихся линейными разностными уравнениями. Среди разнообразных алгоритмов, предназначенных для оценивания коэффициентов уравнений по наблюдаемым данным, чаще всего используются рекуррентные методы. У Ф. Фишера [77] рассмотрены вопросы идентификации экономических систем, а именно, вопросы оценивания параметров зависимостей, выражающих технологию или экономическое поведение систем на основе эмпирических исследований. Дается систематическое изложение проблем, связанных с идентификацией моделей больших размерностей. Рассматриваются условия, накладываемые на систему, а также проблемы, связанные с нелинейностью уравнений.
Для сложных реальных объектов приходится предварительно решать такие задачи, как: выбор структуры или задание класса моделей, оценивание степени и формы влияния входных переменных на выходные. Часто из-за отсутствия достаточных априорных сведений эти проблемы становятся неразрешимыми. В этом случае рассматривают задачу идентификации в «широком смысле» [43,72 и др.].
Принципы формирования алгоритмов идентификации тесно связаны с выбором аппроксимирующего уравнения объекта, выбором критерия качества этой аппроксимации (функции потерь) и выбором метода оптимизации критерия [56,83]. До сих пор этот выбор был в значительной степени произвольным, и поэтому предпочитали квадратичную функцию потерь. В этом случае получали в качестве оценки выходов среднеквадратичную (среднюю) регрессию, которую обычно называют просто регрессией, т. е. традиционно при сглаживании данных применяют модели вида: y = M{Y/x}. (В .2)
Построение и исследование регрессионных моделей можно рассматривать как с позиций параметрического подхода [5,21,27,32,33], так и непараметрического [26,48,64,80]. Следует заметить, что использование моделей средней регрессии оправдано, если условная плотность распределения выходных переменных при данном значении входа имеет симметричный или близкий к нему вид. В последнее время появилась потребность многих наук в обработке данных, не имеющих характерное гауссовское распределение. В частности, таковы многие задачи экономики, социологии, биологии и т. д. В этом случае, более разумно в качестве оценки выхода выбирать наиболее вероятное значение условного распределения [43,80,93], т. е. строить модели вида: у = mod р(у / х), (В.З) которые назовем модально-регрессионными. Следует отметить, при использовании модально-регрессионных моделей получаемые оценки выходов являются робастными, т. е. менее чувствительны к «засорениям» статистических данных и влиянию грубых ошибок, попавших в статистический материал. Пропагандой робастных методов оценивания занимались Д. Тьюки
75], Н. Джонсон и Ф. Лион [14]. В книге В. Хардле [80] упоминается о таком простом и устойчивом методе оценивания, как медианное сглаживание и говорится об устойчивости этого метода по отношению к большим выбросам. В этой же работе рассматривается ".задача предсказания на один шаг для одномерных временных рядов", а одним из способов предсказания будущих значений является метод, основанный на функции моды условной плотности (в предположении ее однозначности).
Ясно, что применение моделей (В.З) при идентификации различных объектов предпочтительнее, т. к. оценки выходов, получаемые по этим моделям, будут точнее, чем оценки, полученные с использованием обычных регрессионных моделей (В.2), но здесь возникает задача оценивания моды условной плотности. Естественный путь ее решения — восстановить плотность и найти абсциссу максимума оценки. Этот прием основан на том, что Парзеном была введена оценка в$ моды в распределения, а именно: р5{в5) = шахр5 (х) . X
Причем в случае, когда мода 0-единственна, доказана состоятельность и асимптотическая нормальность этой оценки 65~. Сама по себе задача восстановления плотности распределения по результатам наблюдений является центральной задачей математической статистики. Для ее решения могут применяться как параметрические, так и непараметрические подходы. При параметрическом подходе на основании некоторых априорных сведений выдвигается гипотеза о том, что закон распределения наблюдаемых данных принадлежит к тому или иному параметрическому семейству - гауссовскому, показательному и т. п. Эти распределения считаются зависящими от конечного числа параметров, которые оцениваются по выборочным данным. К настоящему времени разработаны различные алгоритмы оценивания неизвестных параметров по наблюдениям входа и выхода объектов с привлечением, как правило, классических методов - метода наименьших квадратов, метода максимального правдоподобия и метода моментов [10,33,56]. На следующем этапе проверяется адекватность выбранного распределения с
2 2 использованием критериев согласия типа % Пирсона, Колмогорова, со Мизеса и др. Применение критериев согласия для проверки простых и сложных гипотез рассматривается в [39,65,68].
Естественно, что ограниченное множество типов параметрических распределений, используемых на практике, не всегда позволяет адекватно описать реально существующие зависимости, или априорной информации недостаточно для того, чтобы выдвинуть ту или иную гипотезу относительно предполагаемого закона распределения. В этом случае применяют методы обработки данных, которые не предполагает знания априори параметрического семейства законов распределений, т.е. применяют непараметрические методы. Они начали развиваться значительно позднее, чем гауссовские и обладают перед ними рядом преимуществ. Основные из них — более широкое поле приложений, а также возможность их использования для выборок малого объема. Вопросам непараметрического оценивания плотностей последнее время в научной литературе посвящено много работ и монографий [13, 15-18]. Внимание к этой проблеме вызвано как ее теоретическим значением, так и важностью для приложений.
Предварительными простейшими оценками плотностей можно считать гистограмму и полиграмму первого и более высокого порядков [60,68,74].
Последующий вклад в теорию непараметрического оценивания плотности внесли М. Розенблатт, Е. Парзен [88, 89], В.А. Епанечников [18]. В работах этих и других авторов вводятся новые классы оценок, обобщающие гистограмму. Так, один из этих классов, называемых "ядерными оценками", был предложен Розенблаттом и Парзеном. В работах [16,44,49,64] исследуются вопросы несмещенности оценок, асимптотика и скорость сходимости отклонений, изучается влияние формы ядра на качество приближения оценки к функции плотности. В статьях [24,31] рассматриваются варианты определения параметра размытости (сглаживания) непараметрических оценок плотности, в частности, с гауссовым ядром. Определяются границы области поиска экстремума по параметру размытости функционала правдоподобия или эмпирического риска, исследуется скорость сходимости к нулю интегральной среднеквадратичной ошибки. Mark Brewer в работе "Байесовская модель для локального сглаживания в ядерной оценке плотности" [86] предлагает процедуру для управления шириной окна в ядерной оценке одномерной плотности с использованием перекрестной проверки и анализа графической модели. Процедура допускает гибкий выбор ширины окна в терминах требуемой величины степени сглаживания. Показывается особое преимущество метода с точки зрения квадратичного риска при малых объемах выборок, что подтверждено на примере оценки плотности по реальным данным.
При построении оценок естественными являются вопросы исследования их асимптотического поведения и сходимости к оцениваемым функциям. Задачи статистического оценивания, свойства параметрических и непараметрических оценок рассматриваются в книгах JL Девроя и JL Дьерфи [13], И.А. Ибрагимова и Р.З. Хасьминского [23], Г.М. Мания [41], Э.А. Надарая [49], Ф.П. Тарасенко [74], в статьях Ю.А. Кошевника [30], Г.М. Кошкина [31], С.Ю. Новака [52,53].
Работа посвящена построению модально-регрессионных моделей, причем рассматривается несколько подходов к их построению, т. е. применяются как параметрические, так и непараметрические методы.
Вопрос о том, какую группу методов следует использовать при анализе данных, составлял предмет спора с давних времен. Примером тому могут служить разногласия между Пирсоном и Фишером, о которых пишет в своей монографии В. Хардле [80]: ".обе точки зрения по-своему интересны. Пирсон отмечал, что цена, которую мы должны заплатить за чисто параметрическое приближение, - это возможность грубой ошибки при спецификации, приводящей к слишком большому смещению модели. С другой стороны, Фишер выражал обеспокоенность в связи с рассмотрением моделей без параметров в чистом виде, которые могут приводить к большому разбросу оценок, особенно для выборок малого объема".
В научной литературе разрабатывается идея о совместном использовании тех и других методов для наиболее полного учета априорной информации. В.Хардле отмечает, что совмещение параметрических и непараметрических составляющих может даже привести к построению лучших моделей. В последнее время получены успешные результаты при восстановлении стохастических зависимостей, использующих учет частичных сведений об их виде и данных экспериментальных исследований. Такой комплексный подход имеет место в работах Г.М. Мания [41], А.В. Лапко, В.А. Лапко, С.В.Ченцова [35-37].
В диссертационной работе при построении модально-регрессионных моделей (В.З) для нахождения оценки моды условной плотности предлагается несколько способов. Один из них состоит в том, что, сначала, используя непараметрические оценки Розенблатта-Парзена, восстанавливается условная плотность, а затем находится абсцисса ее максимума (модель А). Применение ядерных оценок связано с нахождением оптимального параметра размытости. Этому вопросу посвящены работы [24,31,42]. В данной работе предлагается несколько видов новых критериев для его нахождения, проведен их численный сравнительный анализ.
Другой подход предусматривает для некоторого типа данных нахождение моды плотности без восстановления последней (модель В).
Цель работы состоит в построении модально-регрессионных моделей идентификации стохастических объектов по наблюдениям входа и выхода, измеренными с помехами с неизвестными функциями распределения. Для достижения поставленной цели необходимо решить следующие задачи:
- сформировать выборку условного распределения выходов при каждом фиксированном значении вектора входных переменных;
- найти оценку условной плотности одномерного распределения выходов;
- предложить критерий нахождения оптимального параметра размытости;
- предложить алгоритмы нахождения моды условной плотности;
- при нахождении моды с использованием аналитических формул предложить способ определения параметра л:0.
Методы исследования. При выполнении диссертационной работы использован современный вероятностно-статистический аппарат, методы теории оптимизации и статистического моделирования, элементы аналитической геометрии, а также методы непараметрического оценивания плотностей вероятностей.
Научная новизна работы состоит в следующем:
1. Предложен новый метод идентификации стохастических систем, а именно, новый класс модально-регрессионных моделей;
2. Сконструирована непараметрическая оценка условной плотности и доказана с помощью трех лемм теорема ее асимптотической сходимости к условной плотности в среднеквадратическом смысле;
3. Предложены критерии выбора оптимального значения параметра размытости в оценках одномерных плотностей Розенблатта-Парзена, в которых используется новая непараметрическая оценка функции распределения и доказана ее сходимость к оцениваемой функции;
4. Выведены формулы определения моды плотности в зависимости от асимметрии распределения для некоторого вида изучаемых данных и аналитически построен интервал, которому принадлежит мода;
5. Предложены некоторые виды нелинейных преобразований статистических данных, сводящие их распределение к нормальному, и метод определения параметра таких преобразований.
Практическая ценность. Результаты работы могут найти применение в математическом моделировании, в обработке статистической информации и системном анализе при изучении работы сложных стохастических объектов и систем, наблюдаемые входные и выходные данные которых осуществляются с помехами с неизвестными функциями плотностей распределения. Предлагаемые в диссертации методы могут быть использованы в широком круге приложений экономики - инвестиционный анализ, принятие решений, управление риском и др.
На защиту выносятся:
1. Методы построения модально-регрессионных моделей;
2. Критерии нахождения оптимального параметра размытости при непараметрическом ядерном восстановлении плотностей;
3. Методы определения оценки моды плотности;
4. Результаты сравнительного анализа оценивания выходов по регрессионной и модально-регрессионным моделям, проведенного на модельных примерах;
5. Теоремы об асимптотической сходимости непараметрических оценок условной плотности и функции распределения в среднеквадратическом смысле к оцениваемым функциям.
Апробация работы. Основные результаты диссертации докладывались и обсуждались:
- на V, VII Всероссийских научно-практических конференциях "Проблемы информации региона. ПИР", Красноярск, 1999, 2001 гг.;
- на I, II Всесибирских конгрессах женщин-математиков, Красноярск, 2000, 2001 гг.;
- на IV, V Международных симпозиумах "Интеллектуальные системы" INTELS '2000,2002, Москва, 2000г., Калуга, 2002г.;
- на Международной научной конференции 'Интеллектуальные системы и информационные технологии управления IS&ITC - 2000", Псков, 2000г.;
- на VIII Международной конференции "Математика. Компьютер. Образование.", Пущино, 2001г.;
- на Межрегиональной научно-практической конференции преподавателей и работников торговли, Красноярск, 2001г.;
- на Всероссийской научно-практической конференции с международным участием "Достижения науки и техники - развитию сибирских регионов", Красноярск, 2001г.;
- на VI Международной конференции "Computer Data Analysis and Modeling", Минск, 2001г.;
- на III Международной конференции "Кибернетика и технологии XXI века", Воронеж, 2002г.;
- на I, II Всероссийских конференциях по финансово-актуарной математике и смежным вопросам. ФАМ' 2002, 2003, Красноярск,2002, 2003гг.;
- на Межрегиональной конференции "Математические модели природы и общества", Красноярск, 2002г.;
- на Международной конференции САКС-2002;
- на семинарах в Научно-исследовательском институте СУВПТ (20002003гг.);
- семинарах кафедры высшей и прикладной математики КГТЭИ (20002004гг.).
Публикации. По результатам работы опубликовано 15 печатных работ; в том числе, лично -8; в виде статей - 13 и тезисов докладов - 2.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка используемой литературы из 104 названий и приложения. Содержание работы изложено на 130 страницах печатного текста, проиллюстрировано 78 рисунками.
Заключение диссертация на тему "Разработка и исследование непараметрических вероятностных моделей стохастических систем"
Заключение
В диссертационной работе было предложено при идентификации стохастических объектов использовать не общепринятые регрессионные, а новые модально-регрессионные модели. Построение таких моделей осложнено тем, что необходимо оценивать моду условных плотностей. Поскольку сами условные плотности априори неизвестны, в работе сконструированы их непараметрические оценки и доказана, с помощью трех лемм, теорема об асимптотической сходимости оценки условной плотности в среднеквадратическом смысле к условной плотности. Эти оценки, в случае к -мерных входных переменных, зависят от (/: + 1)-мерных векторов параметров размытости, задача нахождения которых пока не решена. В диссертации предложен алгоритм формирования одномерной выборки выходов при каждом фиксированном значении вектора входных переменных. По этим выборкам осуществляется оценивание моды, которая и принимается за оценку выхода. Задача нахождения оценки моды плотности условного распределения решается разными методами, каждый из которых имеет свои сложности. Один из методов построения модально-регрессионных моделей предполагает восстановление условной плотности с использованием непараметрических оценок Розенблатта-Парзена. В этом случае качество восстановление существенно зависит от выбора параметра размытости С5. В работе предложено несколько критериев для настройки этого параметра, проведено численное исследование восстановления плотностей по выборкам как большого, так и малого объемов, где параметр С5 находился по одному из этих критериев. После чего был сделан вывод, что наиболее оправдано применение критерия (С5). При выборе параметра размытости по этому критерию требуется меньше машинного времени, чем при работе с критериями
ПРИ этом У восстановленной плотности видны ее все особенности. Это очень важно, если учесть, что целью восстановления является определение моды. В каждом из этих критериев используется новая непараметрическая оценка функции распределения, которая была предложены в данной работе. Доказана теорема об ее асимптотической сходимости в среднеквадратическом смысле к функции распределения.
Другой метод может применяться в таких областях как экономика, медицина, экология и др. В этом случае можно показать, что условные плотности будут иметь распределения близкие к логарифмически нормальным. В работе выведены формулы нахождения моды плотности Мох, аналитические выражения которых зависят от таких характеристик как медиана Мех и среднее квадратичное отклонение <7. Они легко определяются по имеющимся данным. Также в этих формулах присутствует параметр х0, для однозначного определения которого, предложен критерий И^Осо). Применение этих формул значительно упрощает задачу построения модально-регрессионных моделей, т. к. в этом случае нет необходимости восстанавливать условную плотность, но может применяться только для определенного типа данных.
В диссертации предложен способ преобразования данных, имеющих асимметричную функцию плотности, к данным, распределение которых имеет близкий к нормальному вид. Так же аналитически получен интервал, которому принадлежит мода, что позволит уменьшить объем вычислений при нахождении моды по восстановленной плотности.
Применяя методы имитационного моделирования, были проведены численные исследования применения модально-регрессионных и регрессионных моделей при идентификации стохастических объектов и систем. Предложенные и построенные модально-регрессионные модели показали лучшую точность восстановления зависимостей по статистическим данным с точки зрения абсолютных ошибок, посчитанных по моделям.
Сформулируем кратко заключительные выводы.
1. Предложен новый класс модально-регрессионных моделей при идентификации объектов и несколько методов их построения.
2. Сконструирована непараметрическая оценка условной плотности и предложена новая непараметрическая оценка функции распределения, доказаны теоремы асимптотической сходимости этих оценок к оцениваемым функциям в среднеквадратическом смысле.
3. Предложены критерии выбора параметров размытости для оценок плотности Розенблатта-Парзена и исследовано их применение на различных выборках.
4. Выведены формулы нахождения моды для данных, имеющих распределение близкое к логнормальному или зеркально ему отраженному.
5. Предложен способ преобразования статистических данных, имеющих логнормальное распределение к нормальному.
Библиография Слонова, Лидия Адольфовна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Александров, П.С. Курс аналитической геометрии и линейной алгебры / П.С. Александров. М.: Наука, 1979. - 512 с.
2. Беляков, Г.П. Основы системотехники / Г.П. Беляков, В.А. Сарычев,
3. B.А. Сорокин и др. Томск: МГП «РАСКО», 1992. - 312с.
4. Браунли, К.А. Статистическая теория и методология в науке и технике / К.А. Браунли. М.: Наука, 1977. - 407 с.
5. Вадзинский, Р.Н. Справочник по вероятностным распределениям / Р.Н. Вадзинский. Спб.: Наука, 2001. - 295 с.
6. Вапник, В.Н. Восстановление зависимостей по эмпирическим данным / В.Н. Вапник. М.: Наука, 1979. - 446 с.
7. Венедякин, Г.В. Общая методика экспериментального исследования и обработки опытных данных / Г.В. Венедякин. М.: Колос, 1972. - 315 с.
8. Вентцель, Е.С. Теория вероятностей и ее инженерные приложения / Е.С. Вентцель, Л.А. Овчаров. М.: Наука, 1988. - 480 с.
9. Гитник, А.П. О статистической оценке вероятности случайного события / А.П. Гитник // Автоматика и вычислительная техника. 1975. - №5. —1. C. 62-69.
10. Гихман, И.И. Непараметрические методы статистики / И.И. Гихман, Б.В. Гнеденко, Н.В. Смирнов // Тр. 3-го Всесоюз. математ. съезда. М., 1958.-Т.З.-С. 320-334.
11. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учеб. пособие / В.Е. Гмурман. М.: Высш. шк., 1998. - 478 с.
12. Гнеденко, Б.В. Курс теории вероятностей: Учебник / Б.В. Гнеденко. М.: Наука, 1988. - 448 с.
13. Гроп, Д. Методы идентификации систем / Д. Гроп. М.: Мир, 1979. -426с.
14. Деврой, Л. Непараметрическое оценивание плотности. Ь —подход / Л.Деврой, Л. Дьерфи. М.: Мир, 1988. - 407 с.
15. Джонсон, Н. Статистика и планирование эксперимента в технике и науке. Т. 1,2 / Н. Джонсон, Ф. Лион. М.: Мир, 1980. - 610 с.
16. Дмитриев, Ю. Г. Статистическое оценивание распределений вероятностей с использованием дополнительной информации / Ю.Г. Дмитриев, Ю.К.Устинов; Под ред. В.В. Конева. Томск: Изд-во Томск, гос. ун-та, 1988. -194 с.
17. Добровидов, A.B. Непараметрическое оценивание сигналов / A.B. Добровидов, Г.М. Кошкин. М.: Наука. 1997. - 336 с.
18. Елисеенко, И.Л. Некоторые задачи непараметрического оценивания плотности распределения: Автореф. дис. . канд. физ. мат. наук. / И.А.Елисенко. - Л., 1988. - 14 с.
19. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности / В.А. Епанечников//ТВиП. 1969.- Т.14. - С.156-161.
20. Живоглядов, В.П. Непараметрические алгоритмы адаптации / В.П. Живоглядов, A.B. Медведев. Фрунзе: Илим, 1974. - 136 с.
21. Загоруйко, Н.Г. Алгоритмы обнаружения эмпирических закономерностей / Н.Г. Загоруйко, В.Н. Елкина, Г.С. Лбов. Новосибирск: Наука. Сиб. отд-ние, 1985.-108 с.
22. Замков, О.О. Математические методы в экономике: Учебник / О.О. Замков, A.B. Толстопятенко, Ю.Н. Черемных; Под ред. A.B. Сидоровича. М.: ДИС, 1998. - 368 с.
23. Золотарев, В.М. Одномерные устойчивые распределения / В.М. Золотарев -М.: Наука, 1983.-304с.
24. Ибрагимов, H.A. Асимптотическая теория оценивания / И.А. Ибрагимов, Р.З. Хасьминский. М.: Наука, 1979. - 527 с.
25. Иванова, Н.В. Определение параметров сглаживания в непараметрических оценках функции плотности по выборке / Н.В. Иванова, К.Т. Протасов // Математическая статистика и ее приложения. Томск: изд-во Томск, гос. ун-та, 1982. - Вып. 8. - С. 50-65.
26. Ильин, E.B. К задаче восстановления плотности вероятности в условиях непараметрической неопределенности: Препринт ВЦ СО АН СССР / Е.В.Ильин, A.B. Лапко. Красноярск, 1980. - 26 с.
27. Катковник, А. Я. Непараметрическая идентификация и сглаживание данных / А.Я. Катковник. М.: Наука, 1985. - 415 с.
28. Кендал, М. Теория распределений / М. Кендал, А. Стьюарт. М.: Наука, 1966. - 587 с.
29. Кендал, М. Статистические выводы и связи / М. Кендал, А. Стьюарт. М.: Наука, 1973.-899 с.
30. Корн, Г. Справочник по математике / Г. Корн, Т. Корн. М.: Наука, 1977. -832 с.
31. Кошевник, Ю.А. О некоторых предельных свойствах непараметрических оценок функции распределения / Ю.А. Кошевник // ТВиП. 1984. - Т. 29. -№ 4. - С. 772-778.
32. Кошкин, Г.М. Улучшенная неотрицательная ядерная оценка плотности / Г.М. Кошкин // ТВиП. 1988. - Т. 33. - № 4. - С. 816-822.
33. Крамер, Г. Математические методы статистики / Г. Крамер. М.: Мир, 1975.-648 с.
34. Кремер, Н.Ш. Теория вероятностей и математическая статистика: Учебник / Н.Ш. Кремер. М.: Юнити-Дана, 2000. - 543 с.
35. Кудрявцев, Л. Д. Математический анализ: Учебник. Т. 2 / Л.Д. Кудрявцев. М.: Высш. шк., 1973. - 470 с.
36. Лапко, A.B. Непараметрические системы обработки информации: Учеб. пособие / A.B. Лапко, C.B. Ченцов. М.: Наука, 2000. - 350 с.
37. Лапко, В.А. Синтез и анализ непараметрических моделей коллективного типа / В .А. Лапко И Автометрия. 2001. - № 6. - С. 98-106.
38. Лапко, B.Â. Непараметрические коллективы решающих правил / В.А. Лапко; Под ред. C.B. Ченцова. Новосибирск: Наука. Сиб. отд-ние, 2002. -168 с.
39. Лемешко, Б.Ю. Статистический анализ одномерных наблюдений случайных величин / Б.Ю. Лемешко; НГТУ. Новосибирск, 1995. - 125 с.
40. Лемешко, Б.Ю. К применению непараметрических критериев согласия для проверки адекватности непараметрических моделей / Б.Ю. Лемешко, С.Н. Постовалов, A.B. Французов // Автометрия. 2002. - № 2. - С. 3-14.
41. Льюнг, Л. Идентификация систем / Л. Льюнг. М.: Наука, 1991.-421 с.
42. Мания, Г.М. Статистическое оценивание распределения вероятностей /Г.М. Мания. Тбилиси: Изд- во Тбилис. гос. ун-та, 1974. — 237 с.
43. Маркович, Н. Непараметрическое оценивание плотности вероятности: восстановление распределений с тяжелыми хвостами / Н. Маркович // Междунар. конф. по проблемам управления: Избр. тр. Т 2. - М.: СИНТЕГ, 1999. - С. 66-67.
44. Медведев, A.B. Непараметрические оценки плотности вероятности и ее производных / A.B. Медведев // Автоматизация промышленного эксперимента. Фрунзе: Илим, 1973. - С. 22-31.
45. Медведев, A.B. Адаптация в условиях непараметрической неопределенности / A.B. Медведев // Адаптивные системы и их приложения. Новосибирск: Наука. Сиб. отд-ние, 1978. - С. 4-34.
46. Медведев, A.B. Непараметрические системы обучения и адаптации: Препринт ВЦ СО АН СССР / A.B. Медведев. Красноярск, 1981. - 72 с.
47. Медведев, A.B. Непараметрические системы адаптации / A.B. Медведев. — Новосибирск: Наука. Сиб. отд-ние, 1983. 174 с.
48. Медведев, A.B. О моделировании организационных процессов / A.B. Медведев // Вестник Сибир. аэрокосм. акад. имени академика М. Ф. Решетнева: Сб. науч. тр. / Под ред. Г. П. Белякова; CAA. Красноярск, 2000. - Вып. 1.-С. 173-191.
49. Надарая, Э.А. Об оценке регрессии / Э.А. Надарая // ТВиП. 1964. - Т. 9. -№1. - С. 157-159.
50. Надарая, Э.А. О непараметрических оценках плотности вероятности и регрессии / Э.А. Надарая // ТВиП. 1965. - Т. 10. - № 1.- С. 184-187.
51. Надарая, Э.А. Непараметрическое оценивание плотности вероятности и кривой регрессии / Э.А. Надарая. Тбилиси: Изд-во Томск, гос. ун-та, 1983. -193 с.
52. Надарая, Э.А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии / Э.А. Надарая // ТВиП. 1970. - Т. 15. -№ 1.-С. 139-142.
53. Новак, С.Ю. О моде неизвестного вероятностного распределения / С.Ю. Новак // ТВиП. 1999. - Т 44. - № 1. - С. 119-123.
54. Новак, С.Ю. Обобщенная ядерная оценка плотности / С.Ю. Новак // ТВиП. 1999. Т 44. - № 3. - С. 634-645.
55. Пискунов, Н.С. Дифференциальное и интегральное исчисления: Учебник. Т. 2 / Н.С. Пискунов. М.: Наука, 1972. - 576 с.
56. Поллард, Дж. Справочник по вычислительным методам статистики / Дж. Поллард; Под ред. Е.М. Четыркина.- М.: Финансы и статистика, 1982.-344 с.
57. Пугачев, B.C. Теория вероятностей и математическая статистика / B.C. Пугачев. М.: Наука, 1979. - 590 с.
58. Райбман, Н.С. Что такое идентификация / Н.С. Райбман. М.: Наука, 1970. -117 с.
59. Райбман, Н.С. Адаптивные модели в системах управления / Н.С. Райбман, В.М. Чадеев. М.: Сов. радио, 1966. -160 с.
60. Рубан, А.И. Идентификация и чувствительность сложных систем / А.И. Рубан. Томск: Изд-во Томск, гос. ун-та, 1982.- 302 с.
61. Рубан, А.И. Методы анализа данных: Учеб. Пособие. В 2 ч. / А.И. Рубан; КГТУ. Красноярск, 1994. - 312 с.
62. Рубан, А.И. Методы оптимизации / А.И. Рубан; КГТУ. Красноярск, 2001. -527 с.
63. Рунион, Р. Справочник по непараметрической статистике / Р. Рунион М.: Финансы и статистика, 1982. - 198 с.
64. Сейдж, Э.П. Идентификация систем управления / Э.П. Сейдж, Д.Л. Мелса. М.: Наука, 1974. - 246 с.
65. Сергеев, B.JI. К оптимизации регрессионных оценок непараметрического типа при ограниченных выборках / B.JI. Сергеев. // Матем. статистика и ее приложения. Томск: Изд-во Томск, гос. ун-та, 1982. Вып. 8. - С. 123-148.
66. Смирнов, Н.В. О распределении w критерия Мизеса / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. - М.: Наука, 1970. - С. 60-78.
67. Смирнов, Н.В. Об уклонениях эмпирической кривой распределения / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. - С. 88-107.
68. Смирнов, Н.В. О приближении плотностей распределения случайных величин / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. - С. 205-223.
69. Смирнов, Н.В. Курс теории вероятностей и математической статистики для технических приложений: Учеб. пособие / Н.В. Смирнов, И.В. Дунин-Барковский. М.: Наука, 1969. - 511 с.
70. Снедекор, Дж. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии / Дж. Снедекор. М.: Сельхозиздат, 1961. -503 с.
71. Соболь, ИМ. Метод Монте-Карло / И.М. Соболь. М.: Наука, 1985. - 40 с.
72. Советов, Б.Я. Моделирование систем / Б.Я. Советов, С.А. Яковлев. М.: Высш. шк., 1998. - 319 с.
73. Современные методы идентификации систем / Под ред. П. Эйкхоффа. М.: Высш. шк., 1977. - 288 с.
74. Справочник по прикладной статистике / Под ред. Э. Ллойда, У. Ледермана, С.А. Айвазяна и др. М.: Финансы и статистика, 1989. - Т. 1. - 510 е., Т. 2. -527 с.
75. Тарасенко, Ф.П. Непараметрическая статистика / Ф.П. Тарасенко Томск: Изд-во Томск, гос. ун-та, 1967. - 265 с.
76. Тьюки, Дж. Анализ результатов наблюдений / Дж. Тьюки. М.: Мир, 1981. -693 с.
77. Уилкс, С. Математическая статистика / С. Уилкс. М.: Наука, 1967.- 632 с.
78. Фишер, Ф. Проблема идентификации в эконометрии / Ф. Фишер. М.: Статистика, 1978. - 223 с.
79. Хальд, А. Математическая статистика с техническими приложениями / А. Хальд. М.: Иностр. лит., 1956. - 326 с.
80. Хан, Г. Статистические модели в инженерных задачах / Г. Хан, С. Шапиро. М.: Мир, 1969.-395 с.
81. Хардле, В. Прикладная непараметрическая регрессия / В. Хардле. М.: Мир, 1993.-349 с.
82. Хастингс, Н. Справочник по статистическим распределениям / Н. Хастингс, Дж. Пикок. М.: Статистика, 1980. - 95 с.
83. Цыпкин, Я.З. Основы информационной теории идентификации / Я.З. Цыпкин. М.: Наука, 1984.- 320 с.
84. Ченцов, Н.Н. Статистические решающие правила и оптимальные выводы / Н.Н. Ченцов. М.: Наука, 1972. - 520 с.
85. Эйкхофф, П. Основы идентификации систем управления / П. Эйкхофф. -М.: Мир, 1975.-683 с.
86. Aitchison, J. The Log-normal Distribution / J. Aitchison, J.A.C. Brown. -Cambridge University Press, Cambridge, 1957. 134 p.
87. Brewer Mark J. A. Bayesian model for local smoothing in kernel density estimation / Mark J. A. Brewer // Statistics and Computer. 2000. - Vol. 10. -№4.-P. 299-309.
88. Johnson, N.L. Distributions in Statistics / N.L. Johnson, S. Kotz // Discrete Distributions. Houghton Mifflin. - Boston, 1969. - Vol. 1. - P. 197-203.
89. Parzen, E. On the Estimation of Probability Density Function and the Mode / E. Parzen // Ann. Math. Statist., 1962. Vol. 33. - P. 1065.
90. Parzen, E. On Estimation of a Probability Density, Function and Mode / E. Parzen I I IEEE Transactions on Information Theory. 1982 Vol. Pam - 4. -№ 6. - P. 663-666.1. Список публикаций автора
91. Слонова, JI.A. К исследованию непараметрических вероятностных моделей / Е.В. Куприянова, Л.А. Слонова, В.М. Пысин // Вестник НИИ СУВПТ. / НИИ СУВПТ. Вып.4. - Красноярск, 2000. - С.53-79.
92. Слонова, JI.A. Об одном алгоритме построения непараметрических вероятностных моделей / JI.A. Слонова // 2-й сибир. конгресс женщин-математиков / Краснояр. гос. ун-т. Красноярск, 2002. - С. 133-138.
93. Слонова, JI.A. Об одном подходе к построению непараметрических вероятностных моделей / Л.А. Слонова // Труды 1-й Всерос. ФАМ'2002 конф. Ч. 2 / ИВМ СО РАН. Красноярск, 2002. - С. 251-258.
94. Слонова, JI.A. Об одном критерии при непараметрическом восстановлении неизвестных распределений / Л.А. Слонова // Труды межрегион, конф. «Математические модели природы и общества» / КГТЭИ. Красноярск, 2002.-С. 205-211.
95. Слонова, JI.A. Об одном подходе к нахождению моды плотности распределения / Л.А. Слонова // Труды межрегион, конф. «Математические модели природы и общества» / КГТЭИ. Красноярск, -С. 212-222.
96. Слонова, Л.А. К вопросу построения вероятностных моделей / Л. А. Слонова // Тез. докл. Междунар. науч. практич. конф. САКС-2002 / СибГАУ. - Красноярск, 2002. - С. 320-322.
97. Слонова, JJ.A. Об одном подходе к нахождению наиболее вероятного значения по наблюдениям / JI.A. Слонова // Труды 2-й Всерос. ФАМ'2003 конф. Ч. 2 / ИВМ СО РАН. Красноярск, 2003. - С. 195-199.
98. Слонова, JI.A. О различных подходах при моделировании экономических систем / JI.A. Слонова // Материалы 3-й межвуз. науч. конф. аспирантов «Актуальные проблемы современной науки и пути их решения» / КГТЭИ. Красноярск, 2003. - С. 47-50.
99. Слонова, JI.A. О стохастическом моделировании экономических систем /JI.A. Слонова // Проблемы экономики и управления-2003,- № 1 С. 17-20.
100. Slonova, LA. The identification of multipli connected systems under incomplete information / A.P. Krasnoshtanov, E.V. Kupriyanjva, M.A. Protsykova et al. // Тр. 4-го Междунар. симпозиума ИНТЕЛС'2000. M.: РУСАКИ, 2000. -С.99-101.
101. Slonova, L.A. Adaptive non-parametric models and solution adoption algorithms / M.G. Berezovsky, A.V. Kuchmasov, A.V. Medvedev et al. // Труды 3-й Междунар. конф. «Кибернетика и технологии двадцать первого века». / ВГТУ.- Воронеж, 2002. С.577-588.
-
Похожие работы
- Многоуровневая непараметрическая система обработки информации
- Синтез и анализ непараметрических коллективов решающих правил
- Синтез и анализ непараметрических моделей стохастических зависимостей и распознавания образов в условиях малых выборок
- Многоуровневые непараметрические системы распознавания образов на основе декомпозиции обучающей выборки по ее размерности
- Непараметрические модели коллективного типа в задачах восстановления стохастических зависимостей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность