автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями
Автореферат диссертации по теме "Программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями"
На правах рукописи
>Л>Ч
ДЕГТЯРЕВА Ольга Александровна
ПРОГРАММНЫЙ КОМПЛЕКС АППРОКСИМАТИВНОГО АНАЛИЗА ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ ОРТОГОНАЛЬНЫМИ ФУНКЦИЯМИ
Специальность 05.13.18 —Математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Самара 2006
Работа выполнена в Самарском государственном аэрокосмическом университете имени академика СЛ. Королева
Научный руководитель
заслуженный работник высшей школы РФ, доктор технических наук, профессор Прохоров С.А.
Официальные оппоненты доктор физ.-мат. наук,
профессор РадченкоВ.П.
кандидат технических наук, доцент Храмов А.Г.
Ведущая органшация ОАО "СНЖ им. Н.Д-Кузнецова"
Защита состоится" 23" июня 2006 в 13 часов
на заседании диссертационного совета при Самарском государственном аэрокосмическом университете имени академика С.П. Королева по адресу: 443086, г. Самара, Московское шоссе, 34
С диссертацией можно ознакомиться в библиотеке Самарского государственного аэрокосм ического университета
Автореферат разослан " 19" мая 2006 г.
Ученый секретарь диссертационного совета д.т.н., профессор
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Всесторонний аналю первичной экспериментальной информации, как правило, является начальным этапом поиска решений для явлений и объектов различной природы и сложности. Физические явления, которые рассматриваются при решении разнообразных задач научных исследований, зачастую описываются массивами данных, имеющих случайный характер. Иногда, когда исследуемый объект не имеет полного математического описания, экспериментальная информация становится единственным источником получения важных инженерных гираметров исследуемого объекта. Целью статистической обработки массивов экспериментальной информации в рамках анализа реализаций случайных процессов часто является получение системы статистических оценок с определенной доверительной вероятностью и точностью. При этом, как правило, оцениваются числовые характеристики, корреляционные и спектральные функции и характеристики, законы распределения.
Функциональные характеристики положения - законы распределения — занимают особое место в статистическом анализе. Их получение, как правило, требует серьезных вычислительных затрат, однако они несут в себе существенную информацию об исследуемых процессах. В данной работе исходной информацией для проведения анализа являются временные ряды, представляемые для стационарных процессов совокупностью отсчетов. На основе полученных статистических данных строятся аналитические модели законов распределения и характеристических функций с параметрами, удовлетворяющими заданному критерию оптимальности.
Задача аппроксимативного анализа случайных процессов сводится к получению аналитического выражения для интересующей характеристики. Такое выражение может быть найдено, например, в виде ряда по некоторой полной ортогональной системе функций, выбор которой связан с видом исследуемых функциональных характеристик.
Следует отметить, что перечисленным задачам в своих работах уделяли большое внимание такие ученые, как М. Розенблат, Г. Крамер, Л.Деврой, Л. Дьерфи, Б.В. Сильверман, В.Н. Вапник, Н.Н.Ченцов, Б.Р. Левин, С.А. Прохоров, Ф.П. Тарасенко, Э.А.Надарая и другие, однако интерес к ним не пропадает. Совершенствуются методы оценивания, информационное обеспечение, разрабатываются специализированные программные комплексы.
Существующие современные автоматизированные системы математических расчетов предназначены для решения широкого круга задач и обладают высокой степенью универсальности. Многие позволяют использовать ортогональные функции для аппроксимации функциональных характеристик, однако получение непараметрических оценок плотности вероятности требует дополнительной настройки универсальных программ, то есть создания специального программного обеспечения. Узкоспециализированные программные комплексы оказываются сильно привязанными к выбранному методу оценивания плотности вероятности и ориентированы на решение задач выбранного класса. Добавление новых методологий и алгоритмов решения задач требует существенного развития имеющихся комплексов программ, то есть создания подсистем, реализующих эти алгоритмы.
В связи с этим актуальной представляется задача создания программного комплекса непараметрического оценивания плотности вероятности ортогональными функциями Эрмига, Лагерра, Лежандра, Дирихле, реализующего предлагаемые и известные алгоритмы построения аппроксимативных оценок плотности вероятности и позволяющего провести исследования оценок. Разработанный комплекс является составной частью программного комплекса аппроксимативного анализа случайных процессов, созданного на кафедре информационных систем и технологий Самарского государственного аэрокосмического университета.
Целью работы является разработка алгоритмического и информационного обеспечения программного комплекса непараметрического оценивания законов распределения случайных процессов ортогональными функциями Эрмига, Лагерра, Лежандра, Дирихле.
В соответствии с поставленной целью решаются следующие задачи исследования:
• разработка алгоритмов построения проекционных и гистограммно-аппроксимационных оценок плотности вероятности, удовлетворяющих свойству нормировки, основанных на использовании ортогональных базисов, не содержащих постоянную функцию нулевого порядка (Эрмига, Лагерра, Лежандра, Дирихле);
• исследование и сравнительный анализ проекционной и гистограммно-аппроксимационной оценок;
• построение аналитических выражений для характеристической функции по параметрам аппроксимации плотности вероятности;
• разработка алгоритма формирования класса «согласованных» оценок плотности вероятности в соответствии с критерием согласия Пирсона и исследование оценок построенного класса на альтернативных реализациях;
• разработка программного комплекса, реализующего разработанные методы и алгоритмы и его апробация на реальных данных.
Методы исследования. В качестве методологической основы работы используются методы теории вероятностей и математической статистики, теории случайных процессов, теории оптимизации и аппроксимации, системного анализа, имитационного моделирования и численные методы.
Научная новизна работы заключается в следующих положениях:
• предложен алгоритм получения модифицированной проекционной оценки плотности вероятности, определенной на всей числовой оси, который основан на идее разбиения плотности вероятности на две полубесконечные ветви и применении ортогональных функций Лагерра, Лежандра, Дирихле для оценивания ветвей с последующим нормированием аппроксимирующего выражения;
• предложен алгоритм построения гистограммно-аппроксимационной оценки плотности вероятности, основанный на сглаживании гистограммной оценки плотности вероятности ортогональными функциями Эрмига и ортогональными функциями Лагерра, Лежандра, Дирихле с разбиением плотности вероятности на две ветви относительно точки, в которой полигон частот не равен нулю;
• получены соотношения, обеспечивающие «склеивание» и «гладкое склеивание» аппроксимирующих выражений в точке разбиения;
• разработаны алгоритм построения класса «согласованных» оценок по критериям согласия и методика отбора «наилучших» оценок из построенного класса.
Практическая ценность работы заключается в создании комплекса программ, который является:
• средством построения аппроксимативных оценок плотности вероятности в виде конечных разложений по ортогональным функциям;
• средством проведения вычислительных экспериментов методом имитационного моделирования временных рядов с заданным законом распределения для исследования свойств алгоритмов оценивания плотности вероятности;
• средством обработки данных натурного эксперимента.
Положения, выносимые на защиту:
• предложенные алгоритмы построения оценок плотности вероятности, использующие метод деления плотности вероятности на две ветви, позволяют обеспечить свойство непрерывности, а также гладкости получаемой оценки с обеспечением свойства нормировки;
• разработанный программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями позволяет эффективно решать задачи построения класса оценок плотности вероятности с помощью разложений по ортогональным функциям, выявлять «наилучшие» оценки из числа согласованных по критериям согласия; является средством численного моделирования временных рядов (реализаций стационарных случайных процессов) и исследования свойств проекционных и гистограммно-аппроксимационных оценок плотности вероятности методом имитационного моделирования; а также является инструментом для обработки реальных экспериментальных данных.
Внедрение результатов работы
Результаты работы внедрены в УлГТУ (Ульяновск) в работу университетской интегрированной информационной системы Мотор (УИС Мотор), а также в учебном процессе кафедры информационных систем и технологий Самарского государственного аэрокосмического университета при подготовке студентов 3-4 курсов по специальности 230102 - автоматизированные системы обработки информации и управления-при выполнении лабораторных, курсовых работ и дипломного проектирования.
Апробация работы
Основные положения и результаты работы докладывались и обсуждались на студенческих научно-технических конференциях (г. Самара), международной конференции "Информационные, измерительные и управляющие системы" (г. Самара, 2005), международном симпозиуме «Надежность и качество 2005» (г. Пенза), П научно-практической конференции «Качество, безопасность, диагностика в условиях информационного общества КБД-инфо 2005» (г. Сочи).
Публикации
По результатам исследований опубликовано 7 печатных работ, в том числе 1 тезисы докладов и 6 статей.
Объем и структура работы
Диссертация состоит из введения, 5 глав и заключения. Основное содержание работы изложено на 110 страницах, включая 24 рисунка и 8 таблиц. Список исполь-
зованных источников включает 69 наименований, 4 приложения размещены на 17 страницах.
СОДЕРЖАНИЕ РАБОТЫ
Во введении показана актуальность темы диссертации, определена цель работы, задачи исследования, изложена научная новизна и практическая значимость полученных результатов, сформулированы основные положения, выносимые на защиту.
В первой главе проведен аналю существующих методов аппроксимативного исследования законов распределения стационарных случайных процессов (временных рядов).
Задача аппроксимации законов распределения (функций распределения, плотностей вероятности) на основе экспериментальных данных решалась многими авторами, разработавшими ряд методов ее решения, однако интерес к такого рода задачам сохраняется. Знание закона распределения стационарного случайного процесса в аналитическом виде дает возможность теоретическим путем определять законы распределения, характеристические функции, числовые характеристики других случайных объектов, связанных известным образом с первыми, определять вероятности одних событий через другие. Такие возможности позволяют значительно экономить время и средства, затрачиваемые на эксперимент.
В то же время следует отметить, что аппроксимативный подход позволяет существенно сократить объем хранимой статистической информации, заменяя ее простыми аналитическими выражениями.
Методы аппроксимации плотности вероятности можно разбить на два крупных класса:
• методы параметрической аппроксимации;
• методы непараметрической статистики.
Методы первого класса основаны на предположении о конкретном функциональном виде искомой плотности вероятности, который зависит от конечного набора параметров, причем число параметров предполагается известным априори. Здесь фактически для получения оценки плотности вероятности нужно оценить параметры модели. Для оценки параметров используюгся, например, такие методы, как метод максимума правдоподобия, метод минимального расстояния, метод номограмм, метод моментов, байесовские методы (например, метод апостериорной плотности вероятности). Далее, после решения задачи оценивания параметров, проводится проверка качества полученной математической модели плотности вероятности на основе статистических критериев.
Практическая пригодность методов параметрической аппроксимации существенно ограничена требованием принадлежности оцениваемой плотности вероятности выбранному функциональному параметрическому классу. На практике нередко бывает затруднительно указать какие-либо веские причины, по которым конкретное распределение результатов наблюдений должно принадлежать тому или иному параметрическому семейству.
В этом случае целесообразно применение методов непараметрического оценивания. Задача восстановления плотности вероятности по экспериментальным данным относится к классу некорректных задач, общий подход к решению которых был разработан А.Н. Тихоновым.
К числу методов непараметрического оценивания относятся гистограммные методы, методы ядерных оценок, методы, основанные на аппроксимации плотности вероятности смесью базисных функций, например, ортогональными разложениями.
Достоинством ядерных оценок плотности является их положительная определенность, что не всегда наблюдается у оценок, связанных с ортогональными разложениями. В то же время, ядерные оценки несут в себе, по выражению авторов, определенный субъективный протвол, связанный с выбором формы и параметров ядра и не позволяют представить информацию в компактном виде, поскольку требуют постоянного хранения всего массива исходных данных. Оценки, связанные с ортогональными разложениями, имеют более лаконичную аналитическую форму.
Во второй главе описаны предлагаемые методы аппроксимации плотностей вероятности ортогональным и функциям и.
Классическую проекционную оценку //Дх) плотности вероятности, если область определения плотности вероятности совпадает с областью определения ортогональных функций, можно записать в виде ряда т
/*(*)= ^РкЧ'Ах'О). (1)
к=о
где у/£ А=(Ц2,.. - ортогональный базис,
а - масштабирующий параметр, который для проекционной оценки полагался равным 1.
Оценки для коэффициентов разложения в этом случае записываются следующим образом:
где х\,х2,...,хы дискретная реализация случайного процесса объемом N.
В случае, когда искомая плотность вероятности определена на всей числовой оси, предлагается применять для ее аппроксимации ортогональные базисы, определенные на полуоси. Такую оценку будем называть проекционной с разбиением на ветви. Запишем ее в виде: т„
/м (*) = X Рк,пУк (* " *0 >«п)К* - *0 ) +
к=О
тп
+ 0 -^«лХОо
к=О
где х0 - точка разбиения плотности вероятности на ветви, например, точка максимума полигона, построенного по реализации;
{лл-Л' пРих^®>-единичнаяфункция;
|о, прих<0.
тп, тл - число слагаемых в аппроксимирующих суммах для правой и левой ветви.
Коэффициенты разложения для правой и левой ветви записываются следующим образом:
1 ~х0,ап)
Ы2 '
/е/„
——' (5)
шл ыг
где /п -множество тех значений индекса ¡, при которых х, е (х0;+оо);
/л - множество тех значений индекса ¡, при которых х, е(-оо;х0].
Если для реализации случайного процесса построена гистограмма (полигон), то, аппроксимируя ее линейной комбинацией ортогональных функций получим оценку, которую будем называть гистограммно-аппроксимационной оценкой. Эта оценка будет иметь вид т
/«(*)= (6)
к=О
а выражения для коэффициентов разложения запишутся в следующем виде:
1 °°
Рк=-Т I/а (*.«)<**•
Ы -1
где а -масштабирующий параметр;
/а(х) - полигон частот.
Если оцениваемая плотность вероятности определена на всей числовой оси, то при построении гистограммно-аппроксимационной оценки в качестве базиса можно использовать не только функции, определенные на всей числовой оси, но и функции, определенные на полуоси. При этом необходимо разбить полигон частот на две ветви относительно, например, его максимума. Гистограммно — аппроксимационная оценка с разбиением на ветви имеет вид, аналогичный (3), а коэффициенты разложения записываются следующим образом:
1 °°
Рк.п = --¿Г ~ 'ап (8)
Ы ХП
Рк,л = —I/а(хУУк(*о -х,ал)с!х.
Г* II
Выражения для ортогональных функций, используемых в программном комплексе, имеют вид: 1. Функции Лагерра:
к ч„ оэс
Ьк (х, а) = У^ ; . •
(^ехУ-Т
5=0
2. Функции Лежандра:
1е§к(х,а) = е-ахРк[1-2е-2ах\,
р,л 1 (2к-2*)1
„А-25
5=0
(10) (И)
ортогональные
полиномы Лежандра. 3. Функции Дирихле: к
ам=В-П—1 • о«
5=0 /=0 7=а+1 ^ ^
Ь
причем g(i) = 1, если а>Ь. 1—а
4. Функции Эрм ига:
Нк{х,а)= п е 2 ■ 03)
5=0
В работе показано, что для обеспечения выполнения основного свойства плотности вероятности - свойства нормировки — следует осуществить корректировку коэффициентов. Получены формулы для корректировки. Если при построении оценки не производится разбиение на ветви, то корректировку коэффициентов разложения следует производить по формуле: т
ък=Рк-
/=0
•S£Jnteg1(i)
и 21Ы1
Integ(k)
2|Ы|2 '
(14)
где
1гйе%{к)= ^цгк(рс,а)сЬс. (15)
—оо
Заметим, что для функций Эрмига значения, определяемые формулой (15) можно вычислить только численным методом, а для функций Лагерра, Лежандра, Дирихле данные значения вычисляются аналитически.
В случае разбиения аппроксимирующей функции на две ветви коэффициенты, обеспечивающие выполнение основного свойства плотности вероятности, запишутся следующим образом:
6А,и(л) = Рк,п(л) ~
т„ т„
22Х И12(- +22>>,г (- №л)У -1
1=0_»=0_х
т„ тп
2Ё1К«2(- ^(0,ап))21 + 22>||2(- ^.(0 ,ал)Г
1=0 /=о ,
х{-Ук(0,ап(л))} (16)
В том случае, когда аппроксимация правой и левой ветви плотности вероятности ортогональными функциями ведется по отдельности, вполне возможно, что в точке соединения правой и левой аппроксимирующих кривых будет разрыв. Бели аппроксимируемая плотность вероятности является непрерывной, то необходимо обеспечить «склеивание» этих ветвей в точке дг0. Для построения гладкой оценки необходимо обеспечить «гладкое склеивание» аппроксимирующих функций в точке ;с0. В работе с помощью метода множителей Лагранжа получены значения коэффициентов, обеспечивающих равенство значений аппроксимирующих ветвей в точке разбиения (условие «склеивания») и равенство первых производных аппроксимирующих функций в точке разбиения (условие «гладкого склеивания») при соблюдении условия нормировки.
На рисунке 1 приведен пример аппроксимации плотности распределения вероятностей ортогональными функциями Лежавдра с учетом основного свойства, «склеиванием» ветвей в точке разбиения и «гладким склеиванием». Здесь ломаной линией изображен полигон частот, построенный по гистограмме.
В третьей главе рассмотрен алгоритм формирования класса согласованных оценок плотности вероятности, основанный на применении критериев согласия, с последующим выбором «наилучших» оценок.
При построении оценки плотности вероятности в виде конечного разложения по системе ортогональных функций возникает естественный вопрос о том, сколько следует взять членов разложения.
а) без «склеивания» б) с «гладким склеиванием»
Рисунок 1 — Аппроксимация плотности вероятности
Если слагаемых в аппроксимирующем выражении будет «слишком мало», то оценка получится грубой. При этом будет потеряна важная информация о виде оцениваемой плотности. Если слагаемых взять «слишком много», то оценка будет излишне детально описывать эмпирические данные, имеющие случайный характер. Таким образом, необходимо обеспечивать контроль над качеством оценки при изменении параметра ее сложности (числа суммируемых элементов разложения). Для контроля над качеством оценки в предложенном алгоритме используются статистические критерии согласия. С целью формирования класса согласованных оценок используется параметрический двусторонний критерий Пирсона. Поскольку для расчетного значения критической статистики необходимо иметь значения параметров оценки Ь)., то прежде производится их расчет по формулам, приведенным в главе 2.
В результате применения критерия к различным приближающим суммам выделяются те из них, которые согласуются с эмпирической информацией. Среди всех этих сумм можно выделить ту, которая имеет наименьшее число слагаемых. Обозначим его Ат,п. При последующем увеличении количества слагаемых погрешность аппроксимации уменьшается до тех пор, пока не будет воспринята как маловероятная и отвергнется критерием. Последняя из оценок будет содержать наибольшее число слагаемых &тах. В результате отбора получим класс оценок, содержащих от до £тах членов разложения ряда. Все они будут
согласованным и с эмпирическими данными по критерию х1 • Следует заметить, что число элементов в сумме ряда £тах ограничено числом интервалов группирования К(*тах<К-1).
На рисунке 1 представлен пример расчета набора гистограммно-аппроксимационных оценок, согласованных с эмпирическим временным рядом по критерию Пирсона. Здесь слева изображен график оцениваемой плотности вероятности. Символом Д обозначена величина среднеквадратического уклонения оценки от полигона. Объем временного ряда N=10000.
до ем
V ОЛ
Функции Эрмига Лагерра Лежандра Дирихле
^пип 9 12 14 10
Д при к = *т(п 0.00037 0.0005 0.00013 0.0003
^■тах 18 20 20 19
Д при А = *тах 0.00024 0.00015 0.00006 0.00006
Рисунок 2 Классы оценок, полученных по критерию Пирсона
Поскольку класс оценок найден для одной реализации случайного процесса (для обучающей реализации), то целесообразно проверить, какие оценки, принадлежащие найденному классу, сохраняют согласованность и с другими (контрольными) реализациями, если они имеются.
В таблице 1 представлены расчетные значения статистики %2 для оценок той же
плотности вероятности, полученных с помощью функций Дирихле для одной реализации случайного процесса, при проверке их согласованности с контрольными реализациями (объем выборки N=10000).
Таблица 1
Расчетные значения критической статистики критерия Пирсона для _контрольных реализаций_
При а = 0.01 Х\-а(К~1) = 40,289; при а = 0.1 Х\-<х(АГ-1) = 30,813
№ реализации Число элементов в сумме
10 12 14 16 18 20
1 30,935 26,077 25,998 25,215 27,679 28,601
2 22,648 18,535 16,903 19,175 21,267 21,898
3 14,264 13,336 15,311 15,164 15,231 15,708
4 27,951 23,122 17,832 22,467 26,219 28,672
5 20,742 15,127 18,837 18,371 19,076 17,358
6 7,469 6,481 6,504 10,477 11,614 11,271
7 32,567 28,079 24,313 30,761 30,924 35,71
8 26,561 22,123 13,724 20,106 25,656 29,308
9 11,742 8,949 7,578 10,157 12,34 12,096
10 23,799 19,787 19,962 20,941 22,91 21,94
11 35,885 32,451 30,913 27,436 25,27 29,202
12 18,521 14,224 16,527 13,446 13,751 13,883
13 16,477 12,239 11,812 14,091 15,433 15,029
14 9,532 8,76 11,837 11,652 11,261 9,914
15 24,685 19,024 21,281 24,906 28,13 31,162
16 22,448 17,626 14,635 18,585 22,605 23,253
17 8,562 5,786 8,607 7,841 7,664 7,218
18 14,793 10,372 5,776 10,726 14,566 15,832
19 17,96 12,643 15,043 16,237 16,596 14,193
20 24,929 19,885 17,362 20,565 24,728 25,525
Процентные точки статистики х2 в таблице 1 рассчитываются для К-1 степеней свободы, так как число параметров оценки, подлежащих определению, равно 0. В таблицах жирным шрифтом отмечены те расчетные значения критической статистики, которые превышают допустимое значение для уровня значимости а = 0.1.
Как правило, количество превышающих допустимый уровень значений критической статистики оказывается в пределах, соответствующих уровню значимости критерия. В работе отмечается, что для одномодальных плотностей вероятности «наиболее согласованными» - согласованными с наибольшим числом контрольных реалгааций - оказываются оценки, содержащие число слагаемых в сумме ряда, близкое к Ащщ. Для двумодальных плотностей это число несколько смешается в сторону увеличения. Такие оценки называются здесь «наилучшими».
В случае обработки реальных данных, когда нет возможности получить контрольные реализации, предлагается разбить имеющуюся выборку на две части равного объема — обучающую и контрольную, если выборка достаточно большая. Иначе представляется целесообразным из всех «согласованных» оценок рекомендовать для практического применения самую простую.
На рисунке 3 приведены результаты исследований зависимости среднаквадрати-ческой погрешности оценивания плотности вероятности, изображенной на рисунке 2, ортогональным и функциям и Дирихле.
0,5 0.4 0.3 0,2 0,1 0
- - проекционная оценка
....... . гистограммно-аппроксимационная оценка
m - наилучшее число слагаемых в аппроксимирующей сумме
Рисунок 3 - Зависимость среднеквадратической погрешности оценивания от объема
реализации
Проведенные исследования показывают, что при увеличении объема реализации число наилучших слагаемых в сумме ряда увеличивается. При этом среднеквадра-тическая погрешность аппроксимации уменьшается.
В четвертой главе описан комплекс программных средств для аппроксимативного анализа законов распределения случайных процессов.
Система реализована в среде программирования Delphi 6. Структурная схема комплекса программ изображена на рисунке 4.
Первая часть данного программного комплекса предоставляет возможность генерирования реализаций случайного процесса с заданным законом распределения, построения гистограммы, полигона частот и кумулятивной кривой, а также оценивания статистических моменгных характеристик. Целью создания этой части является имитационное моделирование случайных процессов с заданными вероятностными характеристиками. Данная возможность реализована для проверки и анализа алгоритмов аппроксимации методом имитационного моделирования.
Вторая часть программного комплекса позволяет строить оценки плотности вероятности. Здесь предусмотрены два варианта аппроксимации законов распределения: параметрическими моделями и ортогональными функциями. Аппроксимация ортогональными функциями предполагает построение проекционных и гистограмм-но-аппроксимационных оценок плотности вероятности. Имеется возможность производить проверку согласованности полученной оценки с выборкой по критериям согласия Пирсона и Колмогорова. Возможно также построение целого класса «согласованных» оценок в соответствии с критерием согласия Пирсона и выделение «наилучшей» оценки из построенного класса. Предусмотрена возможность определения характеристической функции по параметрам аппроксимирующих выражений и аппроксимации самих характеристических функций. Во всех подсистемах имеется возможность сохранения данных в файл. Требования к аппаратному и программному обеспечению: процессор Pentium-166 и выше; ОЗУ 32Мб; свободное место на диске 2Мб; операционная система Windows'98 и выше.
В петой главе приводятся примеры апробации разработанного программного комплекса.
На рисунке 5 приведены результаты апробации программного комплекса на тестовом примере. Здесь оцениваемая плотность вероятности определена на всей числовой оси и представляет собой линейную комбинацию плотностей вероятности Релея и Вейбулла. Объем реализации N=1000.
При доверительной вероятности 0,95 лучшей проекционной оценкой оказывается оценка с разложением в рядЛагерра, а лучшая гистограмм но-аппроксимационная оценка — с разложением в ряд Лежандра. Обе оценки строились с применением алгоритма «гладкого склеивания». Среднеквадратическая погрешность первой оценки равна 0,04, второй — 0,03 при числе членов разложения, равных 12 и 11 соответственно.
Методика и алгоритмы аппроксимации законов распределения ортогональными функциями, а также разработанный на их основе комплекс программ, использованы для обработки данных и характеристик университетской интегрированной информационной системы Мотор (УИС Мотор, УлГТУ), представляющей из себя сетевую систему массового обслуживания.
На рисунке 6 представлены оценки плотности вероятности процесса подачи заявок на перезачет дисциплин, сданных ранее (для второго высшего образования или повторного обучения) и времени обслуживания заявки студента на перезачет в учебном отделе. Эти плотности вероятности не относятся к типовым.
Рисунок 4 - Структурная схема программного комплекса
-2.5
-0.5
1.5
3.5
5.5
- плотность вероятности
- проекционная оценка
- гистограммно-аппроксимационная оценка
Рисунок 5 -Графики оценок плотности вероятности
5 10 15 20253)35 40 45 50 55 60 65 70
а) оценка плотности вероятности процесса подачи заявок на перезачет
* !
1 : ..........!............
Л=с=
Ч.....^'Г
б) оценка плотности вероятности времени обслуживания заявки на перезачет
Рисунок 6 - Оценки плотностей вероятности процесса подачи и времени обслуживания заявок на перезачет дисциплин в учебном отделе
Для плотности вероятности процесса подачи заявок наиболее простой го числа согласованных по критерию Пирсона оказывается гистограммно-аппроксимационная оценка функциями Лагерра. Она содержит 6 слагаемых в сумме
ряда. Для плотности вероятности времени обслуживания заявки наиболее простой оказывается гистограммно-апроксимационная оценка с разделением в базисе Ле-жандра, содержащая 16 слагаемых в сумме ряда.
Программный комплекс был также апробирован для обработки экспериментальных данных вибрационной диагностики газотурбинного двигателя. Оценки строились для вибросигналов, полученных при различном времени наработки подшипников, разрушившихся в ходе испытаний. Следует отметить, что, поскольку результатом обработки является аналитическое выражение для плотности вероятности, то становится возможным не только исследование процесса разрушения, но и имитационное моделирование подобных процессов.
ОСНОВНЫЕВЫВОДЫИ РЕЗУЛЬТАТЫ
1. Предложены алгоритмы построения проекционных и гистограммно-аппроксимационных оценок плотности вероятности, определенной на всей числовой оси, с помощью ортогональных функций Лагерра, Лежандра, Дирихле, основанные на разделении аппроксимируемой функции на две ветви. Эти алгоритмы расширяют возможности построения наименее сложных оценок плотности вероятности, согласующихся с эм лирическим и данным и.
2. Предложены формулы расчета коэффициентов разложения оценок плотности вероятности, обеспечивающие «склеивание» а также «гладкое склеивание» аппроксимирующих ветвей при соблюдении условия нормировки.
3. Проведен сравнительный анализ результатов аппроксимации плотности вероятности с использованием ортогональных функций Эрмига, Лагерра, Лежацдра, Дирихле на различных тестовых примерах.
4. Разработан алгоритм формирования класса согласованных с экспериментальными данными оценок плотности вероятности, основанный на применении критерия Пирсона.
5. Предложен алгоритм получения аналитических выражений для характеристической функции по параметрам аппроксимирующего выражения для плотности вероятности
6. Разработан комплекс программ аппроксимативного анализа законов распределения ортогональными функциями. Комплекс реализован в среде программирования Delphi 6.
7. С помощью разработанного комплекса программ на тестовых примерах было проведено исследование зависимости погрешности оценивания от числа отсчетов реализации случайного процесса (объема выборки). Были получены оценки плотностей вероятности входных процессов и времени обслуживания заявок в университетской интегрированной информационной системе Мотор (УлГТУ, Ульяновск), а также оценки плотности вероятности вибросигналов подшипников газотурбинного двигателя.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Прохоров С.А., Дегтярева O.A. Подсистема генерирования псевдослучайных последовательностей автоматизированной системы аппроксимативного анализа законов распределения. / Актуальные проблемы радиоэлектроники. Выпуск 6. Самара: СГАУ 2001,-с. 100-110.
2. Дегтярева O.A. Анализ методической погрешности аппроксимации плотностей вероятности ортогональными функциями Лагерра. / Актуальные проблемы гуманитарных и общественных наук. Самара: СаГА 2004. — С.281 -286.
3. Прохоров С.А., Дегтярева O.A. Автоматизированная система аппроксимативного анализа законов распределения случайных процессов./ В сб. Информационные, измерительные и управляющие системы (ИИУС-2005). Материалы Международной научно-технической конференции 2005 г. Секция "Системный анализ и теория управления". Тезисы докладов. Самара: СамГТУ, - 2005. 277 с. - с. 268-269.
4. Прохоров С.А., Дегтярева O.A. Автоматизированная система аппроксимативного анализа законов распределения случайных процессов. / Вестник Самарского Государственного Технического Университета. Выпуск 33. Серия "Технические науки". Самара: СамГТУ, - 2005,360 с. - с. 335-340.
5. Прохоров С.А., Дегтярева O.A. Аппроксимация плотностей распределения вероятности стационарных случайных процессов ортогональными функциями Лагерра. / Труды международного симпозиума "Надежность и качество-2005" / Под ред. Н.К. Юркова, В.А Трусова, В. Я. Баннова, Пенза: издательство Пензенского гос. университета, 2005, 530 е., ил, —с. 101-103.
6. Прохоров С.А., Дегтярева O.A. Аппроксимация плотности вероятности ортогональными функциями Лагерра и получение аналитических выражений для характеристических функций по параметрам модели ./ Электронный журнал "Исследовано в России", 117, стр. 1184-1189, 2005, http://zhumal.ape.relam.rU/articles/2005/l 17.pdf
7. Прохоров С.А., Дегтярева O.A. Получение аналитических выражений для плотности распределения вероятностей по параметрам аппроксимации характеристических функций ортогональными функциями Лагерра / Материалы научно-практической конференции «Проблемы качества, безопасности и диагностики в условиях информационного общества КБД-инфо-2005» / Под ред. В.Г. Домрачева, С.У.Увайсова. МИЭМ, 2005, 461 е., ил. - с. 169-175.
Подписано в печать 15.05.06 г. Формат 60x84 ^
Усл. печ. л. 1,125. Тираж 100 экз. Отпечатано с готовых оригинал-макетов в типографии СГАУ.
Оглавление автор диссертации — кандидата технических наук Дегтярева, Ольга Александровна
Перечень условных обозначений и сокращений
Введение
Глава 1. Анализ методов аппроксимативного анализа законов 10 распределения случайных процессов
1.1. Основные понятия и определения в анализе случайных 10 процессов
1.2. Методы аппроксимации законов распределения
1.2.1. Параметрическая аппроксимация законов 18 распределения
1.2.2. Непараметрические оценки плотности вероятности
1.3. Выводы
Глава 2. Применение ортогональных базисов для оценивания 27 плотности вероятности
2.1. Проекционные и гистограммно-аппроксимационные оценки 27 плотности вероятности
2.1.1. Проекционные оценки плотности вероятности
2.1.2. Гистограммно - аппроксимационные оценки 32 плотности вероятности
2.1.3. Сравнение проекционных и гистограммно- 38 аппроксимационных оценок
2.2. Обеспечение непрерывности аппроксимирующей функции в 42 точке соединения правой и левой ветвей
2.3. Обеспечение гладкости аппроксимирующей функции в точке 46 соединения правой и левой ветвей
2.4. Свойства проекционных и гистограммно-аппроксимационных 52 оценок
2.5. Исследование аппроксимационных возможностей 55 ортогональных базисов
2.6. Выводы
Глава 3. Определение наилучших оценок плотности вероятности
3.1. Определение оценок, удовлетворяющих критериям согласия
3.1.1. Поиск набора «наилучших» оценок по критерию 61 Пирсона
3.1.2. Применение критерия Колмогорова для проверки 69 согласованности класса оценок плотности вероятности
3.2. Зависимость сложности оценки от объема выборки
3.3. Исследование погрешности аппроксимации для 75 согласованных оценок
3.4. Аналитические выражения для характеристических функций
3.5. Выводы
Глава 4. Программный комплекс аппроксимативного анализа законов 88 распределения случайных процессов
4.1. Описание программного комплекса
4.2. Подсистема имитационного моделирования и первичной 92 статистической обработки данных
4.3. Подсистема аппроксимации законов распределения 94 функциями заданного вида
4.4. Подсистема аппроксимации плотностей вероятности 96 ортогональными функциями
4.5. Подсистема аппроксимации характеристических функций 99 ортогональными функциями
4.6. Выводы
Глава 5. Примеры апробации программного комплекса
5.1. Апробация программного комплекса на тестовом примере
5.2. Применение комплекса программ для обработки результатов 103 экспериментальных исследований
5.3. Выводы 108 Заключение 109 Список литературы 111 Приложение 1. Типовые законы распределения 118 Приложение 2. Формулы преобразования коэффициентов разложения 122 для «склеивания», «гладкого склеивания», аналитических выражений для характеристической функции
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Дегтярева, Ольга Александровна
Всесторонний анализ первичной экспериментальной информации, как правило, является начальным этапом поиска решений для явлений и объектов различной природы и сложности. Физические явления, которые рассматриваются при решении разнообразных задач научных исследований, зачастую описываются массивами данных, имеющих случайный характер. Иногда, когда исследуемый объект не имеет полного математического описания, экспериментальная информация становится единственным источником получения важных инженерных параметров исследуемого объекта. Целью статистической обработки массивов экспериментальной информации в рамках анализа реализаций случайных процессов часто является получение системы статистических оценок с определенной доверительной вероятностью и точностью. При этом, как правило, оцениваются числовые характеристики, корреляционные и спектральные функции и характеристики, законы распределения.
Функциональные характеристики положения — законы распределения — занимают особое место в статистическом анализе. Их получение требует серьезных вычислительных затрат, однако они несут в себе существенную информацию об исследуемых процессах. В данной работе исходной информацией для проведения анализа являются временные ряды, представляемые для стационарных процессов совокупностью отсчетов. На основе полученных статистических данных строятся аналитические модели законов распределения и характеристических функций с неизвестными параметрами, удовлетворяющими заданному критерию оптимальности.
Задача аппроксимативного анализа случайных процессов сводится к получению аналитического выражения для интересующей характеристики. Такое выражение может быть найдено, например, в виде ряда по некоторой полной ортогональной системе функций, выбор которой связан с видом исследуемых функциональных характеристик.
Следует отметить, что перечисленным задачам в своих работах уделяли большое внимание такие ученые, как М. Розенблат, Г. Крамер, Л.Деврой, JL Дьерфи, Б.В. Сильверман, В.Н. Вапник, Н.Н. Ченцов, Б.Р. Левин, С.А. Прохоров, Ф.П. Тарасенко, Э.А.Недарая и другие, однако интерес к ним не пропадает. Совершенствуются методы оценивания, информационное обеспечение, разрабатываются специализированные программные комплексы.
Существующие современные автоматизированные системы математических расчетов предназначены для решения широкого круга задач и обладают высокой степенью универсальности. Многие позволяют использовать ортогональные функции для аппроксимации функциональных характеристик, однако получение непараметрических оценок плотности вероятности требует дополнительной настройки универсальных программ, то есть создания специального программного обеспечения. Узкоспециализированные программные комплексы [3,4] оказываются сильно привязанными к выбранному методу оценивания плотности вероятности и ориентированы на решение задач выбранного класса. Добавление новых методологий и алгоритмов решения задач требует существенного развития имеющихся комплексов программ, то есть создания подсистем, реализующих эти алгоритмы.
В связи с этим актуальной представляется задача создания программного комплекса непараметрического оценивания плотности вероятности ортогональными функциями Эрмита, Лагерра, Лежандра, Дирихле, реализующего предлагаемые и известные алгоритмы построения аппроксимативных оценок плотности вероятности и позволяющего провести исследования оценок. Разработанный комплекс является составной частью программного комплекса, созданного на кафедре информационных система и технологий Самарского государственного аэрокосмического университета.
Целью работы является разработка алгоритмического и информационного обеспечения программного комплекса непараметрического оценивания законов распределения случайных процессов ортогональными функциями Эрмита, JIareppa, Лежандра, Дирихле.
В соответствии с поставленной целью решаются следующие задачи исследования:
• разработка алгоритмов построения проекционных и гистограммно-аппроксимационных оценок плотности вероятности, удовлетворяющих свойству нормировки, основанных на использовании ортогональных базисов, не содержащих постоянную функцию нулевого порядка (Эрмита, Лагерра, Лежандра, Дирихле);
• исследование и сравнительный анализ проекционной и гистограммно-аппроксимационной оценок;
• построение аналитических выражений для характеристической функции по параметрам аппроксимации плотности вероятности;
• разработка алгоритма формирования класса «согласованных» оценок плотности вероятности в соответствии с критерием согласия Пирсона и исследование оценок построенного класса на альтернативных реализациях;
• разработка программного комплекса, реализующего разработанные методы и алгоритмы и его апробация на реальных данных;
Методы исследования. В качестве методологической основы работы используются методы теории вероятностей и математической статистики, теории случайных процессов, теории оптимизации и аппроксимации, системного анализа, имитационного моделирования и численные методы.
Научная новизна работы заключается в следующих положениях:
• предложен алгоритм получения модифицированной проекционной оценки плотности вероятности, определенной на всей числовой оси, который основан на идее разбиения плотности вероятности на две полубесконечные ветви и применении ортогональных функций Лагерра, Лежандра, Дирихле для оценивания ветвей с последующим нормированием аппроксимирующего выражения;
• предложен алгоритм построения гистограммно-аппроксимационной оценки плотности вероятности, основанной на сглаживании гистограммной оценки плотности вероятности ортогональными функциями Эрмита и ортогональными функциями Лагерра, Лежандра, Дирихле с разбиением плотности вероятности на две ветви относительно точки, в которой полигон частот не равен нулю;
• получены соотношения, обеспечивающие «склеивание» и «гладкое склеивание» аппроксимирующих выражений в точке разбиения;
• разработан алгоритм построения класса «согласованных» оценок по критериям согласия и методика отбора «наилучших» оценок из построенного класса.
Практическая ценность работы заключается в создании комплекса программ, который является:
• средством построения аппроксимативных оценок плотности вероятности в виде конечных разложений по ортогональным функциям;
• средством проведения вычислительных экспериментов методом имитационного моделирования временных рядов с заданным законом распределения для исследования свойств алгоритмов оценивания плотности вероятности;
• средством обработки данных натурного эксперимента.
Положения, выносимые на защиту:
• предложенные алгоритмы построения оценок плотности вероятности, использующие метод деления плотности вероятности на две ветви, позволяют обеспечить свойство непрерывности, а также гладкости получаемой оценки с обеспечением свойства нормировки;
• разработанный программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями позволяет эффективно решать задачи построения класса оценок плотности вероятности с помощью разложений по ортогональным функциям, выявлять «наилучшие» оценки из числа согласованных по критериям согласия; является средством численного моделирования временных рядов (реализаций стационарных случайных процессов) и исследования свойств проекционных и гистограммно-аппроксимационных оценок плотности вероятности методом имитационного моделирования; а также является инструментом для обработки реальных экспериментальных данных.
Внедрение результатов работы
Результаты работы внедрены в Институте Дистанционного Образования УлГТУ (Ульяновск) в работу университетской интегрированной информационной системы Мотор (УИС Мотор),, а также в учебный процесс кафедры информационных систем и технологий Самарского государственного аэрокосмического университета при подготовке студентов 3-4 курсов по специальности 230102 - автоматизированные системы обработки информации и управления- при выполнении лабораторных, курсовых работ и дипломного проектирования.
Апробация работы
Основные положения и результаты работы докладывались и обсуждались на студенческих научно-технических конференциях (г. Самара), международной конференции "Информационные, измерительные и управляющие системы" (г. Самара, 2005), международном симпозиуме "Надежность и качество 2005" (г. Пенза), II научно-практической конференции "Качество, безопасность и диагностика в условиях информационного общества КБД-инфо 2005" (г. Сочи).
Публикации
По результатам исследований опубликовано 7 печатных работ, в том числе 1 тезисы докладов и 6 статей.
Объем и структура работы
Диссертация состоит из введения, 5 глав и заключения. Основное содержание работы изложено на 110 страницах, включая 24 рисунка и 8 таблиц. Список использованных источников включает 69 наименований, 4 приложения размещены на 17 страницах.
Заключение диссертация на тему "Программный комплекс аппроксимативного анализа законов распределения случайных процессов ортогональными функциями"
4.6 Выводы.
1. Разработана структура и программное обеспечение комплекса аппроксимативного анализа законов распределения случайных процессов.
2. Программный комплекс включает подсистему генерирования дискретных реализаций случайных процессов с заданным законом распределения и с заданными параметрами. Подсистема позволяет использовать метод имитационного моделирования для исследования свойств алгоритмов аппроксимации функциональных вероятностных характеристик.
3. Аппроксимация плотностей вероятности и функций распределения реализаций случайного процесса может проводиться параметрическим методом. Оценка параметров распределения производится методом моментов и методом наименьших квадратов.
4. Программный комплекс позволяет получать оценки плотности вероятности с помощью разложения в ортогональных базисах Эрмита, Лагерра, Лежандра и Дирихле; определять класс оценок, согласующихся с эмпирической информацией по критериям согласия Пирсона и Колмогорова, а также производить оценку характеристической функции по параметрам аппроксимации плотности распределения вероятностей.
5. Комплекс позволяет проводить тестирование разработанных алгоритмов оценивания плотности вероятности с целью исследования точностных характеристик оценок, свойства их состоятельности, определения оптимального числа слагаемых в сумме ряда при фиксированном объеме выборки, используя при этом метод имитационного моделирования.
Глава 5 Примеры апробации программного комплекса
5.1 Апробация программного комплекса на тестовом примере
С помощью разработанного программного комплекса был проведен ряд вычислительных экспериментов с использованием тестовых примеров. Частично результаты экспериментов приведены в главах 2 и 3. Здесь рассматривается пример расчета согласованных оценок, полученных во всех четырех ортогональных базисах.
Для генерирования реализации дискретного случайного процесса была использована двумодальная плотность вероятности, определенная на всей числовой оси и представляющая собой линейную комбинацию плотностей Ре лея и Вейбулла:
-ррхм 1 ехр (- рхм ) (- оо < х < 0), 2
1 / 1 X ( X1 Л , ч (5.1)
-Мрхи ехр {- рхи )+ -• —г-ехр--- ДО < х < с),
I Zcr ^
V 2о-2 у
1 * 2 где ц = 4, р = 0.05 - параметры закона Вейбулла; сг = 1.5 - параметр закона Релея; с -1.5 - сдвиг закона Вейбулла.
График плотности вероятности изображен на рисунке 5.1 сплошной черной линией. Для оценивания плотности вероятности была получена реализация объемом N=1000. Оценивание проводилось с использованием базисов Эрмита, Лагерра, Лежандра и Дирихле. Причем для последних трех базисов применялся алгоритм «гладкого склеивания» ветвей. Во всех случаях проводилась нормировка.
При построении класса согласованных оценок проводилось последовательное наращивание их сложности (то есть числа слагаемых в сумме ряда) начиная с одного слагаемого для базиса Эрмита и четырех слагаемых для остальных базисов (по два слагаемых для правой и левой ветви). Расчет коэффициентов разложения для проекционных оценок проводился по формулам (2.15), (2.17), (2.18), а для гистограммно-аппроксимационных оценок - по формулам (2.53), (2.78) с применением численного интегрирования.
Для каждой оценки проверка ее согласованности с выборкой по
I критериям Пирсона и Колмогорова при доверительной вероятности 0.95.
Далее генерировались 30 контрольных выборок и проверялась согласованность построенных ранее оценок с этими выборками.
В таблице 5.1 приведены диапазоны значений параметров сложности оценок для указанных базисов. Здесь за wmin и ттах обозначены минимальное и максимальное число слагаемых для согласованных оценок; через т обозначена характеристика сложности наилучшей (то есть наиболее простой) из числа «хорошо согласованных» оценок. Из проекционных оценок наилучшими оказались оценки в базисах Лагерра и Дирихле, имеющие одинаковую характеристику сложности т = 12, но погрешность АТ оценки рядом Лагерра оказалась меньше. Среди гистограммно-аппроксимационных оценок наилучшей оказалась оценка в базисе Лежандра с характеристикой сложности т = 11.
На рисунке 5.1 синей линией изображена наилучшая гистограммно-аппроксимационная оценка, красной линией - наилучшая проекционная оценка.
5.2 Применение комплекса программ для обработки результатов экспериментальных исследований
Описанные методы и алгоритмы аппроксимативного анализа могут быть использованы в решении достаточно широкого круга задач, связанных с обработкой экспериментальных данных. Примером этого служит использование разработанной автоматизированной системы при определении характеристик университетской интегрированной информационной системы Мотор (УИС Мотор) [38].
0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0
Л 1 К V. w л
1 1 I г г
-2,5 -0,5
1,5
3,5
5,5
-плотность вероятности гистограммно-аппроксимационная оценка в базисе Лежандра л ■ ■ проекционная оценка в базисе Лагерра
Рисунок 5.1 - Наилучшие оценки двумодальной плотности вероятности Таблица 5.1. Значения параметров сложности оценок двумодальной
2 Уровень значимости « = 0.05 ~ 1) = 33.924
Функции Эрмита Функции Лагерра Функции Лежандра Функции Дирихле
Г роекционные оценки т '"mm 9 11 14 10 max 19 20 20 20 т 13 12 17 12
А.Т 0.0057 0.0043 0.0119 0.0047
Гистограммно-аппроксимац донные оценки тш 8 11 9 11 т шах 18 19 20 20 т 12 13 11 15 д7. 0.0036 0.0044 0.0028 0.0053
УИС Мотор, созданная на основе ISO и IMS стандартов, является специально разработанной системой массового обслуживания (СМО) для управления деятельностью российских высших и средних профессиональных учебных заведений. УИС Мотор совершенствуется таким образом, чтобы автоматизировать все основные направления образовательной деятельности, начиная со школ, включая учреждения среднего профессионального образования, ВУЗы и, наконец, корпоративные центры или университеты предприятий.
В данной СМО [17,50] некоторые входные процессы в подсистемы являются близкими к пуассоновским, а некоторые времена обслуживания заявок в системе имеют показательный закон распределения. В этом случае расчет параметров подсистем и вероятностей перехода в СМО не представляет труда. Однако такие процессы, как процесс подачи заявок на перезачет и последовательность времен обслуживания заявок, имеют законы распределения, которые трудно отнести к какому-либо конкретному классу. Для плотностей распределения этих процессов были получены оценки в ортогональных базисах.
На рисунке 5.2 представлен фрагмент графика процесса поступления в учебный отдел заявок на перезачет дисциплин, сданных ранее (для второго высшего образования или повторного обучения) и соответствующий ему полигон частот, изображенный черной линией (N=212).
-—i—>—: ■ -■■:■ -■ ■-■ к M.JIII 1
0,13 0,12 0.11 0.1 оде ода
0,07 ода ода ода ода
0,03 V эти» я) bj л> во » 100 110 120
S 10 15 20 25 30 35 40 *55055
К 70 а) процесс подачи заявок на перезачет б) плотность вероятности Рисунок 5.2 - Подача заявок на перезачет в учебном отделе
Как видно из рисунка 5.2 закон распределения процесса подачи заявок на перезачет не является типовым. Наиболее простой из числа согласованных по критерию Пирсона оказывается гистограммно-аппроксимационная оценка функциями Лагерра. Она содержит 6 слагаемых в сумме ряда. Для сравнения отметим, что полигон частот характеризуется 44 параметрами. По параметрам полученных аналитических выражений проводится расчет характеристик потока заявок, характеристик пропускной способности системы, вероятности перехода системы из состояния в состояние [9], а также возможно имитационное моделирование процессов в системе, по результатам которого принимаются превентивные управленческие решения по распределению персонала, обслуживающего заявки, поступающие в ту или иную подсистему УИС.
На рисунке 5.3 изображен фрагмент случайного процесса, характеризующего время обслуживания заявки студента на перезачет в учебном отделе (N=2836). Также представлен закон распределения времени обслуживания. Наиболее простой оказывается гистограммно-апроксимационная оценка с разделением в базисе Лежандра, содержащая 20 слагаемых в сумме ряда. Для левой ветви значения аппроксимирующего выражения, имеющие отрицательную абсциссу, обнуляются, и проводится перенормировка оценки.
0,000016 0,000014 0,000012 0ДШ1 0,000006 0.000006 е.ооооси 0,0000(0 G . , J. щ \. ч т. i -г г
1 ч
100 200 ЭСО 4d0
100 «с УХ)
I 100 000 гооооо эооооо чооооо б) плотность распределения а) времена обслуживания заявок
Рисунок 5.3 - Время обслуживания заявки студента на перезачет
Параметры аналитических выражений для плотностей распределения вероятностей времен обслуживания заявок в разных подсистемах используются для расчета вероятности состояний системы [9], а также расчета нормативов времени обслуживания заявок различного типа.
Программный комплекс был также использован для обработки результатов измерений, полученных при вибрационной диагностики газотурбинного двигателя. Для обработки использовались последовательности результатов измерения вибросигналов осевыми датчиками, полученные на различных стадиях процесса наработки подшипников, разрушившихся в ходе испытаний. При стандартной работе подшипника плотность распределения результатов измерения вибросигналов имеет вполне определенную форму. При возникновении нарушений в работе подшипника форма плотности распределения претерпевает изменения. То есть, наблюдая плотность распределения вибросигналов, можно судить о состоянии подшипника.
На рисунке 5.4 приведены результаты аппроксимации плотности вероятности для подшипника №383.
Рисунок 5.4 - Оценки плотностей вероятности сигнала с вертикального датчика различного для времени наработки подшипника №383
Каждый из приведенных графиков характеризует наиболее простую t оценку, согласованную с реализацией, имеющей 9966 отсчетов при уровне значимости 0.95. Графики 1, 2 и 3 соответствуют гистограммно-аппроксимационным оценкам в базисе Эрмита, содержащим 8, 7 и 4 слагаемых в сумме ряда соответственно.
Таким образом, применение разработанных алгоритмов позволяет получить оценки плотности вероятности в довольно простом аналитическом виде, что выгодно отличает их от гистограммных. 5.3 Выводы
1. Разработанные алгоритмы и методы, а также программный комплекс применены для исследования характеристик УИС Мотор, для определения характеристик системы и принятия управленческих решений, повышающих эффективность работы УИС Мотор и оптимизирующих распределение персонала Института Дистанционного Управления Ульяновского Государственного Технического Университета.
2. Проведена апробация комплекса программ применительно к исследованию вибросигналов подшипника газотурбинного двигателя.
Параметры аппроксимации плотности вероятности позволяют не только исследовать процесс разрушения подшипника, но и проводить имитационное моделирование подобных процессов.
Заключение
Разработанные алгоритмы аппроксимативного анализа законов распределения позволяют решить различные задачи анализа случайных процессов. В ходе исследования были получены следующие выводы и результаты:
1. Предложены алгоритмы построения проекционных и гистограммно-аппроксимационных оценок плотности вероятности, определенной на всей числовой оси, с помощью ортогональных функций Лагерра, Лежандра, Дирихле, основанные на разделении аппроксимируемой функции на две ветви. Эти алгоритмы расширяют возможности построения наименее сложных оценок плотности вероятности, согласующихся с эмпирическими данными.
2. Предложены формулы расчета коэффициентов разложения оценок плотности вероятности, обеспечивающие «склеивание» а также «гладкое склеивание» аппроксимирующих ветвей при соблюдении условия нормировки.
3. Проведен сравнительный анализ результатов аппроксимации плотности вероятности с использованием ортогональных функций Эрмита, Лагерра, Лежандра, Дирихле на различных тестовых примерах.
4. Разработан алгоритм формирования класса согласованных с экспериментальными данными оценок плотности вероятности, основанный на применении критерия Пирсона.
5. Предложен алгоритм получения аналитических выражений для характеристической функции по параметрам аппроксимирующего выражения для плотности вероятности
6. Разработан комплекс программ аппроксимативного анализа законов распределения ортогональными функциями. Комплекс реализован в среде программирования Delphi 6.
7. С помощью разработанного комплекса программ было проведено исследование зависимости погрешности оценивания от числа отсчетов реализации случайного процесса (объема выборки). Исследование I проводилось на тестовых примерах с использованием имитационного моделирования временных рядов; были получены оценки плотностей вероятности входных процессов и времени обслуживания заявок в университетской интегрированной информационной системе Мотор (Ульяновск), использующиеся для определения характеристик системы и оценки плотности вероятности вибросигналов подшипников газотурбинного двигателя.
Библиография Дегтярева, Ольга Александровна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Абрамовиц М., Стиган И. Справочник по специальным функциям. М.: Наука, 1979.-832 с.
2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983.-471 с.
3. Алгоритмы и программы восстановления зависимостей / Под ред. В.Н. Вапника. М.: Наука, 1984.-816с.
4. Ахметшина О.Р. Исследование метода построения плотности распределения с помощью проекционного оценивания — 2005. http://nit.miem.edu.ru/2005/sectionl/3.1 l(m).htm.
5. Ахметшина О.Р. Разработка методов оценки плотности методом вейвлет-анализа с учетом цензурированной информации — 2004. http://www.polar.mephi.ru/conf/2004/tez2004/bez.htm
6. Бендат Дж., Пирсол А. Применение корреляционного и спектрального анализа: Пер. с англ. — М.: Мир, 1983. 312 с.
7. Бенткус Р., Казбарас А. Оптимальные статистические оценки плотности распределения в присутствие априорной информации / Литовский математический сборник. T.XXII, №3, 1982. с.29-40.
8. Богданов Ю.И. Информация Фишера и непараметрическая аппроксимация плотности распределения / Заводская лаборатория. Диагностика материалов, т. 64. N 7. 1998. с. 54-60.
9. Богданов Ю.И., Богданова Н.А. и др. Статистическое исследование времени до пробоя подзатворного диэлектрика в условиях электрического стресса//Микроэлектроника. 1994. Т. 23. №1. С. 75-85.
10. Ю.Болыпев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1965.
11. Боровков А.А. Курс теории вероятностей М.: Наука, 1972. - 287 с.
12. Боровков А.А. Математическая статистика. Учебник. М.: Наука, 1984. — 472 с.
13. Бочаров П. П., Печинкин А. В. Теория вероятностей. Математическая > статистика. Учебное пособие. М.: Гардарика, 1998. - 326 с.
14. М.Вапник В.Н. Восстановление зависимостей по эмпирическим данным. -М.: Наука, 1979.
15. Вапник В.Н., Стефанюк А.Р. Непараметрические методы восстановления плотности вероятности / Автоматика и телемеханика, №8, 1978. — с.38-52.
16. Вентцель Е.С., Овчаров JI.A. Теория вероятностей. Изд 2-е, стереотипное М.: Наука, 1973. - 368 с.
17. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 2001. - 576 с.
18. Гихман И.И. Скороход А.В. Введение в теорию случайных процессов Изд. 2-е М.: Наука ,1977. - 568 с.
19. Гольцов Н.А. Метод наименьших квадратов.- М.: МТИПП, 1989.- 20с.
20. Гольцов Н.А. Некоторые обобщения методов конструирования алгоритмов прикладного численного анализа.- М.: МГУ леса, 2001.- 64с.
21. Двайт Г.Б. Таблицы интегралов и другие математические формулы. Пер. с англ. Изд 5-е М.: Наука, 1977. - 224 с.
22. Деврой JL, Дьерфи JI. Непараметрическое оценивание плотности. Li -подход. Пер. с англ. М.: Мир, 1988. - 408 с.
23. Дегтярева О.А. Анализ методической погрешности аппроксимации плотностей вероятности ортогональными функциями Лагерра. / Актуальные проблемы гуманитарных и общественных наук. Самара: СаГА 2004.-С.281-286.
24. Дьяконов В.П. MATLAB 6/6.1/6.5 + Simulink 4/5 в математике и моделировании. Полное руководство пользователя. М.: СОЛОН-Пресс. -2003.-657 с.25.3аездный A.M. Основы расчетов по статистической радиотехнике. — М.: Связь, 1969.-447 с.
25. Иващенко А.В. Аппроксимативный анализ взаимных корреляционно-спектральных характеристик временных рядов с помощью ортогональных функций Лагерра. Дисс. канд. техн. наук. Самара, 2004. - 182 с.
26. Коваленко И.Н., Филипова А.А. Теория вероятностей и математическая % статистика. Учебное пособие для втузов. М.: Высшая школа, 1973. - 368 с.
27. Коварцев А.Н. Численные методы: Учебное пособие. Самара: НВФ "Сенсоры. Модули. Системы", 1998. - 143с.
28. Крамер Г. Математические методы статистики. Изд. 2-е, стереотипное. -М: Мир, 1975.-648 с.
29. Кудрина М.А. Программный комплекс аппроксимации корреляционно-спектральных характеристик случайных процессов параметрическими моделями. Дисс. канд. техн. наук. Самара, 2004. - 173 с.
30. Кузнецов Ю.Н., Кузубов В. И., Волощенко А. Б. Математическое программирование. М.: Высшая школа, 1976. - 351 с.
31. Кулаичев А.П. Полное собрание сочинений в трех томах. Том 1. Методы и средства анализа данных в среде Windows. STADIA. Изд. 3-е, перераб и доп. М.: Информатика и компьютеры, 1999. - 341 е., ил.
32. Левин Б.Р. Теоретические основы статистической радиотехники. Книга первая. М.: Советское радио, 1969. - 725 с.
33. Лукач Е. Характеристические функции. Пер. с англ./ Под ред. В.М. Золотарева. М.: Наука, 1979. - 424 с.
34. Математическая статистика: Методические указания к решению задач./ сост. Э.И. Коломиец. — Куйбышев: Куйбышев, авиац. ин-т, 1990.-32 с.
35. Надарая Э.А. Непараметрическое оценивание плотности вероятности и кривой рег-рессии. Тбилиси: ТГУ, 1983. - 194 с.
36. Надарая Э.А. Об оценке плотности распределения случайных величин // Сообщ. АН ГССР. 1964. - Т.34. - № 2. - С. 277-280.
37. Панова В.М., Исаев Ю.В., Соснин П.И., Мухина Н.Б., Гадалина Н.Н., Вьюговский А.В., Сидоров А.С. Университетская интегрированная информационная система Мотор. Ульяновск: УлГТУ, 2005. - 32 с.
38. Прохоров А.В., Ушаков В.Г., Ушаков Н.Г. Задачи по теории вероятностей: Основные понятия. Предельные теоремы. Случайные процессы: Учебное пособие. М.: Наука, 1986. - 328 с.
39. Прохоров С.А. Аппроксимативный анализ случайных процессов. — 2-е • изд., перераб. и доп. Самара: СНЦ РАН, 2001. - 380 с.
40. Прохоров С.А. Математическое описание и моделирование случайных процессов. Самара: СГАУ, 2001. - 329 с.
41. Прохоров С.А., Графкин А.В. Программный комплекс корреляционно-спектрального анализа в ортогональных базисах. — Самара: СНЦ РАН, 2005.- 198 с.
42. Прохоров С.А., Дегтярева О.А. Подсистема генерирования псевдослучайных последовательностей автоматизированной системыаппроксимативного анализа законов распределения. / Актуальные i проблемы радиоэлектроники. Выпуск 6. — Самара: СГАУ 2001. с. 100110.
43. Рытов С.Н. Введение в статистическую радиофизику. Часть 1. Случайные процессы. М.: Наука, 1976. - 496 с.
44. Смагин В.А., Бубнов В.П., Филимонихин Г.В. Расчет вероятностно-временных характеристик пребывания задач в сетевой модели массового обслуживания // Изв. ВУЗов. Приборостроение. T.XXXII - № 2. - 1989. -С.23-25.
45. Смолянский М.Л. Таблицы неопределенных интегралов. Издание 2-е. исправленное. М.: — Физматгиз, 1963. 112 с.1 52.Солодянников Ю. В. Математическая статистика. Учебное пособие кспецкурсу. 4 1./ Куйбышевский государственный университет, 1982. -106 с.
46. Справочник по математике (для научных работников и инженеров) / Корн Г., Корн Т. Пер. со 2-го амер. перераб. изд. М.: Наука, 1974. - 831 с.
47. Терехов С.А. Лекции по теории и приложениям искусственных » нейронных сетей. Снежинск, 1994-1998,http://alife.narod.ru/lectures/neural/Neu index.htm.
48. Тиман А.Ф. Теория приближения функций действительного переменного. М.: Физматгиз, 1978. - 624 с.
49. Тихонов А.Н. Арсенин В.Я. Методы решения некорректных задач. Учебное пособие для вузов. Изд 3-е, исправленное. М.: Наука, 1986. -288 с.
50. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В.Э.
51. Фигурнова. 3-е изд., перераб. и доп. - М.: ИНФРА-М, 2003. - 544 с.
52. Фаронов В. Delphi 6: учебный курс. СПб.: Питер, 2002. - 512 с.
53. Ходасевич Г.Б. Обработка экспериментальных данных на ЭВМ. Часть 1. Обработка одномерных данных. Учебное пособие. http://www.dvo.sut.ru/libr/opds/il30hodo parti/index.htm
54. Численные методы: Курс лекций / А.Н. Коварцев. Самарскийгосударственный аэрокосмический университет, 2000. 177 с. бЗ.Ченцов Н.Н. Оценка неизвестной плотности распределения по наблюдениям / Доклады АН СССР, т. 147, №1, 1962.- с.45-48.
55. Чистяков В.П. Курс теории вероятностей. М.: Наука, 1978. - 224 с.
56. Шумаков П.В. Delphi 3 и разработка приложений баз данных. М.: Нолидж, 1999. - 704 с.
57. Е. Parzen On the estimation of probability density and mode. Ann. Math. Statist. 1962, v.33, N3, p.1065-1076.
58. Zeevi A.J., Meir R. Density Estimation Through Convex Combination of Densities: Approximation and Estimation Bounds // Neural Networks. 1996, v.10, p.99-109.
59. Lampard D.G. A new Method of determining Correlation Function Stationary Time Series. "Proceedings of the Institution of Electrical Engineers", vol. 102, part. C. March, 1955, London, № 1.
60. Prokhorov S. Manual for the Simulation of Random Processes and Dynamic • Systems. IRB- Zagreb. - 1980. - 62 p.i
-
Похожие работы
- Аппроксимативный анализ взаимных корреляционно-спектральных характеристик временных рядов с помощью ортогональных функций Лежандра, Дирихле
- Аппроксимативный анализ законов распределения ортогональными полиномами и нейросетевыми моделями
- Методы, алгоритмы и комплекс программ аппроксимативного корреляционно-спектрального анализа в ортогональном базисе Бесселя
- Аппроксимативный анализ взаимных корреляционно-спектральных характеристик временных рядов с помощью ортогональных функций Лагерра
- Программный комплекс аппроксимации корреляционно-спектральных характеристик случайных процессов параметрическими моделями
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность