автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных
Автореферат диссертации по теме "Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных"
На правах рукописи
ГОЛУШКО Сергей Иванович
МАТЕМАТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ ОЦЕНКИ ВЕРОЯТНОСТНЫХ ХАРАКТЕРИСТИК РЕАЛЬНЫХ ОБЪЕКТОВ ПРИ МАЛЫХ ОБЪЁМАХ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ
диссертации на соискание учёной степени кандидата физико-математических наук
Саратов 2005
Работа выполнена в ГОУ ВПО «Саратовский государственный технический университет»
Научный руководитель: кандидат технических наук, доцент
Сайкин Александр Иванович
Официальные оппоненты: доктор физико-математических наук, профессор
Безручко Борис Петрович
доктор технических наук, профессор Львов Алексей Арленович
Ведущая организация: Институт проблем точной механики
и управления РАН (г. Саратов)
Защита состоится « 28 » ноября 2005 г. в 1330 часов на заседании диссертационного совета Д212.242.08 при ГОУ ВПО «Саратовский государственный технический университет» по адресу: 410054, Саратов, ул. Политехническая, 77, Саратовский государственный технический университет, корп. ауд. 319.
С диссертацией можно ознакомиться в научно-технической библиотеке ГОУ ВПО «Саратовский государственный технический университет».
Автореферат разослан « Я » октября 2005 г.
Учёный секретарь
диссертационного совета ^¡/¡Т Большаков А.А.
¿006 ¿2/3 Г
2 um s
з
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. В практической деятельности мы постоянно сталкиваемся со случайными величинами, определяемыми экспериментально. Эксперименты сопряжены с определёнными затратами, и поэтому их число ограничено. Таким образом, во многих случаях о случайных величинах мы вынуждены судить только по малым выборкам их значений.
Полная характеристика случайной величины - распределение вероятностей, но оно известно нам далеко не всегда. Причин тому много, но основная из них - это недостаточность объёма выборки значений случайной величины.
Задача аппроксимации реальных распределений решается нами для малых выборок. Обычно выборка полагается малой, если она содержит 2030 значений случайной величины. В нашем случае объём выборки должен быть не менее 8 и быть кратным четырём.
Задача аппроксимации по малым выборкам двояка. Для этого необходимо выбрать аппроксимирующее распределение, затем оценить параметры аппроксимирующего распределения и провести аппроксимацию. Большинство авторов выбирают для аппроксимации или нормальное распределение, или распределения пуассоновского типа. Это хорошо исследованные распределения, имеются многочисленные публикации, в том числе и наиболее известных авторов, как зарубежных, так и отечественных: А.Н. Колмогоров, Ю.В. Линник, В. Феллер, Е. Кофман, A.B. Прохоров, A.M. Шурыгин и многие другие.
Большинство авторов рассматривают аппроксимацию по одному или по двум параметрам в основном для нормального распределения. Многопараметрические распределения были получены Пирсоном. Они образуют семейство двенадцати различных типов, в том числе и нормальное распределение, но все они однозначно определяются максимум четырьмя начальными моментами.
Аналогично, Г.К. Архиповым было получено гиперэрланговское распределение, которое имело четыре независимых параметра и позволяло аппроксимировать реальные распределения по четырём моментам.
Мы исходим из того, что чем по большему числу моментов проводится аппроксимация, тем она точнее, и поэтому ставим задачу аппроксимации по К моментам. Но аппроксимация по К моментам, как известно, составляет неразрешённую степенную проблему моментов Чебышева, суть которой в том, чтобы по заданным значениям начальных моментов записать формулу распределения с моментами, совпадающими с заданными. В диссертационной работе эта проблема была решена алгоритмически при аппроксимации по 12 начальным моментам.
Чтобы аппроксимировать реальные распределения, необходимо знать для них К генеральных моментов, Но по ограничсинвш выборкам мы
РОС НАЦИОНАЛЬНА"
БИБЛИОТЕК^ , С. ОЭ
>Э WS âi&K-^i t
находим только выборочные моменты, которые, как известно, случайны и зависят от конкретной выборки. Кроме того, во многих практических случаях приходится довольствоваться выборками малого объёма в 20-30 значений. Оценка старших моментов по малым выборкам в литературе представлена недостаточно.
В диссертационной работе предложена оригинальная методика оценки К генеральных моментов реальных распределений по выборкам объёмом не менее 8 значений для положительно определённых случайных величин.
В целом в работе решена задача аппроксимации реальных распределений положительно определённых случайных величин по К моментам в условиях малых выборок, что имеет большое практическое значение.
Цель и основные задачи диссертационного исследования. Целью диссертационной работы является разработка методов аппроксимации вероятностей реальных распределений по К начальным моментам в условиях малых выборок с допустимой погрешностью.
Для достижения поставленных целей были сформулированы следующие основные задачи:
1. Выбрать и исследовать многопараметрическое аппроксимирующее распределение, имеющее К свободных начальных моментов.
2. Разработать методики аппроксимации по К моментам реальных распределений.
3. Установить и доказать свойство монотонности начальных выборочных моментов.
4. Разработать методику экстраполяции значений К генеральных моментов реального распределения по малым выборкам.
5. Разработать методику уточнения оценок генеральных моментов реального распределения на основе принципа аналогий.
6. Разработать соответствующее программное обеспечение, решающее поставленные задачи.
Объект исследования: положительно определённые случайные величины, имеющие выборочный коэффициент вариации в пределах от 0.1 до 1.4.
Методы исследований. В работе использовались методы теории вероятностей, математической статистики, теории массового обслуживания, методы статистического имитационного моделирования и другие.
Научная новизна работы:
1. Предложено и исследовано обобщённое гиперэрланговское распределение, имеющее 38 свободных параметров, что позволяет варьировать в широких пределах независимо друг от друга двенадцатью начальными моментами.
2. Разработаны и исследованы методики аппроксимации реальных распределений по К начальным моментам.
3. Определено и доказано свойство монотонности выборочных моментов для положительно определённых случайных величин.
4. Предложена методика гиперболической экстраполяции значений генеральных моментов реального распределения, включающая многокритериальный выбор экстраполирующих гипербол.
5. Предложен и исследован принцип аналогий, позволяющий уточ-. нить оценки генеральных моментов реальных распределений за счёт компенсации погрешности экстраполяции.
Научная ценность работы состоит в том, что: • 1. Найдено алгоритмическое решение степенной проблемы моментов
Чебышева для частного случая обобщённого гиперэрланговского распределения.
2. Определено и доказано общее свойство монотонности выборочных моментов для положительно определённых случайных величин.
3. Определена и обоснована методика гиперболической экстраполяции генеральных моментов, включающая многокритериальный выбор экстраполирующих гипербол.
4. Обоснована методика выбора лучшего по множеству приближения к реальному распределению по критерию согласия.
Практическая значимость работы заключается в том, что разработанные методики позволяют достоверно аппроксимировать вероятности реальных событий по малым выборкам, объёмы которых не позволяют сделать достоверный прогноз при использовании традиционных подходов. При этом всякий раз достоверность аппроксимации устанавливается по количественному критерию - погрешности аппроксимации, вычисленной относительно оценок генеральных моментов.
Достоверность результатов и выводов исследования обусловлена доказательностью предложенных методик, основывающихся на фундаментальных разделах математики, а также большим объёмом машинных экспериментов, проведённых для исследования корректности предложенных методов.
Основные результаты и положения, выносимые на защиту:
- обобщённое многопараметрическое гиперэрланговское распределение, имеющее К свободных начальных моментов;
- методика аппроксимации по К моментам в условиях избыточности параметров аппроксимирующего распределения, дающая приближённые значения параметров путём направленного перебора;
- методика аппроксимации по К моментам, дающая точные значения параметров для некоторого множества аппроксимирующих распределений;
- свойство монотонности выборочных моментов;
- методику гиперболической аппроксимации с учётом многокритериального выбора экстраполирующих гипербол;
- принцип аналогий, компенсирующий погрешность экстраполяции;
- методика выбора наилучшего по множеству аппроксимирующего распределения по критерию согласия Колмогорова.
Личный вклад соискателя. Соискатель изучал литературу, проводил патентный поиск, разрабатывал и доказывал предлагаемые методы, разработал программное обеспечение, решающее поставленные задачи, провёл необходимые исследования разработанных методов, используя ма- .
шинное моделирование.
Апробация работы. Результаты работы докладывались на:
1) XVII Международной научной конференции «Математические методы в ч технике и технологиях» (Кострома, 2004).
2) II Международной научно-технической конференции «Материалы и технологии XXI века» (Пенза, 2004).
3) Международной научно-технической конференции, посвящённой 15-летию кафедры радиотехники (Саратов, 2004).
4) VII Международной научно-технической конференции «Динамика технологических систем» (Саратов, 2004) (Два доклада).
Публикации. Основные результаты изложены в 13 опубликованных печатных работах.
Структура и объём диссертации.
Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы. Общий объём диссертации 108 страниц. Диссертация содержит 24 рисунка и 13 таблиц. Список литературы включает 27 наименований. Приведены три приложения, включающие данные реальных объектов.
СОДЕРЖАНИЕ РАБОТЫ
Во введении излагаются постановка задачи, актуальность, цель работы, новизна, практическая значимость, а также положения, выносимые на защиту.
В первой главе представлено состояние вопроса аппроксимации вероятностей реальных распределений по малым выборкам. Нами поставлена задача аппроксимации реальных распределений, вид которых неизвестен. По этой причине мы построили некоторое обобщённое распределение обобщённое гиперэрланговское (в дальнейшем обобщённое распределение), которое включает при правильном подборе параметров практически все распределения пуассоновского типа: экспоненциальное, распределение Эрланга порядка К, гиперэкспоненциальное, обобщённое распределение Эрланга и другие распределения, состоящие из экспоненциальных фаз. Плотность обобщённого распределения имеет вид
W
где р, - вероятности переходов в одну из тринадцати возможных ветвей; к, - количество фаз в 1-й ветви с экспоненциальным распределением; ц, - интенсивности экспоненциального распределения в фазе.
Мы исходим из того, что чем по большему числу моментов проводится аппроксимация, тем она точнее. Поэтому ставится задача аппроксимации реальных распределений по К начальным моментам. Обобщённое распре, деление отвечает этому условию - оно имеет К свободных моментов, которые могут независимо друг от друга меняться в широких пределах.
Моменты обобщённого распределения находятся из следующей I системы:
' N
»а/,
1=1
.¿¿А+ил/ц?»^ (2)
£ к,(к, + \)(к, + 2)...(к, +К- 1)р,№ = Мк.
Аппроксимация по К моментам требует решения степенной проблемы моментов Чебышева. Наиболее полно эта проблема изложена в трудах В. Феллера и Н.И. Ахиезера. Необходимое и достаточное условие разрешимости степенной проблемы моментов задаётся теоремой Гамбургера. Единственность такого решения определяется теоремой Карлемана. Но в целом это фундаментальная задача теории вероятностей не решена в общем виде.
Как показано в первой главе, обобщённое гиперэрланговское распределение отвечает теоремам Гамбургера и Карлемана, что в принципе позволяет проводить аппроксимацию по К моментам данным распределением.
На практике далеко не всегда удаётся получить выборки достаточно большого объёма. Чаще всего мы имеем дело с малыми выборками объёмом в 20-30 значений случайной величины.
Любое количество начальных моментов можно получить из выборок малого объёма:
МЫ^х'/к, (3)
ы /
где
- начальный момент порядка к, К - значение объёма выборки.
Но эти выборочные моменты по очевидным причинам будут сильно отличаться от генеральных моментов искомого распределения. И поэтому задача аппроксимации реальных распределений по К моментам требует изначально оценки генеральных моментов по малым выборкам. Эта задача в литературе отражена недостаточно, поскольку основное внимание уделя-
ется оценке математических ожиданий и дисперсий, как, например, у М В. Козлова, A.B. Прохорова, А.М. Шурыгина и многих других отечественных и зарубежных авторов.
Во второй главе рассмотрено решение задачи оценки К генеральных моментов по малым выборкам. Решение этой сложной задачи требует некоторых допущений. Всякий раз мы полагаем, что выборка хотя и мала, но даёт статистически устойчивые выборочные моменты, то есть выборки ,
одинакового объёма дают равные начальные моменты или хотя бы достаточно близкие по значениям.
Оценка генеральных моментов осуществляется на основе установ- ^
ленного нами свойства монотонности выборочных моментов. Оно состоит в следующем. Рассмотрим произвольную выборку положительно определённой случайной величины. Эта выборка не обязательно должна быть статистически устойчивой. Единственное ограничение - объём выборки V должен быть не менее 8 и кратным 4. Преобразуем эту выборку в вариационный ряд в порядке возрастания значений случайной величины. Образуем пары значений из соседних элементов вариационного ряда. Из каждой пары отбросим наименьшее число. Оставшиеся элементы вновь образуют вариационный ряд, но их будет вдвое меньше. Проделаем с ним аналогичную процедуру. В результате получим три вариационных ряда: исходный и два прореженных. Несложно показать, что моменты одного порядка из этих рядов будут монотонно возрастать от ряда к ряду, поскольку значения случайной величины от ряда к ряду возрастают по построению рядов. Наименьшие моменты в первом ряду, большие во втором и самые большие в третьем. Если процедуру прореживания продолжать, то, в конце концов, получим ряд из одного числа - наибольшего по исходной выборке. Если прореживать дважды, то для момента порядка К получим три значения для вариационных рядов разного объёма: V, V/2 и V/4, соответственно. Через эти три точки можно провести экстраполирующую кривую второго порядка, которая, очевидно, не должна пересекать осей координат. Из всех известных кривых второго порядка подходит только равнобокая гипербола, уравнение которой
у(х) = (Ах + В)/(Сх +1), (4)
где х - значение объёма выборки,
у - выборочный момент, соответствующий объёму выборки х.
Но отброшенные меньшие значения случайной величины также образуют два вариационных ряда, выборочные одноимённые моменты которых будут монотонно убывать от ряда к ряду. По аналогичным соображениям в качестве экстраполирующей кривой также выберем равнобокую гиперболу, но её уравнение будет иметь вид
Мт = 2М - (Atп + Bt )/(Ctп +1), (5)
где Ак, Вк, Ск - коэффициенты, найденные для экстраполяции момента порядка к,
М - значение момента в общей точке.
Эти две кривые проходят через общую точку, соответствующую объёму исходной непрореженной выборки.
Экстраполяция проводится для каждого момента в отдельности. Теперь, если в уравнениях (3) и (4) объёмы выборок устремить в бесконечность, то получим значение генерального момента, для которого проводилась экстраполяция. Таких значений будет два по числу кривых, и необходимо выбрать ближайшее к нему. Если выбрать среднее значение, то оно будет заведомо хуже ближайшего, если точное значение лежит с внешней стороны кривых (см. рис.).
К задаче выбора экстраполирующих гипербол
Для выбора наилучшей экстраполирующей кривой мы вводим 9 косвенных критериев: 1) среднее значение коэффициента вариации по трём точкам кривой; 2) среднее значение коэффициента вариации, отнесённое к длине кривой; 3) средняя кривизна кривой; 4) длина кривой; 5) кривизна в последней точке; 6) среднее значение выборочных моментов по трём точкам; 7) средний момент, отнесённый к длине кривой; 8) среднее геометрическое выборочных моментов; 9) среднее геометрическое выборочных моментов, отнесённое к длине кривой. Данные критерии выбора кривых являются эвристическими. Например, кривая подлежит выбору, если среднее значение коэффициента вариации в ней меньше. Или кривая подлежит выбору, если она короче и так далее. Физический смысл выбранных критериев не всегда однозначен, поэтому их достоверность оценивалась статистически. Если в серии опытов какой-либо критерий давал неверные ука-
зания в большей части случаев, то он инвертировался. Вероятности правильного выбора кривых по каждому критерию в отдельности лежат в интервале от 0.7 до 0.82. Чтобы учесть их все, использовали правило: если из 9 критериев 5 или более указывали на одну и ту же кривую, то она полагалась выбранной.
Разные критерии дают несовпадающие результаты, поэтому, полагая их независимыми, оценивается вероятность правильного выбора по схеме испытаний Бернулли. В этом случае возрастает: для первого момента -0,998, для второго - 0,93, для третьего - 0,948, для четвёртого - 0,941, для пятого - 0,972, для шестого - 0,953, для седьмого - 0,964, для восьмого -0,977, для девятого - 0,986, для десятого - 0,99, для одиннадцатого - 0,99, для двенадцатого - 0,996.
Было проведено порядка 50 тысяч пробных оценок по критериям для случаев, когда правильный выбор был заранее известен. И оказалось, что вероятность правильного выбора по девяти критериям примерно 0.95 для выборок объёмом 8 и для коэффициентов вариаций, лежащих в интервале от 0.1 до 1.4. С увеличением объёма выборки и коэффициента вариации вероятность правильного выбора по критериям монотонно возрастает.
Выделим на рис. восемь сечений. Сечение первое Т1 соответствует минимальному объёму выборки, равному N/4, Т2 - объёму N/2, ТЗ - выборке заданного объёма N. Поскольку мы проводим экстраполяцию, то погрешность экстраполяции мала, как обычно полагают, на полушаге. Мы выбрали сечение Т4 на полушаге. В нашем случае полушаг равен N/4. Мы также взяли сечения на шаге, на полуторном шаге, двух шагах и двух с половиной шагах, соответственно, получили сечения Т4, Т5, Т6, Т7, Т8.
Выбор наилучшей гиперболы позволяет в каждом сечении найти выборочный момент, ближайший к значению генерального момента, то есть для каждого сечения из двух значений выборочных моментов выбрано наилучшее.
Как показал машинный эксперимент, дисперсия оценки генеральных моментов наименьшая практически всегда по второму сечению Т2, что объясняется тем, что в нём два значения отстоят друг от друга оптимальным образом по сравнению с другими сечениями. Возможность выбора улучшает оценку генерального момента по сравнению с оценкой сечения третьего ТЗ, хотя объём выборки для сечения ТЗ больший. Таким образом, нам удалось улучшить оценку генеральных моментов, используя многокритериальный выбор экстраполирующих гипербол.
Как показал статистический анализ, погрешность оценок генеральных моментов остаётся значительной. Её величина зависит от многих факторов: объёма выборки, коэффициента вариации аппроксимируемого распределения и т.д., и, в частности, от того, насколько удачна конкретная выборка. В этих условиях особую значимость приобретает возможность оценить достоверность аппроксимации в каждом отдельном случае.
В третьей главе рассматривается задача аппроксимации по 12 моментам и обосновывается принцип аналогий.
Решая задачу аппроксимации, мы сталкиваемся со степенной проблемой моментов, которая является фундаментальной в теории вероятностей. В работе найдено алгоритмическое решение степенной проблемы моментов в частном случае: для положительно определённых случайных величин и обобщённого гиперэрланговского распределения. Математически это требует решения системы (2). В правой части этой системы - заданные начальные моменты, по которым производится аппроксимация, в левой части системы - неизвестные параметры обобщённого распределения р„ к, и ц,.
При этом неизвестные к, являются целочисленными, а р, и ц, непрерывными. В общем виде, учитывая порядок и число неизвестных, такую систему решить нельзя. Для решения системы (2) применялись следующие подходы. Осуществлялся перебор допустимых значений для целочисленных неизвестных к, и допустимых значений ц„ которые должны быть больше нуля. При этом, как оказалось, если решение системы однозначно, т.е. число уравнений совпадает с числом неизвестных, то путем перебора найти решение невозможно, поскольку это требует, чтобы перебором часть корней была найдена в точности. Поэтому пришлось ввести избыточность в эту систему и ввести дополнительные параметры. Если решать нелинейную систему, задавая значения ^ и |д„ то нелинейная система станет линейной относительно оставшихся неизвестных которые легко находятся. Мы по-прежнему исходим из того, что чем по большему числу моментов проводится аппроксимация, тем точнее результат. Но, учитывая вычислительные сложности, мы были вынуждены остановиться на аппроксимации по 12 моментам. Для этого необходимо иметь в распределении тринадцать ветвей (см. (1)), а это привело к тому, что общее число неизвестных стало равным 39. Эта избыточность облегчила поиск допустимых решений, при которых все вероятности р1 положительны,то есть за приемлемое машинное время получаем примерно 1000 допустимых решений на 1000000 перебираемых случайным образом вариантов значений к, и Но это потребовало решения задачи выбора наилучшей аппроксимации из множества найденных. Наилучшее решение выбирается по критерию согласия Колмогорова, которое дополняет в данном случае критерий моментов. Но, учитывая специфику этой задачи, здесь ближе среднеквадратичная оценка:
(6)
(»1
хотя эти оценки приводят к одинаковым результатам. Таким образом, сочетаем аппроксимацию по 12 моментам с выбором наилучшего по множеству приближения по критерию согласия.
Наряду с этим методом, который условно назван точным, применялся и приближённый метод, при котором направленным перебором из 23 миллионов вариантов находили распределение, ближайшее по моментам к искомому. Этот метод поиска особенно важен в тех случаях, когда оценки генеральных моментов противоречивы, например если они сделаны по разным выборкам.
Следует заметить, что результаты аппроксимации всегда легко проверяются, а именно найденные параметры при подстановке в систему должны дать заданные моменты.
Принцип аналогий состоит в следующем: погрешность экстраполяции, определённая для одного распределения, переносится на генеральные моменты другого распределения, которое близко первому. В нашем случае для генеральных моментов, найденных экстраполированием, проведём аппроксимацию по К моментам обобщённым распределением. В результате получим аппроксимирующее распределение, достаточно близкое к искомому реальному распределению. Построим для аппроксимирующего распределения выборку значений того же объёма, что и исходная выборка значений. Повторим всю процедуру оценки генеральных моментов для этой искусственно созданной выборки и получим погрешность оценок, которую можно сравнить с аналитическими значениями генеральных моментов, вычисляемых по (2) для аппроксимирующего распределения. Это сравнение позволяет вычислить погрешность оценок для найденного обобщённого распределения. Поскольку, по нашей гипотезе, обобщённое распределение близко искомому реальному, найденные погрешности генеральных моментов учтены в моментах реального распределения и получено:
(11=М^-Мт, (7)
где М[|]э, М(1' - моменты порядка ¡, вычисленные при экстраполяции и из системы (2), соответственно.
Было проведено статистическое исследование достоверности получаемых результатов. Рассматривались малые выборки, кратные четырём, объёмом от 8 до 32 значений случайной величины. Генеральные моменты определялись аналитически, поскольку формула распределения всякий раз была известна.
Оценка генеральных моментов экстраполированием с выбором гиперболы по многим критериям давала погрешность от 0,02% до 4% для распределений с малыми коэффициентами вариаций, от 3% до 20% для распределений со средними значениями коэффициентов вариаций и от 5% до 90% для распределений с большими коэффициентами вариаций для первого и двенадцатого начальных моментов распределений, соответственно. Для прочих моментов от первого до двенадцатого погрешности монотонно возрастают от начального значения до конечного. Это хорошие результаты с учётом специфики задачи.
Как показали проведённые исследования, принцип аналогий можно применить только в том случае, если погрешность аппроксимации по отношению к оценкам генеральных моментов не превышает 10%, что определяется в процессе вычислений. При этом практически всегда удаётся улучшить оценки генеральных моментов.
В четвёртой главе проведено исследование применимости данной методики в общем случае.
Методика аппроксимации реальных распределений состоит в следующем:
1. Вначале проводится оценка генеральных моментов по малой выборке. Строится вариационный ряд. Затем он дважды прореживается. Строятся две экстраполирующие гиперболы. Затем вычисляются выборочные моменты для сечения Т2, и из пары значений выбирается ближайшее к генеральному моменту по девяти критериям, оценивающим гиперболы.
2. Проводится приближённая аппроксимация путём поиска ближайшего обобщённого распределения, имеющего двенадцать моментов, наиболее близких к значениям оценок генеральных моментов. Моменты этого распределения принимаются за новые оценки генеральных моментов. Они всегда лучше первоначальных оценок.
3. Затем анализируется погрешность этой приближённой аппроксимации по отношению к оценкам генеральных моментов. Если погрешность менее 10%, проводится уточнение результатов в соответствии с принципом аналогий. При этом результаты всегда улучшаются примерно на 1030%. Если погрешность менее 15%, но более 10%, то аппроксимирующее имеет примерно такую же погрешность по генеральным моментам реального распределения. В прочих случаях погрешность аппроксимации может быть больше вдвое или втрое, чем погрешность приближённой аппроксимации по отношению к оценкам выборочных моментов.
4. Для моментов, найденного аппроксимирующего распределения, с помощью точной аппроксимации строится множество обобщённых распределений с такими же двенадцатью моментами. Из этого множества выбирается наилучшее распределение по критерию согласия, которое и принимается за искомое.
Проверка этой методики проводилась как с помощью машинного эксперимента, так и для реальных экспериментальных данных. При машинном эксперименте в качестве исходных данных брались обобщённые распределения, 38 параметров которых задавались генератором случайных чисел (ГСЧ). Обобщённое распределение включает практически всё множество распределений пуассоновского типа и хорошо аппроксимирует все известные по справочникам распределения положительных случайных величин. В качестве ГСЧ использовалась широко известная функция гал-с1от(г), которая не обеспечивает статистической устойчивости малых вы-
борок. Таким образом, машинные эксперименты ставились для наиболее неблагоприятных условий.
Получены обширные таблицы с результатами, которые опубликованы в работах автора и содержатся в диссертации. Анализируя их, можно прийти к выводу, что методика оценки генеральных моментов и аппроксимации применима и для общих случаев. В работе рассматривались выборки объёмом от 8 до 32 значений случайной величины. Коэффициенты вариаций исходных распределений лежали в пределах от 0,1 до 1,4.
Примерно в половине случаев аппроксимация даёт хорошие или, во всяком случае, приемлемые результаты. Приемлемыми полагались результаты, если наибольшая по 12 моментам погрешность не превышала 30%.
Хорошими полагались результаты, если наибольшая погрешность не превышала 5% (примерно е 23% рассмотренных случаев). Практически всегда погрешность в оценки генеральных моментов мала для моментов малых порядков и резко возрастает для двенадцатого момента. До седьмого момента погрешность аппроксимации чаще всего не превышает 10-20%.
В целом результаты положительные, поскольку оценка проводилась для наихудших условий, при отсутствии какой-либо стабильности малых выборок.
Наиболее важным представляется то, что в каждом отдельном случае можно достоверно оценить погрешность аппроксимации, основываясь на величине погрешности приближённой аппроксимации по отношению к оценкам генеральных моментов. Так, если погрешность приближённой аппроксимации не превышает 15%, то оценка генеральных моментов имеет примерно такую же погрешность.
Принцип аналогий, уточняющий оценки генеральных моментов, даёт положительные результаты, если погрешность приближённой аппроксимации не превышает 10%.
Общие границы применимости данной методики очертить сложно, поскольку аппроксимирующее распределение имеет 38 независимых параметров. При этом необходимо учитывать ещё и качество каждой отдельной выборки, по которой проводится аппроксимация. По всем этим причинам нельзя сказать заранее, в каком случае аппроксимация будет достоверной. Например, аппроксимация может быть достоверной для малых выборок и недостоверной для больших, но менее удачных.
Исследована возможность аппроксимации для малых выборок объёмом от 8 до 32 значений. В отдельных случаях аппроксимация проходила и для выборок минимального объёма. Но лучшие результаты получаются для выборок объёмом больше 20 значений. Следует иметь в виду, что объём выборки не является гарантом успеха, в отдельных случаях аппроксимация не проходила и для выборок объёмом в 300-400 значений.
Аналогично и для коэффициентов вариаций распределений. В среднем, чем больше коэффициент вариации, тем сложнее проходит аппрокси-
мация, но в отдельных случаях лучше могут аппроксимироваться распределения с большими коэффициентами вариаций, чем с меньшими.
Исследована аппроксимация реальных распределений, заданных малыми выборками. Для реальных распределений результаты аппроксимации оказались значительно лучше, поскольку малые выборки для реальных случайных величин более стабильны, чем в машинном эксперименте. Из 19 рассмотренных вариантов только один оказался неудовлетворительным.
Проведенный анализ распределения численности грызунов, переносчиков опасных инфекций, для разных климатических районов и анализ распределения вероятностей непроданных печатных листов в издательстве показал эффективность разработанной методики для выборок объёмом не менее 20 значений случайной величины.
В заключении излагаются основные результаты работы.
Основные результаты работы:
1. Разработано и исследовано обобщённое гиперэрланговское распределение, имеющее двенадцать независимых моментов. Найдены функции плотности распределения и интегральная функция распределения. Получены аналитические выражения для начальных моментов обобщённого распределения.
2. Разработана и исследована методика аппроксимации по К моментам при избыточности параметров обобщённого распределения, что представляет собой частное решение степенной проблемы моментов Чебышева.
3. Предложено из многих аппроксимирующих по К моментам распределений выбирать наилучшее по критерию согласил.
4. Установлено и доказано свойство монотонности выборочных моментов, которое справедливо всегда для выборок положительно определённых случайных величин.
5. Разработана и исследована методика гиперболической экстраполяции с многокритериальным выбором гипербол для прогноза генеральных моментов реального распределения.
6. Предложена методика уточнения прогноза генеральных моментов на основе принципа аналогий.
7. Показана эффективность применения предлагаемых методов аппроксимации по К моментам и оценки генеральных моментов реального распределения.
Публикации по теме диссертации:
1. Голушко С.И. Аппроксимация реальных распределений случайных величин по N выборочным моментам обобщённым гиперэрланговским распределением при избыточности параметров / А.И. Сайкин, С.И. Голушко // Материалы и технологии XXI века: сб. статей П Междунар. науч -техн конф. - Пенза: Приволжский дом знаний, 2004. С.150-155.
21512
2006-4
2. Голушко С.И. Методика прогноза генеральных моментов по
свойства монотонности / А.И. Сайкин, С.И. Голушко // Динамю 22135 сб. трудов VII Междунар. науч.-техн. конф. - Саратов: СГТУ, 20
3. Голушко С.И. Оценка алгоритмического решения проблемы
критерию согласия Колмогорова / А.И. Сайкин, СЛ. Голушко // Динамика технологических систем: сб. трудов VII Междунар. науч.-техн. конф. - Саратов: СГТУ, 2004. -С. 312-315.
4. Голушко С.И. Алгоритмическое решение проблемы моментов статистики / А.И. Сайкин, С.И. Голушко // Математические методы в технике и технологиях - ММТТ-17: сб. трудов XVII Междунар. науч. конф.: В 10 т. Т.2. Секция 2 / под общ. ред. B.C. Балакирева. - Кострома: Изд-во Костромского гос. технол. ун-та, 2004. - С. 172.
5. Голушко С.И. Прогноз N моментов генеральной совокупности гиперболической экстраполяцией по ограниченным выборкам / А.И. Сайкин, С.И. Голушко // Сложные системы. Анализ, моделирование, управление: сб. науч. статей. - Саратов: Научная книга, 2005. - С. 61.
6. Голушко С.И. Статистическое моделирование систем массового обслуживания дискретными рядами / А.И. Сайкин, С.И. Голушко // Моделирование и управление в сложных системах: сб. науч. статей. - Саратов: СГТУ, 2004.-С.13 -17.
7 Голушко С.И. Представление непрерывных распределений дискретными множествами в задачах имитационного моделирования систем массового обслуживания / А.И. Сайкин, С.И Голушко // Радиотехника и связь: материалы Междунар. науч.-техн. конф., посвященной 15-летию кафедры радиотехники. - Саратов: СГТУ, 2004.-С. 92-100.
8 Голушко С.И. Метод моментов при аппроксимации распределениями пуассоновско-го типа / С.И. Голушко // Теория и практика управления общественными институтами и процессами в России: сб. науч. трудов. - Саратов: ПАГС, 2003. - С. 241-243.
9. Голушко С.И. Исследование обобщённого гиперэрланговского распределения / А.И Сайкин, С.И. Голушко; Сарат. гос. техн. ун-т. - Саратов, 2002. - 14 с.-Деп. в ВИНИТИ 26.07.02, №1416-В2002.
10. Голушко С.И. Аппроксимация по N-моментам реальных распределений законами пуасооновского типа в задачах машинного моделирования стохастических систем / А.И. Сайкин, С.И. Голушко; Сарат. гос. техн. ун-т. - Саратов, 2003.- 13 с. - Деп.
в ВИНИТИ 08.07.03, №1309-В2003.
11. Голушко С.И. Свойство монотонности в задачах оценки моментов генеральной совокупности по малым выборкам / А.И. Сайкин, С.И. Голушко, Е.Ю. Журавлева; Сарат. гос. техн. ун-т. - Саратов, 2004. - 24 с. Деп. в ВИНИТИ 22.09.04, №1502-В2004.
12. Голушко С.И. Имитационное моделирование обобщённого гиперэрланговского распределения при аппроксимации реальных распределений по К моментам / А.И. Сайкин, С.И. Голушко; Саратов: СГТУ, 2003. - 12 с. Деп. в ВИНИТИ 08.07.2003 № 1310-В2003.
13 Голушко С.И Равновероятностная дискретизация непрерывных распределений с коррекцией выделенных точек по критерию моментов / А.И. Сайкин, С.И. Голушко; Сарат. гос. техн. ун-т. - Саратов, 2004. - 14 с. Деп.в ВИНИТИ 20.04.2004. №645-В2004.
Лицензия ИД № 06268 от 14.11.01
Подписано в печать 26.10.05 Формат 60x84 1/16
Бум. тип. Усл. печл. 0,93 (1,0) Уч.-изд.л. 0,9
Тираж 100 экз. Заказ 379 Бесплатно
Саратовский государственный технический университет
410054, Саратов, Политехническая ул., 77 Отпечатано в РИЦ СГТУ. 410054, Саратов, Политехническая ул., 77
Оглавление автор диссертации — кандидата физико-математических наук Голушко, Сергей Иванович
Введение.
1. Глава 1. Состояние вопроса, постановка задачи построения моделей и методов оценки вероятностных характеристик реальных объектов.
1.1. Выбор аппроксимирующего распределения.
1.2. Оценка значимости числа моментов, по которым проводится аппроксимация.
1.3. Методы оценки аппроксимирующего распределения и его параметров.
1.4. Методы получения точечных оценок.
1.5. Методы получения интервальных оценок.
1.6. Оценка характеристик генеральной совокупности по малым выборкам.
1.7. Эмпирические распределения, гистограммы и полигоны.
1.8. Выводы к главе 1.
2. Глава 2. Свойство монотонности и оценка генеральных моментов реального распределения по малой выборке.
2.1. Свойство монотонности выборочных моментов.
2.2. Экстраполяция значений выборочных моментов.
2.3. Многокритериальный выбор аппроксимирующих гипербол.
2.4. Погрешности оценки генеральных моментов по малым выборкам.
2.5. Выводы к главе 2.
3. Глава 3. Аппроксимация реальных распределений по К моментам обобщённым гиперэрланговским распределением.
3.1. Метод моментов для обобщённого гиперэрланговского распределения.
3.2. Решение задачи аппроксимации перебором в условиях избыточности параметров.
3.3. Приближённое решение задачи аппроксимации по двенадцати моментам направленным перебором.
3.4. Выбор наилучшего по множеству аппроксимирующего распределения по критерию согласия.
3.5. Принцип аналогий и уточнение результатов аппроксимации.
3.6. Выводы к главе 3.
4. Глава 4. Методика оценки вероятностных характеристик реальных объектов.
4.1. Методика аппроксимации реальных распределений положительно определённых случайных величин по малым выборкам.
4.2. Исследование точности и области применимости аппроксимации по двенадцати моментам.
4.3. Аппроксимация обобщённым распределением реальных распределений по малым выборкам.
4.4. Выводы к главе 4.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Голушко, Сергей Иванович
На практике многие реальные объекты характеризуются случайными величинами, значения которых получаются в экспериментах. Число экспериментов может быть ограничено или из-за их сложности и стоимости, или ограничено из-за длительного времени проведения эксперимента. Количество значений случайной величины, полученных в эксперименте, назовём выборкой. Таким образом, мы сталкиваемся со случайными величинами, о которых можем судить лишь по выборкам их значений. Полная характеристика случайной величины распределение вероятностей, но, как правило, это распределение, которое мы будем называть реальным, нам неизвестно. Причин тому много, но основная из них это недостаточность объёма выборки значений случайной величины. Мы исключаем те немногие случаи, при которых вид распределения случайной величины известен на основании предыдущего опыта или, исходя из физических законов. В данной постановке, о случайной величине ничего не известно, кроме ограниченной выборки её значений. Мы аппроксимируем, реальное распределение распределением заданного вида, но каким должно быть это аппроксимирующее распределение мы в точности не знаем, поэтому для аппроксимации мы выбрали обобщённое распределение, включающее в себя сразу несколько распределений пуассоновского типа: экспоненциальное, Эрланга к порядка, гиперэкспоненциальное и обобщённое Эрланга к порядка. Это распределение имеет К свободных параметров, что позволяет проводить аппроксимацию по К начальным моментам, при этом К может достигать значения в несколько десятков и сотен. В диссертационной работе рассматриваются только положительно определённые случайные величины. Такие задачи, как нам известно, ранее не ставились. Известно, что распределения Пирсона образуют семейство непрерывных распределений двенадцати типов, но все они однозначно определяются четырьмя начальными моментами и не обладают избыточностью параметров. Мы исследовали достаточность четырёх моментов в задачах массового обслуживания и, оказалось, что на среднюю длину очереди влияют первые семь начальных моментов времени обслуживания и времени поступления заявок. Отбрасывание моментов старше второго, третьего или четвёртого приводит к недопустимо большим погрешностям для средней длины очереди. Поэтому мы поставили задачу аппроксимации по возможно большему числу моментов, исходя из того, что чем по большему числу моментов проводится аппроксимация тем она точнее. Аппроксимация по К моментам, как известно, составляет не разрешённую в общем виде, проблему моментов Чебышева. Эта проблема была решена нами алгоритмически для частного случая обобщённого распределения и положительно определённых случайных величин. Чтобы аппроксимировать реальные распределения, необходимо знать его К генеральных моментов. По ограниченным выборкам, мы находим только выборочные моменты. Выборочные моменты, как известно, случайны и зависят от конкретной выборки, ноэтому мы ноставили задачу оценки генеральных моментов реального раснределения но малым выборкам, нолагая, что объём выборок не позволяет достоверно оценить генеральные моменты, во всяком случае, традиционными методами. Для малых выборок задача оценки генеральных моментов может решаться только при условии отдельных допущений и соглашений. В качестве таковых мы принимаем, что малые выборки объёмом в 10-30 значений статистически устойчивы, что в свою очередь требует, чтобы коэффициенты вариаций не превышали существенно значение 1. Для оценки генеральных моментов определено и доказано общее свойство монотонности выборочных моментов. Использована гиперболическая экстраполяция генеральных моментов. Применён многокритериальный выбор экстраполирующих гипербол и, наконец, процедура уточнения оценки генеральных моментов на основании принципа аналогий. Таким образом, для решения задачи аппроксимации реальных распределений по малым выборкам, имеющих большое прикладное значение, нами разработаны специальные модели и методы, которые оказались пригодными и в общих случаях и дали хорошие результаты там, где их вообще было получить крайне затруднительно. Решение этой задачи оказалось возможным только при условии применения быстродействующей вычислительной техники и разработки соответствующего программного обеспечения. Целью диссертационной работы является разработка методов оценки значений К генеральных моментов реального распределения по малым выборкам с допустимой погрешностью. Аппроксимация реального распределения по К моментам многими обобщёнными гиперэрланговскими распределениями. Выбор из множества аппроксимирующих распределений наилучщего по критерию согласия. Объект исследования. Положительно определённые случайные величины, имеющие выборочный коэффициент вариации в пределах от 0.1 до 1.4. Методы исследований. Методы теории вероятностей, математической статистики, теории массового обслуживания, методы статистического имитационного моделирования и другие. Научная ценность работы состоит в том, что найдено алгоритмическое решение проблемы моментов Чебышева, для частного случая обобщённого гиперэрланговского распределения. Определено и доказано общее свойство монотонности выборочных моментов для положительно определённых случайных величин, а также методика гиперболической экстраполяции генеральных моментов, включающая в себя многокритериальный выбор экстраполирующих гипербол, что позволяет достоверно определить интервалы значений К генеральных моментов реальных распределений. Практическая значимость работы заключается в том, что все разработанные методики позволяют достоверно прогнозировать вероятности реальных событий по малым выборкам, объёмы которых не позволяют сделать достоверный прогноз при использовании традиционных подходов. В работе рассмотрены статистические материалы численности грызунов в прикаспийской низменности, любезно предоставленные РосНИПЧИ "Микроб" и статистические материалы производства и продаж печатной продукции ЗАО ЛА "Научная книга" В диссертации также представлены обширные статистические материалы проведения машинных экспериментов в рамках рассматриваемых методик аппроксимации и оценок. Автор защищает: обобщённое многопараметрическое гиперэрланговское распределение, имеющее К свободных начальных моментов; методику аппроксимации по К моментам, дающую точные и приближённые значения параметров обобщённого распределения; свойство монотонности выборочных моментов; методику гиперболической экстраполяции, с учётом многокритериального выбора экстраполирующих гипербол; модель оценки генеральных моментов по выбранным сечениям; принцип аналогий, компенсирующий погрешность экстраполяции. Результаты работы внедрены в ЗАО "Научная книга". Работа написана в СГТУ на кафедре "Программное обеспечение вычислительной техники и автоматизированных систем".
Заключение диссертация на тему "Математические модели и методы оценки вероятностных характеристик реальных объектов при малых объемах экспериментальных данных"
4.4. Выводы к главе четвертой
1. Разработана эффективная методика аппроксимации по двенадцати моментам обобщённым распределением по малым выборкам, включающая в себя прогноз генеральных моментов реального распределения по малым выборкам. Прогноз основывается на использовании свойства монотонности, построении экстраполирующих гипербол, выборе наилучшей гиперболы по эвристическим критериям. Последующая аппроксимация по двенадцати моментам даёт наилучшее по множеству приближение по моментам к реальному распределению.
2. Установлен критерий оценки достоверности аппроксимации в каждом отдельном случае, основывающийся на величине погрешности приближённой аппроксимации по отношению к оценкам генеральных моментов.
3. Установлен критерий применимости принципа аналогий, уточняющего результаты, основывающийся на величине погрешности приближённой аппроксимации по отношению к оценкам генеральных моментов.
4. Установлены границы применимости данной методики, как по объёмам выборок, так и по допустимым значениям коэффициентов вариаций аппроксимируемых распределений, определяемых по малым выборкам.
5. Исследована аппроксимация реальных распределений, заданных малыми выборками. Показана эффективность разработанной методики для выборок объёмом не менее 20 значений случайной величины.
ЗАКЛЮЧЕНИЕ
Аппроксимация реальных распределений по малым выборкам представляет актуальную задачу, решение которой существенно улучшит количественные оценки случайных величин, описывающих реальные объекты.
Поскольку вид реального распределения во многих случаях нам не известен, то для аппроксимации необходимо обобщённое распределение, включающее в себя множество других распределений, нашедших достаточно широкие области применения. В качестве такого обобщённого распределения нами выбрано обобщённое гиперэрланговское распределение, имеющее К свободных моментов, которые могут изменяться независимо друг от друга в широких пределах.
Попытки применить для решения задачи аппроксимации методы наименьших квадратов и оценки набольшего правдоподобия не увенчались успехом из-за сложности математической модели, требующей решения нелинейных алгебраических систем высокого порядка, в которых треть неизвестных являются целочисленными величинами. Мы не смогли найти способы получения стабильных решений нелинейных систем в этих случаях.
Метод моментов оказывается единственным, работающим стабильно, который нам удалось реализовать на сегодняшний день. Но это потребовало введения избыточности в задаче аппроксимации, которая привела к множественности аппроксимирующих распределений, имеющих общие начальные моменты. По этой причине нами была решена задача выбора наилучшего по множеству допустимых решений аппроксимирующего распределения по критерию согласия Колмогорова, что оправдало себя на практике.
Аппроксимация проводилась нами по К начальным моментам, мы исходили из того, что чем по большему числу моментов проводится аппроксимация, тем она точнее. С учётом возможностей современной вычислительной техники аппроксимация проводилась нами по 12 моментам. Это существенно лучше, чем аппроксимация по двум или даже четырём моментам. Кроме того, как это было показано, в задачах анализа систем массового обслуживания с произвольно распределёнными временами поступления и обслуживания заявок необходимо учитывать до семи моментов распределений. Таким образом, аппроксимация по 12 моментам оказывается достаточной как минимум в задачах массового обслуживания.
Практическое использование метода моментов требует знания генеральных моментов искомого распределения. Для малых выборок выборочные моменты существенно отличаются от генеральных моментов и фактически не позволяют получить достоверное решение. Поэтому нами предлагается методика оценки значений генеральных моментов искомого распределения по малым выборкам.
Эта оценка основывается на установленном нами свойстве монотонности выборочных моментов, которое справедливо для произвольных выборок и в свою очередь позволяет применить экстраполяцию значений генеральных моментов.
В качестве экстраполирующей функции нами была выбрана равнобокая гипербола, которая по своим свойствам больше всего подходит в данном случае.
Для оценки генеральных моментов необходимо построить две гиперболы, которые дают равносильные результаты, и выбрать из них наилучший. Выбор оказался возможным на основе девяти критериев, затрагивающих геометрические параметры экстраполирующих кривых: длину, кривизну, и, кроме того, величины перепада значений моментов и коэффициентов вариаций вдоль кривых. Эти эвристические критерии были оценены статистически. Они позволяют в своей совокупности выбирать экстраполирующую кривую одну из двух с лучшей оценкой генерального момента с вероятностью не хуже 0,93 в зависимости от порядка оцениваемого момента. Причём для первого момента вероятность правильного выбора приближается к 1, а для старших моментов она возрастает более 0,93. Это позволяет выбрать наилучшую оценку из сечения Т2, которая имеет наименьшую дисперсию по отношению к другим сечениям.
Оценки генеральных моментов полученные по малым выборкам всегда лучше выборочных моментов, подсчитанных по исходной выборке.
Полученные оценки моментов лучшие для каждого момента в отдельности, но в совокупности по 12 моментам они противоречивы, так как получены по разным выборкам. Поэтому используется приближённая аппроксимация по 12 моментам, которая даёт наилучшее приближение по множеству рассмотренных, которое составляет при программной реализации 23 миллиона вариантов. Моменты аппроксимирующего распределения не противоречивы и в совокупности они всегда ближе к значениям генеральных моментов, чем ранее сделанные оценки.
Как показали многочисленные эксперименты, погрешность приближённой аппроксимации по отношению к оценкам, позволяет судить о том, насколько удачно были сделаны оценки генеральных моментов. Если погрешность менее 15%, то генеральные моменты найдены примерно с такой же погрешностью. Если погрешность менее 10%, то значения генеральных моментов могут быть уточнены в соответствие с принципом аналогий. При этом погрешность уменьшается на 10-30%.
Достоверность аппроксимации напрямую зависит от малой выборки, которая может быть удачной или нет. Рассмотренная методика позволяет оценить достоверность полученных результатов в каждом отдельном случае. Результаты достоверны, если погрешность приближённой аппроксимации не более 15%. В противном случае необходимы выборки большего объёма.
Машинные эксперименты, поставленные для наиболее неблагоприятных условий, показали, что примерно в половине случае эта методика даёт как минимум приемлемые результаты. А в 20% случаев хорошие, при которых погрешность по всем 12 моментам не превосходит 6%.
Для реальных случайных величин, которые по своей природе ближе к регулярной модели, результаты значительно лучше. Хорошие результаты были получены в 18 случаях из рассмотренных 19.
В целом аппроксимация реальна по выборкам более 20 значений случайной величины, если выборочный коэффициент вариации не превосходит 1.4. Для меньших выборок так же возможна успешная аппроксимация, но это будет определяться качеством самой выборки.
Таким образом, нами в целом предложена новая методика аппроксимации реальных распределений по 12 моментам, которая во многих случаях позволяет достичь достоверных результатов, которые нельзя получить традиционными методами.
Библиография Голушко, Сергей Иванович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Архипов Г.К. Гиперэрланговское распределение в теории массового обслуживания. В сб. "Применение вычислительной техники к решению некоторых инженерных задач". Тула, ТПИ. 1973 г.
2. Кофман А., Крюон Р. Массовое обслуживание. Теория и приложения. -М.: Мир, 1965 г.
3. Сайкин А.И., Голушко С.И. Аппроксимация по N-моментам реальных распределения законами пуассоновского типа в задачах машинного моделирования стохастических систем. Саратов, СГТУ, Деп. в ВИНИТИ 08.07.2003, № 1309 В2003.
4. Сайкин А.И., Голушко С.И. Исследование обобщённого гиперэрланговского распределения. Саратов, СГТУ, Деп. в ВИНИТИ 26.07.2002, № 1416 -В2002.
5. Ахиезер Н.И. Классическая проблема моментов. М.: Наука, 1961 г.
6. Риордан Дж. Вероятностные системы обслуживания. М.: Связь, 1966г.
7. Сайкин А.И., Махарджан Р. Исследование влияния асимметрии и эксцесса распределений на характеристики систем массового обслуживания. Саратов, СГТУ. Деп. в ВИНИТИ 22.05.2001, № 1309 В2001 г.
8. Сайкин А.И., Голушко С.И. Имитационное моделирование обобщённого гиперэрланговского распределения при аппроксимации реальных распределений по К моментам. Саратов. СГТУ, Деп. в ВИНИТИ 08.07.2003 г, №1310 -В2003.
9. Голушко С.И. Метод моментов при аппроксимации распределениями пуассоновского типа// Теория и практика общественными институтами и процессами в России. Сб. научных трудов ПАГС, -Саратов, 2003, с.252
10. Сайкин А.И., Голушко С.И. Статистическое моделирование систем массового обслуживания дискретными рядами. // Моделирование и управление в сложных системах. Сб. научных статей. Саратов. СГТУ, 2003 г.
11. Фигурин В.А., Оболонкин В.В. Теория вероятностей и математическая статистика. Минск: ООО "Новое знание", 2000 г.
12. Крем ер Н.Ш. Теория вероятностей и математическая статистика. -М.: Юнити, 2002 г.
13. Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. М.: "Арис пресс", 2004 г.
14. Вероятность и математическая статистика. Энциклопедия. Гл. ред. Ю.В.Прохоров. М.: "Большая российская энциклопедия", 1999 г.
15. Каган A.M. Проблемы передачи информации. -М.: Связь, 1976 г.
16. Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. -М.: ФМ, 1962 г.
17. Козлов М.В., Прохоров A.B. Введение в математическую статистику. М.: МГУ, 1987 г.
18. Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: ВШ, 2001.
19. Венцель Е.С. Теория вероятностей. М.: Наука, 1969 г.
20. Сайкин А.И., Голушко С.И. Прогноз N моментов генеральной совокупности гиперболической экстраполяцией по ограниченным выборкам./Сложные системы. Анализ, моделирование, управление. -Саратов: ООО Издательство "Научная книга", 2005. -118 с.
21. Сайкин А.И., Голушко С.И. Методика прогноза генеральных моментов по малым выборкам с учётом свойства монотонности// Динамика технологических систем. Сборник трудов VII Международной научно-технической конференции (ДТС-2004). Саратов, СГТУ, 2004 г.
22. Сайкин А.И., Голушко С.И. Равновероятностная дискретизация непрерывных распределений с коррекцией выделенных точек по критерию моментов. Сарат. Гос. Техн. ун-т. Саратов, 2004. Деп в ВИНИТИ 20.04.2004. №645-В2004.
23. Сайкин А.И., Голушко С.И., Журавлёва Е.Ю. Свойство монотонности в задачах оценки моментов генеральной совокупности по малым выборкам.; Сарат. гос. техн. ун-т. Саратов, 2004. - 24 с. - Деп. в ВИНИТИ 22.09.04, №1502-В2004 г.
24. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.
25. Бара Ж.-Р. Основные понятия математической статистики. М.: Мир, 1974.
26. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. -3-е изд. М.: Наука, 1983.
27. Боровков A.A. Асимптотические методы в теории массового обслуживания. -М.: Наука, 1972.
28. Ван дер Варден Б.А. Математическая статистика / Пер. с нем. М.: ИЛ, 1960.
29. Гнеденко Б.В., Колмогоров А.Н. Предельные распределения для сумм независимых случайных величин. Л. - М.: Гостехиздат, 1949.
30. Иванов Г.А., Чешкин Ю.Р. Исследование статистических критериев, используемых для построения математической модели при аппроксимации опытных данных. В сб.: Некоторые вопросы теории случайных процессов. Киев: ИМ АН УССР, 1984, с. 133-140.
31. Карлин С. Основы теории случайных процессов, М.: Мир, 1970.
32. Кендалл М., Стьюарт А. Теория распределений / Пер. с англ. М.: Наука, 1970.
33. Кокс Д., Хинкли Д. Теоретическая статистика / Пер. с англ. М.: Мир, 1978.
34. Колмогоров А.Н. Интегрирование и экстраполирование случайных последовательностей. Изв. АН СССР, сер. мат., 1941.
35. Крамер Г. Математические методы статистики / Пер. с англ. 2-е изд. -М.: Мир, 1975.
36. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. -М.: Мир. Т. 1-2, 1980.
37. Джессен Р. Методы статистических обследований / Пер. с англ.; Под ред. и с предисл. Е.М.Четыркина. -М.: Финансы и статистика, 1985.
38. Енюков И. С. Методы, алгоритмы, программы многомерного статистического анализа. М.: Финансы и статистика, 1986.
39. Дубров A.M., Мхитарян B.C., Трошин Л.И. Многомерные статистические методы. Учебник. -М.: Финансы и статистика, 1998.
40. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 2-е, испр. и доп. М.: Наука, 1965.
41. Мацкевич И.П., Свирид Г.П., Булдык Г.М. Сборник задач и упражнений по высшей математике. Теория вероятностей и математическая статистика. -М.: Выщэйшая школа, 1996.
42. Яглом A.M. Экстраполирование, интерполировании и фильтрация стационарных процессов с рациональной спектральной плотностью. Тр. Моск. мат. об-ва, 1955, с. 333-374.
43. Прохоров Ю.В. Сходимость случайных процессов и предельные теоремы теории вероятностей. Теория вероятностей и ее применения, 1956, 1,№2, с. 127-238.
44. Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений. -М.: Физматгиз, 1962.
45. Гихман И.И. Предельные теоремы для последовательностей серий случайных величин. Теория случайных процессов. Респ. межвед.сб. Киев: Наук, думка, 1974, вып. 2, с. 37-47.
46. Сазонов В.В. О скорости сходимости в многомерной центральной предельной теореме. Теория вероятностей и ее применение, 1968, №1, с. 191-194.
47. Большев J1.H. Асимптотические пирсоновские преобразования. -Теория вероятностей и ее применение, 1963, №8, с. 129-155.
48. Боровков A.A., Сычева Н.М. О некоторых асимптотических оптимальных непараметрических критериях. Теория вероятностей и ее применение, 1968, №13, с. 385-418.
49. Гихман И.И., Гнеденко Б.В., Смирнов Н.В. Непараметрические методы статистики. Тр. 3 Всесоюз. матем. съезда, Т. 3. - М.: Изд-во АН СССР, с.320-334.
50. Ибрагимов И.А., Хасьминский Р.З. Асимптотическое поведение некоторых статистических оценок в гладком случае. Теория вероятностей и ее применение, 1972, №17, с. 469-486.
51. Ибрагимов И.А., Хасьминский Р.З. О моментах обобщённых байесовских оценок и оценок максимального правдоподобия. Теория вероятностей и ее применение, 1973, №3, с. 535-546.
52. Бернштейн С.Н. Распространение предельной теоремы теории вероятностей на суммы зависимых величин. Успехи матем. наук 10, 1944, с. 65-144.
53. Гихман И.И. О некоторых предельных теоремах для условных распределений и о связанных с ними задачами статистики. Укр. матем. журн. 5, 1953, с. 413-433.
54. Дынкин Е.Б. Некоторые предельные теоремы для сумм независимых случайных величин с бесконечными математическими ожиданиями. Изв. АН СССР, 1955, с.247-266.
55. Кац М. О некоторых связях между теорией вероятностей, дифференциальными и интегральными уравнениями. Математика (сб. переводов), №2, 1957, с.95-124.
56. Рогозин Б.А. О распределении некоторых функционалов, связанных с граничными задачами для процессов с независимыми приращениями. -Теория вероятностей и ее применение, 1966, №11, с. 656-670.
57. Мартин Дж. Вычислительные сети и распределенная обработка данных: Программное обеспечение, методы и архитектура. Т.1. М.: Финансы и статистика, 1986. - 269 с.
58. Костин А. Е., Илюшечкин В. М., Шальгин В. Ф. Язык сетевого моделирования вычислительных систем // Алгоритмическое обеспечение и проектирование микропроцессорных управляющих систем: Сб. науч. тр. -М.: МИЭТ, 1981.-С. 67-79.
59. Костин А. Е., Илюшечкин В. М., Шаньгин В. Ф. Принципы организации диалоговой системы имитационного моделирования ВС // Алгоритмическое обеспечение и проектирование микропроцессорных управляющих систем: Сб. науч. тр. ~М.: МИЭТ, 1981. С. 3-10.
60. Бахтин Ю.Ю., Данилов A.B., Канцель A.B., Червоненкис А.Я., Метод восстановления поля условных распределений по эмпирическим данным. Автоматика и телемеханика, 2000, N12, с.75-86.
61. Тутубалин В.Н. Теория вероятностей и случайные процессы. Основы математического аппарата и прикладные аспекты. М., Изд-во МГУ, 1992, 400с.
62. Беляев Ю.К., Носко В.П. Основные понятия и задачи математической статистики. -М.: Изд-во МГУ, ЧеРо, 1998.
63. Беляев Ю.К.,Чепурин Е.В. Основы математической статистики. М., Изд-во МГУ, ч. 1 -1982, 200 е.; ч.2 1983; 148 с.
64. Цареградский И.П. Курс теории вероятностей и математической статистики для студентов Химического факультета Московского университета, издано на ротапринте Химфака МГУ, 1970; 132 с.
65. Королев М. А., Фигурнов Э. Б. Статистика и экономический анализ в управлении народным хозяйством. М.: Экономика, 1977.
66. Лихолетов И.И., Мацкевич И.П. Руководство к решению задач по высшей математике, теории вероятностей и математической статистике. -Мн.:,Выш. шк., 1976.
67. Свирид Г.П., Макаренко Я.С., Шевченко Л.И. Решение задач по математической статистике на ПЭВМ. Мн.: Выш. шк., 1996.
68. Мацкевич И.П., Свирид Г.П. Высшая математика. Теория вероятностей и математическая статистика. Мн.: Выш. шк., 1993.
69. Кузнецов A.B. Применение критериев согласия при математическом моделировании экономических процессов. -Мн.: БГИНХ, 1991.
70. Карасев А.И., Аксютина З.М., Савельева Т.И. Курс высшей математики для экономических вузов. М.: Высшая школа, 1982., ч. 2.
71. Войтенко М.А. Руководство к решению задач по теории вероятностей / ВЗФЭИ. М.: 1988.
72. Четыркин Е.М., Калихман И.Л. Вероятность и статистика. М.: Финансы и статистика, 1982.
73. Общая теория статистики. Статистическая методология в изучении коммерческой деятельности /Под ред. A.A. Спирина, О.Э. Башиной. М.: Финансы и статистика, 1996.
74. Колесникова И.И. Социально-экономическая статистика: Учеб. пособие. Мн.: Новое знание, 2002.
75. Практикум по социально-экономической статистике /Под ред. И.Е. Теслюка. Мн: БГЭУ, 1997.
76. Елисеева И.И., Юзбашев М.М. Общая теория статистики. М.: Финансы и статистика, 1995.
77. Ефимова М. Р., Рябцев В.М. Общая теория статистики. М.: Финансы и статистика, 1998.
78. Коршунов Д.А., Чернова Н.И. Сборник задач и упражнений по математической статистике. Новосибирск: Изд-во Института математики им. С.Л.Соболева СО РАН, 2001.
79. Майков Е.В. Математический анализ: Числовые ряды. М.: Изд-во МГУ, 1999.
80. Тюрин Ю.Н., Макаров A.A. Анализ данных на компьютере. М.: Инфра-М и Финансы и статистика, 1995.
81. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики. -М.: Наука, 1965.
82. Гмурман В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов /В.Е. Гмурман.-8-е изд. стер.-М.: Высш. шк., 2002. 479 с.
83. Чистяков В.П. Курс теории вероятностей : учеб. для втузов / В.П. Чистяков.- 2-е изд., переработ, и доп. -М.: Наука, 1982., 255 с.
84. Теория вероятностей: Учеб. для вузов / Под ред. B.C. Зарубина, А.П. Крищенко.- 3-е изд., испр. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004., 456 с.
85. Айвазян С. А., Мхитарян B.C. Прикладная статистика. Основы эконометрики: В 2-х т. Т. 1. Теория вероятностей и прикладная статистика: Учебник. М.: ЮНИТИ-ДАНА, 2001. - 656 с.
86. Айвазян С. А., Мхитарян B.C. Прикладная статистика в задачах и упражнениях: Учебник. М.: ЮНИТИ-ДАНА, 2001. - 270 с.
87. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей: Пер. с нем. СПб.: ООО «ДиаСофтЮП», 2001. - 608 с.
88. Дубров А. М. Компонентный анализ и эффективность в экономике: Учеб. пособие. М.: Финансы и статистика, 2002. - 352 с.
89. Дубров А. М., Мхитарян В. С., Трошин JI. И. Многомерные статистические методы: Учебник. М.: Финансы и статистика, 2000. - 352 с.
90. Жуковская В. М., Мучник И. Б. Факторный анализ в социально-экономических исследованиях. М.: Статистика, 1976. - 151 с.
91. Калинина В. Н. Многомерный статистический анализ в управлении: Учеб. пособие / МИУ. М., 1987. - 80 с.
92. Колемаев В. А., Калинина В. Н. Теория вероятностей и математическая статистика: Учебник. М.: ИНФРА-М, 2001. - 302 с.
93. Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и математическая статистика: Учеб. пособие. М.: Высшая школа, 1991.-400 с.
94. Куперштох В. JI., Миркин Б. Г., Трофимов В. А. Сумма внутренних связей как показатель качества классификации // Автоматика и телемеханика. 1976. -№3.
95. Харман Г. Современный факторный анализ: Пер. с англ. М.: Статистика, 1972. -486 с.
96. Губарев В.В. Вероятностные модели: Справочник. В 2-х ч. / Новосиб. электротехн. ин-т. Новосибирск, 1992. -422с.
97. Лемешко Б.Ю., Постовалов С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. 2001. №7 Стр. 62-71.
98. Лемешко Б.Ю., Постовалов С.Н. Применение непараметрических критериев согласия при проверке сложных гипотез // Автометрия. 2001. -№2.-Стр. 88-102.
99. Лемешко Б.Ю., Постовалов С.Н. О правилах проверки согласия опытного распределения с теоретическим // Методы менеджмента качества. Надежность и контроль качества. 1999. № 11.- Стр. 34-43.
100. Бондарев Б.В. О проверке сложных статистических гипотез // Заводская лаборатория 1986 №10 - стр. 62-63.
101. Лемешко Б.Ю., Постовалов С.Н. О распределениях статистик непараметрических критериев согласия при оценивании по выборкам параметров наблюдаемых законов // Заводская лаборатория. 1998. Т.64. №3. Стр. 61 -72 .
102. Тимофеева JI.К., Суханова Е.И. Математика для экономистов. Сборник задач по теории вероятностей и математической статистике. М.: УМиИЦ «Учебная литература», 1998. -182 с.
103. Тимофеева JI.K., Суханова Е.И., Сафиулин Г.Г. Теория вероятностей и математическая статистика / Самарск. гос. экон. акад. Самара, 1994.
104. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. -М.: Статистика, 1974.
105. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.
106. Агеев М.И., Алик В.П., Марков Ю.И. Библиотека алгоритмов 5161006. (Справочное пособие.). Вып. 2. -М.: Сов. радио, 1976.
107. Бахвалов Н.С. Численные методы (анализ, алгебра, обыкновенные дифференциальные уравнения). Т. 1. -М.: Наука, 1973.
108. Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся втузов / Пер. с нем. под ред. Г.Гроше и В.Циглера. -М.: Наука, 1981.
109. Вазов В.Р., Форсайт Дж. Разностные методы решения дифференциальных уравнений в частных производных / Пер. с англ. М.: Мир, 1969.
110. Воробьева Г.Н., Данилова А.Н. Практикум по вычислительной математике. Изд. 2. М.: Высшая школа, 1990.
111. Кнут Д.Е. Искусство программирования. Т. 2. Получисленные алгоритмы / Пер. с англ. М.: Мир, 1977.
112. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров / Пер. с англ. под ред. И.Г. Арамановича. М.: Наука, 1978.
113. Крылов В.И., Бобков В.В., Монастырный П.И. Вычислительные методы высшей математики. Т. 1. Минск: Вышэйшая школа, 1972.
114. Ортега Дж., Рейнболд В. Итерационные методы решения нелинейных уравнений со многими неизвестными / Пер. с англ. М.: Мир, 1975.
115. Теория вероятностей и математическая статистика/Под. ред. Колемаева В.А.: Учебное пособие для эконом, спец. вузов. М.: Высшая школа, 1992.
116. Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений / Пер. с англ. Х.Д. Икрамова. М.: Мир, 1980.
117. Форсайт Дж., Молер К. Численное решение систем линейных алгебраических уравнений / Пер. с англ. М.: Мир, 1969.
118. Хемминг Р.В. Численные методы для научных работников и инженеров / Пер. с англ. М., Наука, 1972.
119. Численные методы. Учебник для техникумов. / Под ред. Данилина Н.И., Дубровской Н.С., Кваши О.П. и др. М.: Высшая школа, 1976.
120. Дорот B.JL, Троицкий В.А., Шелест В.Д. Элементы вычислительной математики. JL: Изд-во ЛПИ им. Калинина, 1977.
121. Данциг Дж. Б. Линейное программирование, его применение и обобщения / Пер. с англ. М.: Прогресс, 1966.
122. Белашов В.Ю. Специальные функции и алгоритмы их вычисления. -М.: Магадан, 1997.
123. Число нереализованных печатных листов за период с 2000 по 2004 годы с разбивкой по кварталам.
124. Данные представлены Саратовской фирмой ЗАО ЛА "Научная книга"1. Юридическая редакция -1
125. Редакция научно-популярной литературы 21. Вузовская педагогика 41. Школьная педагогика 3
126. I 28 56 300 56 110 68 15 10 20 461. 56 82 120 280 15 200 19 5 46 892001 I 75 53 153 76 25 53 26 56 110 761. 24 86 186 110 56 180 35 53 153 49
127. I 85 50 143 75 58 65 26 45 200 831. 26 52 53 72 54 63 40 36 45 1602002 I 45 53 59 86 52 68 45 86 86 461. 39 58 86 59 68 62 18 49 89 110
128. I 58 54 88 53 64 63 6 75 56 1501. 75 59 78 53 68 64 35 110 83 452003 I 100 53 73 58 69 76 36 45 53 731. 45 59 46 54 86 75 32 76 46 85
129. I 48 46 50 48 100 79 40 45 20 491. 53 58 59 120 15 73 42 48 25 562004 I 85 100 52 163 46 80 41 53 35 431. 46 89 51 200 49 150 25 65 58 53
130. I 86 53 86 49 43 100 28 58 20 861. 28 75 55 58 42 85 29 89 35 54
131. Численность фоновых видов грызунов прикаспийского песчаного очагаза 1946 -1989 годы
132. Данные Яндыковского противочумного отделения) Численность зверьков на 1 га1. Ландшафтные районы
133. Ильмено-Придельтовый Приморский Чёрные земли
134. Дисперсии оценки генеральных моментов, оцениваемых по малым выборкам на основе свойствамонотонности.
-
Похожие работы
- Метод и средства аналитического вероятностного моделирования измерительных информационных систем
- Разработка рациональных алгоритмов исследования работоспособности электронных цепей
- Автоматизированная система количественной оценки операционного риска
- Анализ и моделирование сигналов, волновых полей и параметров радиосистем с применением устойчивых распределений
- Использование вероятностного потокораспределения для анализа неоднородностей в ЭЭС
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность