автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Статистическое моделирование с характеризацией вероятностных распределений условием постоянства регрессии

кандидата физико-математических наук
Токмачев, Михаил Степанович
город
Новгород
год
1997
специальность ВАК РФ
05.13.18
Автореферат по информатике, вычислительной технике и управлению на тему «Статистическое моделирование с характеризацией вероятностных распределений условием постоянства регрессии»

Автореферат диссертации по теме "Статистическое моделирование с характеризацией вероятностных распределений условием постоянства регрессии"

AN

. v На правах рукописи

Cr-

ТОКМАЧЁВ Михаил Степанович

СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ С ХАРАКТЕРИЗАЦИЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ УСЛОВИЕМ ПОСТОЯНСТВА РЕГРЕССИИ

0.5.13.1 В. - теоретические основы математического моделирования, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук

Новгород - 1997

Работа выполнена на кафедре прикладной математик! Новгородского государственного университета.

Научный руководитель -заслуженный деятель науки РФ,

действительный член Международной академии наук высшей школы действительный член Международной академии информатизации, доктор физико-математических наук, профессор Н.М.МАТВЕЕВ

Научный консультант -заслуженный деятель науки и техники РФ, действительный член Петровской АНИ, доктор технических наук, профессор Б.Ф.КИРЬЯНОВ

Официальные оппоненты -доктор физико-математических наук, профессор Р.М.БАРСЕГЯН, кандидат физико-математических наук, доцент В.А.ФРОЛЬКИС.

Ведущая организация -Казанский государственный технический университет им. А.Н.Туполева.

Защита состоится " Ц" ноября 1997 г. в часов н; заседании специализированного совета К 064.32.05 по присуждения учёной степени кандидата физико-математических наук в Новгородом государственном университете им. Ярослава Мудрого по адресу: 173003, г Новгород, ул. Большая Санкт-Петербургская, д.41, ауд. 2402.

С диссертацией можно ознакомиться . в библиотек Новгородского государственного университета.

Автореферат разослан " (о " Октя'Ьра- 1997 г.

Ученый секретарь специализированного совета кандидат физ.-мат. наук К.Н.Беляев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

АКТУАЛЬНОСТЬ ТЕМЫ. Во многих задачах науки и техники спользуются случайные величины и в'ероятностные методы исследования , шрокое примененйё получило статистическое моделирование с спользованием ЭВМ. Прй:!этом большой удачей для исследователя вляется знание хотя бы приближенно закона распределения ассматриваемых случайных величин. Представление о распределении для еальных выборочных значений случайной величины можно получить с :омощью критериев согласия , сравнивая эмпирическое распределение с :екоторым теоретическим . Однако установить класс распределений или онкретное распределение возможно , основываясь на "механизме лучайности" с помощью подходящей модели этого "механизма", арактеризующей распределение. Характеризационные задачи , спользуюшие различные свойства случайных величин , функций или гатистик , представляют собой важный раздел теории вероятностей и [атематической статистики , у истоков которого стояли Г. Пойа , Ш.Бернштейн , И.Марцинкевич и другие известные математики. Одно из сновных мест в задачах характеризации занимают модели , основанные а регрессионных свойствах статистик и , в частности , на условии остоянства регрессии . В связи с этим следует отметить работы Э.В.Линника, Е.Лукача, С.Р.Рао, Б.Рамачандрана, Р.Лаги, С.Г.Кхатри, ^..М.Кагана, А.А.Зингера. Например, с помощью модели постоянства егрессии полиномиальных статистик на линейную форму получены арактеризационные условия для достаточно большого круга аспределений : нормального, пуассоновского, гамма-распределения и екоторых других. И все же , несмотря на обилие результатов , поле еятельности в развитии данного направления достаточно обширно.

Вплотную к задачам характеризации примыкает актуальнейшая, но :алоисследованная задача практического применения полученных езультатов, разработка соответствующих численных методов.

ЦЕЛЬ РАБОТЫ. Целью данной работы является потребность, во-ервых, дополнить имеющиеся характеризации новыми моделями; во-торых, пересмотреть некоторые результаты, предполагая исправление еточностей, упрощение, а также возможное обобщение; в-третьих, для аждого полученного распределения представить соответствующую егрессионную модель, выразив коэффициенты полиномиальных гатистик не некими соотношениями, а выписав их конкретные значения; -четвёртых, для некоторых классов статистик провести полное сследование всех возможных случаев, включая случаи вырожденного и гсучаи отсутствия каких бы то ни было распределений.

Дальнейшая проблема работы - применение полученных егрессионных моделей для решения практических задач, в частности для адачи распознавания вероятностных распределений. То есть целью анной работы является разработка алгоритмов для построения

соответствующих регрессионных моделей гауссовского типа и алгоритмов для отбора наиболее подходящей модели.

МЕТОДЫ ИССЛЕДОВАНИЯ. Статистическое моделирование случайности при исследовании вероятностных законов, использующее модель постоянства регрессии полиномиальных статистик на линейную форму приводит к исследованию и решению в характеристических функциях дифференциальных уравнений соответствующих порядков.

В случае получения нестандартных решений найденные функции исследуются на свойство положительной определённости.

Для построения регрессионных моделей гауссовского типа используются методы регрессионного анализа.

Поведение полученных моделей исследуется на ЭВМ, разработаны" соответствующие алгоритмы.' ■' ■

НАУЧНАЯ НОВИЗНА. Пересмотрены резюмирующие теоремы в случае' модели постоянства рецессии однородной квадратичной статистики на линейную"' статистику: получены : характеризации распределений типа биномиального и типа отрицательного биномиального, не найденные в этой задаче ранее, а также получена характеризацйя и исследовано новое распределение, названное распределением типа гиперболического косинуса с характеристической функцией

■ ДО + , ш<0, ц=Е(х),

V т р т )

р, т, Р - действительные параметры, 1 = 4-Т .

Исправлены случаи, при которых невыполнимо условие постоянства регрессии.

Получено упрощение результата Лукача, использовавшего для характеризации некоторых распределений статистику четвёртого порядка. Показано, что тот же результат получается при статистике второго порядка, причём можно использовать больший произвол на коэффициенты, т.е. речь идёт и об обобщений известного результата.

Указана связь между статистикой второго порядка и статистикой Лукача.

При использовании в моделях статйстики третьего порядка с определёнными коэффициентами получены не встречавшиеся ранее распределения типа свёртки двух экспоненциальных распределений и, в частности, распределения Лапласа и Эрланга.

Впервые реализована попытка применить регрессионные модели гауссовского типа в задачах распознавания вероятностных распределений по выборочным данным. При этом в отличие от других методов допускается в качестве данных использовать не сами выборочные

значения, а выборки первых моментов. Разработаны соответствующие численные методы и алгоритмы, реализованные в компьютерные программы.

ТЕОРЕТИЧЕСКОЕ ЗНАЧЕНИЕ И ПРАКТИЧЕСКАЯ ЦЕННОСТЬ. В теоретическом плане работа дополняет известные результаты характеризации вероятностных распределений, представляет новое не известное ранее распределение и вносит определённый вклад в изучение и моделирование законов распределения регрессионными методами.

Полученные результаты могут найти применение во многих приложениях, где используются регрессионные методы, а также в задачах распознавания вероятностных распределений при достаточно большом количестве наблюдений (п>30). Использование выборочных моментов вместо выборочных значений позволяет существенно уменьшить объём данных при неизменной информации, что немаловажно при хранении информации в памяти компьютера.

Разработан комплекс программ, нашедших практическое применение в ряде научных разработок.

АПРОБАЦИЯ РАБОТЫ. Основные результаты диссертационной работы докладывались и обсуждались в течение ряда лет на семинарах кафедр высшей и прикладной математики НовГУ, на ежегодных Новгородских областных научно-технических конференциях, на Всероссийском симпозиуме "Статистическое моделирование (методы и средства)" (1991 г.), на семинаре кафедры ЭВМ Казанского государственного технического университета им. А.Н.Туполева.

Рассматриваемые в диссертации методы построения статистических моделей используются в учебном процессе в виде курсовых работ на кафедре прикладной математики НовГУ, а также на кафедре ЭВМ КГТУ им. А.Н.Туполева в научных разработках и учебном процессе в курсе "Моделирование".

ПУБЛИКАЦИИ. По материалам диссертации опубликованы девять статей [1-9].

СТРУКТУРА И ОБЪЁМ РАБОТЫ. Диссертация состоит из введения, трёх разделов, заключения, списка литературы, включающего 73 наименования, и приложения на 4? страницах. Общий объём диссертации составляет иг страниц машинописного текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обсуждается постановка задачи, являющаяся составной частью научно-технической проблемы, даётся литературный обзор, рассматривается содержание работы.

В первом разделе приводятся некоторые вспомогательные соотношения, сформулированы известные результаты и обсуждаются их достоинства и недостатки, более широко и доказательно ставится решаемая задача, рассматриваемая применительно к каждому из разделов.

Во втором и третьем разделе излагаются основные результаты работы.

Второй раздел состоит из трёх глав.

В главе 2.1 рассматривается характеризация вероятностных распределений с помощью модели постоянства регрессии квадратичной однородной статистики <3 на линейную статистику Л. Аргументами статистик служат независимые одинаково распределённые с.в. Хь Х2,..., Хп. В этом случае характеризации нормального распределения, гамма-распределения и распределения биномиального типа с нулевым средним в зависимости от соотношений на коэффициенты <3 получены ранее Е. Лукачем и Л.Б.Клебановым. При всех оставшихся соотношениях предполагалось либо вырожденное распределение, либо несовместность с условием постоянства регрессии С> на Л. В данной работе имеющиеся результаты дополнены другими распределениями и соответственно пересмотрены относительно вырожденного распределения и случаев невыполнения постоянства регрессии. Итог подведён в трёх теоремах 2.14, 2.15,2.16.

Теорема (см. теор. 2.14). Пусть X), Х2)..., Х„ - независимые одинаково распределённые с.в., обладающие вторыми моментами. Статистики и Л имеют вид

Q=i±a]kX1Xk, ±аа= В„ ¿¿а,к=В2,

>1к = 1 j=l ]'=1к=1

Л -Х;1 Х2+...+Хп.

Обозначим Е(Х,) = ц, Е(0) = С.

Тогда необходимыми . и достаточными условиями постоянства регрессии

Е(<3 I А) = Е(<3)

являются следующие:

1) если В]* О, В2 = 0, то с.в. Хь Х2,..., Х„ гауссовские;

2) если В^ О, В2 О, С = 0, 0, то с.в. Хь Х2,..., Хп имеют гамма-распределение;

3) если В^ О, В2 ^ О, С/В2< 0, то с.в. Хь Х2,..., Хп имеют распределение типа гиперболического косинуса с характеристической функцией

^ т (3 ту

где

т = В,/В2, Р2=-С/В:

(следует отметить, что условия теоремы гарантируют ш < 0);

4) если В,* 0, В2 * 0, С/В2> 0, С/В2 ¿у.2, В1/В2=ш, ш е N. то с.в. Хь Х2,..., Х„ имеют характеристическую функцию

ч

— + — | + е .2 2а

N Ш

2 2а

г.е. X = где 2Ь Ъг,..., Zm - независимые одинаково

1 1 И г

распределенные с.в., равные 1 с вероятностью —+ и равные (-1) с

2 2а

вероятностью - - —, а2 = С/В2, А = а/т ; 2 2а

5) если Вр* 0, В2 # 0, С/В2> 0, С/В2 В^г^т, т < 0, то с.в. Хь Х2,..., Х„ имеют характеристическую функцию

1 - яе"

где а2=С/В2, а=-2а/т, р = 2а/(а+^), д=1-р,

г.е. X] = аЪ^ + а, и ^ имеют отрицательное биномиальное распределение с параметрами -тир.

В теоремах 2.15, 2.16 рассмотрены все оставшиеся возможности ;оотношений коэффициентов статистик р, которые приводят либо лишь к зырожденному распределению, либо к невыполнению условия постоянства эегрессии.

В данной главе также исследовано впервые появившееся эаспределение типа гиперболического косинуса, доказана его эезграничная делимость. Найдена плотность вероятности распределения

1ШХ

ч-т-2(-т)Гт~'1

Р00 = -

(3 + 1Ц] 23 13 -щ.

т 1тх т них

х В--н--,—

2 2(3 2

,и-1

~де В(и,у) = ]-

о (1 + г)

чк - бета-функция.

N -ш

Р

Для каждого из распределений, фигурирующих в теореме 2.14, толучены соответствующие статистики 0 с конкретными коэффициентами, выраженными через первые моменты распределений. Таким образом

указаны регрессионные модели, пригодные для практическое использования.

В главе 2.2 для независимых одинаково распределённых с.в. рассматривается характеризация вероятностных распределений с использованием модели нулевой регрессии квадратичной статистики вида

:=1к=1 j=l

на линейную статистику Л = Х^ Х2+-.-+Хп. Рассмотрен случай BJ * О (1=1,2,3). Получены регрессионные модели для функций с.в. Xj =-ЬУ] биномиального и отрицательного биномиального распределений (в частном случае при Ь = -1 имеем биномиальное и отрицательное биномиальное распределения), а также функции с.в. Х^ = Ь^ - Б отрицательного биномиального распределения.

В главе 2.3 исследуется модель нулевой регрессии статистики 0 третьего порядка с конкретными коэффициентами

¿Х^ + лГл 1¥т1 п]=1 п(п-1)^! к=1 п(п-1](п-2)^,к=1 5=1

к*]

на линейную статистику Л = Х^ Х2+...+Хп. Аналогично X), Х2)..., Хп -независимые одинаково распределённые с.в.

В зависимости от соотношений математического ожидания ц и дисперсии о2 получены регрессионные модели для характеризации распределений Лапласа, Эрланга и свёртки двух экспоненциальных распределений.

Раздел 3 посвящён применению регрессионных моделей раздела 2 в задаче распознавания вероятностных распределений по выборочным данным. Рассматриваются регрессионные модели гауссовского типа. По выборочным данным строятся статистики <3 и Л видов, приведённых в разделе 2. Причём указаны два вида ввода начальных данных: ввод выборочных значений и ввод выборок первых выборочных моментов. Далее из всех регрессионных моделей выбирается наиболее подходящая с учётом выполнимости условия постоянства регрессии и ограничений на параметры.

Указаны соответствующие алгоритмы.

В приложении приведены ' программы на языке ПАСКАЛЬ, реализующие изложенные алгоритмы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ

1. Дано теоретическое обоснование параметрических регрессионных моделей, в частности

а) Пересмотрены результаты характеризации вероятностных распределений свойством постоянства регрессии квадратичной однородной статистики на линейную статистику. По отношению к известным результатам получены два новых' для данной задачи распределения (типа гиперболического косинуса и типа отрицательного биномиального), обобщён результат характеризации ■ распределения биномиального типа на случай (1/0, дополнены случаи характеризации вырожденного, распределения, пересмотрены: случаи ..отсутствия распределений. Проведено полное исследование регрессионной модели указанного вида. ;; , •

б) Значительно упрощена и обобщена :характеризация некоторых дискретных . распределений: вместо полиномиальной статистики четвёртого порядка в модели используется статистика второго порядка. ■ Проведено сравнение результатов.

в) Для каждого из характеризуемых распределений используемые при моделировании статистики получены с вполне определёнными коэффициентами, выраженными через первые моменты и параметры распределения, пригодные для практического применения.

2. Составлены персональные статистические регрессионные модели для ряда рассматриваемых распределений.

3. Приведены алгоритмы распознавания вероятностных распределений, исходя из выборочных данных.

4. В задаче идентификации распределений с помощью построения и исследования регрессионных моделей рассмотрена возможность использовать в качестве исследуемых данных не только выборочные значения, но и выборки первых моментов, что существенно отличает данный метод от других методов распознавания распределений.

5. Разработаны соответствующие алгоритмы и составлены компьютерные программы распознавания 11ЕОМОБ 1 и ИЕОМОБ 2.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1.Токмачёв М.С. Характеризация некоторого распределения биномиального типа свойством постоянства. регрессии. 71:НовГУ. : Новгород, 1994 г 10 е. - Деп. в ВИНИТИ 24.06.94, N 1575-В94.

2. Токмачёв М.С. Характеризация распределения ^ипа гиперболического косинуса свойством постоянства регрессии. / НовГУ. -Новгород, 1994 - 11 с. - Деп. в ВИНИТИ 21.06.94, N 1542-В94.

3. Токмачёв М.С. Постоянство регрессии квадратичной статистики на линейную статистику. // Вестник НовГУ, 1995. - N1. -

С. 139-141. ■ =

4. Токмачёв М.С. О параметрах распределений типа гиперболического косинуса и биномиального типа. / НовГУ. - Новгород, 1995. - 13 с. - Деп. в ВИНИТИ 03.04.95, N 909-В95.

5.Токмачёв М.С. Условие нулевой регрессии статистики второго порядка на линейную статистику / НовГУ. - Новгород, 1994 - 13 с. - Деп. в ВИНИТИ 19.12.94, N 2956-В94.

б.Токмачёв М.С. Нулевая регрессия статистики'второго порядка на линейную статистику. // Вестник НовГУ, 1996. - N3. - С. 93-96.

7. Токмачёв М.С. Обоснование регрессионной модели для распределения Лапласа и некоторых близких к нему / НовГУ. - Новгород, 1997 - 13 с. - Деп. в ВИНИТИ 08.01.97, Ы61-В97.

8. Токмачёв М.С. Построение гауссовских регрессионных моделей в задаче распознавания вероятностных распределений / НовГУ. - Новгород, 1997 - 11 с.-Деп. в ВИНИТИ 29.05.97 N 1758-В97.

9.Токмачёв М.С., Лапшин В.А. Использование гауссовских регрессионных моделей в компьютерных программах распознавания. Новгород: НовГУ, (в печати) с. 2.

Лицензия ЛР № 020815 от 20.09.93.

Подписано в печать 6-/£>• Формат 60*84/16. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ № 2 О. Издательско-полиграфический центр Новгородского государственного университета им. Ярослава Мудрого: 173003, Новгород, ул. Б.Санкт-Петербургская, 41. Отпечатано в ИПЦ НовГУ. 173003, Новгород, ул. Б.Санкт-Петербургская, 41.