автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Применение одного класса многомерных дискретных распределений вероятностей к задачам радиоэкологии и логистики

кандидата технических наук
Туретаев, Даулет Исабекович
город
Алматы
год
2000
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Применение одного класса многомерных дискретных распределений вероятностей к задачам радиоэкологии и логистики»

Автореферат диссертации по теме "Применение одного класса многомерных дискретных распределений вероятностей к задачам радиоэкологии и логистики"

УДК 519.2; 511.29; 517.52 Н^ древах рукописи

' : ■ : I

ТУРЕТАЕВ ДАУЛЕТ ИСАБЕКОВИЧ

ПРИМЕНЕНИЕ ОДНОГО КЛАССА МНОГОМЕРНЫХ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ К ЗАДАЧАМ РАДИОЭКОЛОГИИ И ЛОГИСТИКИ

05.13.16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

Автореферат диссертации на соискание ученой степени кандидата технических наук

Республика Казахстан Алматы 2000

Работа выполнена в Институте Математики Министерства Образования и Науки Республики Казахстан, Алматы

Научный руководитель:

доктор физико-математических наук, профессор Воинов В.Г. Официальные оппоненты:

доктор технических наук, профессор Закарин Э.А. кандидат физико-математических наук, доцент Аренбаев Н.К.

Ведущая организация: Казахский Национальный Технический Университет им. К. Сатпаева

Защита состоится 27 декабря 2000г. в 15-00 часов

на заседании диссертационного совета ОД53.12.01 Института математики МО и Н РК по адресу: 480100, Алматы, ул. Пушкина

С диссертацией можно ознакомиться в библиотеке Института Математики МО и И РК

125

Автореферат разослан

2000г.

Ученый секретарь диссертационного совета доктор технических наук

I

Мухамедгалиев А.Ф.

£ 0///Г О

/

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

В работе рассматривается новый класс многомерных дискретных распределений вероятностей, порожденный урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами. Основными проблемами, рассмотренными в работе, являются: вычисление точных значений вероятностей и их статистических оценок, которое сводится к нахождению решений системы линейных днофантовых уравнений в неотрицательных целых числах, или, что то же самое, к построению всех разбиений вектора г на точно п частей; вычисление значений вероятностей и их статистических оценок альтернативным комбинаторным методом, не требующим нахождения решений системы линейных диофантовых уравнений; предельные распределения и свойства рассматриваемого класса распределения вероятностей и построение критерия хи-квадрата для проверки адекватности предлагаемой модели экспериментальным данным.

Актуальность проблемы. Описание радиоактивного загрязнения, обусловленного ядерными взрывами, необходимо, чтобы способствовать улучшению контроля и мониторинга. Эти поля, очевидно, имеют стохастическое происхождение и обладают довольно сложной пространственной структурой. Существует много подходов, которые могут быть использованы для такого описания, например, вычислительная геометрия, контурные и пространственные статистики, фрактальный анализ, мультифракта-лы и вероятностный. (Мульти)-фрактальный подход кажется наиболее многообещающим, потому что он позволяет учесть масштабную инвариантность полей радиоактивного загрязнения, открытую в последние годы. Однако, применение такого подхода для задач прогнозирования неочевидно, хотя бы из-за того, что пространственная плотность измерений, как правило, очень низка. Вот почему, вероятностный подход, рассматриваемый в данной работе, также интересен, поскольку он дает альтернативное и дополнительное описание полей радиоактивного загрязнения.

Класс одномерных дискретных распределений вероятностей, порожденный урновой схемой с шарами, помеченными произволь-

ными положительными числами, был введен сравнительно недавно. Такое вероятностное распределение на самом деле есть сумма полиномиальных вероятностей, которое подразумевает, что шары извлекаются из урны независимо и случайно. Идентифицируя каждый извлеченный шар с измерением в какой-то точке, можно видеть, что эти условия достигаются, если значения загрязнения, измеренные в различных точках, могут рассматриваться как независимые. Модель позволяет вычислить вероятность, что среднее значение радиоактивного загрязнения для каждых п точек из общего числа измерений в выборке превышает уровень опасности. Среди других преимуществ данной модели, помимо ее ясного вероятностного смысла то, что применяемое в ней усреднение уменьшает ошибки в оценивании вероятностей. Основной недостаток этой простой модели состоит в том, что она не может описать векторные пространственно зависимые события, особенно в случае очень больших ошибок измерения.

В настоящей диссертации рассматривается обобщенный класс многомерных дискретных распределений вероятностей, порожденный урповой схемой с шарами, помеченными векторами, компоненты которых есть произвольные целые числа, включая и отрицательные. Надо заметить, что вследствие довольно больших экспериментальных ошибок, эти компоненты могут принимать как положительные так и отрицательные целые значения. Предложенная в диссертации модель более пригодна для описания векторных полей радиоактивного загрязнения, чем модель, описанная выше . Во-первых, она позволяет принять в расчет зависимость между компонентами вектора измерений. Во-вторых, ее можно использовать для пространственно зависимых измерений полей радиоактивного загрязнения, производимого одним радионуклидом.

Данная модель находит применение не только в задачах радиоэкологии, но и при выборочном обследовании популяций. Предположим, что составляется анкета с целыо сбора данных у респондентов. Ответ респондента на каждый пункт анкеты характеризует степень согласия или несогласия. Набор вопросов (пунктов анкеты) зависит от цели исследования. Степень согласия обычно

нумеруется, например, (1,2,..., 10), где 1 соответствует полному согласию, а 10 соответственно полному отрицанию. Ответы на каждое утверждение могут иметь различные числовые шкалы. После сбора информации проводится статистический анализ данных.

В данной работе предлагается использовать вышеупомянутую многомерную вероятностную модель, которая является наиболее подходящей для такого анализа, потому что она принимает в расчет корреляцию между различными пунктами анкеты и обладает простым вероятностным смыслом.

В настоящее время задачи анализа многозональной видеоинформации аэрокосмического происхождения можно рассматривать как первостепенные. В качестве одного из средств создания признакового пространства для распознавания объектов на изображениях можно рассмотреть предлагаемую многомерную вероятностную модель, поскольку мультизональный цифровой текстурный образ, полученный в различных частях спектра, можно описать, используя урновую схему с шарами, помеченными векторами с целочисленными компонентами. Затем оценить вероятности превышения заранее заданных чисел для сумм компонент векторов на извлеченных шарах и использовать их в качестве признаков объектов.

Проблему вычисления самих вероятностей, рассматриваемой модели, стоит выделить особо, поскольку она связана с решением систем линейных диофантовых уравнений в неотрицательных целых числах на современных компьютерах за разумное время. В настоящей диссертации для решения данной проблемы используется техника построения разбиений векторов. И хотя алгоритмы построения разбиений в данной работе приводятся в рамках рассматриваемого класса многомерных дискретных распределений вероятностей, техника построения разбиений представляет и самостоятельный интерес. В данной работе предложена формула для общего члена формального степенного ряда, который является произвольной комплексной степенью полинома с произвольными положительными целыми степенями. Используя этот результат и производящую функцию для композиций получена

формула для числа композиций диофантового уравнения

0,1X1 + а2Х 2 + ... + а^Хк = п,

где «ь а2,..., а к - любые целые числа, и формулы для самих решений.

Таким образом, предлагаемое исследование имеет теоретический и практический интересы для раздела аддитивной теории чисел и комбинаторики, связанного с построением и перечислением разбиений векторов, а также для дискретного линейного программирования. То, что касается вероятностной схемы то, как было описано выше, она имеет много очевидных приложений: в радиоэкологии при описании векторных полей радиоактивного загрязнения территорий; в социологии при выборочном обследовании популяций; в науках о Земле для описания и анализа текстурных изображений, получаемых с летательных аппаратов, и многие другие.

Целью работы является: исследование многомерных дискретных вероятностных распределений, порождаемыхурновой схемой, в которой шары маркируются векторами с целочисленными компонентами, разработка методов вычисления вероятностей событий для данного класса вероятностных распределений, основанных на построении алгоритмов разбиений вектора г на точно п частей, отыскание предельных (асимптотических) распределений в рамках данной урновой схемы, решение проблемы статистической оценки параметров исходного распределения вероятностей п ее ошибки, изучение различных свойств данного вероятностных распределений и применение рассматриваемого класса для исследования некоторых задач радиоэкологии и логистики. В качестве материала для численных исследований были использованы результаты анкетирования 45 зарубежных компаний, аккредитованных в Казахстане, и спектрометрические измерения в воздухе гамма-излучения Пз~22$и, 232Т/г, ЮК, тСз и общей гамма-радиации довольно большой территсрии Казахстана, расположенной к востоку от бывшего Семипалатинского ядерного полигона.

Научная новизна. Предложен новый класс дискретных мно-

го мерных распределений вероятностей, порождаемых урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами. Разработаны два альтернативных алгоритма вычисления вероятностей и их оценок для предложенной модели: алгоритм, основанный на решении систем линейных днофантовых уравнении в неотрицательных целых числах (ИР полная задача) или, что то же самое, на построении всех возможных векторных разбиений заданного вектора и комбинаторный алгоритм. Получены несмещенные оценки вероятностей для предложенного класса распределений с равномерно минимальной дисперсией. Доказаны предельные теоремы и изучены, связанные с ними асимптотические свойства предлагаемой вероятностной модели. Для проверки адекватности рассматриваемой модели экспериментальным данным построен критерий типа хи-квадрат.

Практическая ценность. Результаты диссертации имеют теоретический и практический интересы для дискретного линейного программирования, раздела аддитивной теории чисел и комбинаторики, связанного с построением и перечислением разбиений векторов, а также теории вероятностей и математической статистики. Их можно использовагь в радиоэкологии при описании векторных полей радиоактивного загрязнения территорий; в социологии при выборочном обследовании популяций; в науках о Земле для описания и анализа текстурных изображений, получаемых с летательных аппаратов, и т.п. К диссертации прилагается акт внедрения результатов настоящей диссертационной работы в учебный процесс Казахстанского Института Менеджмента, Экономики и Прогнозирования при Президенте Республики Казахстан.

Основные положения, выносимые на защиту:

1. Новый класс дискретных многомерных распределений вероятностей, порождаемых урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами (Глава 1)

2. Два альтернативных алгоритма вычисления вероятностей и их оценок для предложенной модели: алгоритм, основанный на

решении систем линейных диофантовых уравнений в неотрицательных целых числах (NP полная задача) или, что то же самое, на построении всех возможных векторных разбиений заданного вектора и комбинаторный алгоритм (Глава 1)

3. Несмещенные оценки вероятностей для предложенного класса распределений (Глава 1)

4. Предельные теоремы и связанные с ними асимптотические свойства предложенной вероятностной модели, позволяющие эффективно применять ее при выборках большого объема (Глава 2)

5. Критерий хи-квадрат для проверки адекватности модели экспериментальным данным (Глава 2)

6. Вероятностное описание полей радиоактивно загрязненных территорий, прилегающих к бывшему Семипалатинскому ядерному полигону (Глава 3)

7. Вероятностное описание цепей снабжения иностранных компаний в Казахстане (Глава 4)

Апробация работы. Основные результаты диссертационной работы докладывались на следующих семинарах и конференциях:

• Семинары в Институте Математики МОиН и КазГНУ

• Научная студенческая конференция, КазГНУ, Апрель 1999

• Second International Research Workshop "Case Studies on Enterprises and Organizations in Transition Economics", 25-26 Sept. 1999, KIMEP, Almaty, Kazakhstan

• Third International Research Workshop "Developing Research-Based Teaching Materials for Business Education", 2-3 June 2000, KIMEP, Almaty, Kazakhstan

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка используемых источников, приложения, в котором приведено описание программы и акта внедрения результатов диссертационной работы.

СОДЕРЖАНИЕ РАБОТЫ

Во введении кратко излагается постановка задач, рассматриваемых в диссертации, области их применения, некоторые момен-

ты истории исследований по проблеме построения разбиений, а также дастся обоснование актуальности темы диссертации. Далее формулируется цель работы, основные положения, выносимые на защиту. Приводятся список опубликованных по теме диссертации работ, описывается апробация работы и структура диссертации.

В главе 1 формулируется предлагаемая вероятностная модель. Пусть имеется урна с шарами. Шары перенумерованы векторами а = (ab...,am)r, aj € {äjUäj2,... ,äjkj}, j = 1,2,...,rn, äij - произвольные целые числа. Пусть аj = (aji, ajo.... ,a,jm)T, j = 1,2,..., К, где К = ki • • • ■ km, всевозможные значения а, определяемые но возможным значениям компонент а; . Обозначим через ра>, j = 1,2,..., К, вероятность того, что шар с вектором а^ будет извлечен с возвращением, причем

к

IX-= 1-

i=1

Пусть случайный вектор X = (А'ь ..., Х„,)т принимает значение г = (rj,... ,rm)T, если суммы j-ых компонент векторов на п шарах, извлеченных с возвращением, есть

к

п min äß <r< <п max ä,-t-, j — 1,2,... ,m, l<i<kj 1 <i<kj

где 1Щ,i = 1,..., К, обозначает число шаров в выборке, пронумерованных вектором а,, причем /а, - неотрицательные целые числа, такие, что

к

£ К - п-¿=1

Очевидно, что

p(x=rlP) = i:7^-n^. (2)

nUi=1 1=1

где р = (ра,,.. .,рак)т - вектор параметров, а суммирование идет по всем множествам неотрицательных решений /„,, г = 1,2,..., К,

системы линейных диофантовых уравнений

|Л"

£ = г,-, ^ = 1,2,.. .,ш

'"а-1 (3)

Г /а, - П.

¡ = 1

Предложение 1. Р(Х=г.р) является вероятностным распределением, т.е.

£Р(Х = г) = 1.

г

Далее формул и руется и доказывается

Теорема 1. Пусть X имеет распределение (1), тогда производящая функция вероятностей X есть

= (4)

¿=1

где 8 - ..., зт)т и а3' = 5?" • • •

Таким образом, Теорема 1 задает вид производящей функции вероятностей X, которая описывает вероятностные характеристики распределения, в частности, с помощью нее можно получить математическое ожидание и дисперсию.

В разделе 1.2 рассматриваются два алгоритма вычисления вероятностей. Если выборки малы, то вероятности (2) можно вычислить построением всех разбиений вектора г на точно п частей. Для этого необходимо решить систему уравнений (3) в неотрицательных целых числах. Можно применить следующий способ решения: построим все разбиения для любого целого числа г,../ --- 1,..., т, из (1) с точно п частями, пересечение этих решений для всех П1 уравнений (1) очевидно и будет решением системы (3). Следовательно, достаточно рассмотреть одномерную вероятностную модель. Пусть

51Я1 + згаг -----1" = (5)

где 5)4-52 4-----Ьа'; < М, М < п и ¿¿,г = 1,... ,1, - неотрицательные

целые числа, а\,а2,....(Ц - произвольные целые числа. В диссертации дается обоснование, что достаточно рассмотреть случай,

когда ai,...,а; различны и отличны от нуля. Введем следующие обозначения:

г — 5i(aisi — ... — at+2Sj+2) — М шах {0, max {о,}} ____

ai+i — max {0, шах 1аЛ}

и

г - 5i(aisi - ... - afc+2St+2) - М min {0, min {а,}}

^д __\<i<k

Q/..+1 — min {0, min {а,}} '

l<i <к

к = 1,...,/ — 1, = = 0, <5/ = 0 при к — I — 1 и 1 в остальных случаях. Выражение для числа Br(M, I) композиций г имеет следующий вид

Rr(M,l) =

ИЛ- [A,-i\- [.4J_ М]

= ,,=М']+ ''' •'-и2!. (M-s,-...-s1y.Sl\s2\...Sl\' (6)

если S1+S2+.. .+5/ < М, Si = (г—s/a;—...—S2ö2)/öi - неотрицательное целое число и Rr(M, /) = 0 в противном случае. Множества {52, S3, ...,sj} определяют все разбиения числа г, а члены

_АЛ_

(М — si — ... — si)!si!s2!.. .s/!

считают все композиции числа г при фиксированных sj, S2, s;-Разбиения можно записать в следующем виде

{Ow-*--*,aiV ..,«;■}, (7)

где {s2, S3,..., s/} - множества индексов суммирования из (6) и si = (г — s;a; — ... — S2ü2)/a\ - неотрицательное целое число. Запись (7) означает, что в каждом разбиении количество нулей равно М — Si — ... — si, количество а\ - s 1. количество а2 - и т.д.

Второй алгоритм рассматривается на более узком классе чисел a\,...,ai таких, что 0 < ai < ... <щ. Но данный алгоритм заслуживает внимания, поскольку в некоторых случаях (см.ниже) является наилучшим. Под наилучшим понимается такой алгоритм, который дает все решения, не перечисляя лишних, т.е. не требуется дополнительного условия принадлежности значения к

множеству решений. В первом алгоритме такими условиями были «1+52 + - • - + < М, = (г ~31Щ — ...— 52аг)/а1 - неотрицательное целое число. Прежде, чем перейти ко второму алгоритму, дадим некоторые вспомогательные утверждения. Рассмотрим тождество

т ос

(Ьо+£М*)°= (8)

¿=1 к=0

где а - произвольное комплексное число. Требуется выразить коэффициенты ак(а, 771) через а, &о,..., Ьт и с\,..., ст.

Лемма.Коэффициенты аДа, т) удовлетворяют следующем}' рекуррентному соотношению

[йп] (а)5

ак(а, т) = £ —-а*_Сга3(а: - я, т - 1 )Ь*т, (9)

где (а)8 = а(а — 1)... (а — й + 1) и [х] целая часть х. Положим

<^¿+1 =

д

«+1

Ст

к(сш - (к-\) ~ к-Аъ+х - сг)

<4 - Сг-\

¡. = 1,..., т — 2, при условии со — 0, 1о =

т

Теорема 2. Если задан степенной ряд вида ¿о + £ Ьггс\ где

1=1

с,-, г = 1,. ..,тп - положительные целые числа, удовлетворяющие условию сх < ... < Сщ, то для произвольного комплексного числа а справедливо следующее равенство

т со

¿=1 к=О

где

ак(а,тп) =

= Е Е ••• Е ^ П (/' ¿0 0 п =

[с»-,]

, к — ¡1 1,п-1 . к ~ и+\ /,-.4

10 = -,Ьп-1 — -— -1

С1 сш — С,п_1 С{+1 — С;

где г = 1,..., т — 2, а+ = тах(0, а), причем должны быть выбраны только те значения г = 1,...,тп — 1 из (10), при которых £,-, г = 1, ...,т — 1 - неотрицательные целые числа.

На основании Теоремы 2 выражение для числа ПТ(М, т) композиций г имеет следующий вид

Заметим, что

(к - и) + (¿1 - г2) + ... + (*т_2 - ¿т-О + «т-! = «о < М,

(¡■Лк ~ Ь) + аг(^1 - ¿г) + ••• + ат-1(^-2¿ш-1) + ат'ш-1 =

Отсюда следует, что все композиции г, на не менее, чем М частей, определяются всеми перестановками разбиений

{а^^л.-мо^г'"-1,<&-•}, аз)

где множества {¿о, -•-, ¿т-\} определяются по (11), причем должны быть выбраны только те значения /¿, г = 1 ,...ш — 1 из (12), при которых г — 0, ...,пг — 1 - неотрицательные целые числа. Наилучший алгоритм достигается в случаях, когда

0 < ах = ац " ••• = аы, — 1 < о-г = ^21 = ••• = п2 — 2 < ... < ат = = — ... = атПт = тп,

где П1,..., пт - произвольные положительные целые числа.

Раздел 1.3 посвящен несмещенным оценкам с равномерно минимальной дисперсией для вероятности (2). Известно, что что полной достаточной статистикой для параметров полиномиального распределения является подвектор 2>к-1 — (¿ч, •••, %к-1)Т вектора

к-1

где — пМ — Т. М - число выборок, каждая из которых содержит п шаровки

где Хц - число шаров с номером в г-ой выборке из п шаров.

Следующая теорема определяет формулу вычисления несмещенных оценок вероятности (2), основанную на решении систем линейных диофантовых уравнений в неотрицательных целых числах

Теорема 3. Несмещенной оценкой с равномерно минимальной дисперсией (такую оценку в дальнейшем для краткости будем называть оптимальной) То — Р(Х = г|Х) вероятности Р(Х = г,р) будет

р0 = £А(г,1), (и)

где

[ п(,!-)

А{Ъ,\) = т^у" 1, (15)

[0 в противном случае,

и суммирование в (14) идет по всем множествам неотрицательных решений ¿а_. системы (3).

Оптимальная оценка Ту дисперсии УагРо будет

Ух = Го2 - Т>2, (16)

где

Р2 = £В(г,1) + 2£С(г,1), (17)

1>]

В(2,1) =

' п (2'°*)(г*)

гк>21ак,М>2, (18)

О в противном случае,

П 2к \

с(г, 1) = ^ ъ > 4 +11,м > 2, (19)

О в противном случае,

{/!,,, —,1'ак} — 1, является г-м множеством произвольно упорядоченных множеств решений системы уравнений (3), 1 < < ц, где д это общее число множеств решений для заданного г. Первая сумма в (17) идет по всем д множествам, а вторая - по всем множествам, удовлетворяющим условию i > Свойство оценки Та выражает

и

Теорема 4. Несмещенная оценка Vq удовлетворяет свойству вероятностного распределения, т.е.

г

Приведем другое представление несмещенных оценок, не требующее при вычислениях нахождения решений системы линейных диофантовых уравнений.

Пусть М - число выборок, каждая объема п. Количество выборок объема п из пМ шаров равно Число выборок, благоприятствующих событию {X = г}, обозначим -через Л. Теперь рассмотрим выборки объема 2п из пМ шаров. Из тех, которые благоприятствуют событию {X = 2г}, произведем выборки объема п. Число выборок, благоприятствующих {X = г}, обозначим через Д.

Теорема 5. Несмещенной оценкой с равномерно минимальной дисперсией (оптимальной) Vq вероятности Р(Х = г, р) будет

Л = 1201

Оптимальная оценка "Pj дисперсии VarPo будет

Pi = V02 - Т2,

где

ЖУ

В разделе 1.4 рассматривается сравнительный анализ предлагаемых алгоритмов вычисления несмещенных оценок вероятности (14) и несмещенных оценок их дисперсий (16). оба алгоритма были реализованы на Pascal и апробированы на компьютере Pentium RAM 64 М. Первый алгоритм (I) основывается на нахождении решений системы линейных диофантовых уравнений (3). Второй алгоритм (И) использует только выборочные данные и ему не требуется решать систему (3), к тому же он имеет простой вид и ясное комбинаторное значение. Суть этого алгоритма - подсчет Л и Д из Теоремы 5. Из результатов теста видно, что второй алгоритм с ростом объема выборки затрачивает больше времени, чем первый.

Однако, на вычислении оценок вероятности без вычисления оценок дисперсии второму алгоритму требуется не больше времени. Недостатку второго алгоритма можно противопоставить то, что он использует только выборочные данные. В принципе, вычисление дисперсии вторым алгоритмом можно ускорить за счет того, что при вычислении оценок вероятности находятся все решения системы линейных диофантовых уравнений, которые достаточно подставить в формулу (16).

Глава 2 посвящена асимптотическим свойствам предлагаемой вероятностной модели и критерию хи-квадрат.

Случайный вектор X следует обобщенному пуассоновскому распределению, если его можно представить как сумму случайного числа N независимых, одинаково распределенных случайных векторов Ху, где N следует распределению Пуассона. Известно, что п.ф.в. обобщенного пуассоновского распределения имеет вид G(s) = exp {\(g(s) — 1)}, где А - параметр распределения Пуассона и g(s) - п.ф.в. распределения Х_,-. Учитывая это, можно C(s) представить как

G(s) = exp{X¿pa¡sa--l)}, (21)

¿=i

где pa¡ = Р(Х, = ai), i = 1,..., К.

Следующие три предельные теоремы выражают зависимость между распределением (2) и обобщенным пуассоновским распределением с п.ф.в. (21).

Теорема 6. Пусть А' - неотрицательная целочисленная случайная величина, Y - целочисленный случайный вектор такой, что условное при X = п распределение вектора Y есть распределение (2). Для того чтобы X следовал распределению Пуассона с параметром А > 0 необходимо и достаточно, чтобы Y имел обобщенное пуассоновское распределение с п.ф.в. (21).

Теорема 7. Пусть X - неотрицательная целочисленная случайная величина, Y - целочисленный случайный вектор. Пусть А' имеет распределение Пуассона с параметром А > 0, а условное при X = ?i распределение вектора Y не зависит от А. Для того, чтобы это условное распределение следовало распределению (2), необходимо и достаточно, чтобы Y имел обобщенное пуассонов-

ское распределение.

Следующая теорема верна, если среди векторов а;..... а; имеется хотя бы один нулевой. Без ограничения общности положим ах = 0. В этом случае п.ф.в. обобщенного пуассоновского распределения запишется в следующем виде

С(з) = ехр{ЕЛ,(за'-1)}, (22)

1=2

К

где Л; = Ара,, г = 2,..., К, £ А; < +оо.

1=1

Теорема 8. Пусть X имеет распределение (2). Тогда при п —» оо и ра, —> 0 таких, что прщ —» А,, г = 2распределение (2) стремится к обобщенному пуассоповскому распределению с п.ф.в. (22).

Для проверки адекватности модели экспериментальным данным построен критерий хи-квадрат.

В Главе 3 рассматривается применение предложенной вероятностной модели к решению задач радиоэкологии. Вначале описывается сам эксперимент по сбору данных с радиоактивно загрязненных территорий, расположенных к востоку от бывшего Семипалатинского ядерного полигона. Приводятся общая площадь исследуемой территории, направление маршрутов и другие фиксируемые параметры проведенного эксперимента. Раздел 3.2 содержит анализ данных, здесь определяется расстояние между измерениями, на котором они могут рассматриваться независимыми. Это необходимо было определить, поскольку измерения ассоциируются с шарами, которые, согласно вероятностной модели, извлекаются независимо друг от друга. В связи с этим, были вычислены автоковариационные функции вдоль маршрутов. Раздел 3.3 посвящен процедуре выбора параметров предлагаемой вероятностной модели для корректного описания загрязнения. Далее исследуется влияние корреляции между радионуклидами. Представлены оцененные коэффициенты корреляции р между- II, Т/г, К и Св. Показано, что оценки вероятностей, вычисленные при условии некоррелированности радионуклидов, систематически выше, чем те же оценки, полученные с учетом корреляции между компонентами. Данный результат подтверждает тот факт, что необ-

ходимо учитывать корреляцию между радионуклидами. В разделе 3.6 обсуждается возможность предсказания с использованием рассматриваемой вероятностной модели. Приведены две выборки из экспериментальных данных. Для первой тестируемой выборки прогноз получился неплохой (оценка находилась внутри 68% доверительной предсказывающей области), однако, для другой выборки оценка находилась вне 68% доверительной предсказывающей области и таким образом, предсказание невозможно. Если такое предсказание было бы возможным, то производить измерения на маршрутах, расположенных на расстоянии 20 км друг от друга было бы намного дешевле, чем на расстоянии 10 км (именно на таком расстоянии располагаются экспериментальные маршруты) . Более того, мы могли бы предсказывать радиоактивность для территорий, где нелегко производить измерения. Результат данного раздела (невозможность прогнозирования) почти очевиден, поскольку известно, что типичный размер сильно загрязненных областей ~ 5 км. Таким образом, используя нашу вероятностную модель, мы не можем прогнозировать радиоактивность для маршрутов, расположенных больше, чем на 10 км. Раздел 3.6 посвящен оцениванию вероятностей реального загрязнения. Используя предлагаемую вероятностную модель и уровни безопасности для отдельных радионуклидов оценивались различные вероятности их превышения для исследуемой территории. Результаты данного раздела приводят к выводу что территория не заражена 13'Сз. Исследование показало также, что часть изученной территории не заражена и а К ( все соответствующие оценки вероятностей практически 0 ), только Тк дает гамма-активность, превышающую уровень безопасности, соответствующий международному значению. Если, к примеру, уменьшить уровень безопасности для и наполовину ( 5.31 /хг//г вместо 10.42//г//г), тогда оценки вероятностей превышения этого уровня становятся значимыми для некоторых пар маршрутов.

В Главе 4 рассматривается бизнес-приложение предлагаемой вероятностной модели. Предположим, что ироводится исследование популяции. Для этого составляется анкета с целью сбора данных у респондентов. Ответ респондента на каждый пункт анкеты

характеризует степень согласия или несогласия. Набор вопросов (пунктов анкеты) зависит от цели исследования. Степень согласия обычно нумеруется, например, (1,2,..., 10), где 1 соответствует полному согласию, а 10 соответственно полному отрицанию. Ответы на каждое утверждение могут иметь различные числовые шкалы. После сбора информации проводится статистический анализ данных. Применяются различные методы обработки информации. В разделе 4.1 дается обоснование выбора рассматриваемой вероятностной модели и предлагается использовать ее, которая кажется более подходящей для такого анализа, потому что она принимает в расчет корреляцию между различными пунктами анкеты и обладает простым вероятностным смыслом.

Статистический анализ выборочной ковариационной матрицы, основанной на ответах 43 опрашиваемых компаний, показал, что ответы для некоторых пунктов анкеты значимо коррелиро-ваны. Выделяются три группы таких ответов. Первая группа содержит вопросы, связанные с политикой: (1) торговая политика национального правительства, (2) политика местных администраций, (3) управление национальным правительством, (4) управление местными администрациями. Вторая группа относится к таможне: (1) таможенные процедуры, (2) время, затрачиваемое на таможенные процедуры, (3) подготовка сертификата о происхождении товара, (4) выполнение национальных законов, (5) законодательство, (б) коррупция и (7) контрабанда. Третья группа относится к социальной политике: (1) образование служащего фирмы, (2) его опыт и (3) этика работы.

Выло проведено сравнение оценок вероятностей, вычисленных при двух предположений: 1) пункты анкеты (вопросы) независимы и 2) они коррелируют. Оценки имели достаточное отличие, чтобы показать, что учитывать корреляцию между пунктами анкеты необходимо.

В разделе 4.3 рассматриваются 8 исследовательских вопросов, относящихся к цепям снабжения иностранных компаний в Казахстане:

1) В каком состоянии находится менеджмент цепей снабжения европейских и североамериканских компаний, распространяющих

сбою продукцию внутри Казахстана?

2) Какой уровень транспортного обслуживания европейских и североамериканских компаний на рынке Казахстане?

3) Какие издержки несут эти компании в Казахстане по сравнению с Европой и Северной Америкой?

4) В какой степени присутствуют информационные технологии, используемые европейскими и северо-американскими компаниями для управления цепями снабжения, в Казахстане?

5) В какой степени европейские и северо-американские компании формируют альянсы по цепям снабжения для ведения бизнеса на новом рынке Казахстана?

6) Какова природа дистрибуторской сети европейских и североамериканских компаний, распространяющих свои товары в Казахстане?

7) Есть ли связь между выбранными рыночными стратегиями и осуществлением цепей снабжения для европейских и североамериканских компаний, распространяющих свои товары в Казахстане?

8) В какой степени политические, правовые, экономические, социальные и культурные факторы казахстанской рыночной среды воздействуют на цепи снабжения иностранных компаний в Казахстане?

Проведенный анализ показывает, что предлагаемая вероятностная модель весьма полезна для обработки информации анкет. Благодаря процедуре усреднения она позволяет уменьшить ошибки оценок вероятностей, представляющих интерес. Второе преимущество это то, что модель позволяет принимать в расчет корреляцию между пунктами анкет, которая может быть статистически значимой. Если же не принимать корреляцию во внимание, то оценки интересующих нас вероятностей могут быть весьма занижены или, наоборот, завышены.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

В работе рассмотрен класс многомерных дискретных распределений вероятностей, порожденный урновой схемой с шарами, помеченными векторами с произвольными целочисленными ком-

понентами. Преимуществом данной модели является то, что она принимает во внимание корреляцию между компонентами случайных векторов. Другим преимуществом является то. что принятая процедура усреднения уменьшает ошибки в оценках вероятностей. Установлено, что рассматриваемый класс многомерных дискретных распределений действительно является вероятностным. Для практического применения этой схемы бала рассмотрена проблема вычисления вероятностей, которая связана с решением систем линейных диофантовых уравнений на современных компьютерах за разумное время. Эта задача, как известно относится к классу полных задач, неразрешимых за полиномиальное время. В настоящей диссертации для решения данной проблемы использовалась техника построения разбиений. В работе приводятся два алгоритма построения разбиений вектора г на точно п частей. Полученные результаты имеют теоретический и практический интересы для раздела аддитивной теории чисел и комбинаторики. Это важно также для построения и перечисления разбиений векторов, а также для дискретного линейного программирования. Предложена формула для общего члена формального степенного ряда, который является произвольной комплексной степенью полинома с произвольными положительными целыми степенями. Выписаны несмещенные оценки вероятностей и несмещенные оценки их дисперсий. Показано, что эти оценки могут быть вычислены простым комбинаторным методом без решения системы линейных диофантовых уравнений. Этот факт значительно облегчает применение предлагаемой вероятностной модели в случае, если оценки ошибок оцениваемых вероятностей не представляют особого интереса. Показано, что несмещенная оценка вероятности события изучаемого класса вероятностных мер удовлетворяет свойству вероятностного распределения. Установлено, что рассматриваемое распределение вероятностей при некоторых условиях стремится к обобщенному пуас-соновскому распределению и рассмотрены некоторые предельные свойства данного класса.

Данная вероятностная схема имеет много очевидных приложений: в радиоэкологии при описании векторных полей радиоак-

'пшного загрязнения территорий; в социологии при выборочном обследовании популяций; в науках о Земле для описания и анализа текстурных изображений, получаемых с летательных аппаратов, и многое другие.

Используя многомерную модель и уровни безопасности для отдельных радионуклидов, были оценены различные вероятности их превышения для исследуемой территории. Оценивались вероятности прямоугольных областей ( ~ 25 х 10 кт2 ) территории для точек соседних маршрутов. Оценки вероятностей превышения уровня безопасности для ,37С5 ( 760 тС\/кт2 ) есть нули но всем маршрутам. Таким образом, нет статистически значимого загрязнения по 131С в, которое превышает 760 тпа/кт2. Была вычислена также вероятность превышения уровня безопасности общего канала гамма-активности Су +■ 2.3Сгл + Сд- ( уровень опасности - 25.59/хг//г ). Этот совместный канал соответствует в основном радиоактивному фону II, Г/г и К, содержащихся в граните. Элементы II, и ТН также могут встречаться как результат ядерных испытаний. Вычисление вероятностей, что активность 13 'Сб пли активность II, Тк и К превысит их уровни безопасности ( 769тпа/кт2 и 25.59рг/Л. соответственно ) показало, что они почти те же самые, как и в предыдущем случае. Очевидно, что это приводит к выводу, что территория практически не заражена Исследование показало также, что часть изученной территории не заражена и и К ( все соответствующие оценки вероятностей практически 0 ). Из этого следует, что только Т/г дает гамма-активность, превышающую уровень безопасности, соответствующий международному значению. Если, к примеру, уменьшить уровень безопасности для II наполовину ( 5.31 цг/И вместо 10.42рьг/Ъ. ), тогда оценки вероятностей превышения этого уровня становятся значимыми для некоторых пар маршрутов.

Проведенный анализ бизнес-приложения показал, что предлагаемая вероятностная модель весьма полезна для обработки информации анкет. Благодаря процедуре усреднения она позволяет уменьшить ошибки оценок. Второе преимущество это то, что модель позволяет принимать в расчет корреляцию между пунктами анкет, которая может быть статистически значимой. Если

же не принимать корреляцию во внимание, то оценки интересующих нас вероятностей могут быть весьма занижены или, наоборот, завышены.

Что касается цепей снабжения европейских и североамериканских компаний, то было показано, что:

о Эти компании имеют в Казахстане меньший контроль над своими цепями снабжения, чем на европейском или североамериканском рынках,

о По сравнению с уменьшением цены или улучшением работы с покупателями, освоение рынка не играет такую же существенную роль в управлении цепями снабжения,

о Нельзя сказать однозначно, что рассматриваемые компании имеют менее интегрированные цепи снабжения и стоят на более низкой стадии развития в Казахстане,

о Издержки цепей снабжения этих компаний в конечном итоге имеют более высокий процент от конечной стоимости товаров на казахстанском рынке,

о В Казахстане большинство современных информационных технологий используются в меньшей степени,

о В Казахстане компании формируют не так много альянсов по цепям снабжения,

о Стратегии рыночного участия, используемые в Казахстане и те, которые используются в глобальном масштабе, практически не различаются,

о Стратегии вхождения на рынок, используемые в Казахстане и те, которые используются в глобальном масштабе, имеют различия и соответствуют различному осуществлению цепей снабжения на практике,

о Существует несколько политических и правовых, социальных и культурных факторов, которые отрицательно влияют на цепи снабжения этих компаний.

Основные выводы диссертации сводятся к следующим: 1. Предложен и изучен новый класс дискретных многомерных распределений вероятностей, порождаемых урновой схемой с шарами, помеченными векторами с произвольными целочисленными компонентами

2. Разработаны два альтернативных алгоритма вычисления вероятностей и их оценок для предложенной модели: алгоритм, основанный на решении систем линейных диофантовых уравнений в неотрицательных целых числах (№ полная задача) или, что то же самое, на построении всех возможных векторных разбиений заданного вектора и комбинаторный алгоритм

3. Получены несмещенные оценки вероятностей для данного класса распределений

4. Получены различные возможные предельные распределения для данной модели, позволяющие эффективно применять ее при выборках большого объема

5. Разработан критерий типа хи-квадрат для проверки адекватности модели результатам наблюдений

6. Предложенная модель применена для анализа полей радиоактивного загрязнения территорий, прилегающих к бывшему Семипалатинскому ядерному полигону, и показана ее важность в связи с тем, что она позволяет корректно учесть реально присутствующую корреляцию между измерениями гамма-активности различных радиоизотопов. Показано, что исследуемый участок (по международным стандартам) можно считать практически не зараженным изотопом 13'Сз

7. Предложенная модель применена для выборочного анализа эффективности цепей снабжения иностранных компаний в Казахстане. Показано, что и в этом случае, модель имеет неоспоримые преимущества перед известными методами анализа, т.к. она позволяет учитывать корреляцию между различными пунктами анкеты, используемой при проведении такого анализа. Конкретные выводы этого анализа перечислены выше.

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Туретаев Д.И., Об одном классе многомерных дискретных распределений вероятностей, Доклады МН-ВО НАН РК, N4,1999, С.

зо-зэ

2. Туретаев Д.И., Предельные теоремы одного класса многомерных дискретных распределений вероятностей, Вестник МОиН НАН РК. N1, 2000, С. 71-76

3. Voinov V.G., Nikulin M.S., Novak M.M., Turetayev D.I., Estimating environmental radioactive contamination in Kazakhstan, Central Asian Journal of Econ.& Soc. Research, Premier Issue, 2000, P. 59-71

4. Nikulin M.S., Price P.M., Turetayev D.I., Voinov V.G., An application of a multivariate discrete probability distribution for sampling survey analysis of supply chains, Technical Report N9905 of Université Bordeaux 2, 1999, Bordeaux, France

5. Price P.M., Turetayev D.I., Voinov V.G., Some remarks on environmental factors that affect companies' supply chain operations in Kazakhstan, Central Asian Journal of Econ.& Soc. Research, (в печати)

Turetayev Daulet Isabekovich

Using of a class of multivariate discrete probability distributions to the problems of radioecology and logistics

Summary

A new class of multivariate discrete probability distributions induced by an urn scheme containing balls marked by vectors with arbitrary integer components is considered. Unbiased estimators for such probabilities are derived. Algorithms for probabilities and their unbiased estimators evaluating based on a solution of system of linear diophantine equations in nonnegative integers are proposed. Also an alternative combinatorial algorithm for unbiased estimators evaluating is proposed. Properties of new model are studied and limit theorems are given. A chi-square test for this class of probabilities is obtained. It has been shown that the model is useful for an analysis of many surveys, in particular for a survey analysis of supply chains. A probabilistic description of radioactive contamination based on a proposed model is studied.

Теретаев Дэулет Исабекулы

Радиоэкология жэне логистика эсептерше кеполшемд! уздйсп мумкшдж улеспрджтердщ 6ip класын к,олдануы.

Тужырымдама

Бутш компонент векторлармен белплеген шарлар бар урна схемамен жаралган узджт! мумкшдж улесирдштердщ жаца класы кдрастырылган. Осындай мумкшджтерге к,озгалсыз бакалар к,урылган. Мумкшджперд! жене олардыц к,озгалсыз багаларын есептеу ушш Tepic емес бутш санда сызыкдык, диофантык, тецдеулер жуйесппц шещушде нег1зделген алгоритмдер усынран. Жопе к,огалсыз богаларды есептеу ymiH альтернатнвалык, комбинаторикалык, алгоритм берЬ\ген. Жаца модельд1ц к,асиеттэр! зертелген жэне предел теоремалар усыпан. Осы класс муммнд1ктерерге критерий хи-квадрат к,урылган. Модель коп зерггеу жумыстарын етк1зу yuiiii, мысалы алым т1збегшш анализ1не, пайдалы деи керсет1лген.

Осы модельде нег1зделген радиоактивт1 ластануын мумкшдж'п бейнелеус! зерттелген.