автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Задача классификации подмножеств случайного множества и ее применение

кандидата физико-математических наук
Куприянова, Татьяна Васильевна
город
Красноярск
год
2002
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Задача классификации подмножеств случайного множества и ее применение»

Оглавление автор диссертации — кандидата физико-математических наук Куприянова, Татьяна Васильевна

Введение

1. Постановка задачи

2. Решение задачи

Введение.

1. Вероятностная псевдометрика.

1.1. Основные понятия и результаты теории СКАМ.

1.2. Псевдометрика над СКАМ.

1.3. Равенство псевдометрики нулю.

1.4. Вырождение неравенства треугольника в равенство.

1.5. Отношения между множествами в решетке 2^ и псевдорасстояние между ними.

1.6. Связь псевдорасстояния и ковариации.

1.7. Возрастающие последовательности множеств и псевдорасстояния между их элементами.

Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Куприянова, Татьяна Васильевна

1. Решение задачи классификации на два класса.129

2. Решение задачи классификации на девять классов.134

3. Взаимозависимости множеств акций — лидеров по объемам продаж . 136

4. Другие приложения задачи классификации подмножеств случайного множества .140

Заключение.141

Заключение 143

Список работ по теме диссертации 147

Литература 148

Список основных обозначений 155

Предметный указатель 157

Введение

Актуальность темы

Диссертация развивает теорию случайных конечных абстрактных множеств (СКАМ) в части задачи классификации подмножеств случайного множества без указания учителя, представляя математический аппарат, созданный автором для формулировки и решения указанной задачи.

Необходимость формулировки задачи классификации подмножеств случайного конечного абстрактного множества без указания учителя возникла из потребности разбиения множества всех подмножеств случайного множества на несколько классов, где множества из одного класса имеют более схожие вероятностные характеристики, чем множества из разных классов. Человеку трудно анализировать ситуации с 2Л исходами, ему проще обрабатывать т <С '2N исходов — этим и обусловлена необходимость в формулировке и решении задачи классификации. Необходимость решения задачи классификации подмножеств случайного конечного абстрактного множества без указания учителя имеется во многих практических областях: в медицине — при исследовании пространства заболеваний, в экономике - при анализе покупательского спроса или прогнозе котировок акций, а также при прогнозе политических и экономических событий и т.п.

Существует ряд методов решения задачи классификации: кластер -анализ (P.P. Сокал, Дж. Крускал, Дж.А. Хартиган и др.): ботрилогия (И. Дж. Гуд и др.); экспериментальное сравнение эталонных моделей иерархической группировки по г диаметру относительно показателя согласия (Дж. Хьюберт, Б. Бейкер и др.)'- процедура кластеризации Кинга (Г. Соломон и др.); дискримииантный анализ для случая, когда в начальной выборке имеется засорение по масштабу (В. Ахмед, П.А. Ла-кенбрух); линейная классификация по наилучшим представителям более низкой размерности (Р. Хадлет. Р. Джонсон); простой гистограм-мный метод для непараметрической классификации; правила классификации, основанные на гистограммном методе для одномерного и дву-.мерного случая (Пи Ионг Чи. Дж. Вэн Райзин и др.); алгоритм предсказания значения количественного признака, использующий линейно - логические правила (Г.С. Лбов): классификация объектов с разнотипными информативными признаками (Г.С. Лбов): классификация объектов с признаками, замеренными в разных шкалах (Ю.А. Воронин, Ю.В. Мерекин, Ю.И. Журавлев, В.В. Никифоров); классификация объектов с булевыми признаками; алгори тм КОРА (М.М. Бонгард, М.Н. Вайнцвайг, Ю.И. Журавлев, А.Н. Дмитриев. Ф.П. Кренделев. Э. Хант. Дж. Марин. Ф. Стоун); классификация объектов с номинальными признаками (Н.И. .Манарчук, В.П Гладун).

В задачах кластерного анализа для построения кластеров используется ряд мер близости, которые не обладают метрическими свойствами, причем выбор меры близости принципиально зависит от прикладной области решаемой задачи. Классы (кластеры), полученные таким образом при классификации подмножеств случайного конечного абстрактного множества, не будут связными, что противоречит представлению о классе, как о группе объектов, которую можно представить как нечто целое.

Методы решения задач классификации объектов с булевыми признаками и классификации объектов с номинальными признаками основаны на алгоритме обнаружения логических закономерностей в виде конъюнкций значений признаков, причем данные логические закономерности не учитывают статистические зависимости между значениями информативных признаков. Поэтому, в общем случае, при использовании данных методов решения задачи классификации в один класс могут попасть объекты со значениями информативных признаков, которые никогда не встречаются вместе, что противоречит представлению о классе, как о множестве объектов со статистически близкими значениями информативных признаков.

Методы линейной классификации и гистограммные методы для п -мерных случаев классифицируют объекты, у которых информативные признаки характеризуются только числовыми векторами. Если информативный признак объекта принимает в качестве значения подмножество случайного конечного абстрактного множества, то все возможные значения информативного признака невозможно поместить в п - мерное линейное пространство, поэтому методы линейной классификации и гистограммные методы для n-мерных случаев непригодны для классификации подмножеств случайного конечного абстрактного множества.

Предложенные в работе формулировка и решение задачи классификации подмножеств случайного множества без указания учителя используют в качестве меры близости вероятностную псевдометрику, учитывающую статистические зависимости между подмножествами. В этом случае отличия между исследуемыми объектами измеряются значением величины вероятностной псевдометрики, для определения которой не требуется погружения всех значений информативных признаков (подмножеств) в многомерное линейное пространство.

При разработке математического аппарата для формулировки и решения задачи классификации подмножеств случайного множества без указания учителя автором были решены следующие задачи, имеющие

8 Вврцспис сам остоятел ьную знач имость: метризация совокупности подмножеств случайного конечного абстрактного множества, для чего впервые введено понятие вероятностной псевдометрики на решетке подмножеств конечного множества, исследованы свойства вероятностной псевдометрики: построение вычислимой аппроксимации произвольного распределения случайного конечного абстрактного множества с наперед заданной точностью, для чего введено новое понятие кусочно - независимого ряда распределений случайных множеств и доказано, что любое распределение можно аппроксимировать кусочно - независимым рядом распределений случайных множеств с наперед заданной точностью.

Расстояние - одно из самых важных и основных понятий экономики, физики, а также математики. Как правило, отличие между объектами ассоциируется с расстоянием между ними. В математике измеряют даже расстояние между такими объектами как функции; одна из самых простых формул подсчета расстояния между функциями — это тах|/ — д\. е

Понятие расстояния между обтжтамп используется при решении многих прикладных задач.

При исследовании отношений между объектами, чаще всего, у исследуемых объектов выделяют общие числовые признаки, после чего объекты "погружают" в евклидово пространство с размерностью, равной числу общих признаков. Значение каждой координаты объекта в евклидовом пространстве — это числовое значение соответствующего признака. Отличия между объектами измеряются расстоянием между объектами в евклидовом пространстве. Этот принцип широко используется для решения задачи классификации без указания учителя.

Однако, нередко встречаются задачи (например, задача классификации, задачи теории серий), в которых необходимо измерить отличие между объектами, но объекты обладают не только числовыми признаками. Наиболее распространенный способ решения этой проблемы — "поставить" число в соответствие каждому значению признака. Представив таким образом объекты, последние "погружают"1 в евклидово пространство. Очевидно, что такое описание объектов имеет свой минус: величина отличия между объектами, измеряющая расстояние между объектами в евклидом пространстве, принципиально зависит от того, какие числа поставлены в соответствие каждому значению нечислового признака.

Понятие метрики в пространстве множеств существует давно. Одна из самых распространенных метрик — мощность симметрической разности d'{A,B) = \ААВ\. А.ВСх. (0.1)

Воробьев А.О. обобщил мощность симметрической разности, и ввел целый класс метрик, измеряющих расстояние между множествами: d"(A,B) = (|А\В|" + \В\А\п)[/\ А, В С п > 1; d"'(AB) =max{|A\5|,|5\.4|} А, В С1. (0.2)

Однако, метрики (0.1) и (0.2) учитывают только структуру решетки 2х, но не учитывают статистические зависимости между множествами, навязываемые случайным конечным абстрактным множеством К. Рассмотрим отображение

К : (П,^,Р) (2*,22*), где Р — это вероятностная мера. Очевидно, что при разных отображениях К\ и А"2 расстояния между множествами А. В С I , учитывающее только внутреннюю структуру подмножеств множества X, не отличаются друг от друга (другими словами, значение метрик для множеств А и

В при разных отображениях К\ и К-2 будет одинаково). Отображение К называется случайным конечным абстрактным множеством (СКАМ).

Существует ряд задач, применяющих аппарат случайных конечных абстрактных множеств, в которых расстояния, учитывающие только внутреннюю структуру подмножеств множества X, не отражают сути описываемого явления. Примером может служить задача классификации подмножеств случайного множества без указания учителя, для которой важна не только внутренняя структура решетки подмножеств конечного абстрактного множества, но и статистические зависимости между множествами.

Псевдометрика, введенная во второй главе диссертации, отображает не только внутреннюю структуру решетки подмножеств конечного абстрактного множества, но и статистические зависимости между множествами.

Техническая сложность хранения и работы со всеми 2'*' вероятностями распределения случайного множества является одной из самых острых проблем, решение которой — аппроксимация произвольного распределения.

В работе предложена аппроксимация кусочно - независимым рядом распределений случайных множеств с наперед заданной точностью и доказано, что любое распределение случайного множества представимо в виде линейной выпуклой комбинации кусочно - независимых распределений.

Одна из самых первых аппроксимаций — это аппроксимация кусочно - независимым распределением, основанная на предположении, что рассматриваемое множество X распадается на независимые блоки (фрагменты) Q:j(X) = { 3Ei, .,£/} . Исходя из этого предположения достаточно знать только вероятности покрытия всех подмножеств каждого блока фрагмента), что значительно меньше, чем все вероятности значения распределения. По вероятностям покрытия всех подмножеств каждого блока (фрагмента) строится кусочно - не зависимое распределение.

Понятно, что предположение о независимости блоков — это довольно сильное предположение, но существуют явления, где все элементы связаны друг с другом. Аппроксимация f-плетным распределением также основана на предположении, что все множество элементов распадается на непересекающиеся блоки, мощность которых не превышает t. Причем непересекающиеся множества, принадлежащие разным блокам, мощность объединения которых больше t. являются независимыми. Если же мощность объединения меньше либо равна t, то множества, вообще говоря, зависимы. Параметрами f-nлетного распределения являются вероятности покрытия всех множеств, мощность которых меньше либо равна t. По данным параметрам строится аппроксимация распределения. Понятно, что f-плетное распределение есть обобщение кусочно -независимого.

Предположение о независимости каких - либо множеств — это сильное предположение, которое описывает только ограниченный круг встречающихся на практике явлений. Поэтому в работе предлагается аппроксимация распределения случайного множества кусочно - независимым рядом с заданной точностью. Для данной аппроксимации не требуется никакого предположения о виде распределения, все зависимости определяются с заданной точностью, аппроксимация имеет полиномиальное число параметров.

Необходимость в решении задачи классификации подмножеств случайного множества без указания учителя возникает во многих прикладных задачах. Классический пример, используемый в теории случайных множеств. - это классификация больных по множеству заболеваний. диагностируемых у пациентов. Другой пример — это классификация покупателей оптового рынка по ассортименту товара, покупаемого каждым покупателем. В работе рассмотрена задача классификации множеств акций, являющихся лидерами по объему продаж. Каждый день на российских биржах продаются акции российских предприятий. И каждый день фиксируется, на какую сумму было продано акций, например, Норильского никеля или РАО ЕЭС России и т.д.

Как участникам фондового рынка, так и другим лицам для своей практической деятельности необходимо знать, чьих акций сегодня было продано больше всего, из чьих акций в определенный день состояло множество акций — лидеров по объему продаж. На основании статистической информации лица, участвующие в фондовом бизнесе, решают три проблемы.

Первая проблема — это выработка стратегий на каждый возможный исход, то есть выработка стратегий поведения на любое множество ■акций, которое может быть множеством акций — лидеров по объемам продаж на фондовом рынке (здесь и далее в работе под множеством акций понимается множество, состоящее из названий акций, участвующих в фондовом рынке; название акции — это наименование предприятия эмитента). Понятно, что если число потенциальных лидеров по объемам продаж, скажем, больше 10. то вообще говоря, необходимо выработать 210 стратегий на каждый возможный исход. Обычный человек может выработать одну, две, десять стратегий, но выработать 210 стратегий обычный человек не в состоянии. Для упрощения решения •задачи по выработке стратегий поведения необходимо классифицировать все 2Л множеств акций по вероятностному признаку на несколько классов таким образом, чтобы множества акций из одного класса были статистически ближе, чем множества из разных классов. При такой классификации брокер или любое другое лицо, интересующееся фондовым бизнесом, может в конце каждого финансового дня "распознать", к какому классу принадлежит множество акций — лидеров по объему продаж за текущий день, и соответственно реализовать стратегию, выработанную для данного класса,

Вторая проблема, которую вынуждены решать лица, участвующие в фондовом бизнесе. — это выработка стратегий поведения с учетом статистических зависимостей акций разных предприятий — лидеров по объему продаж. На рынке "крутятся" акции не одного и не двух предприятий, причем в силу специфики предприятий эмитентов все акции "завязаны" с друг другом. Это значит, что если акция какого - либо предприятия становится лидером по объемам продаж, то это сказывается на поведении какого - то множества акций, и это множество либо также попадает в разряд лидеров по объему продаж, либо не попадает. Ситуацию можно обобщить следующим образом: если некоторое множество акций становится множеством акций — лидеров по объему продаж. то это сказывается на другом каком - нибудь множестве, оно либо тоже становится множеством акций — лидеров по объему продаж, либо не становится. Множественные зависимости акций важны для анализа ситуаций на фондовом рынке: если какое - то множество акций "становится" лидером по объемам продаж, а у брокера лежит целый портфель акций разных предприятий, ему необходимо определить, какие акции (множество акций) он может успешно продать. Понятно, что помнить (хранить) все множественные зависимости невозможно, поэтому настоящая работа предлагает решение этой проблемы следующим образом: все подмножества акций делятся на необходимое число классов таким образом, что каждое множество из одного класса чаще встречается с представителем данного класса (наиболее вероятного подмножества из данного класса), чем с представителями других классов. Таким образом участнику фондового рынка нет необходимости помнить все множественные зависимости, достаточно знать классы (число которых невелико). полученные в результате решения задачи классификации подмножеств случайного множества акций - - лидеров по объемам продаж.

Третья проблема — это проблема прогнозирования ситуаций на фондовом рынке. Можно предположить, что акции различных предприятий попадают в лидеры и формируют множество акций лидеров по объемам продаж в зависимости от политике - экономической ситуации в России и в мире. Понятно, что исходя из этого предположения, желательно установить связь между множеством полнтико - экономических ситуаций и множеством акций — лидеров по объемам продаж, чтобы, имея информацию о возможной ситуации в конкретный день, брокер мог прогнозировать. каких акций в этот день будет продано очень много. Как уже отмечалось выше, обычный человек не может предположить 2Л политике - экономических ситуаций, поэтому настоящая работа предлагает классифицировать на несколько классов все множества акций — потенциальных лидеров по объемам продаж, и каждой политико - экономической ситуации взаимно - однозначно поставить класс множеств акций — потенциальных лидеров по объемам продаж. Имея информацию, о возможной политико - экономической ситуации, скажем на завтрашний день, брокер может планировать продать "завтра" портфель акций таких предприятий, который представляет множество акций, принадлежащих классу, взаимно - однозначно соответствующему этой политико - экономической ситуации.

Цели работы

Целью работы является разработка математического аппарата для формулировки и решения задачи классификации подмножеств случайного множества без указания учителя.

Данная цель достигается за счет решения следующих задач: метризации совокупности подмножеств случайного конечного абстрактного множества введением вероятностного псевдорасстояния: построения вычислимой аппроксимации произвольного распределения случайного конечного абстрактного множества (с наперед заданной точностью); разработки алгоритмов классификации подмножеств случайного конечного абстрактного множества без указания учителя, основанных на вероятностной псевдометрике.

Методы исследования

Методы исследования основаны на использовании теории случайных конечных абстрактных множеств, теории вероятностей, математической статистики, математического и функционального анализа — для изучения свойств введенной в работе вероятностной псевдометрики, формулировки задачи классификации подмножеств случайного множества и аппроксимации произвольного распределения случайного множества с наперед заданной точностью.

Теоретическая значимость и научная новизна

Теоретическая значимость и научная новизна состоят в следующем: впервые введено понятие вероятностной псевдометрики, являющейся мерой близости подмножеств случайного конечного абстрактного множества, обладающей метрическими свойствами и учитывающей как обычные расстояния между подмножествами, так и статистические зависимости между ними: введено новое понятие кусочно - независимого ряда распределений случайных множеств и доказано, что любое распределение случайного конечного абстрактного множества аппроксимируется с заданной точностью кусочно - независимым рядом распределений случайных множеств. сформулирована новая задача классификации подмножеств случайного конечного абстрактного множества без указания учителя и разработаны алгоритмы её решения.

Практическая значимость

Результаты работы могут быть использованы для решения задач классификации без указания учителя, когда информативные признаки объектов характеризуются подмножествами конечного абстрактного множества (например, при исследовании пространства заболеваний, при анализе покупательского спроса или прогнозе котировок акций, а также при прогнозе политических и экономических событий и т.п.)

Апробация работы

Основные научные результаты работы докладывались и обсуждались на следующих международных, всероссийских и региональных конференциях и семинарах: Международная конференция "Проблемы оптимизации и экономические приложения" (Омск, 1997), I и II Всесибирский конгресс женщин - математиков (Красноярск, 2000,2002), V и VI Всероссийские семинары "Моделирование неравновесных систем" (Красноярск, 2000, 2001), Конференции молодых ученых Красноярского научного центра СО РАН (Красноярск, 1998, 1999), II - V ФАМ конференции (Красноярск, ИВМ СО РАН. 1998 - 2001), семинары Института вычис-.лительного моделирования СО РАН. кафедры прикладной математики Красноярского государственного университета, а также ФАМ семинары (Красноярск, ИВМ СО РАН. 1997 - 2002).

17

Публикации

По результатам научных исследований соискателем лично и в соавторстве (две работы) было опубликовано 11 научных работ в виде отдельных статей (две в сборниках и две депонированных) и тезисов докладов.

Структура и объем работы

Диссертационная работа состоит из введения,

Заключение диссертация на тему "Задача классификации подмножеств случайного множества и ее применение"

146 Заключение дачи классификации подмножеств случайного множества без указания учителя более простым и наглядным.

В третьей главе диссертации рассмотрено практическое использование задачи классификации подмножеств случайного множества без указания учителя для множества акций, являющихся лидерами по объему продаж на фондовом рынке. В работе оценено распределение акций, лидеров по объемам продаж, и решена задача их классификации по вероятностному признаку ликвидности акций, а также даны рекомендации по использованию результатов решения.

Список работ по теме диссертащии

1] куприянова т.в. О внутренней структуре связей между подмножествами множества. Записки ФАМ семинара, Т.2 // Красноярск: ИВМ СО РАН, 1999, с. 93 - 102.

2] Воробьев О.Ю., Куприянова Т.В. Кусочно - независимый СКАМ ряд// Красноярск: ИВМ СО РАН, Деп. в ВИНИТИ от 10.07.00 №1904 - В00, 15 с.

3] Воробьев О.Ю., Куприянова Т.В. О субнормальных случайных множест,вах и их применение. Записки ФАМ семинара, Т.1 // Красноярск: ИВМ СО РАН, 1998. с. 97-116.

4] КУПРИЯНОВА Т.В. Гиперобъемные распределения случайных конечных множеств. Конференция молодых ученых'98. Материалы конференции// Красноярск: ИВМ СО РАН, 1998, с. 112.

5] куприянова Т.В. Задача классификации подмножеств конечного абстрактного множества. Третий всероссийский семинар по моделированию неравновесных систем. Тезисы докладов // Красноярск: ИВМ СО РАН, 2000, с. 138.

6] КУПРИЯНОВА Т.В. Решетка случайных конечных абстрактных множеств. II Всесибирский конгресс женщин - математиков: Тез. Докладов. Красноярск: ИВМ СО РАН, 2001. - С. 117.

148 СПИСОК РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

7] Куприянова Т.В. Распределение случайного конечного абстрактного множества как линейная комбинация кусочно - независимых распределений случайных конечных абстрактных множеств и остаточного члена I Всесибирский конгресс женщин - математиков. Тезисы докладов // Красноярск: ИВМ СО РАН. 2000, с. 114.

8] куприянова т.в. Расстояние между множествами, навязываемое вероятностью// Красноярск: КрасГУ Деп. в ВИНИТИ 2000, 32 с.

9] куприянова Т.В. Энтропия случайных множеств. Конференция молодых ученых'99. Материалы конференции// Красноярск: ИВМ СО РАН, 1999, с. 83.

10] Быкова В.В., Куприянова Т.В. Сравнительный анализ М-ациклических и комплектных гиперграфов. Международная конференция: Проблемы оптимизации и экономические приложения: Тез. Докладов // Омск: Омский государственный университет, 1997. - С. 20.

Библиография Куприянова, Татьяна Васильевна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Амбарцумян Р.В. Мекке И., Штойян Д. Введение в стохастическую геометрию// Москва: Наука, 1989, 401 с.

2. Барнабеи М., Брини А., Рота Дж.-К. Теория функций Мебиуса// УМН. 1986. - Т. 41, вып. 3(249), с. 113 - 157.3. биркгоф Г. Теория решеток// Москва: Наука, 1984, 567 с.

3. БОГОЛЮБОВ Н.Н. О некоторых статистических методах в математической физике// Киев: Изд.АН УССР, 1945.

4. БОГОЛЮБОВ Н.Н. (МЛ.) Метод исследования модельных гамильтонианов/ / Москва: Наука, 1974.

5. ДЕЛЛАШЕРИ К. Емкости, и случайные процессы// Москва: Мир, 1975, 192 с.

6. ЕГОРЫЧЕВ Г.П. Интегральное представление и вычисление комбинаторных сумм// Новосибирск: Наука, Сибирское отд ние, 1977. 286 с.

7. Емеличев В.А. Лекции по теории, графов// Москва: Наука, 1990, 384 с.

8. Исихара А. Статистическая физика// Москва: Мир, 1973, 471 с.

9. КановеЙ В.Г. Идеи Колмогорова, в теории операций над множествами// УМН. 1988. - Т. 43, вып. 6(264), с. 93 - 128.15. кантор Г. Труды по теории, множеств// Москва: Наука. 1985, 431 с.

10. Кен да л л М., Моран П. Геометрические вероятности/ / Москва: Наука, 1972, 192 с.

11. Куратовский К. Мостовский А. Теория множеств// Москва: Мир, 1970, 416 с.1. ЛИТЕРАТУРА 151

12. ЛБОВ Г.С. Методы обработки разнотипных экспериментальных данных)j Новосибирск: Наука, Сиб. отд ние, 1981, 159 с.

13. ЛЕОНТЬЕВ В.К. Комбинаторика: ретроспектива и перспективы// Компьютер и задачи выбора. Под ред. Ю.И. Журавлева, Москва: Наука, 1989, с. 49 88.

14. Ляпунов A.A. R множества!I Труды МИАН СССР. - 1953. - Т. 40, с. 294 - 303.

15. Ляпунов А.А., Новиков П.С. Дескриптивная теория множеств// Математика в СССР за 30 лет. М. Л.: Гостехиздат, 1948, с. 243 - 255.

16. Матерон Ж. Случайные множества и интегральная геометрия// Москва: Мир, 1978, 320 с.

17. МЕЙЕР П.-А. Вероятность и потенциалы// Москва: Мир, 1975, 326 с.

18. Мин л ОС Р. А. Лекции по статической физике/ / УМН. 1968. - 23, N 1. с. 133 - 190.28. очан Ю.с. Некоторые вопросы эквивалентности семейств множеств// Изд. АН СССР, 1942, N 6. с. 171 - 188.

19. ОЧАН Ю.С. Теория операция над множествами// УМН, 1955, Т.10, вып.3(65), с. 71 128.30. паровиченко И.И. Теория операций над множествами// Кишинев: Штиница, 1981, 187 с.152 ЛИТЕРАТУРА

20. ПЕТРОВ В.В. Суммы независимы,х случайны,х величин// Москва: Наука, 1972, 352 с.

21. Престон К. Гиббсовские состояния на счетных множествах// Москва: Мир, 1977. 126 с.

22. Прохоров Ю.В., Розанов Ю.А. Теория вероятностей: основные понятия, предельные теоремы, случайны,е процессы// Москва: Наука, 1978, 380 с.34. пугачев B.C. Теория вероятностей и математическая статистика/ / Москва: Наука, 1979, 370 с.

23. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика// Москва: Наука, Главная редакция физико — математической литературы, 1985. 320с.

24. Сантало Л. Интегральная геометрия и геометрические вероятности/ / Москва: Наука, 1983, 360 с.

25. Сачков В.Н. Введение в комбинаторные методы дискретной математики/ / Москва: Наука, 1982, 384 с.

26. СекеЙ Г. Парадоксы в теории вероятностей и математической статистике// Москва: Мир, 1990, 240 с.

27. Синай Я.Г. Теория фазовых переходов// Москва: Наука, 1980, 208 с.

28. Ширяев А.Н. Вероятность// Москва: Наука, 1980, 575 с.

29. Список основных обозначений

30. X —конечное абстрактное множество: X =яь . XN} .

31. Ас —дополнение множества: Ас = X \ А.

32. А\ — число элементов множества А.

33. А А В — объединение двух непересекающихсямножеств.

34. Ai + . + Ап — объединение п непересекающихсямножеств.

35. А С В — множество А содержится в множестве1. В.

36. A D В — множество А содержит множество В.

37. А С В — множество А строго содержится в множестве В (строгое включение).

38. A D В — множество А строго содержит множество В (строгое включение).7, Т, Р) — вероятностное пространство.2х — система подмножеств множества X.

39. К —случайное конечное абстрактное множество заданное под X.р —- распределение случайного конечногоабстрактного множества К.р(Е) — вероятность значения множества Е.

40. Ре — вероятность покрытия множества Е1. СКАМ К.рЕ — вероятность включения СКАМ в множество Е.

41. С а,в — ковариация между множествами А и В.d( A, В) —вероятностная псевдометрика для парыподмножеств А В.

42. Список основных обозначений

43. Aj,. Ап — множество классов, полученных при решении задачи классификации множеств на п классов без указания учителя.

44. Е\,.Е* — множество представителей классов, полученных при решении задачи классификации множеств на п классов без указания учителя.

45. G(V, U) — граф. где V" — множество вершин, U —множество ребер.

46. G\,.,Gn — множество графов, соответствующихклассам А\,.,Ап, полученных при решении задачи классификации множеств на п классов без указания учителя.

47. Hi — класс кусочно независимых распределений, определяемых разбиением aj(X), которому не принадлежат кусочно независимые распределения hj (1 < j < г).ijfi , — кусочно — независимый СКАМ ряд.2Ji=\ain'i

48. T^m а ^ —аппроксимация кусочно — независимым1.1 ' СКАМ рядом, где m < \х\.1. Предметный указательг-плетное /-разбиение, 61 г-ый максимум, 841. Вероятностнаяпсевдометри ка, 29

49. Вероятностная мера, 9 Вероятностная псевдометрика для двух А>значных множеств, 60 Возрастающаяпоследовательность множеств, 52 Второй максимум, 841. Глобальное максимальноемножество, 81 Граф, соответствующий решетке подмножеств 2*, 801. Класс, 81

50. Классы кусочно независимыхраспределений, 61 Ковариация, 28

51. Коэффициенты разложения, 67 Кусочно независимоераспределение, 61 Кусочно независимый СКАМ ряд, 711. Локальный максимум, 80

52. Максимально коррелированныемножества, 33 Множества находятся на однойлинии, 45 Множества отличаются на одинэлемент, 57 Множество максимального минимума, 1111. Непрерывные случайныевеличины, 23 Неравенство треугольника, 29 Нулевое расстояние, 41

53. Одномерность, 52 Оптимизационная задача, 63 Остаточное распределение, 67 Отображение, 9

54. Первый максимум, 84 Портфель, 14158

55. Представитель второго класса, 84 Представитель первого класса, 84 Прогнозирование, 14

56. Распознавание образов, 23 Распределение с максимальной зависимостью между подмножествами, 77 Распределение симметрично относительно перестановки s, 73

57. Расстояние между множествами, 9

58. Ряд первого максимума, 106

59. Семейство п локальных максимальных множеств, 83 Симметрическая разность, 24 Случайная величина, 24 Статистические зависимости, 10

60. Точка минимального максимума, 106

61. Элемент максимального минимума, 1111. ПРЕДМЕТНЫЙ УК А ЗАТЕЛЬ