автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Решающие правила групповой классификации и оценки их характеристик
Автореферат диссертации по теме "Решающие правила групповой классификации и оценки их характеристик"
РГ6 од
" НОЯ Р0С(ЖСКАЯ АКАДЕМИЯ НАУК
ВЫЧИСЛИТЕЛЬНЫЙ ЩНТР
На правах рукописи
А Б У С Е В Ракип Ахметович
РЕШАЮЩЕ ПРАВИЛА ГРУППОВОЙ КЛАССИФИКАЦИИ И ОЦЕНКИ ИХ ХАРАКТЕРИСТИК
Специальность 05.13.17 - Теоретические основы информатики
Автореферат
Диссертации на соискание ученой степени доктора физико-математаческих наук
Москва - 1993
Работа выполнена в Пермском государственном университете им. А.М.Горького
Научный консультант:
доктор физико-математических наук, профессор Я.П.Лумельский. Официальные оппоненты:
доктор физико-математических наук, профессор Ю.Н.Благовещенский.
доктор технических наук, профессор А.А.Дорофеюк. доктор физико-математических наук, профессор Ю'.С.Харин.
Ведущая организация - Центральный эконсмико-математаческий институт РАН.
Защита состоится час./ (
X/'
199-Т.
мин. на заседании Специализированного совета Д002.32.06 при Вычислительном центре РАН по адресу: 117967, Москва ГСП-1, ул. Вавилова, 40, конференц-зал.
С диссертацией можно ознакомиться в библиотеке МИ РАН.
Автореферат разослан
£
_199)г.
Ученый секрктарь Специализированного совета, кандидат физико-математических наук
/С.М.1№-артин'
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы и цель работа. Важнейшими задачами в современней информатике, математической теории решений и многомерном статистическом анализе являются задачи построения математически! моделей поточечной и групповой классификации, разработки ептамальных решахщих правил, вычисления и оценивание вероятностей ошибок и других качественных характеристик.
Решение этих задач представляет большой теоретический интерес и имеет важные приложения в технической и медицинской диагностике, управлении технологические процессами^ итерпретации геофизических данных и других областях знаний.
В настоящей работе впервые систематически исследуются задачи групповой классификации многомерных наблюдений: строятся оС-шде математические модели групповой классификации, з частности вероятностно-статистические, решается задача построения, асимптотически оптимальных параметрических и непараметрических методов групповой классификации. В диссертации продолжается исследования по классификации и распознаванию образов С.А.Айвазяна, В.В.Александрова, А.А.Борсвкова, Ю.Н.Благовещенского,В.Н.Вапника,В.И.Васильева, В.Л.Гирко, А.А.Дсрофекка, Ю.И.Журавлева, Н.Г.Загоруйко, Я.П.Лумвльского, В.Д.Мазурова, Л.Д.Металкина,Ш.Ю.Раудиса,Ю.С.Ха-рина, Я.З.Цыпкина, М.И.Шлезингера, В.А.Якубовича, В.Н.Фомина и многих другш. авторов.
Центральное место в диссертации занимает задачи построения статистически состоятельных решахщих правил групповой классификации и связанные с ними задачи параметрического и непараметрического оцI чивания плотностей распределений в пространстве выборок заданного сйъема или в пространстве д. статочных статистик.
исследования свойств этих правил и оценок.
Некоторые задачи, решаемые в диссертации является продолжениями или обобщениями работ Т.Андерсона,Р.Бахадура, С.Гупты, А.Фукунага и других иностранных авторов.
Целью настоящей работы является построение законченной теории групповой классификации, представляющей новое направление в общей теории классификации,и на этом пути решить следующие взаимосвязанные математические задачи:
- сформулировать обобщенную задачу групповой классификации и построить математические модели для решения этой задачи;
- построить статистические параметрические, байесовские и непараметрические оценки для плотности совместного распределиния достаточных статистик многомерного нормального распрделения и распределения .Уишарта;
- разработать асимптотически оптимальные решахг ' правила групповой классификации, в частности в случае нормальных совокупностей и распределений Уишарта;
- исследовать качественные характеристик полученных оценок и решашцих правил, таких как квадратическая погрешность, смещение, вероятность сшибок классификации, функция риска и др.
- разработать алгоритмы, ориентированные на создание прог-прогрзмного обеспечения статистической групповой классификации.
Методы исследования. В диссертации используются методы теории распознавания образов, теории решений, теории вероятностей и математической статистики, а так же метода линейной алгебры и теории приближения функций. Решение ряда задач приводилось с применением методов статистического моделирования на ЭВМ.
Научная новизна и теоретическая значимость. Впервые построй ена теория статистической групповой классификации, которая пред-
ставляет собой самостоятельное научное напрвление в теории классификации. В рамках этой теории решены следующие задачи:
'. Впервые сформулирована обобщенная задача групповой классификации и построены математические модели этой задачи, установлена глубокая связь между задачами групповой классификации и кластер-анализа.
2. Найдены статистические параметрические и непараметрические оценки, для распределений, неизвестные ранее, в выборочном пространстве и пространстве достаточных статастик и исследованы их асимптотические свойства.•
3. На основе этих оценок разработаны асимптотически оптимальные параметрические и непараметрические решалцие правила групповой классификации и изучены их свойства. Особое внимание уделено случаю многомерных нормальных распределений и распределений Уишарта.
4. Решена важная задача вычислила и оценивания вероятности сшибок и других качественных характеристик для правил групповой классификации и построены двухстороние границы для этих характеристик.
5. Аналитическими методами и с помощью ЭВМ проведено сравнение методов групповой классификации с методами поточечной классификации, в случае нормальных совокупностей с общей ковариационной матрицей показано, что при группо^о^ классификации вероятность ошибок уменьшается.
6. Для оперативного решения теоретических и практических задач групповой классификации, вычисления качественных характеристик алгоритмов групповой классификации, а так же для сравнения методов гру.шсвой классификации между собой и с методами поточечной классификации с помощью метода статистического моде-
лирования на ЭВМ разработаны программы для персональных компьютеров АТ и ХТ.
Практическая значимость. В целом работа носит теоретический характер. "Хотя имеются широкие воеможности практического использования полученных теоретических результатов, в частности при решении задач медицинской диагностики инфекционных заболеваний, токсических поражений, технической диагностики и оценки качества продукции, характеризуемой многими количественными признаками, при выборе приоритетной технологии однотипных изделий или приоритетной методики лечения заданного заболевания и др.
Апробация работы. Теоретические и прикладные результата диссертация докладывались и получили одобрение на многих Всесоюзных и Международных научных конференциях, школах и семинарах, в том числе на Всесоюзных няучно-технических конференциях "Применение многомерного статистического анализа в экономике и оценке качества продукции", Тарту, 1981, 1985, 1989, Всесоюзном научно-практическом семинаре "Прикладные аспекты управления сложными системами", Кемерово, 1983., Всесоюзной научно-технической конференции "Применение статистических методов в производстве и управлении", Пермь, 1984., Всесоюзной конференции "Нечисловая 4 статистика, экспертные оценки и смежна вопросы", Таллин, 1984, Республиканских симпозиумах "Методы и программное обеспечение обработки информации и прикладного статистического анализа", Минск, 1985, 1992., Всесоюзных научно-технических конференциях "Проблемы и перспективы автоматизации производства и управления на предприятиях приборостроения и машиностроения", Пермь, 1987., 1990, Всесоюзный школе-г.еминаре "Программно-алгори мичес-кое обеспечение прикладного статистического анализа", Цахкад-вор, 1987., Региональной научно-техничьской конференции "Измере-
ние характеристик случайных сигналов с применениями микрсмашин-ных средств", Новосибирск, 1988., Первом Всемирном конгрессе Общества Математической статистики и теории вероятностей им. Бор-нулли, Ташкент, 1986., VI и VII Всесоюзных семинарах "Непараметрические и робастные статистические методы в кибернетике и информатике", Томск, 1987,1990., V Международном семинаре "Статистический анализ данных", Болгария, Варна, 1989, Всесоюзной конференции "Математические методы в распозновании образов" N№'0-1V, Рига, 1989., Всесоюзной научно-технической конференции с Международным участием "Применение статистических методов в производстве и управлении", Пермь, 1990., Всесоюзном научно-техническом симпозиуме с Международным участием "Теория и практика классификации и систематики в народном хозяйстве", г.Пущино, 1990., Всесоюзной школе-семинаре "Дискретная математика и ее применение при моделировании сложных систем", Иркутск, 1991., Всесоюзной научно-технической конференции "Идентификация, измерение характеристик и имитация случайных сигналов", Новосибирск, 1991., Всесоюзном школе-семинаре "Статистический и дискретный анализ данных и экспертное оценивание", Одесса, 1991., XV Всероссийском семинаре с Международным участием "Проблемы устойчивости стохастических моделей", Пермь, 1992., Научных семинарах ЦЭМИ РАН, Ленинградского института информатики и автоматизации РАН, ВЦ РАН, института математики при Познаньском университете (Польша), Пермского университета.
Публикации.Диссертация выполнена автором самостоятельно. Научные результаты, сформулированные и полученные в диссертации, обоснованы и доказаны математисчески корректно. По теме диссертации опубликовано 70 работ, в том числе одна мгнография. Основное содержание диссертации отражено в работах [1] - [20], список
которых приведен в конце автореферата. Вклад автора в совместных работах [15Ы20] отмечен в тексте диссертации.
Структура диссертации. Диссертация состоит из введения, трех глав, включащих 18 параграфов, и приложения. Библиография-227 наименований.
ОБЗОР СОДЕРЖАНИЯ РАБОТЫ
Первая глаза посвящена описанию предложенных автор»: диссертации математических моделей групповой классификации многомерных векторных и матричных наблвдений, построению статис,гичес-ких оценок, неизвестных ранее, для плотностей распределений достаточных статистик и вычислению квадратических погрешностей полученных оценок, в случае нормальных распределений и распредоле-ний Уишарта.
В §1.1 приводятся постановки задач грушевой классификации и строятся математические модели этих задач. Пусть деве И генеральных совокупностей л?, л2,..., пц объектов X и высока :;С0=(Х0), Хог,..., Х^ > объема п0, принадлежащая одной лз
о
л{ <1 ,М. Задача групповой классификации состоит в построе: -/и решавшего правила для отнесения группы п00 в целом к одной лз генеральных совокупностей л{ {=1 этом возможны два слу-
чая.. В первом случае предполагается, классы л полностью описаны, что в вероятностной постановке о чачаот, что даны законы распределения р1 (г) (плотности распределений' '/'ъектов К в л 1=ТТМ. Во втором - пре/лолагают, что ег-вокупг'хлм т., представлены только конечными подмножествами :.воих : ,г ^дстав'ителей .> А\ 0>..., X. ), называемых оОуччзпцими ркамм объемов п1 1=Т7В. Если X и являются прямоугольными матицами; имеющими "г строк и т столбцов „'-Т"7гг , то оудем говорить
об обобщенной задаче групповой классификации. Отсвда при условии, что &= т и матрицы X, Х1} положительно определенные и симметрические, получим задачу групповой классификации п0 случайных матриц, имевших распределение Уишарта ./=1,п,, 1=и,и.
О) (2) Ск)
Если же ш= 1, а матрицы столбцы X' = {X ,Х ,...,Х ) X' =
(I) <21 (к)
(х^ ,... Д{^ ) является независимыми j=T7^¿i, {=Ц7Э, то
приходим к задаче групповой классификации п0 независимых й-мерных векторов. Штрих - знак транспонирования.
Наконец, когда га=1, п0~ 1 и матрицы-столбцы X, X {=и,М независимы получим задачу поточечной классификации, т.е. задачу классификации й-мерного вектора X в ^-мерном пространстве признаков Я*.
Пусть р(л00/л{) - условная плотность распределения выборки л00 при гипотезе Н{ состоящей в тем, что л00с л{ {=171?.
Пусть В - есть пространство всех выборок л00 объема п и Е есть подпространство принятия гипотезы И по некоторому за-
4 4 м
данному решающему правилу, Е{П 0 J, 1У1 ^,J=TT¡l. Тогда величина риска для этого правила дается выраже-¡лем
и И
й= I Е4-: (
где цг - априорная вероятность класса п{> а^ { - вероятность ошибочного отнесения группы л00 из класса л{ в классе л,,а с(]/{) -- стоимость такой ошибки, причем с((/г,)= О,
Ч/ , Г-«/"»5 •
Т71. Оптимальное байесовское решашцее правило групповой классификации, доставлякЕвэ минимум величене риска (1; имеет вид (теорема 1.1.1)
и
nJt если J^ q{ c(J/t) р(л00/п{) <
i=' ( 2) < £ g, c(r/i) р(п00/л{)
при всех rv j, r=T",TL
В случае, когда Н= 2, положив u(= q;c(2/1), u2= qPc(1/2) из (2) получим оптимальное решающее пр.авило групповой классификации объектов ^з двух классов
р(л /л ) ш тт с Л , если---—— > , п,
00 ' P<WP и| (3)
с величиной риска
» = S J P^oo/7V ^00 + шг J P<n0£/V ^00 , ,,
е е, ( ;
Модель групповой классификации (3) может быть реализована в двух вариантах. В общем случае, когда нет никаких ш.риорных предположений о распределениях р{х/7!{), естественно в качес тве .../",) взять функцию правдоподобия, т.е. положить
и
Р<поо/7Ч> = L(WV = L&o,'xc*.....*0n/V r- П P(*o/V
J=1,2 и использовать решающее пр.авило
L^XO1>X0S.....Х0n /7V
ллос 71 J • если -~— s — ( b)
о
Это так называемый ненараметрический случай.
Когда же предполагается, чго расттределения совокупностей зависят от некоторого многомерного параметра Н т.е. р{х/п{)-р(£/е{)= рн (x/ni) и существует достаточная статистика для н
при каждой гшотезе то в качесто Р^с/71^ следу е'~ взять условную плотность p(t/* ) рчспредолония достаточной статистики 2- TtXy,. X ,.... ) при гипотезе Н{ 1-- V7B. При так;« па
а
ргметрическом подходе имеем ¿п^ивялент^ "i оптимальное решающее правило групповой классификации
- 9 -
р(г/е> )
л с л , если -1- >
00 ' р{г/в2)
Из (5) и (6) следует, что если поточечная классификация
к
производится в й-мернсм евклидовом пространстве Н , то групповая классификация производится либо в (п0* й)-мерн. ■•'. эвклидовом пространстве, либо в пространстве достаточных статистик.
В § 1.2 решг.'т гея задачи групповой классификации случайных векторов из совокупностей л{, имевших ^-мерное нормальное рас-
пределеше с плотностям".
1 Г < ->
Рм .2 ^ -й7г-Т7г етР\ - 2 ^ < 7>
' ' (2л) |е,| 1 . '
когда параметры ц , £{ известны и случайных матриц,имеющих рас-
шеделение Уишарта
(р-Ь-П/2 г . -к
1У1 ехр {- 7 5р У Е{ ]
»(•?/£,,р) ------ ( 8)
Ър/2 к(к-1)/4 р/2 А г
2 л |Е.| И Г
I
с известными параметрическими матрицами £ и с р степенями свободы 1= Т~ГЗ.
При каждой гипотезе Н{ статистики
к £ п030= I ^01- V < ^
являются достаточными статистиками для параметров ц , е{ распределения совокупности л{ и р( е{) = р( I/ Ц{,е4) = = р{х ,пЯ /\1 е.), причем
° ° ° 4 * к/2 (п0-к-2)/2
П0 I по
р(х0,«^0/цг,Е{) = ---^- *
кп/2 к(к+1)/4 п/2 (п--г)
2 ° л |е{ | i | г —(10)
г-1
х ехр {- 4° [ йр + (v ц{)' е>0- д«)]}.
ы " .1?.
В теоремах 1.2.6, 1.2.7, 1.2.8 найдены выражение для совместных плотностей распределений статистик х0), хог, .... х^ ,
о
£ • £ , с , £ .с и <7...«у. . т
п+пп+пппп+п'п+п О» • С2 Оп п +п
О I О I О О О I О I С О I
при гипотезе Н{, где
г =£+1, с = с + с
те +п п п п+п п п
О I О I О I О I
(11)
и выборка лоои л{0 извлечена из распределения (7), а
Т = У ?„,+ V = Г +Т (12)
п+п / , 0J / , ij п п '
достаточная статистика для неизвестного параметра е распределения Уишарта {=Т71.
Построены оптимальные решающие правила групповой классификации случайнах гауссовских векторов и случайных матриц имещих распределение Уигарта.
Следующие три параграфа посвящены решению задач теории оценивания неизвестных плотностей распределений в пространстве достаточных статистик. Эти новые задачи ранее не решались и возникли при решении задач статистической групповой классифи--ции и требуют самостоятельного исследования.
Это связано со следунцими двумя особенностями принципиального характера в подходе к решению задач оценивания плотностей в пространстве достаточных статистик.
Во-первых, оценки для неизвестных плотностей £(л /л ) распределения выборки л00 и, тем более, для .-относ1"'* р(*/л{) распределений достаточной статистики £, не могут быть выражены через статистические оценки для плотностей р(х/л{) объектов в совокупностях л{ £= ТТЛ. Во-вторых, разработанные
методы оценивания в пространстве достаточных статистик, основаны на идее когда и для построения оценки используют объединенную выборку л.1) п00 при гипотезе И 1= Т7Ж. Последнее позволяет существенно расширить априорную информацию и приводи" - структурным и содержательным изменениям полученных оценок, особенно при существенно ограниченных объемах обучавших выборок.
Решается также весьма важная задача вычисления величины
V * { I [ > - Р "2)
которая называется квадратической погрешность® статистической оценки РА№0С/л{) Для плотности р(пос/л() 1= ТТШ.
В § 1.3 получены оценки максимального правдоподобия для функции правдоподобия Х(лсо/л4) и плотности (10), а так же оценки (1.3.16) для плотности распределения
Уишарта (8). В теоремах 1.3.1 и 1.3.2 найдены асимптотические выражения для квадратических погрешностей полученных оценок, ¿;ля доказательства последних теорем использованы результаты леммы 1.3.1 и формула (1.3.23) позволящие найти свертки несколыжг плотностей распределений в пространстве достаточных статистик многомерного нормального распределения и распределений Уишарта.
Исследованию вопросов несмещенного оценивания плотностей в пространстве достаточных статистик многомерного нормального распределения и распределения Уишарта посвящен § 1.4.
Теорема 1.4.1. Пусть и Х{Х{2,..., Х{п - независимые
й-мерные случайные вектора Х{}~ Щц{,Е{), -где =1 ,М. "лгда при гипотезе единственная несмещенная оценка
тг
I.
\ (л00) для функции правдоподобия ^ ^ (лсо)= Пр^ >г С^), выраженная через достаточные статистистики
Pt= П°Хп°0 I rcf'- % + V £<= Vi + Vo +
n(n+n) _ _ _ _
+ t:—- »i?
t
дается выражением
к/г , (п.+п.-Л
ínp + nt) Л г 1-ЦД-Ч
,2 (71оо)_" —кТ2—ь^ГТЗ I I
I
X —
П.-.1
1
П„(ПЛ+П,) (п.
<W2| - Vo + -- (V Pt)(V *<>' !
(п (п
I |
ее;:/ оценка отлична от нуля. Здесь
I V
п гг _
п. х.= г , с - —ц,—- тт.и
«г п{' { « п П1
Несмещеннь.з оценки для плотьостей р,( г (, « ), и функ-
I ' I
ции правдоподобия Ь^ „ (л0С/Е.,р). случайных матриц, имеющих
распределение Уишарта получены в теоремах ■ и 1.4.8. В теоремах 1.4.3 и 1.4.5 найдены несмещенные оценки для I^ (л&£)) и
Рр г в случае, когда вектор неизвестен, и матрица
ковариации е известна, а в теоремах 1.4.4 и 1.4.6 - в случае, когда матрица ковариаций Е{ не известна и воктор сродного ^ -известен {=ТТЙ. В следствиях 1.4.2 и 1.4.3 установлены аналогичные результаты в одномерном случае и для плотности распределения »опарта. Весьма важным является результат теоремы 1.^.4, в которой получе? ^ точное аналитическое выражение квадратической . п-
решюсти несмещенной оценки р^ г (1:0,пр80) для плотности
р . (,х0,п^50) { = 1 ,М. В ^устнос'ги, найдено асимптотическое
разложение для этой величины при е - I
-й2 /2
Пп 2 ~ л г ( °Т 1
к
о = "о П
Я 1/4 I I 2 IПА}
Л Г
х< -2-2- + О
4 п
1 ^
В теоремах 1 4.4.12 получены анало1,ичные результаты
КБЗЛ:-Гтгтчвсиг: погрешностей несмещенных оценок т (л00)
- функции граздог.-ж--Л'я и ¡»(У/Х^.р) - плотности распределения Уишэрта.
Квадратеческие п.лтагя.тоти. несмещенных оценок
р^ ^для условной плотности рр ^ {х0,п£0~) совмест-1 1 2
ного распределения достаточных статистик х0, одномерного
нормального распределения и р{и/б,,р) для плотности распределения хи-квадрат получены в 1.4.5 и 1.4.6 соответственно .
Б §1.5 впервые получены основные результаты по построению эмпирических байесовских оценок плотностей распределений выборочных характеристик многомерного нормального закона и распределения Уишарта. Решена задача статистического оценивания их квад-ратических погрешностей. Пусть 8А(©) есть квадратическан погрешность статистической оценки РА^оо^вг ^ дая плотности р( л^/^) спред&ленная формулой (12) и пусть р{е>) есть некоторая заданная лебегова мера на множестве 8. Тогда эмперическая байесовская оценка РБ№0£/П{0) Для р(л00/л{'0), построенная на основе независимой повторной выборки л{0 объема п{ из л{ находится из условия минимума Функционала
6А= ] 8Л(е) р(9) аэ
е
В теореме 1.5.1 получена байесовская оценка
зависящая только от достаточных статастик ¡а{, е{ для функции
правдоподобия Кл^/ц. ,е,) когда оба параметра , е, не из-00 4 4 ( )/2 4 1 вестны и р(ц{,е4)= 1 или |е{| - Как следствие
из этой теоремы при п0=1, получена байесовская оценка
рБ(х/Д{,£{) для плотности й-мерного нормального распределения
р т (х) с неизвестными параметрами ц,,Е,-
К I ^
В случае одномерных нормальных совокупностей байесовские оценки для ЪБ{п00/^гб21) и ) для
плотности р г (х) одномерного нормального распределения найдены в следствиях 1.5.2 и 1.5.3. Имеет место следующее общее утверждение.
Теорема 1.5.3. Пусть 7, I независимые случайные величины и при гипотезе Н{ NЕ{), 2- йЧ2/Е{,л0- 1) с совместной
^ та
плотностью р^ „ (у,г),определенной в (10).Пусть ,
независимая повторная выборка и 1(л^0/р{,Е4) - ее плотность распределения. Тогда статистическая байесовская оценка 1^(п'00/5п,Сп) для этой плотности, когда оба параметра е4
неизвестны, построенная на основе независимой повторной выборки
п -(11*1 1/2
и априорной мере р(ц1,Е{)= |Е{| дается
формулой
к/г
(гг<+771)гг0-1) г{ ^ос'Ч Л >=--Г—г *
у(й,гг{п0-1) 2
Ыа-к
"о.?1
г^, (п-к-2)/г (ч п„-и/г
» Ат(п -» )/4 к
Л
ПгМ
((тг.+п^ )по-1 )/г'
п,т
1 т1 _ _
О + тг- ) тВ + 7-г-=;(У - у )(у - у )
п П_ / . 03 т П,+ т ат ап ап
V I
где
п п
I. I.
ПЛ = I (У<.Г йп Уп )'; Уп = я, Е
1 ^ 1 1 1 1 ^
V Я I Уог ^ I <Уо.Г
п
о = г..в +1 у 2, « « % ¿а 4
только от статистик
ктп/2 к(к-!)/4 Д. Г(Я„-ГИЛ
у».п > 2 л П Г °
J
3.= >
и эта оценка зависит только от статистик у , . Здесь
Из этой теоремы при т=1, получена эмпирическая байесовская оценка рБ{х0,п0Б0/уп ,0п ) при той же априорной мере для плот-
1 I
ности р _ в следствии 1.5.4.
и С/ (у
I ' г
Результата-- теоремы 1.5.2 является выражение для бай^соэс-_ г 2
кой оценки рБ(х0,п(?30) плотности рр я случае од-
номерных нормальных совокупностей.
В теореме 1.5.4 показано, что если выборка л00 извлечена из совокупности л{ имеющей распределение Уишарта Щ.К/Е, ,р), то эмперическая байесовская оценка для функции правдоподобия .р), построенная на основе независимой повторной выборки л-{0 из этой совокупности, при априорном распределении р(£г, )=1 и выраженная только через достаточную статистику Т дается
I о
формулой
n
П° (р-Ъ-П/2
lyOri
L^{v.nn/T ,p)= -—-
CJ 00 n +n ^ n
1 ° k- 1 ) у °(fc.p)
in р-ь-);/2 |Г - Г I 1
' n +n n 1
((n +n)p-k-1)/i |Г | 1 °
' n +tv1
Как следствие 1.5.5 из этой теоремы при тг0-=1, получена байесовская оценка tVg (3/р, Г ,) для плотности распределения
Уишарта W(y/p,E{) с неизвестной параметрической матрицей Е{ при Р(Е, )=1 • Гам же найдены байесовские с-ценя:: рДи/р,£ ,) для
I 1 Ь * П + '
плотности распределения хи-квадрат р(и/р,б".') с неизвестным параметром при двух различных предположениях со .априорном распределении параметра .
Следу»шив результаты этого параграфа связаны с шеледовани-ем качественных характеристик бэйосспск'.*х опенок. В теореме 1.5.5 получено точное аналитическое выражение для квадратической погрешности 6Е байесовской оценки Ь^Гг /Д{,£{). Асимптотическое разложение этого выражения имеет вид
Zk^ns ühn,+ Ъг~ к
—2-^- + с
кп /г
4ni
льгдратическая погрешос-тт- байесовской оценки рБ(х/рг,£{) для плотности р^ т (_с) ^-мерного норм5!, '-ного распределения,
когда оба параметра Е{ неизвестны, найдена в след / .зии
1.С.7. Аналог/тчные результаты получены в случае &=1 (следствие 1.5.8). Явное аналитическое выражение для квадратической погрешности 5иВ байесовской оценки ^.(У/р.У плотности распредз-
ления Уишарта (8) найдено и теореме 1.5.6 и выписано асимптота-
ческое разложение для нее. Для квадратаческой погрешности байесовской оценки рБ(и/р,гп+)) плотности распределения хи-
квадрат рБ(и/р,б^) аналогичное выражение с соответствующей асимптотикой приводится в следствии 1.5.9.
Глава 2 посвящена построению общих статистических моделей групповой классификации. Рассмотрены практические задачи, сводящиеся к статистической групповой классификации. Показано, что задача статистической групповой классификации не может быть решена в рамках классической теории поточечной статистической классификации и треоует самостоятельного исследования и создания совершенно новых подходов решения. Для этого разработаны целые классы статистически содержательных параметрических и непараметрических методов групповой классификации, исследованы их асимптотические свойства, в случае многомерных нормальных совокупностей и совокупностей имеющих распределение Уишарта.
В § 2.1 приводятся общие понятия и определения теории статистической классификации. Два правила статистической классификации и Л, называются асимптотически подобными над семейст-В'-лч распределений Р=--{р(л00/е),е<8>, если для любого &>0 и любых Р(лос/а() и р№00Л'?) из V при достаточно больших п), независимо от того, имеет ли л распределение Р(3,0(/в() или р(л00/вг) вероятность того, что правила А,, Ау дадут один и тот же результат классификации будет больше чем ( 1-е ).
Любое статистическое решающее правило А;, асимптотически подооное оптимальному правилу (1.1.14) является асимптотически оптимальным.
Если для любого р €8 и любой ВЫбО/КИ -п(,г р(л() А»и Р(л00/вр) являются состоятельными оценками для. неизвестных плегг-.:.л;тей р(л00/^() и о/«,) соответствешо, то статистическое
решащее правило групповой классификации
Р("оо/9,> П3)
с л , если ^- > с 1 '
00 ' . Р("00/б2)
является асимптотически оптимальным над семейством Р(р(лсо/е ),
о е8) (теорема 2.1.1).
При этом в качестве р(лОС1/в{) используются либо состоятельные оценки Дл00/в{)для Ь(7100/е{), либо состоятельные сценки р(г/б>4)= ри(л00)/е{) для р(г/е{) {= 1,2. Совершенно ясно, что ни 2(л00/е1) ни тем более р(г/е4) не могут быть получены через состоятельные оценки р(х0^/е{) ./= 1, п0, I = 1,2. Отсвда следует, что в общем случае, задача статистической группсвсй классификации не может быть решена в принципе в рамках теории поточечной классификации. Кроме того, в § 1.3 - 1.5 оценки р(л00/е{), при каждой гипотезе строились на основе объединенной выборки л{0и л00 и поэтому являются зависимыми величинами. Отсюда, статистические решаицие правила групповой классификации основаны на отношении зависимых величин. Такой подход позволяет существенно расширить априорную информацию, особенно при существенно ограниченных объемах обучающих выборок.
Задачи статистической групповой классификации на основе оценок максимального правдоподобия решаются в § 2.2 в случае многомерных нормальных совокупностей. Построены решающие правила групповой классификации и доказано их асимптотическая опти-.мальность (теорема 2.2.1 и следствие 2.2.1 - 2.2.4). Получены два метода, которые основаны на отнсиениях максимумов правдоподобия в случае нормальных распределений с различными общими ковариацишньми матрицами соответственно. Из них при п0= 1 следует аналогичный результат Андерсона [ 41 ] для поточечной классификации.
Во второй части данного параграфа задача статистической групповой классификации сведена к задаче проверки двух простых гипотез о принадлежности закона распределения одномерной выборки имевдей распределение Фишера. Предложены два критерия и для про^-верки этих гипотез и в теоремах 2.2.2 - 2.2.3 доказкно, что эти критерии являются асимптотически оптимальными.
В § 2.3 разработаны статистические решающие правила групповой классификации в случае нормальных совокупностей, используя несмещенные оценки, полученные в § 1.4. При различных априорных предположениях о параметрах распределений совокупностей построены статистические методы групповой классификации основанные на
несмещенных оценках ^ (л00) для условных функций правдопо-
{, I
добия £ (л00) и р^ £ {10,пср0) для условных плотностей
распределений р^ ^ (х0,п050) достаточных статистик {=1,2.
1,1 по
В теореме 2.3.1 доказано, что при п. -юо и ^ —► 0 {=1,2,
4 'ч
решающее правило групповой классификации
тт00 с п}, если -—*- > с,
когда оба параметра не известны {=1,2, является асимптоти-
чески оптимальным.' Аналогичные утверждения для других правил доказаны е теоремах 2.3.2 - 2.3.4. Исследованы некоторые допол нительные свойства несмещенных оценок плотностей нормального распределения.
Важные результаты теоретического и прикладного значения по построению эмперических байесовских решающих правил групповой классификации и исследованию их свойств получены в § 2.4. На основе результаюв (, 1.5 впервые разработаны статистические бай-
есовские групповые классификаторы многомерных га^ч :: • т векторов, когда параметры рг не известны полностью или ча:::; • : - -л различном выборе априорной меры распределения неизвестных пар а метров. В частности, правило, основанное на байесовской оценке (2.4.1), когда р.,1. неизвестны и р (р.,1.) = 1 состоит
-2-
Л 00 с 71)' еот
Упг+ V УУ V
к/2 Г
П
[п^-к-Щ
Г 2
а
п2+ п0-Ь-К
(п2+н0-Ь-2)/2
\(П2+ п0)Т2 |
(14)
п {п + п ) _ ~ _ ~ ' .-у-
I
I(пг+ п0)1г- п0Б0-
ПЛП2+ (пг-Ъ-2) Я ■
п„ (х0- ц2) 1 2
В теоремах 2.4.1 - 2.4.2 и следствиях 2.4.1 - 2.4.3 доказана сходимость по вероятности эмперических байесовских оценок, полученных в § 1.5 для соответствующих не.известных плотностей. В теореме 2.4.3 доказана асимптотическая оптимальность решающего правила (2.4.2), а для остальных классификаторов аналогичные результаты получены в теореме 2.2.4 и следствиях 2.4.4, 2.4.6. В лемме 2.4.1 показано, что эмпирическая байесовская оценка плотности нормального распределения при любом конечном объеме выборки является плотностью некоторого вероятностного распределения.
Лемма 2.4.2. Байесовская оценка ЬБ(лс0/р{,1{) для функции правдоподобия ^ (л00) является смещенной оценкой с величъ 1Сл смещения £р равной
¿в =
ЛпЛЬ+Я)
+ О
Статистические решапдие правила групповой классификации случайных матриц строятся в § 2.5. Построены два метода статистический групповой классификации случайных матриц, имевдих распределение Уишарта с заданной степенью свободы р и неизвестной параметричексй матрицей на основе оценок максимального правдоподобия. Как частный случай при п0=) из этих правил получено правило для поточечной статистичесой классификации в случае распределений Уишарта.
В теореме 2.5.1 и следствии 2.5.1 доказаны асимптотическая состоятельность полученных решающих правил групповой и поточечной классификации случайных матриц.
На основе несмещенных оценок ¿(л00/р,1{) получено решающее правило групповой классификации случайных матриц
лоо с лс есж
р(п,+ п0)) пгр) р(я2+ п0)) п(р)
* ч?
( о о
|т I ~ |т - т 'Ч^о' 1 п?+по Ч'
из совокупностей, имеющих распределения Уишарта с р степенями свободы и неизвестными параметрическими матрицами 1{{=1,2.
При п0-1 из этого правила получено ггравило поточечной классификации случайных матриц на основе несмещенных оценок плотжх: тей распределений Уишарта.
В теореме 2.5.2 показано, что
»(У/р.I,) ^Р^ >
и в следствии 2.5.2
т00/р,1,) Ь(л00/р,11)
£=1,2.
Доказательство асимптотической оптимальности для этих ре-шащих правил приводится в теореме 2.5.3 и следствии 2.5.3.
В конце параграфа построены эмперические байесовские групповые классификаторы в случае распределений Уишарта и хи - квадрат. Статистическое решающее правило групповой классификации так же построено на основе бацесовских оценок Ъ^(п00/р,Тп +п )
для условных функций правдоподобия 1(л00/р, I.) £=Т7м. Из этого правила при п0=1 получено эмперическое байесовское правило поточечной классификации случайной матрицы У, имеющей условное распределение Уишарта 1У(У/р,Х{) с неизвестной параметрической матрицей X. и это правило состоит
У < Jij , если
npfp-ft-1) у(й,п.р-й-1)
| Тп, + М"П1 + Пр-4-',/г I Tn.+ t -
t J > t
* '| Тп,ч|<<*j+')p-b-t)/e , Tn ,inlP-*-i>7i ' q]
при всех i * j m £=TTM
Теорема 2.5.6. Байесовская оценка для плотности распределения Уишарта с неизвестной параметрической матрицей Х{ является статистически состоятельной т.е.
Р
й"Б(У/р,Тп +») -f №(У/р,Х )
ni* 00
при любом У и X., i=i~Ä. В теореме 2.5.7 доказана асимптотическая оптимальность решашег' правила (16).
В следствии 2.5.4 доказана состоятельность оценки Х^Сл^/рД'п,* i) длл Liv.0C/p,Zi), t=1 ,М , а асимптотическая опта-
мальносгь группового классификатора (2.5.13) показана в следствии 2.5.6.
Такие же результаты, в случае распределения хи-квадрат, содержатся а следствиях 2.5.2 и 2.5.7.
В лемме 2.5.' показано,что байесовская оценка И^У/р.Тс^ + О для плотности условного распределетги.-: .Уикартп 1У(У/р.1{) является плотностью распределения при лиг /м конечном п ,
Лемммя 2.5.2 Эмперическэя байесовская оценка (1.5.30) плотности распределения Уишаота является смещеной оценкой и
у{к, {п.*-: )р-й-1) у(к.п.р)
м »с(У/р,Тп.+о =--------------------1— ИЧУ/Р.>".;
ь 1 у {к, п.р-к-') у(к. 7 - ;р)
{ = 1 ,М. Величина с»-«ощечу,1: у<«»от -тль г.>/.у"-зт, если вост.- '.'.ззо ваться необходимыми асимптоте ¡есгими формулами..
Задачи непараметричеоко: о оценивания плотностей и разработки непараметрических стятуогл >ских методов грунтовой классификации решатт.я ч 5 Рас.-с-л>тре»ты все наиболее известттые методы постргх;:тия непарам«-тричо-чих оценок плотности,такие кге< локальные оценки, ядерные оцени.: .проекционнные оценки.Предложен один непарэмьтрический алгсртг ¡остроения оценки г-я наипеост-ной одномерной плотности с г.^анью сплайн ■ функций. ■'эссмотоены задачи оценивания и распознавание в случае размытых \"ножесл" .
Решение е.тих, задач связано исследованием очень иаодого вопроса о построении функций принадлежности.Функция прггнч.,ложности - это векторная функ.с/^ А (г)-(А, (х) ,А.,(х)). где {(') не'Уфиц.'-:-^льная всюду функция от объекта х, характеризуй/<я меру принадлежности г к совокупно .-та г., 1 = 1 ,Р. Предположим,- го А,(х) + А..,(х) = 1 для любого 1 и •
В работе разработан т- ..* '.*>тг 1ыг& алгоритм по. учения функции А(х) •!'> основе ооуччкиул !■-;■" ;. к п , I 1 ,■>.
На основе полученных функций принадлежностей А1(г) и А2(х) построена непараметрическая сценка
Ра {х) = 2 Му) / у(-х) 2 Му) (17)
для плотности р{(х) в точкэ х,где у(х) - объем выбранной спреде-леннным образом окрестности точки х, л+=л)ои л20> {=1,2. Показано, что при отсутствии какой - нибудь размытости т.е.при А1(з;)=1 при х е пю и А^(х)=0 при j * I (,/=1,2 из (17) следует известная локальная непараметрическая оценка Фикса - Ходжеса. Исследуются свойства оценок (17) на содержательном уровне, связанные с расширением априорной информации за счет использования функций А{(2) 1=-1,2.
Используя оценки (17) построены непараметрические решающие правила поточечной классификации. В теореме 2.6.2 показана асимптотическая оптимальность этих правил. Пред ложен и непараметрический метод групповой классификации размытых множеств.
Непараметрическое решающее правило групповой классификации построено на основе ядерных оценок и рассмотрены частные случаи при различных конкретных ядерных функциях.Показана связь полученных методов с известными методами потенциальных функций для решения задач поточечной классификации и автоматической классификации.
В § 2.7 рассматривается задача построения алгоритмов групповой классификации, основанных на идеях кластер-анализа. Показано, что между кластер-анализом и групповой классификацией существует тесная связь. Во-первых, если по некоторому алгоритму получены М клаастеров, то для дал1 Лей процедуры сокращения или увел кения числа кластеров е .р . стве функционала качества
можно использовать одно из статистических решающих правил групповой классификации.
В частности, можно использовать правила групповой классификации, основанные на расстояниях между объектами и множествами объекте®. В данном параграфе предложены алгоритмы груцпозей классификации, основанные на рэотояниях между .эталонными ооъек тами. на вычислении среднего рэстояннния vo.«uy ::реднку. i до всех точек обучающей выборки л , í-Г.М к н-' расстояниях ме&пу i и i . í=0. Кроме того, предложен алгоритм гоупдопой
П + П П г г * -
i о i
классификации,основанный на сравнении средних расстояний моу.у выборками Т!{С1 и группы л i -Г.~м.
Далее nwwaHi), что в случае, ног/-- и( »>.«"*мерим«> с м., д."..-1 решения задачи групповой классификации можно кспияьашчть уед;дч кл-'стер анализа. Дри ütom в к"иаство рогчлаеп» правила в;-": гупаот ф уню Л он а л к а ■ч с; г1 п s а.
Но второй части параграфа нредл'-усн .дач подход к репе!'»«' задачи групповой классификации..достхорошо клльхтгрируэтций овяаь между .-адачами групповой кла;.-../Акации и кластер анализа. Идея групповой кл'-т.оификации кпгяи*. • >» том. что выпорка л рас с.матригг'от*. :•: к--к матрица о k r.tpo:;"v/ и п •.••:« у.м:-чи и вводятся квадратны: порядка к матрицы
. В,. . H{J ata, .
где н4 векюр ;;;ojr;ou. .л сумме rmwrxioo матрицы г ,,
í.j «T.M .'¡алее шюди :*'.й функционал от .атих мчтч«.; 4(А, i.j-Vi.t* на ооионо 'одороп? отроится р-ошнн'.цоо ¡.равидо(Д. /. ч). При ••этом, пыпирчя ;'а.-чличные ¡ункционалы м--«.» получать различные методы групповой >{:.'h:fr.'tv»4'«rw. Kj"«" :>•' о •»«wkvjh.-». чго некоторые и - -.их cobi;'-'.данп с известными Фу1'каи.1.а..ами ка '.ества в методах чластор- аналч.Г!. г, ¡астнооти < »»»•:»»;••< v"!,,ia. Колмогорова,
Ланса и др.
Если в § 2.1 - § 2.7 решалась задача групповой классификации независимых векторов, то в § 2.8 рассматривается эта задача в случае, когда гаусовские векторы л10 зависимы 1=0,М. Исследуется наиболее простая модель зависимости Марковского типа через скаляр, т.е.случай, когда матрица ксвариаций последовательности п00 при гипотезе Н{ имеет блочный вцд. Применяя процесс ортогонализации находится последовательность независимых гауссо-
вских векторов у0,у02"-Уоп • Естественно, эту процедуру можно
применить и ко всем обучающим зависимым векторам из л{0, {=1,М.
Тем самш, задача групповой классификации зависимых векторов (Х0) ,Х02,.. .Х^ ) на основе зависимых обучающих
векторов л{0={Хи,Х{2,...Х4п ) сводится к статистической задаче
групповой классификации независимых векторов
л0^={У0) • • -У(п > на осно;.о нез¿висимых гауссовских векторов
Для решения последней задачи использованы эмпёрические байесовские методы, разработанные в § 2.4 в предположении, что скаляр рг известен, а параметры ;Х{ неизвестны 1=Тд. Аналогичным образом можно использовать и методы, описанные в § 2.2 -§ 2.3.
В главе 3 решаются различные задачи, связанные с изучением качественных характеристик решающих правил групповой классификации, таких как вероятность ошибок классификации, расстояния между распределениями и др. В случае нормальных совокупностей и распределений Уишарта получены выражения для вероятносг.ч ошибок в виде одномерного интеграла, постэоены двухсторонние границы
для функции риска, найдены явные аналитические выражения для ряда наиболее известных расстояний между распределениями в пространстве достаточных статистик, проведено сравнение методов поточечной и групповой классификации, приводится краткое описание пакета прикладных программ по статистической групповой классификации СГК '.
В § 3.1 для функции риска Я при грушевой классификации л00 на основе оптимального байесовского правила получено представление
СО
Ш.+ Ш„ . 1 ш.
) г 2 г 1 '
2 Г 1
о
Г,(ш) = | р^л^лрехрИщ^л^ал
Я = -:- + — | — Ля Г2(ш)(3ш -
о о
где
Лл Г (ш)с!ы ,
00
Е
д(л00)= 1п [ игр(п00/л>)/<1)гр(п00/п2)], (-мнимая единица. В случае нормальных совокупностей найдены точные аналитические выражения для Г^(и) ¿=1,2. Исследованы частные случаи...
Вычислению расстояний между условными распределениями дос таточных статистик многомерного закона посвящен § 3.2. Важность этей задачи следует из трудностей вычисления вероятности ошибок не посредственно, и того факта, что любое расстояние является
монотонной Функцией от нее. »
В схучче двух условных распределений р =р т (5 ця,)
» Ц ^ I Л | V С/ • '
получены точные аналитические выражения для "расстояний" Кульсч-ка-Лейлера, Хеллингера, хи-квадрат и др. Для "расстояния" хгч -квадрат например, это выражение имеет вид
[Рц,.!,^ "о3О> - Рц2,12(хо- поВо;]
Мр,.рг>
Е
' ""с'2,,, "о
I £ 1г - I, I *• |Е, |
Ьп 'г и /2 —г-.рг-, г-г' Ь"
2 0 |12| 0 I г
*(д,- р2) + 2 П0 ц; Е;'Ц, - 4 ^ 1-'м2]| - 1 •
Подобные результаты получены в одномерном случае.
Наиболее важными "расстояниями" между распределениями являются такие, для которых известна связь с вероятностью сшибок классификации. Такими "расстояниями" являются верхние и нижние границы для вероятности ошибок.
Такие границы для вероятности ошибок Р^ и риска й построены е § 1М; кс.тл осозначить П(п00)= д(лсо)- 1п - и ? (з) про-
функцию статистики й(п00) при Н, то, используя еще Бз'йаз.онкое "расстояние" Колмогорова между распределениями, доказана теорема.
Теорема 3.3.1. При групповой классификации объектов из двух генеральных совокупностей л( и п2 с псмацью оптимального правила (3.3.1) риск й удовлетворяет неравенству
ш. + ш„ < ,„
{(и, + и2)г - 4 ш}и2 ехр[- 2 А(1/2)]|
<
« й € ш!"^ ехр [ -А(б) 3, где
2 2
с Р < I., ш ) 2
А(з)= -1п4( (б) Кз$1.
Обозначим Кий левую и правую части последнего неравенства. При 0(2/1 )= С (1/2)= 1 из этой теоремы следует аналогичный
результат для вероятности ошибок Р . Следует отметить, что при
о
Б=1/2 величина й как и в теории поточечной классификации, называется "расстоянием" Бхатагория.
В теореме 3.3.2 получены явные выражения для нижней и верхней границ й и й при групповой классификации мрогомерных нор-
мадышх совокупностей. Показано, что в этом случае
"О3*1"3) , Л(а)= - Щ 4,(3) = - 01Г ц2)' I 3 X, + (1-8)12 I -
I | з I, + (1-з)12 |
* (Ц - Ц ) + 1п -=-г-5-.
' 2 2 II,I3 |12|'-3
Доказано,что при групповой классификации вероятность сшибок убывает с ростом п0 (теорема 3,3.3).
В случае, когда параметры не известны, то возникает
задача оценивания величин й и й по обучающим выборкам. В £3.4 в случае, когда совокупности имеют нормальные распределения
,1) с известной матрицей I и неизвестным вектором средних {=1,2 для верхней границы Й величины риска Я при поточечной классификации построены четыре статистические оценки. Эти оцеки ,йэ,И4 для Й построены на основе различных статистических оценок для неизвестных плотностей р., т (х), точнее на основе
непараметрических ядерных сценок, оценок максимального правдоподобия, несмещенных сценок и байесовских сценок соответственно. Найдены математичесекие ожидания Мй{ полученных оценок г=1,2,3,4.
В теореме 3.4.1 доказано, что статистические сценки ЙР. /5Д. являются состоятельными оценками Й и начиная с некоторого п , М й(> М й2> М й3> М й4 .
Получена связь между сценкой Н^ и известными потенциальными функциями. Установлены так же связи между й и И.
В £ 3.5. решается задача сравнешя методов поточечной и групповой классификации. Пусть совокупнее^ , I) и р{,
I известны '.=1,2. Для классификации группы л00 возьмем оптимальный групповой классификатор и метод "голосования" , относящий л00 к той совокупности л{, к которой отнеслось Со.тьше половины
объектов из л00 при поточечной классификации их с помощью оптимального правила
рц,,1,(х) X е п (, если - > 1
при Я,=Чг и С (2/1 )=С (1 /2). При этих условиях вероятности сшибок 1-го и 2-го рода равны между собой а - ¡з = Р(-А/2), где Б' (х) -функция распределения стандартного нормального распределения (1.2.7), Аг=(р(- м2)'1"'(Р,- ц2)- расстояние Мгхаланобиса.
Если а'п и вероятности ошибок оптимального группового
метода и метода "голосования", то
"о
а' = Р по
•- 2 с«: а г(1 -«)
о
Исследовалось поведение величин а' /а'' как функции от п и
п0 п0
а. При фиксированных а и больших п0, используя ассимптотические
формулы получено равенство
2п0 1 ~ 2а Г пп г (1 - 2а)2 -, 1
- = — ар --°и--}
а'2к I ' I 2 1 о^-а) * J
• о 4Л а(1-а)
и показано, что по крайней мере дая 0.12 « а < 0.5 выполняется (1-2о)
неравенство А- 0, что означает (а2п /а^ ] -0 при
п0—-» со. Этот результат показывает существенное щ -имущество метода групповой классификации над методом "голосования".
При малых а и больших п0 такой же результат получен, используя Пуассоновские приближения для биномиальных вероятностей. При малых п0 эта результата подтверждены с псмсщыо вычислительных экспериментов на ЭВМ. Динамика изменений величин а' /а",
по по
а' ,а" приведены в таблицах 3.1, 3.2, 3.3. Преимущество мето о по
дов групповой классификации подтверждено и при решении реальных
задач.
Разработке программного обеспечения задач групповой классификации посвящен § З.б. Методы групповой классификации могут быть успешно применены в решении теоретических и практических задач в различных областях знания. Отсюда возникают задачи выбора наилучшего метода групповой классификации в каждом конкретном случав, а следовательно и задача сравнешя методов классификации и вычисления вероятностей сшибок.
Оперативное и эффективное решение последних задач возможно лииь с использованием комплекса программ на ЭВМ. Такой комплекс программ создан в виде пакета "Статистическая групповая классификация" (СГК) совместно с Е.В.Мазановой и В.В.Ившиным.
В пакете реализованы основные алгоритмы групповой статистической классификации, описанные в главе 2 и алгоритм статистического моделирования многомерного вектора, имекщего нормальное распределение с заданными параметрами.
Основные результаты диссертации опубликованы в работах:
1. Абусев P.A. О квадратичной погрешности при ^параметрических оценках плотности //Сборник "Статистические методы", Перчь,Пермский ун-т, 1980.С.3-18. Abusev R.A. The Standard Error of Nonparametric Density Estimates //Journal oí Soviet Mathematics. Vol.39, No.2, October,1987.
2. Абусев P.A. 0 сравнении поточечной и групповой классификации в случае многомерного нормального распределения //Сборник "Статистические методы", Пермь, Пермский ун-т, 1982. С.3-7. Abusev R.A. Comparison of Point-by-Point and Croup Classification for the Case of a Multivariate Normal Distribution //Journal of Soviet Mathematics. Vol.39, No.4, November,1987.
3. Абусев P.A. К задаче классификации групп многомерных нормальных наблюдений //Прикладная статистика, М:Наука, т. 45 1983. С.371-372.
4. Абусев P.A. Вычисление байесовского риска при классификации групп из нормальных совокупностей //"Статистические методы
оценивания и проверки гипотез", Пермь, Пермский ун-т, 1986. С.65-72. Abuse-; H.A. Computing BayезIan Risk in Classiiication oi Groups from Multivariate Populations //Journal of Soviet Mathematics. Vol.53, No.6, March,1991.
5. АОусев P.A. Построение границ для вероятности сшибок при грушевой классификации //Сборник " Статистическая обработка экспериментальных данньце", г. Новосибирск, НЭТИ, 1986. С.58-63.
6. Абусев P.A. О группсвсй стат. классификации с помощью непараметрических оценок плотности //Тр.VI научного семинара по непараметрическим и робастньм методам статистики в киреренетике, Томск, Томский ун-т., 1987. С.4-9.
7. Абусев P.A. Квадратическая погрешность несмещенной оценки плотности совместного распределения достаточных статистик многомерного нормального распределения //"Статистические методы оценивания и проверки гипотез",Пермь.Пермский ун-т, 1988. С.4-10. Abusev H.A. Quadratic Error of Unbiased Estimator oi Density of Joint Distribution oi Sufficient Statistics of Multidimensional Normal Distribution //Journal of Soviet Mathematics. Vol.56, No.3, September. 1991.
8. Абусев.P.A. О групповом подходе в распоэнавании образов //Тез. докладов Всесоюзной конференции "Математические методы в распознавании образов", г.Рига, ч.1, 1989. С.3-5.
9. Абусев P.A. О квадратическсй погрешности оценок максимального правдоподобия для плотности распределения достаточных статист.-т многомерного нормального рапределения //"Статистические методы оценивания и проверки гипотез", Пермь, Пермский ун-т, 1990. С.4-11.
10. Абусев P.A. Байесовские оценки и стг.лютическая групповая классификация //"Статистические проблемы управления", Инст-т математики и кибернетики АН Лит.ССР. Вильнюс, вып. 93, 1Э90. С.182-193.
11. Абусзв P.A. О групповой классификации зависимых многомерных наблвдений//У1 Международный семинар "Статистический анализ данных". Болгария. Варна. 1990. С.105.
12. Абусев P.A. Статистическая групповая классификация в случае распределения Уишарта //Теория вероятностей и ее применение. J6 4. 1992. С.
13. Абусев P.A. Сравнение статистических оценок плотности нормального распределения. //Всессюзн. научн.-тех. конференции с
Международным участием "Применение статистических методов в производстве и управлении". г.Пермь. 1990. С.273-274.
14. Абусев. P.A. Грулпвая классификация. Решающие правила и их характеристики. Пермь. Изд-во Перм. ун-та. 1992, 220с.
15. Абусев P.A., Лумельский Я.П. Несмещенные сценки и задача классификации многомерных нормальных совокупностей //Теория вероятностей и ее применение, Л 2, 1980. С.381-389.
16. Абусев P.A., Лумельский Я.П. Об одном подходе к решению задач групповой классификации и кластер-анализа возникающих при описании сложных систем //Труды Всесоюзного научно-практического семинара "Прикладные аспекты управления сложными системами", г.Кемерово, 1983, 4.2. С.-255.
17. Абусев P.A., Лумельский Я.П. Вопросы оценивания суммарной вероятное™ ошибок при групповой статистической классификации //Матем. стат., теория вероятностей, комбиьаторка и их применения: Тр. I Всемирн.конгресса Общества Бернулли, Москва-Тула, 1988. Вып.2. Секц. 6-8-М., 1988. С.373-377.
18. Абусев.Р.А., Мазэнова Е.В. Байесовские оценки и статистическая групповая классификация в случае распределений хи- квадрат и Уишарта //"Статистические методы оценивания и проверки гипотез",Пермь,Пермский ун-т. 1990. С.11-18.
19. Абусев p.A., mj3'íhob с!.В. Байесовские оценки плотностей распределения достаточных статистик нормального распределения, и их статистические свойства//"Статистические методы оценивания и проверки гипотез",Пермг-кий ун-т, Пермь, 1991. С.5-13.
2U. АОусеГ) ¡'.А.. Симонова Л.Г. 0 квадратической погрешности несмещенной оц< ¡¡к/ плотности распределения достаточных статистик норм.закона /, Сборник "Статистические методы оценивания и проверки гипотез",г.IJepv¡>,Пермский ун-т, 1984. С.41-48. Abusev H.A. and Simonova I..G. Quadratic Krror of an Unbiased Estimate uf the Probability density of Sufficient Statistics of the Norma'. Distribution //Journal ijГ Soviet Mathematics. Vol.41, No.¡, April, 1988.
Подписано в печать Печать офсетная.
Формат 60x84 1/4. Усл. nf л. 1,Вь Тираж Юо экз. 1-аказ "Ь6Ц 4600, г. Пермь, Рукмров^. 15. Типография ПТУ.
-
Похожие работы
- Групповая классификация на основе байесовских моделей
- Многоуровневые непараметрические системы распознавания образов на основе декомпозиции обучающей выборки по ее размерности
- Теория и применение групповых методов классификации для конечных и континуальных множеств объектов
- Некоторые методы исследования групповых классификаций
- Статистическая устойчивость решающих функций в задачах классификации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность